[サンスクリットページ雑感集・技術情報]

Windows XPでデーヴァナーガリーを使う

Since 2004/7/21 Last Updated 2006/7/1


  1. Windows XPでデーヴァナーガリーを使う
     Microsoft Windows XPでは標準でデーヴァナーガリーフォントMangalが入っていますし、Arial Unicode MS(Unicodeフォント。Office製品に添付)にもデーヴァナーガリーが入っています。 ただ、製品をインストールして誰でもそのまま使えるようになるわけではなく、最初におまじないをしなければいけないのがわかりにくいところです。
     なお、Windows 95/98/Meでは、仮にMangalやArial Unicode MSをインストールしても、正しく表示されません。XPを使いましょう(2000は大丈夫とは思うが未確認)。
     まず、コントロールパネル(スタート−設定 などで起動します)で「地域と言語のオプション」。 「言語」タブをクリックして、「補足言語サポート」のチェックボックスをオンにします。 そのチェックボックスの説明に、「複合文字や右から左方向に書く言語のファイルをインストールする」とあるように、 これをオンにしてはじめて、デーヴァナーガリーやアラビア文字のフォントがインストールされます。
     入力できるようにするためには、同じくコントロールパネルの「地域と言語のオプション」−「言語」タブの「詳細」を押し、 「インストールされているサービス」の「追加」を押して、必要な言語をどんどんインストールします。 さしあたりは「入力言語」のところは「サンスクリット」や「ヒンディー語」を選びます。
     キーボードレイアウトの部分は、 サンスクリットなら「デバナガリ−INSCRIPT」、 ヒンディー語なら「ヒンディー語トラディショナル」と表示されているはずです。 とりあえずはそのままにしておきましょう。
     この作業は、あとで画面右下などにあるIMEのツールバーを右クリックして「設定」を選んでもすることができます。 後で変更がきくので落ち着いてやりましょう。

  2. Arial Unicode MSをインストールする
     上の作業でもうデーヴァナーガリーは扱えますが、 Mangalの字体は下にあるとおり美しくないので、 マイクロソフト社のユニコードフォント、 Arial Unicode MSをインストールすることをおすすめします。
     このフォントは、以前は無償配布していたのですが、 現在ではMicrosoft Officeにしか付属していません。 Officeをインストールするときに、 「Officeツール」の「インターナショナルサポート」の 「ユニバーサルフォント」をインストールするよう設定しましょう。 もちろん後からでも追加することは可能です。 いろいろなやりかたがありますが、 例えばマイクロソフトのサイトの、 [WD2002] Arial Unicode MS フォントに関する一般情報を見てください。
     このArial Unicode MSフォントは、 Officeのバージョンアップによって内容が変更されているようです。 以前、Office2000についていたやつは、 デーヴァナーガリーの書体はMangalと同じちゃちなゴシック体でしたが、 Office2003についてくるやつはきれいな書体(下を参照)に変わっています。 また、その他のインド系も、以前はパンジャビー(グルムキー)、 グジャラート、タミル、テルグぐらいしか入っていませんでしたが、 Office2003のは、新たにベンガル、オリヤー、シンハラ、カナラ(カンナダ)、 マラヤラムが入ってました。 これらは制限つきサポートのようですが、 ともあれこのところインド系文字のサポート状況が急速によくなってきつつあるので、 ソフトはちゃんとバージョンアップしたほうがよさそうです。 WordだけでもかまわないからOfficeはバージョンアップしたほうがよさそうです。
     Officeを使っていない人は…… 実はArial Unicode MSをこっそりアップしているサイトはけっこうあります。 各種検索エンジンで、 Arial Unicode MSとか、そのファイル名の arialuni.ttf で検索してみましょう。 当サイトでは……、 会員登録してくれたらなんとかなるかもしれません。
    [2006/5/1補足]
    その後現在では、フリーのデーヴァナーガリーフォントがいろいろ出回るようになりました。 David McCreedy's Gallery of Unicode Fontsというリンク集にリンクされているいろいろなフォントから好きなものを選んでダウンロード、インストールしてみてください。

  3. Office XPでデーヴァナーガリーを使う
     上記によってWindows XP上の各アプリケーションでデーヴァナーガリーを一応使えるようになったはずです (IMEのツールバー(通常は画面右下あたりにあります)の一番左の「JP」と書いてあるところをクリックして、言語を変更します)。 たとえばメモ帳も、Windows XP上ならば、 フォントをArial Unicode MSに変更すれば、 デーヴァナーガリーを表示、入力することができます。 しかし一部のアプリケーションでは、 アプリケーション側でデーヴァナーガリーのような文字の各要素を複合させていくシステムにちゃんと対応しておらず、 カーソル位置がずれてしまったり、いろいろ不具合が起こります。 OfficeではXPから対応したようです。 実際、Office2000では入力していくにつれカーソル位置がずれてしまい、使い物になりません。
     Officeに付属する「言語設定」(たとえば「スタート」−「プログラム」−「Microsoft Office」−「Microsoft Officeツール」−「Microsoft Office XP(または2003) 言語設定」で起動します)「使用する言語」を選んで「追加」とします。 これをしないとOffice側でうまくデーヴァナーガーリーを扱えるようになりません。
     デーヴァナーガリーを入力したいところでは、上述のように、MS-IMEのツールバーの「JP」と書いてあるところをクリックして、言語を変更します。 ヒンディーやサンスクリットを選ぶとすると自動的にフォントがMangalになると思います。 キーボードレイアウトは次に述べます。
     デーヴァナーガリーは音節文字なので、音節単位で確定されてしまいますが、 たとえばに変えたい場合は、 字と記号の間にはカーソルは移動しませんが、 あわてずに全体の末尾にカーソルを持っていってBackSpaceキーを押すと、 記号だけが消えるので、i記号キーを押せばkiになります。
     WordばかりかExcelでも正常に入力できると思いますし、もちろんソートすると一応それなりにデーヴァナーガリーの順序になります(細かい点は違う)。
     Mangalの書体はちゃちなゴシック体というところですが、 Arial Unicode MS(フォント一覧では、英字フォントのAのところでなく、日本語フォントのAのところにあるのに注意) を用いると、まともなデーヴァナーガリーになります。
    MangalArial Unicode MS


  4. キーボードレイアウト
     以下のとおりです(「デバナガリ−INSCRIPT」の場合)。





     一見雑然としているようですが実は整然と配列されています。
     まず左手が母音記号、右手が子音になっています。 シフトを押すと、左手は母音単独文字、右手は有気音を主体とした子音文字になります。
     母音の配列は、中指がa系、人差し指がi系とu系、薬指がe系、小指がo系になっています。 子音の配列は、k系が中指、c系が小指、系が小指、t系が薬指、p系が人差し指に割り当てられています。 鼻音や半子音、ヴィサルガやアヌスヴァーラやアヌナーシカがどこになるかは上図を見てください。 サンスクリットやヒンディー語には出てこないような見慣れない字母がいくつかあるかもしれませんが、各字母の意味は、下の「関連サイト」の「Unicode デーヴァナーガリー コード表」を参照してください。
     結合子音は、子音字を打ったあとヴィラーマ(Dのキー)で子音のみにした上で、さらに子音字を押すと、自動的に組んでくれます。 少々キー操作が多くて面倒ですね。 よく使うはシフト6、 はシフト7、 はシフト8にありますし、 はシフト4、 はシフト3にあります。
     たいていの結合子音はOKだと思いますが、たまにダメなものがあり、 そういう場合はヴィラーマのままで我慢するしかありません。 ではじまる結合子音は軒並みダメのようです。 もっとも、などは代用アヌスヴァーラにすればいいんですけど。
     3番目の図のAltGrというのは右側のAltキーを押しながら入力するものです(Ctrl+Altでも同じです)。 4番目はAltGrとシフト(左右どちらでも可)を押しながら入力するものです(同様にCtrl+Alt+シフトも可)。 ここには主に、インド式の数字や、ヒンディー語などで使う加点された字母やアヴァグラハなどが入っています。
     空欄になっているキーは、押しても何も反応しません。 もっとも、アプリケーションの中には、独自にキーを定義しているものがあります。 たとえばMicrosoft Wordでは、AltGr+Tで「TM」など、いろいろ出てくると思いますが、あくまでそれは、アプリケーション独自の機能なので、ここでは割愛します。 逆に、そういうアプリケーション独自のキー定義とバッティングするケースがあるかもしれません。 そういう場合は、アプリケーション側の設定変更が必要になることがあるかもしれません。

     なお、上述のように、「ヒンディー語」をインストールしようとすると、デフォルトのキーボードは「ヒンディー語トラディショナル」になります。 これは次のようなキー配列になっています。





     「デバナガリ−INSCRIPT」と比べて、特殊な字母が削除されているかわり、AltGrで英字記号がいろいろ打てるようになっています。 こういう英字記号は「デバナガリ−INSCRIPT」では入力できないので、いちいちキーボードの種類を変更しなければいけません。 特にヒンディー語では?なども使うので、そういう場合は「ヒンディー語トラディショナル」のほうが便利です。 反面、アヴァグラハ記号が打てなくなるのがつらいです。 ヒンディー語でもアヴァグラハは、くだけた場面で長音符号(日本語の「おーい」みたいな)として使うことはあると思うんですけどね。
     もちろん、アプリケーションに特殊文字を入力する機能があれば(Wordなら「挿入」−「記号と特殊文字」)それを使えばいいですし、言語やキーボードの種類を変更すればいいんですけどね。
     マウスを使わなくても、ShiftとAlt(左右どちらでも)だけを同時に押して離すと、言語が切り替わっていきます。 一つの言語に複数のキーボードレイアウトをインストールしている場合(日本語入力用IMEを複数インストールしている場合もこれにあたります)は、ShiftとCtrlだけを同時に押して離すと、キーボードレイアウトが切り替わっていきます。
    [2006/7/1補足]
    なお、キーボードのレイアウトを覚えられない間は、「スクリーンキーボード」を用いることをお勧めします(下図)。これはもともと身体に障害があったりしてキーボードを打てない人のためのユーティリティで、ふつうは余り用いられないので知らない人も多いですが、ちゃんと最初からWindowsに入っています([スタート]−[プログラム]−[アクセサリ]−[ユーザー補助])。これを用いれば画面に常にキーボードレイアウトが表示されますので、これを参考にしながらキーボードをウってもかまいませんし、マウスでクリックして入力することもできます。言語を変えれば自動的にキーボードレイアウトも変わりますし、シフトやAltGrを押すとやはりそれに対応してキーボードレイアウトが変わります。ただしAltGr+シフトには対応していないようです。


  5. Officeとデータのやりとりをする
     さて、今までKH法などのローマナイズでサンスクリットのテキストを書きためていたとします。 これをデーヴァナーガリーに変更してWordに読み込ませることを考えてみましょう。
     ちゃんとした言語を使うのか、 それともエディタやアプリケーションのマクロ機能などを使うのか、 いろいろなやり方があると思うので、ここではヒントだけを書きます。
     やり方のアウトラインは、Unicodeに変換してWordに読み込ませるというわけなのですが、 Unicodeテキストというのはバイナリみたいなものなので、マクロなどで作るのには面倒です。 そこで仲介役としてMS-IEなどのブラウザに登場してもらいます。 HTMLファイルの中に、&#xxxxx;という形でUnicodeを書けば、ブラウザはそのコードに相当する文字を表示してくれます。 これをコピー&ペーストすれば、Wordにうまく貼りつくというわけです。 そこで……
    1. まずは出力ファイルにHTMLのヘッダを書き出す。 ともかくシンプル、必要最小限に、<HTML><HEAD></HEAD><BODY>だけでよい(実際にはもちろん半角)。
    2. 以後は、KH法で書かれたテキストを、&#xxxxx;というUnicodeタグの列に直して書き出していく。 Unicodeの表は下の「関連サイト」の「Unicode デーヴァナーガリー コード表」を参照。 16進数で書かれているので10進数に直す。 たとえばaの独立体は0905と書かれているが、それは16進数なので、10進数の2309に直して、अと書く(実際にはもちろん半角)。 もちろん16進数で、अなどと書いてもかまわない。
    3. 最後に</BODY></HTML>と書き出す。
    4. 書き出したファイルをブラウザで読む。
    5. コピー&ペーストでWordに貼り付ける。
     コードは、キーボードで入力するのと同じ要領で並べればよい。 たとえばkiは、kaが2325で、iの母音記号形が2367なので、そのままकिと書けばよい。 別に、iは左側だから先に書かねばならないなどということはない。 結合子音はヴィラーマを使う。 たとえばstaは、saが2360、ヴィラーマが2381、taが2340なので、स्तとする。 これだけで、あら不思議、ブラウザはちゃんとstaの結合子音形で表示してくれるし、Wordやメモ帳に貼り付けても結合子音形になってくれます。
     実際まんどぅーかは、ローマ字で入力したテキストファイルを、このような文字列を含んだHTMLファイルに変換するプログラムを作っており、それでWordなりメモ帳なりに読み込ませています。

  6. 関連サイト
    1. Unicode デーヴァナーガリー コード表
    2. マイクロソフト キーボードレイアウト




※ご意見、ご教示などは、に戻り、掲示板あるいはメールで賜るとありがたく思います。