ISCII

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

ISCII (Indian Script Code for Information Interchange सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता情報じょうほう交換こうかんようインド文字もじ符号ふごう IS13194:1991) はインド各種かくしゅ書記しょきけい表現ひょうげんするための符号ふごう方式ほうしきである。主要しゅようインドけい文字もじマ字まじ転写てんしゃ符号ふごうする。対応たいおうしている用字ようじけい以下いかとおり: アッサム文字もじベンガル文字もじデーヴァナーガリーグジャラーティー文字もじグルムキー文字もじカンナダ文字もじマラヤーラム文字もじオリヤー文字もじタミル文字もじ、およびテルグ文字もじ。ISCIIはアラビア文字もじもとづく書記しょきけい符号ふごうしないが、それにもかかわらず、カシミールシンドウルドゥーペルシアパシュトーおよびアラビア書記しょきけい符号ふごう提供ていきょうされている。アラビア文字もじもとづく書記しょきけいは、そのPASCII文字もじコードで符号ふごうされた。

ブラーフミー文字もじから派生はせいした書記しょきけいはそのほとんどが類似るいじした構造こうぞうつが、文字もじ形状けいじょうことなるため、ISCIIはおなおん文字もじおな符号ふごう位置いち符号ふごうして、各種かくしゅ用字ようじけいかさわせている。たとえば、ISCII符号ふごう0xB3 0xDBは[ki]あらわす。これはデーヴァナーガリーではकिのように、グルムキー文字もじではਕਿのように、そしてタミル文字もじではகிのように描画びょうがされる。書記しょきけいはリッチテキストではマークアップによって選択せんたくされ、プレーンテキストでは後述こうじゅつのATRをもちいて選択せんたくされる。

単一たんいつ符号ふごう使用しようする動機どうきの1つは、ある書記しょきけいからのものへのこぼし容易よういになることである。しかしながら、あまりに互換ごかんせいおおきいためこれは実際じっさいには現実げんじつてきかんがえではない。ISCIIについて英語えいご参照さんしょう

ISCIIは固定こていちょうの8ビット符号ふごうである。下位かい128符号ふごう位置いちASCIIそのままで、上位じょうい128符号ふごう位置いちがISCII特有とくゆうである。 ISCIIではデフォルトで使つかわれる「デフォルト書記しょきけい」を指定していする手段しゅだん提供ていきょうされていない。

ATR符号ふごう[編集へんしゅう]

文字もじ表現ひょうげんする符号ふごう位置いちくわえ、ISCIIは略号りゃくごうがATR(0xE0)とばれる符号ふごう位置いち提供ていきょうされている。ATRは書記しょきけいまたはフォント属性ぞくせいえを指定していする。

ATRにつづき、0x42 - 0x4Bが指定していされた場合ばあいは、デーヴァナーガリー(0x42)、ベンガル文字もじ(0x43)、タミル文字もじ(0x44)、テルグ文字もじ(0x45)、 アッサム文字もじ(0x46)、オリヤー文字もじ(0x47)、カンナダ文字もじ(0x48)、マラヤーラム文字もじ(0x49)、グジャラーティー文字もじ(0x4a)、グルムキー文字もじ(0x4b)へえられ、ふたたびATRによるデフォルト指定してい(0x40)または改行かいぎょうべつ書記しょきけい指定していがくるまでつづく。これらの指定していされているあいだは、ASCIIの数字すうじもまた、かく書記しょきけい数字すうじ表示ひょうじされる。また、0x41が指定していされた場合ばあいは、マ字まじ転写てんしゃ表示ひょうじされる。

ATRにつづき0x71 - 0x76が指定していされた場合ばあいは、アラビア(0x71)、ペルシア(0x72)、ウルドゥー(0x73)、シンド(0x74)、カシミール(0x75)、パシュトー(0x76)などのアラビア文字もじけい表示ひょうじされることになっているが、ISCIIではそれらの詳細しょうさい規定きていしていない。

ATRにつづき、0x30 - 0x39が指定していされた場合ばあいは、太字ふとじ斜体しゃたい下線かせんき、ばいはばなどの表示ひょうじモードを指定していする。ATRの詳細しょうさい用法ようほうはISCIIの附属ふぞくしょEに規定きていされている。

EXT符号ふごう[編集へんしゅう]

ISCIIはさらに、EXT(0xF0)とばれる符号ふごう位置いち利用りようすることで、ヴェーダ文字もじ使用しようすることができる。ヴェーダ文字もじデーヴァナーガリー拡張かくちょうかんがえることができ、EXTをまえおけすることで『リグ・ヴェーダとう使用しようされる調音ちょうおん記号きごうや『くろヤジュル・ヴェーダ』や『しろヤジュル・ヴェーダ特有とくゆう様々さまざまアヌスヴァーラ鼻音びおん文字もじとう表現ひょうげんすることができる。EXT指定していによるヴェーダ文字もじについては、ATRによる書記しょきけいマ字まじ転写てんしゃへの指定してい無視むしされる。EXTで表現ひょうげんできる文字もじは、udātta(0xB6)やanudātta(0xBE)のような修飾しゅうしょく文字もじ(0xB4 - 0xBE)とそれ以外いがい修飾しゅうしょく文字もじ(0xA1 - 0xB3)にかれ、修飾しゅうしょく文字もじ出現しゅつげんできる箇所かしょデーヴァナーガリーかく音節おんせつのちか、または修飾しゅうしょく文字もじのち限定げんていされている。

Unicodeとの対応たいおう[編集へんしゅう]

UnicodeではISCIIのようにATRでえるのではなく、ことなる文字もじ体系たいけいについては基本きほんてきことなるブロックがてられる。デーヴァナーガリーはU+0900、ベンガル・アッサム文字もじはU+0980、グルムキー文字もじはU+0A00、グジャラーティー文字もじはU+0A80、オリヤー文字もじはU+0B00、タミル文字もじはU+0B80、テルグ文字もじはU+0C00、カンナダ文字もじはU+0C80、マラヤーラム文字もじはU+0D00からはじまるブロックを使用しようする。ヌクタ(てん)つきの文字もじ独立どくりつした符号ふごう位置いちつ。ただしかくブロックのなか配列はいれつじゅんはISCIIとの互換ごかんせいたかい。

ISCIIでEXTを使つかって表現ひょうげんされるヴェーダよう文字もじは2009ねんのUnicodeバージョン5.2で追加ついかされた[1][2]

ISCIIでハラント(ヴィラーマ)とINV(D9)を使つかって表現ひょうげんされるはんからだは、Unicodeではハラントとゼロぶく接合せつごう(ZWJ)を使用しようする。ISCIIではハラントを2かいかさねて明示めいじてきにハラントつきの子音しいん表示ひょうじするが、Unicodeではハラントにゼロぶく接合せつごう(ZWNJ)をわせる。

ISCIIの利用りようじょうきょう[編集へんしゅう]

ISCIIは若干じゃっかん政府せいふ機関きかん使つかわれたのみで、ひろ使つかわれることはなかったが、いまやUnicodeによってほとんど時代遅じだいおくれとなった。Unicodeはインドけい文字もじ書記しょきけいごとに分離ぶんりしたブロックを使つかっているが、おおむねかくブロックないでISCIIの配置はいち保存ほぞんしている。

なお、インドにはIS 13194(ISCII)のほか文字もじコード規格きかくとして、IS 10315 (ASCIIとおなじ)、IS 12326 (ISO/IEC 2022とおなじ)とうがある。

脚注きゃくちゅう[編集へんしゅう]

参考さんこう資料しりょう[編集へんしゅう]

外部がいぶリンク[編集へんしゅう]