(Translated by https://www.hiragana.jp/)
CJKV - Wikipedia コンテンツにスキップ

CJKV

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
CJKVをあらわ漢字かんじたてじゅんに「かんかんこし

CJKV は、中国ちゅうごく日本語にほんご朝鮮ちょうせんベトナム (えい: Chinese-Japanese-Korean-Vietnamese) のりゃくとくに、そのよん言語げんご共通きょうつうして使つかわれる、または使つかわれていた文字もじ体系たいけいである漢字かんじチュノムふくむ)のこと。ソフトウェア国際こくさいなかでも文字もじコードかんする分野ぶんやもちいられる。

比較的ひかくてきはやくに漢字かんじ廃止はいしし、漢字かんじふくめるべきか諸説しょせつあるチュノムをようするベトナムのぞいた中国ちゅうごく日本語にほんご朝鮮ちょうせん頭文字かしらもじだけをとって CJKぶこともある。おもひがしアジア書記しょきけい総称そうしょうするときにもちいられる。用語ようご使用しよう頻度ひんどは CJKV より CJK のほうがおおいが、CJK といながら実際じっさいは CJKV についてべていることもおおい。

特徴とくちょう

[編集へんしゅう]

マルチバイト文字もじ

[編集へんしゅう]

中国ちゅうごく日本語にほんご朝鮮ちょうせんコンピュータあつか場合ばあい英数字えいすうじプログラミング操作そうさ使つかわれる記号きごうくわえ、漢字かんじ平仮名ひらがな片仮名かたかなハングル必要ひつようとなる。これらの文字もじ集合しゅうごうは、欧米おうべい言語げんごおおくがもちいているようなアルファベットとはことなり、1 バイト (8ビット) で表現ひょうげんできる文字もじ総数そうすうおおきくえている。このため、これらの言語げんごではマルチバイト文字もじ使つかうことになる。

文字もじ入力にゅうりょく

[編集へんしゅう]

漢字かんじ平仮名ひらがな片仮名かたかな・ハングル(とく漢字かんじ)は文字もじ集合しゅうごうおおきいので、すべての文字もじキーボード直接ちょくせつてると巨大きょだいなものとなり、習得しゅうとくむずかしくなってしまう。そのため現在げんざいでは、英字えいじキーボード、もしくはそれにいくつかのキーを追加ついかしたキーボードとソフトウェアによるインプットメソッド使用しようして入力にゅうりょくすることが一般いっぱんてきである。そのためには入力にゅうりょくさきとなるソフトウェアが、使用しようしているインプットメソッドに対応たいおうしている必要ひつようがある。

漢字かんじもちいる日本語にほんご中国ちゅうごくでは、みを入力にゅうりょくしてソフトウェアで変換へんかんおこない、目的もくてき表記ひょうき種類しゅるいのインプットメソッドが一般いっぱんてきである(Microsoft IMEGoogle 日本語にほんご入力にゅうりょくATOKSKK など)。みによるインプットメソッドは、さらに変換へんかん区切くぎりによって漢字かんじ 1 文字もじ単位たんいとするたん漢字かんじ変換へんかん漢字かんじ熟語じゅくご助詞じょし構成こうせいされる文節ぶんせつならびを単位たんいとする連文節れんぶんせつ変換へんかんなどにけられる。中国ちゅうごくでは文字もじ全体ぜんたい形状けいじょう分類ぶんるい一部いちぶ筆画ひっかくあたえて漢字かんじ特定とくていするぴつがた輸入ゆにゅうほうなど、構造こうぞうもとづくインプットメソッドも使つかわれている[1]朝鮮ちょうせんのインプットメソッドでは、ハングルを構成こうせいする要素ようそであるチャモ字母じぼ単位たんい入力にゅうりょくおこな方法ほうほう一般いっぱんてきである[2]

組版くみはん

[編集へんしゅう]

おも紙面しめんじょう文書ぶんしょつくさい、CJKV では欧米おうべい言語げんごことなる組版くみはん方法ほうほう必要ひつようになる。

たてたて)はそのひとつである。コンピュータのテキスト表示ひょうじおよび処理しょり元来がんらい横書よこがきであったが、CJK/CJKV のテキストは伝統でんとうてきたてきであるため、組版くみはんではたてきへの対応たいおうもとめられる。そのさいにはたんたて表示ひょうじするだけではなく、文字もじ間隔かんかく配置はいちたて対応たいおうにしなければならない[3]

また、CJKV の組版くみはんではたてみ、よこみのどちらであっても、正方形せいほうけい構成こうせいされる格子こうしうえ文字もじ配置はいちする機能きのうもとめられる。これは、漢字かんじ平仮名ひらがな片仮名かたかな・ハングルなど CJKV 特有とくゆう文字もじ大半たいはんが、正方形せいほうけい字形じけいつためである。しかし、一部いちぶ記号きごうラテン文字もじはそうでないため、それらが混在こんざいする文書ぶんしょではたてよう文字もじへのえなど、複雑ふくざつ処理しょり必要ひつようになる[4]

CJKV に適用てきようできる組版くみはん規則きそくさだめた規格きかくとしては、JIS X 4051-1995 (2004ねん改正かいせい)がられている[5]

文字もじコード規格きかく

[編集へんしゅう]

UnicodeCJK統合とうごう漢字かんじは、ベトナムの符号ふごう文字もじ集合しゅうごう規格きかくである TCVN 5773:1993 と TCVN 6056:1995 の漢字かんじチュニョチュノム)もはら規格きかくとして統合とうごうしており、実態じったいは CJKV である。たとえば、「U+7551 はたけ」には、日本語にほんご国字こくじの「はたけ」 (JIS X 0208-1990 の 482A) とチュノムの「はたけ」 (TCVN 5773:1993 の 3C2F) が統合とうごうされている。

脚注きゃくちゅう

[編集へんしゅう]
  1. ^ ランディ(2002)、pp.231-237
  2. ^ ランディ(2002)、pp.266-267
  3. ^ ランディ(2002)、p.347
  4. ^ ランディ(2002)、p.349
  5. ^ ランディ(2002)、pp.341-343

参考さんこう文献ぶんけん

[編集へんしゅう]
  • ケン・ランディCJKVにちちゅうかんえつ情報処理じょうほうしょりen:Ken Lunde(原著げんちょ)、小松こまつあきら逆井さかさい克己かつみ(わけ)、オライリー・ジャパン、2002ねん12月。ISBN 4-87311-108-0https://www.oreilly.co.jp/books/4873111080/ 

関連かんれん項目こうもく

[編集へんしゅう]

外部がいぶリンク

[編集へんしゅう]