(Translated by https://www.hiragana.jp/)
CJK統合漢字 - Wikipedia

CJK統合とうごう漢字かんじ

ISO/IEC 10646およびUnicodeの符号ふごうよう漢字かんじ集合しゅうごう、およびその符号ふごうひょう
Unicode > CJK統合とうごう漢字かんじ

(シージェーケーとうごうかんじ、えい: CJK unified ideographs)は、ISO/IEC 10646略称りゃくしょう:UCS[1])およびUnicodeユニコードにて採用さいようされている符号ふごうよう漢字かんじ集合しゅうごうおよびその符号ふごうひょうである。CJK統合とうごう漢字かんじ名称めいしょうは、中国ちゅうごくえい: Chinese)、日本語にほんごえい: Japanese)、朝鮮ちょうせんえい: Korean)で使つかわれている漢字かんじをひとまとめにしたことからきている。

CJK統合とうごう漢字かんじ初版しょはんであるUnified Repertoire and Orderingだいはんは1992ねん制定せいていされたが、1994ねんベトナム使つかわれていた漢字かんじふくめることにしたため、CJKV(CJKV統合とうごう漢字かんじ)とばれることもある。CJKVは、中国ちゅうごく日本語にほんご朝鮮ちょうせんベトナム(Vietnamese) をあらわ英語えいご頭文字かしらもじである。とくにそのよっつの言語げんご共通きょうつうして使つかわれる、または使つかわれていた文字もじ体系たいけいである漢字かんじチュノムふくむ)のこと。ソフトウェア国際こくさいなかでも文字もじコードかんする分野ぶんやもちいられる。

CJK統合とうごう漢字かんじは、中国ちゅうごく台湾たいわん日本にっぽん北朝鮮きたちょうせん韓国かんこくベトナム各国かっこく地域ちいき工業こうぎょう規格きかくさだめられた漢字かんじコードとの対応たいおうひょうさだめているが、事情じじょうによりCJK統合とうごう漢字かんじとの対応たいおうたない各国かっこくかく地域ちいき漢字かんじコードをUCSに適切てきせつ変換へんかんできるよう、互換ごかんよう領域りょういき別途べっとさだめられている。この領域りょういき漢字かんじCJK互換ごかん漢字かんじ[2]ばれる。

1978ねん日本にっぽんによって世界せかい最初さいしょISO 2022もとづく漢字かんじコード規格きかくJIS C 6226制定せいていされた。1980年代ねんだいには中国ちゅうごく台湾たいわん韓国かんこく次々つぎつぎ各国かっこく地域ちいきよう漢字かんじコード規格きかく制定せいていされていったが、これらはたがいに関連かんれんせいがなく、混在こんざいさせて使用しようするにはISO 2022のエスケープ・シーケンスで漢字かんじコードひょうえるしかなかった。

1980ねん国立こくりつ国会図書館こっかいとしょかん高橋たかはし徳太郎とくたろうおも書誌しょしがく観点かんてんから、ひがしアジアの統一とういつ漢字かんじコードの必要ひつようせい指摘してきした。同年どうねん台湾たいわん制定せいていされた3バイト漢字かんじコード規格きかくCCCIIは、おそらく日本にっぽん中国ちゅうごく台湾たいわん漢字かんじ統一とういつてきあつかうことを目的もくてきとした最初さいしょ規格きかくひとつである。この規格きかくひがしアジアの文献ぶんけん情報じょうほうようにアメリカでもANSI Z 39.64として採用さいようされた。

1984ねん、ISOの文字もじコード規格きかく委員いいんかい (ISO/TC 97 - SC2) は文字もじセットのえをおこなわずに世界中せかいじゅう文字もじ単一たんいつ文字もじ集合しゅうごうとしてあつかえる文字もじコード規格きかく (ISO 10646) を作成さくせいすることを決定けっていし、せんもんのワークグループ (WG2) を設置せっちした。当初とうしょ、この文字もじコード規格きかくは16ビットを想定そうていし、そのなか日本にっぽん中国ちゅうごくなど各国かっこく漢字かんじコードひょうをそのままれることを想定そうていしていた。しかし中国ちゅうごくはこの方式ほうしきでは自国じこく現在げんざい策定さくていちゅう漢字かんじコードがすべはいらなくなるとしてこの方針ほうしん反対はんたい[よう出典しゅってん]1989ねん各国かっこく漢字かんじコードを統合とうごうした漢字かんじ集合しゅうごうHCC[3]のアイデアを提案ていあんした。

1990ねん完成かんせいしたISO 10646の初版しょはんドラフト (DIS 10646) では、漢字かんじコードは32ビットで表現ひょうげんされ、各国かっこく漢字かんじコードはそのままれることになった。しかし中国ちゅうごく漢字かんじ各国かっこくでばらばらに符号ふごうするのではなく、あくまで統一とういつしてあつかうことをもとめてこのドラフトには当初とうしょから反対はんたいしており、今後こんご漢字かんじコードの方針ほうしんめるため、ワークグループはCJK-JRGばれるグループを別途べっと設置せっちし、そこでつづ検討けんとうすることにした。

一方いっぽう1987ねんころから、ゼロックスのジョー・ベッカー[4]とリー・コリンズ[5]世界中せかいじゅう文字もじ統一とういつしてあつかえる文字もじコードUnicodeを開発かいはつしていた。1989ねん発表はっぴょうされたUnicodeの概要がいようでは、その基本きほんポリシーとして、16ビットですべての文字もじあつかえることを目指めざしており、そのために日本にっぽん中国ちゅうごく韓国かんこく漢字かんじ統一とういつすることとしていた。1990ねんにはこの方針ほうしんもとづいた最終さいしゅうドラフトが完成かんせい、それに賛同さんどうする企業きぎょうによって、よく1991ねん1がつにはUnicodeコンソーシアム設立せつりつされた。このドラフトでは、日本にっぽん中国ちゅうごく韓国かんこく漢字かんじ類似るいじする漢字かんじ統合とうごうすることで2まんじゃく漢字かんじコードをれ、さらに将来しょうらい拡張かくちょうように、3まん程度ていど漢字かんじ領域りょういきべつ用意よういされていた。

1991ねん、ISO/IEC 10646の初版しょはんドラフトはUnicodeとの一本いっぽんもとめる各国かっこくにより否決ひけつされ、また中国ちゅうごくおよびUnicodeコンソーシアムの要請ようせいにより、CJK-JRGにおいて、ISO 10646とUnicodeの一本いっぽんはかられることになった。CJK-JRGは各国かっこく漢字かんじコードにもとづき独自どくじ統合とうごう規準きじゅんさだめ、ISO 10646とUnicodeよう統合とうごう漢字かんじコードひょう作成さくせいした。1991ねんまつ、この文字もじひょうはUnified Repertoire and Ordering (URO) として完成かんせいした。

1992ねん、UROをんだISO 10646のはんドラフトが完成かんせいし、賛成さんせい多数たすう国際こくさい規格きかくされた。ただしUROには若干じゃっかん間違まちがいが発見はっけんされており、それらの修正しゅうせいおこなわれている。

1993ねん5月、U+4E00〜U+9FFFのブロックに最初さいしょのCJK統合とうごう漢字かんじ、20,902てられたISO/IEC 10646が正式せいしき制定せいていされ、その1カ月かげつには内容ないようおなじくするUnicode 1.1が制定せいていされた。

1999ねん、Unicode 3.0で、ISO/IEC 10646の修正しゅうせいあん17において、CJK統合とうごう漢字かんじ拡張かくちょうAとして、U+3400〜U+4DFFのブロックに6,582追加ついかされた[6]当初とうしょは6,584文字もじ予定よていであったが、そのうち2文字もじ互換ごかん漢字かんじ領域りょういきにあったため、互換ごかん領域りょういきの2文字もじ拡張かくちょうAとしてあつかうことにして、この2文字もじ追加ついか集合しゅうごうからは削除さくじょされた[7]どう時期じき発行はっこうされた修正しゅうせいあん13において、URO漢字かんじのうち中国ちゅうごくげん規格きかくがない文字もじたいして、GB 16500にもとづく新規しんきげん規格きかくてがおこなわれ[8]、ベトナムの文字もじらん追加ついかされCTJKVの5らん併記へいきとなった[9]

2001ねん、Unicode 3.1で、ISO/IEC 10646-2として、CJK統合とうごう漢字かんじ拡張かくちょうBに42,711が、U+20000〜U+2A6FFのブロックに追加ついかされた。しかしながら、非常ひじょう膨大ぼうだい漢字かんじ集合しゅうごうきわめて短期間たんきかんのうちにさだめたため、漢字かんじ重複じゅうふく字形じけいあやまりが多数たすう発生はっせいした。

2005ねん、Unicode 4.1で、ISO/IEC 10646:2003修正しゅうせいあん1として、基本きほん多言たげんめん (BMP) のU+9FA6〜U+9FBBに22文字もじ漢字かんじ追加ついかされて20,924文字もじになった。

2008ねん、Unicode 5.1で、基本きほん多言たげんめんのU+9FBC〜U+9FC3に8文字もじ追加ついかされて20,932文字もじになった。

2009ねん、Unicode 5.2で、拡張かくちょうCの4,149文字もじがU+2A700〜U+2B734に、基本きほん多言たげんめんでもU+9FC4〜U+9FCBに8文字もじ追加ついかされて20,940文字もじになった。

2010ねん、Unicode 6.0で、拡張かくちょうDの222文字もじがU+2B740〜U+2B81Fに追加ついかされた。

2012ねん、Unicode 6.1で、基本きほん多言たげんめんのU+9FCCに1文字もじ追加ついかされて20,941文字もじになった。

2015ねん、Unicode 8.0で、拡張かくちょうEの5,762文字もじがU+2B820〜U+2CEAFに追加ついかされた。基本きほん多言たげんめんでもU+9FCD〜U+9FD5に9文字もじ追加ついかされて20,950文字もじになった。

2017ねん、Unicode 10.0で、拡張かくちょうFの7,473文字もじがU+2CEB0〜U+2EBE0に追加ついかされた。基本きほん多言たげんめんでもU+9FD6〜U+9FEAに21文字もじ追加ついかされて20,971文字もじになった。

2018ねん、Unicode 11.0で、基本きほん多言たげんめんのU+9FEB〜U+9FEFに5文字もじ追加ついかされて20,976文字もじになった。

2020ねん、Unicode 13.0で、拡張かくちょうGの4,939文字もじがU+30000〜U+3134Aに追加ついかされた。基本きほん多言たげんめんのU+9FF0〜U+9FFCに13文字もじ追加ついかされて20,989文字もじになった。拡張かくちょうAのU+4DB6〜U+4DBFに10文字もじ追加ついかされて6,592文字もじになった。拡張かくちょうBのU+2A6D7〜U+2A6DDに7文字もじ追加ついかされて42,718文字もじになった

2021ねん、Unicode 14.0で、基本きほん多言たげんめんのU+9FFD〜U+9FFFに3文字もじ追加ついかされて20,992文字もじになった。拡張かくちょうBのU+2A6DE〜U+2A6DFに2文字もじ追加ついかされて42,720文字もじになった。拡張かくちょうCのU+2A735〜U+2A738に4文字もじ追加ついかされて4,153文字もじになった。

2022ねん、Unicode 15.0で、拡張かくちょうHの4,193文字もじがU+31350〜U+323AF, 拡張かくちょうCのU+2A739に1文字もじ追加ついかされて4,194文字もじになった。

2023ねん、Unicode 15.1で、拡張かくちょうIの622文字もじがU+2EBF0〜U+2EE5Fが追加ついかされて622文字もじになった。

2024ねん9月、Unicode 16.0で、拡張かくちょうJの4,300文字もじがU+323B0〜U+3347Bに追加ついか予定よてい[10]

Unicode 15.1 段階だんかいでの文字数もじすう以下いかとおりである(互換ごかん漢字かんじブロックにあり、統合とうごう漢字かんじじゅんじて同等どうとうあつかわれる12くわえると97,680文字もじになる)。

はん  かこえ    しょう JIS日本語にほんご通用つうよう名称めいしょう  かず
U+4E00 - U+9FFF CJK Unified Ideographs CJK統合とうごう漢字かんじ 20,992
U+3400 - U+4DBF CJK Unified Ideographs Extension A CJK統合とうごう漢字かんじ拡張かくちょうA 6,592
U+20000 - U+2A6DF CJK Unified Ideographs Extension B CJK統合とうごう漢字かんじ拡張かくちょうB 42,720
U+2A700 - U+2B739 CJK Unified Ideographs Extension C CJK統合とうごう漢字かんじ拡張かくちょうC 4,154
U+2B740 - U+2B81D CJK Unified Ideographs Extension D CJK統合とうごう漢字かんじ拡張かくちょうD 222
U+2B820 - U+2CEA1 CJK Unified Ideographs Extension E CJK統合とうごう漢字かんじ拡張かくちょうE 5,762
U+2CEB0 - U+2EBE0 CJK Unified Ideographs Extension F CJK統合とうごう漢字かんじ拡張かくちょうF 7,473
U+30000 - U+3134A CJK Unified Ideographs Extension G CJK統合とうごう漢字かんじ拡張かくちょうG 4,939
U+31350 - U+323AF CJK Unified Ideographs Extension H CJK統合とうごう漢字かんじ拡張かくちょうH 4,192
U+2EBF0 - U+2EE5F CJK Unified Ideographs Extension I CJK統合とうごう漢字かんじ拡張かくちょうI 624
合計ごうけい 97,670

CJK統合とうごう漢字かんじ特徴とくちょう問題もんだいてん

編集へんしゅう

将来しょうらい予定よてい

編集へんしゅう

中国ちゅうごくは『かん字典じてん』や、たけしをはじめとする少数しょうすう民族みんぞく使つかわれている特殊とくしゅ漢字かんじなどの文字もじをすべてUCSに収録しゅうろくさせようとしており、日本にっぽん韓国かんこく、ベトナムでも漢字かんじ国字こくじ韓国かんこく国字こくじチュノムなど)の追加ついか提案ていあんがあるため、Unicode16.0では拡張かくちょうJの追加ついか予定よていがあるほか、Unicodeの今後こんごのバージョンでは、CJK統合とうごう漢字かんじ拡張かくちょうブロックが今後こんごさら増加ぞうかする可能かのうせいがある。

甲骨文字こうこつもじ金文きんぶん小篆しょうてんなどの古代こだい文字もじについては、だいさん漢字かんじめん追加ついかすることが検討けんとうされている。

漢字かんじ部品ぶひん仮名かめいやアルファベットとうわせた文字もじ(⿸广K(けい略字りゃくじ)・⿱宀R(りょう略字りゃくじ)・⿰キ(略字りゃくじ)・⿱⿰⿱コン⿱クリ(コンクリート)など)[11]や、仏教ぶっきょうしゃくのり呪文じゅもんとう使つかわれた奇妙きみょう字形じけい文字もじ イン (ふつ))・⿴〇⿻𠃊冂(エン)など)[12]は、通常つうじょう漢字かんじとはべつのブロックとしての追加ついか検討けんとうされている。

CJK互換ごかん漢字かんじ

編集へんしゅう

U+F900~U+FAFFのブロックである。Unicode 3.1では補助ほじょ集合しゅうごうとしてだい2めん追加ついか漢字かんじめん)にU+2F800~U+2FA1Fのブロックが追加ついかされた。基本きほんてきにCJK統合とうごう漢字かんじ重複じゅうふくする漢字かんじてられている。

CJK統合とうごう漢字かんじには、基本きほんてきひとつの漢字かんじひとつの符号ふごう位置いちしかあたえられないため、KS X 1001など各国かっこく規格きかくまったおながた漢字かんじ重複じゅうふくして収録しゅうろくされていた場合ばあい、Unicodeとの相互そうご変換へんかんおこなったさい可逆かぎゃくせいうしなわれることとなる。(KS X 1001の場合ばあいみにより分離ぶんりしているため、みがからなくなってこまることがある)。この問題もんだい解決かいけつするために、このブロックがつくられた。Big5あやまって重複じゅうふくしてしまった2もこのブロックにある。IBM拡張かくちょう漢字かんじのうちCJK統合とうごう漢字かんじれなかったものもあり、そのなかにはU+FA1F(﨟)やU+FA24(﨤)などCJK統合とうごう漢字かんじおな漢字かんじ存在そんざいしないため、CJK統合とうごう漢字かんじおなあつかいをするものが12ある。

Unicode 3.2では、JIS X 0213包摂ほうせつ基準きじゅん変更へんこうされ分離ぶんりされたもののうち、「あなど󠄁󠄁」や「そう󠄁󠄁」、「しゃ󠄁」などUnicodeでは包摂ほうせつされるものがこのブロックに追加ついかされた。これは、CJK統合とうごう漢字かんじ日本にっぽん以外いがいにも中国ちゅうごく韓国かんこく漢字かんじふくめたものであり、日本にっぽんだけのために包摂ほうせつ基準きじゅん変更へんこうして包摂ほうせつ分離ぶんりして追加ついかすると、くに国内こくない規格きかく対応たいおうするUnicodeのコード変更へんこうしなければならないことがあるからである。たとえば、「しゃ󠄁」など⽰偏の漢字かんじGB 18030ではへんが「⺭」のかたち採用さいようしているが、KS X 1001ではへんが「⺭」でなく「⺬」のかたち採用さいようしている。もし「しゃ󠄁」を包摂ほうせつ分離ぶんりしてCJK統合とうごう漢字かんじあらたな符号ふごう位置いち追加ついかしたとすると、GB 18030はそのままでよいが、KS X 1001の「しゃ󠄀」のコードとの対応たいおうあらたに追加ついかされたほう変更へんこうしなければならなくなる。

はら規格きかく

編集へんしゅう

漢字かんじのそれぞれの文字もじには、すくなくともひとつの原典げんてん参照さんしょうがある。[13]

注記ちゅうき 原典げんてん更新こうしんされても、原典げんてん参照さんしょうは、更新こうしんしない。更新こうしんされた原典げんてんは、ふるはんふくまれていない文字もじ識別しきべつだけにもちいてもよい。

原典げんてん G

編集へんしゅう

  原典げんてん G は、つぎのとおりに識別しきべつする。

  • G0 GB 2312-80
  • G1 GB 12345-90
  • G3 GB 7589-87 繁体字はんたいじ
  • G5 GB 7590-87 繁体字はんたいじ
  • G7 現代げんだい漢語かんご通用つうようひょうおよび簡化そうひょう
  • GS シンガポールにおける漢字かんじ
  • G8 GB 8565-88
  • G9 GB 18030-2000
  • GE GB 16500-95
  • GH GB 15564-1995 香港ほんこん一部いちぶ文字もじ放送ほうそうよう漢字かんじ体系たいけい
  • GK GB 12052-89 情報じょうほう交換こうかんようハングル文字もじ符号ふごう文字もじ情報じょうほう
  • G4K よん全書ぜんしょ
  • GBK 中国ちゅうごくだい百科全書ひゃっかぜんしょ
  • GCE 国家こっか教育きょういく研究けんきゅういん英語えいごばん
  • GCH うみ
  • GCY 辞源じげん
  • GCYY 中国ちゅうごくはか科学かがくいん用字ようじ
  • GDM 中国ちゅうごく公安こうあんしょう戸籍こせき人名じんめい地名ちめい漢字かんじ
  • GDZ 地質ちしつ出版しゅっぱんしゃ用字ようじ
  • GFC 現代げんだい漢語かんご規範きはんてんだいはん
  • GFZ 方正ほうせいはいばん系統けいとう
  • GGFZ 通用つうよう規範きはん漢字かんじ字典じてん
  • GGH 古代こだい漢語かんごてん
  • GHC 漢語かんごだいてん
  • GHF 漢文かんぶん仏典ぶってんうたぐなん俗字ぞくじ彙釈あずか研究けんきゅう
  • GHZ 漢語かんごだい字典じてん
  • GHZR 漢語かんごだい字典じてんだいはん
  • GIDC 中国ちゅうごく公安こうあんしょう ID システム
  • GIDC23 中国ちゅうごく公安こうあんしょう ID システム 2023
  • GIDCX 中国ちゅうごく公安こうあんしょう ID システム
  • GJZ 商務しょうむしるししょかん用字ようじ
  • GKX かん字典じてんおよかん字典じてん補遺ほい
  • GKJ Terms in Sciences and Technologies (科技かぎ用字ようじ) approved by the China National Committee for Terms in Sciences and Technologies (CNCTST)
  • GLGYJ たけしぞく嘹歌研究けんきゅう
  • GLK りゅうがん手鑑てかがみ
  • GOCD オックスフォードえいかんかんえいてん
  • GPGLG たけしぞくみん文化ぶんか叢書そうしょひらはて嘹歌
  • GRM 人民日報じんみんにっぽう漢字かんじ
  • GT 1983ねん標準ひょうじゅんでん碼本(修訂しゅうていほん)
  • GU 原典げんてん不明ふめい原典げんてんがあるとされたが、のちあやまりとされたなど)
  • GWZ 漢語かんごだいてん出版しゅっぱんしゃ用字ようじ
  • GXC 現代げんだい漢語かんごてん
  • GXH しんはな字典じてん
  • GXHZ しんはなだい字典じてん
  • GZ たけし字典じてん
  • GZA-1 生生せいせいいきてき伝承でんしょうこうあずかたけしぞくぎょうこう研究けんきゅう
  • GZA-2 たけしぞく倫理りんり道徳どうとくちょうでんあげ訳注やくちゅう
  • GZA-3 たけしぞくみんせき集成しゅうせい情歌じょうかいち)嘹歌
  • GZA-4 たけしぞくみんせき集成しゅうせい情歌じょうか)歓𭪤
  • GZA-6 中国ちゅうごくたけしぞくことわざ
  • GZA-7 とおふるてき追憶ついおくたけしぞく創世そうせい神話しんわうた研究けんきゅう
  • GZFY 漢語かんご方言ほうげんだいてん
  • GZH 中華ちゅうかうみ
  • GZJW いんしゅう金文きんぶん集成しゅうせい引得
  • GZYS たけしぞく人民じんみんてき文化ぶんか遺産いさん-かた块壮, 中国ちゅうごく民族みんぞく文字もじ研究けんきゅう

注記ちゅうき かんひろし字典じてん(GKX)として参照さんしょうされている文字もじたいする符号ふごうひょうじょうでの例示れいじ図形ずけいは、現在げんざい中国ちゅうごく使用しようされているものであり、かんひろし字典じてんしめされている例示れいじ図形ずけいとはわずかにことなる場合ばあいがある。

原典げんてん H

編集へんしゅう

  原典げんてん H は、つぎのとおりに識別しきべつする。

  • H 香港ほんこん増補ぞうほしゅう 2008
  • HB0 Big5:計算けいさんでの中国語ちゅうごくご字形じけい文字もじ符号ふごうとの対応たいおうひょう, Technical Report C-26, 電脳でんのうようちゅう文字もじがたあずか対照たいしょうひょう, 技術ぎじゅつ通報つうほう C-26, 1984, Symbols
  • HB1 Big5 だいいち水準すいじゅん
  • HB2 Big5 だい水準すいじゅん
  • HD 香港ほんこん増補ぞうほしゅう 2016

原典げんてん M

編集へんしゅう

  原典げんてん M は、つぎのとおりに識別しきべつする。

原典げんてん T

編集へんしゅう

  原典げんてん T は、つぎのとおりに識別しきべつする。

  • T1 TCA-CNS 11643-1992 だい 1 めん
  • T2 TCA-CNS 11643-1992 だい 2 めん
  • T3 TCA-CNS 11643-1992 だい 3 めんおよいくつかの追加ついか文字もじ
  • T4 TCA-CNS 11643-1992 だい 4 めん
  • T5 TCA-CNS 11643-1992 だい 5 めん
  • T6 TCA-CNS 11643-1992 だい 6 めん
  • T7 TCA-CNS 11643-1992 だい 7 めん
  • TA 化学かがく命名めいめい原則げんそくだいよんはん
  • TB TCA-CNS 11643-2007 だい 11 めん
  • TC TCA-CNS 11643-2007 だい 12 めん
  • TD TCA-CNS 11643-2007 だい 13 めん
  • TE TCA-CNS 11643-2007 だい 14 めん
  • TF TCA-CNS 11643-2007 だい 15 めん
  • T13 TCA-CNS 11643 だい 19 めん (pending new version)
  • TU 原典げんてんなし

原典げんてん J

編集へんしゅう

  原典げんてん J は、つぎのとおりに識別しきべつする。

原典げんてん K

編集へんしゅう

  原典げんてん K は、つぎのとおりに識別しきべつする。

  • K0 KS X 1001:2004以前いぜんは,KS C 5601-1987 であった。)
  • K1 KS X 1002:2001英語えいごばん以前いぜんは,KS C 5657-1991 であった。)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 韓国かんこく歴史れきし情報じょうほう統合とうごうシステム
  • KU 原典げんてんなし

注記ちゅうき K2、K3、K4 および K5 にふくまれる漢字かんじは、あたらしい韓国かんこく規格きかくぐんにおいて改訂かいてい作業さぎょうすすんでいる。

原典げんてん KP

編集へんしゅう

  原典げんてん KP は、つぎのとおりに識別しきべつする。

  • KP0 KPS 9566-97
  • KP1 KPS 10721:2000および KPS 10721:2003

原典げんてん V

編集へんしゅう

  原典げんてん V は、つぎのとおりに識別しきべつする。

  • V0 TCVN 5773:1993
  • V1 TCVN 6056:1995
  • V2 VHN 01:1998
  • V3 VHN 02:1998
  • V4 喃字てん, 岱喃字典じてん, 沔南喃字榜査
  • VN Vietnamese horizontal extensions

書記しょきもとクラスタ

編集へんしゅう

書記しょきもとクラスタ (grapheme cluster) で、漢字かんじは、UTF-16で可変かへん(16、32、48、64ビット)である[15]

  • 16ビット
基本きほん多言たげんめん(BMP)
  • 32ビット
追加ついかめん
基本きほん多言たげんめん(BMP)+SVS(字形じけい選択せんたく (Unicodeのブロック)英語えいごばん)
  • 48ビット
基本きほん多言たげんめん(BMP)+IVS(字形じけい選択せんたく補助ほじょ英語えいごばん)
  • 64ビット
追加ついかめん+IVS

参考さんこう文献ぶんけん

編集へんしゅう
  • 三上みかみとうと文字もじ符号ふごう歴史れきし アジアへん共立きょうりつ出版しゅっぱんISBN 4-320-12040-X 
  • 安岡やすおか孝一こういち安岡やすおか素子もとこ文字もじ符号ふごう歴史れきし 欧米おうべい日本にっぽんへん共立きょうりつ出版しゅっぱんISBN 4-320-12102-3 

関連かんれん項目こうもく

編集へんしゅう

脚注きゃくちゅう

編集へんしゅう

外部がいぶリンク

編集へんしゅう