(Translated by https://www.hiragana.jp/)
汉字内码扩展规范 - 维基百科,自由的百科全书

汉字ない码扩てん规范

简化ちゅう文字もじしゅう

汉字ない码扩てん规范,简称GBKぜんめい《汉字ない码扩てん规范(GBK)》1.0はんゆかりちゅう人民じんみん共和きょうわこく全国ぜんこくしんいきわざ术标じゅんわざ术委员会1995ねん12月1にちせい订,国家こっかわざ术监とくきょく标准つかさかず电子こう业部科技かぎあずか质量监督1995ねん12月15にち联合以《わざ术标はこ[1995]229ごうぶんけんてき形式けいしき公布こうふ。 GBKどもおさむ录21886个汉图形符号ふごう,其中汉字(包括ほうかつ部首ぶしゅ构件)21003个,图形符号ふごう883个。

汉字ない码扩てん规范
GBK 分配ぶんぱい
MIME / IANAGBK
别名CP936, MS936, windows-936, csGBK
语言くに际,ただし简体ちゅうぶん为主,浏览GB 18030かい
标准GBK 1.0
现状正式せいしきこく标编码,やめかむGB 18030がわ
ぶん扩展ASCII[a]变长编码CJK
つぶせてんEUC-CN
まえようGB2312
きさきGB 18030

GBK为“国家こっか标准扩展”てき汉语拼音(Guójiā Biāozhǔn Kuòzhǎn)ちゅうてきくに”“标”“扩”だいいち个声はは英文えいぶんぜんしょうChinese Internal Code Extension Specification。

GBK ただ为“わざ术规范指导性ぶんけん”,ぞく国家こっか标准。国家こっか质量わざ术监とくきょく于2000ねん3がつ17にち推出りょうGB 18030-2000标准,以取だいGBK。GB 18030-2000じょ保留ほりゅう全部ぜんぶGBK编码汉字,ざいだい二字节把能使用范围再度进行扩展,增加ぞうかりょうだい约一百个汉字及四字节编码空间,ただしこれはたGBKさく为子しゅう全部ぜんぶ保留ほりゅう

历史

编辑

1993ねんUnicode 1.1版本はんぽん推出,おさむ中国ちゅうごくだい台湾たいわん日本にっぽん韩国通用つうようしゅうてき汉字,总共有きょうゆう20,902个。中国ちゅうごくだい陆订ていりょうとうどう于Unicode 1.1版本はんぽんてきGB 13000.1-93”“しんいきわざ通用つうよう八位编码字符集(UCS)だいいち部分ぶぶん体系たいけい结构与基本きほんぶん种平めん”。

よしGB 2312-80ただおさむ录6763个汉ゆうしょう汉字,如部分ぶぶんざいGB 2312-80推出以后ざい简化てき汉字(如“啰”),部分ぶぶん人名じんめい用字ようじ(如中国ちゅうごくぜん总理しゅ镕基てき“镕”),台湾たいわん香港ほんこん使用しようてき繁体字はんたいじにちあさ鲜语汉字とう,并未ゆうおさむ录在ない。于是厂商ほろ利用りようGB 2312-80使用しようてき编码そら间,おさむ录GB 13000.1-93全部ぜんぶ制定せいていりょうGBK编码。

すえほろ资料,GBK对GB2312-80てき扩展,也就CP936码表(Code Page 936)てき扩展(これぜんCP936GB 2312-80いちいちよう),最早もはや实现于Windows 95简体ちゅうぶんばん。虽然GBKおさむGB 13000.1-93てき全部ぜんぶただしGBK一种编码方式并向下兼容GB2312;而GB 13000.1-93とうどう于Unicode 1.1いちしゅう,它的几种编码方式ほうしきUTF8UTF16LEひとしあずかGBK完全かんぜんけんよう

编码方式ほうしき

编辑

ゆう一字节和双字节编码,007F范围ないだいいち个字节,ASCII保持ほじ一致いっち,此范围内严格じょう说有96个文字もじ32个控せい符号ふごう

これきさきてきそう节中,ぜん一字节是双字节的第一位。总体じょう说第一字节的范围是81FE(也就80FF),だい二字节的一部分领域在407E,其他领域ざい80FE

具体ぐたいらい说,てい义的れつ节:

GBKてき编码范围
范围 だい1 だい2 编码すう 字数じすう
みずじゅんGBK/1 A1A9 A1FE 846 717
みずじゅんGBK/2 B0F7 A1FE 6,768 6,763
みずじゅんGBK/3 81A0 40FE (7F除外じょがい) 6,080 6,080
みずじゅんGBK/4 AAFE 40A0 (7F除外じょがい) 8,160 8,160
みずじゅんGBK/5 A8A9 40A0 (7F除外じょがい) 192 166
よう户定义 AAAF A1FE 564
よう户定义 F8FE A1FE 658
よう户定义 A1A7 40A0 (7F除外じょがい) 672
ごう计: 23,940 21,886

そう节符ごう以表达的64Kそら间如图所しめせ。绿色黄色おうしょく区域くいきGBKてき编码,红色よう户定义区域くいきぼつゆう颜色区域くいき不正ふせい确的だい码组あい

 

あずか其他编码てき关系

编辑

GBKこうした完全かんぜんけんようGB2312-80编码。支持しじGB2312-80编码支持しじてき部分ぶぶんちゅうぶんせいちゅうぶんしげるからだにちぶん假名がな,还包括ほうかつまれ腊字はは以及にわか语字ははとう字母じぼ过这种编码不支持しじ国字こくじ,也是其在实际使用しようちゅうあずかunicode编码しょうかけかけてき部分ぶぶん

上述じょうじゅつGBK/1GBK/2てき领域そくGB 2312-80よう通常つうじょう方法ほうほう编码てき区域くいき。GB 2312(せい确说ほう其根すえEUC-CNてき编码)ISO/IEC 2022ちゅう调用GR其他てき94²しゅういち样,A1FEてき范围开始读取节对。这是じょう图中みぎ下角したすみてき部分ぶぶんただし,GB 2312ちゅう对于AAAFF8FE区域くいきそらてきぼつゆう赋予编码。于是GBK就在这些领域さと进行つぶせてん。二者剩余部分作为用户定义区。

さら重要じゅうようてき,GBK进行りょう节范围的扩展。ISO/IEC 2022ちゅうGR区域くいきてき字数じすうゆう94²=8,836てききりせいただよう弃ISO/IEC 2022ちゅう针对图形文字もじひかえせい文字もじ赋予严格てき范围てきしき下位かい节为单字节文字もじ上位じょうい节对保留ほりゅう对应てきこうのう潜在せんざいてき128²=16,384てきだい位置いち就可以使用しよう。GBKさいよう其中てきいち部分ぶぶんだいいち个字节从A1FEまい个字节有94个选项)扩展なり81FE(126个选项),だい二字节的范围是40FE(191个选项),总共有きょうゆう24066(126*191)个位置いち

あずかCP936码表比較ひかく

编辑

ほろ软在ややしんいちてんてきCP936ちゅう使用しよう单字节 0x80 代表だいひょうおうもと(U+20AC),而《规范》GBK编码含此

输入方法ほうほう

编辑

まいり

编辑

注釋ちゅうしゃく

编辑
  1. ^ 严格らい说不いん为ASCII节会现在GBKつぶせてん二字节部分的后半字

参考さんこう文献ぶんけん

编辑

外部がいぶ链接

编辑