(Translated by https://www.hiragana.jp/)
GB 2312 - 维基百科,自由的百科全书 とべ转到内容ないよう

GB 2312

维基百科ひゃっか自由じゆうてき百科ひゃっかぜん
重定しげさだこうGB2312
GB 2312
MIME / IANAGB_2312-80 (EUC めいGB2312
别名iso-ir-58, chinese, csGB2312, csISO58GB231280
语言简体ちゅうぶん, 英文えいぶん
部分ぶぶん支援しえん
しげるたいちゅうぶん, 西里にしざと尔文, まれ腊文
标准GB/T 2312-1980
ぶん支援しえんISO-2022そう节字もとしゅう中日ちゅうにち编码
つぶせてんなりISO-IR-165
编码格式かくしきEUC-CN (GB2312),
HZ-GB-2312
まえようちゅうぶん电码
きさきGBKGB 18030
其他しょう关编码JIS X 0208KS X 1001

GB/T 2312[註 1]GB/T 2312—80 ある GB/T 2312—1980 これちゅう人民じんみん共和きょうわこく国家こっか标准简体ちゅうぶんしゅうぜんしょうしんいき交换よう汉字编码しゅう·基本きほんしゅう》,通常つうじょう簡稱GB(「くに标」汉语拼音くび字母じぼ),またたたえGB0ゆかり中国ちゅうごく国家こっか标准总局於1980ねん发布,1981ねん5がつ1にち实施。GB/T 2312编码通行つうこう中国ちゅうごくだいしん等地とうち也采よう此编码。中国ちゅうごくだい陆几乎所有しょゆう的中てきちゅう文系ぶんけい统和こく际化てき软件支持しじGB/T 2312。

がいじゅつ

[编辑]

GB/T 2312标准どもおさむ录6763个汉字,其中いち级汉3755个,级汉3008个;どう时收录了包括ほうかつひしげ丁字ていじははまれ腊字ははにちぶん平假名ひらがな片假名かたかな字母じぼちゅう音符おんぷごうにわか西里にしざと尔字ははざい内的ないてき682个字

GB/T 2312てき现,基本きほん满足りょう汉字てき计算つくえ处理需要じゅよう,它所收しょしゅう录的汉字やめ经覆盖中国大こくだい陆99.75%てき使用しよう频率。ただし对于人名じんめい汉语とう方面ほうめん现的用字ようじ繁體字はんたいじ,GB/T 2312不能ふのう处理,而是よし一系列的国标辅助集负责编码和显示(如GB/T 12345しんいき交换よう汉字编码しゅう だいいち辅助しゅう》、GB/T 7589 《しんいき交换よう汉字编码しゅう だい辅助しゅう》及GB/T 7590《しんいき交换よう汉字编码しゅう だいよん辅助しゅう》),ただしこれ ISO-2022-CN-EXT さい终未给国标除りょう GB/T 2312 以外いがいてき其他辅助しゅう提供ていきょう逃逸くし[1][2]きさきらいGBKGB 18030汉字しゅうしょう继出现以解決かいけつ這些問題もんだい

ぶん表示ひょうじ

[编辑]

GB/T 2312 ちゅう所收しょしゅう汉字进行りょうぶん”处理,まい含有がんゆう94个汉符号ふごうきょう计94个区。实际じょう,GB/T 2312 ただ使用しようりょう87

よう所在しょざいてきかずらい表示ひょうじ(实际じょう就是码位てき方法ほうほうしょうある许叫“ごうさら为恰とう[らいみなもと請求せいきゅう])。れい如“まんざい4582所以ゆえんまんてき码是 45-82(45码”,82码”)。ざい储存进电脑时,电脑かいざい码上じょう特定とくてい数字すうじきさきざい保存ほぞん进内そん以确其他编码けんよう(如 ASCII)。转码きさき码的“码”かい变成“高位こうい节”,而“码”かい变成“低位ていい节”。

しもれつ GB/T 2312 ふんきさきざいだんない储存てき

  • 01~09(682个):特殊とくしゅ符号ふごう数字すうじえい文字もじせいひょうとう包括ほうかつひしげ丁字ていじははまれ腊字ははにちぶん平假名ひらがな及片假名がな字母じぼちゅう音符おんぷごうにわか语西さと尔字ははとうざい内的ないてき682个全かく
  • 10~15そらとめまち扩展;ざい录3,だい10推荐さくGB 1988—80 なかてき94个图がた区域くいきそくだい3はんかたち版本はんぽん)。
  • 16~55(3755个):常用じょうよう汉字(也称いち级汉),按拼おんはいじょ
  • 56~87(3008个):常用じょうよう汉字(也称级汉),按部首ぶしゅ/笔画はいじょ
  • 88~94そらとめまち扩展。

节结构

[编辑]

ざい GB 2312 ないまい个汉及符ごうてき码位使用しよう两个らい表示ひょうじだい一个字节称为“高位こうい节”,对应ぶんてき编号(码的“码”じょう特定とくてい值);だい二个字节称为“低位ていい节”,对应だんないてき个别码位(码的“码”じょう特定とくてい值)。

ISO 2022-CN(くに标码、交换码)

[编辑]

为了避开ASCIIちゅうてき不可ふか显示じゅうろく进制为0×00いたり0×1Fじゅう进制为0いたり31)及空かくじゅうろく进制为0×20じゅう进制为32),くに标码(またたたえ为交换码)参考さんこう ISO 2022 规定表示ひょうじ ASCII そう节编码范围为じゅうろく进制为 <21 21>-<7E 7E>じゅう进制为 (33, 33) いたり (126, 126)。よし此,ざい进行码位转换时,须将“码”かず码”ぶん别加じょう32(じゅうろく进制为0×20さく为国标码。

ざい这个编码しきない,软件需要じゅよう使用しようていはしひかえせい(C0),こうはしひかえせい(C1)US-ASCIIしゅう(GL)标注ぞく于单节(ASCII)还是そう节,そう容易ようい造成ぞうせいらん(如丢しつひかえせい/转义)。

ざい GB/T 2312 ない高位こうい节使ようりょう0x21—0x7701—87てきごう32ある0×20),低位ていい节使ようりょう0x21—0x7E01—94じょう32ある0×20)。

れい:“まん码 45-82)てき ISO 2022 码じゅう进制为:(45+32, 82+32) = (77, 114),じゅうろく进制为:<4D 72>[3][4]

EUC-CN(つくえない码、うち码)

[编辑]

いん为国标码通用つうようてきASCII码冲突,いん此后续为りょう方便ほうべんべん认单节和そう节的编码,部分ぶぶん厂商ざい ISO 2022 てきもと础上そう节字てき二进制最高位都从 0 换成 1,そく相当そうとう于把 ISO 2022 てきまい个字节都さいじょう128(じゅうろく进制为0×80とくいたつくえない码”表示ひょうじ,简称“うち码”。码”かず码”ぶん别加じょう160(じゅうろく进制为0×A0)也可以得いたあいどうてきつくえない表示ひょうじ,这种格式かくしき也就EUC使用しようGB/T 2312てきほどじょ通常つうじょうさいよう EUC 储存方法ほうほう,以便けんようASCII。这种格式かくしきしょうEUC-CN浏览编码ひょうじょうてき“GB2312”就是ゆび这种表示法ひょうじほう

ざい GB/T 2312 ない高位こうい节使ようりょう0xA1—0xF701—87てきごう160ある0×A0),低位ていい节使ようりょう0xA1—0xFE01—94じょう160ある0×A0)。 ASCII そう节编码范围为じゅうろく进制为 <A1 A1>-<FE FE>じゅう进制为 (161, 161) いたり (254, 254)。

れい:“まん码 45-82)てき EUC 码じゅう进制为:(45+160, 82+160) = (205, 242),じゅうろく进制为:<CD F2>[3][4]

HZ

[编辑]

HZ 编码ゆかりかえでほうざい1988ねん发明てき编码けい[5]。其目的もくてきざい7节的げんせい(如电邮件)储存 GB/T 2312 てきそう节字。其在 ISO 2022 编码てきぜんきさきぶん别加じょう转义~{7E 7B~}7E 7Dきさき使用しよう正常せいじょうてきASCII转码变成 ASCII 部分ぶぶんつくえ也可以接受せつじゅ使用しよう EUC-CN 编码てき转义

れい:“まん码 45-82)てき ISO 2022 码じゅうろく进制为 <4D 72>じょう转义きさきくし变成7E 7B 4D 72 7E 7D。HZてき编码そく~{Mr~}MてきASCII码是0×4DrてきASCII码是0×72)。[6]

修訂しゅうてい

[编辑]

GB 5007.1—85《しんいき交换よう汉字 24x24 てんしゅうくび附錄ふろくたい GB/T 2312 更正こうせい包括ほうかつ

  • 調整ちょうせいひしげ丁字ていじははgてき字形じけい
  • 補充ほじゅうろく拼音符號ふごう ɑ ḿ ń ň ǹ ɡよう汉语拼音[註 2]
  • 更正こうせいため
  • 於第10補充ほじゅう94はん圖形ずけいだい3はんかたち版本はんぽん相當そうとうGB 1988—80
  • 於第11加入かにゅうだい8くび32拼音符號ふごう包括ほうかつ以上いじょう補充ほじゅうろくはんかたち版本はんぽん

GB 5007.1—85曾将「」(84—80)さら换成「こうじ」,ただしきさき续修订(GB 5007.1—2001 GB/T 5007.1—2010)かず其他しゅう仍旧保留ほりゅう GB/T 2312 てきしげるからだ偏旁へんぼうむぎ」。

GB/T 2312 本身ほんみいちちょくゆう修訂しゅうていただし此等修訂しゅうてい收入しゅうにゅう相關そうかんしゅうしもしょう)、GB/T 12345後續こうぞく GBKGB 18030

GB/T 2312 またもちいISO-IR-165

两种不同ふどうてきGB/T 2312实现

[编辑]

ゆう两种不同ふどうてきGB/T 2312实现,ざい它们存在そんざい少量しょうりょうてき别,其中いたりしょうゆういち个是错误てき

码(EUC码) GBKしゅう GB2312.TXT 名称めいしょう[7]
01-04 (<A1 A4>) U+00B7 · MIDDLE DOT U+30FB KATAKANA MIDDLE DOT 间隔てん
01-10 (<A1 AA>) U+2014 EM DASH U+2015 HORIZONTAL BAR やぶおりごう

GBKしゅうあずかGBK/GB 18030けんよう,GB2312.TXT则不けんようきさきしゃもと于ftp.unicode.org曾经提供ていきょうてきGB2312.TXT实现,[8]于2011ねんよしかんかた弃用,[9]2016ねん9がつ时已无原文げんぶんけん踪迹。此外还有很多种厂しょう实现。[8]

截至2015ねん (2015-Missing required parameter 1=month!)ほろ软.NET使用しようてき“GBKしゅう”实现。ICUえいInternational Components for Unicode[10]、libiconv-1.14、[11]php-5.6、ActivePerl-5.20、Java 1.7、Python 3.4[12]使用しよう“GB2312.TXT”实现。Ruby 2.2けんよう两者编码,ただし内部ないぶ使用しよう“GBKしゅう”实现。W3Cてき编码わざ指南しなん规定,应将gb2312节流视为GBK编码,あずかGB18030一并使用同一解码器解码。[13]

しゅう

[编辑]
  • GB 5007.1—85《しんいき交换よう汉字 24x24 てん阵字しゅう
  • GB 5007.2—85《しんいき交换よう汉字 24x24 てん阵字すうすえしゅう
  • GB 5199.1—85《しんいき交换よう汉字 15x16 てん阵字しゅう
  • GB 5199.2—85《しんいき交换よう汉字 15x16 てん阵字すうすえしゅう
  • GB 6345.1—86《しんいき交换よう汉字 32x32 てん阵字しゅう
  • GB 6345.2—86《しんいき交换よう汉字 32x32 てん阵字すうすえしゅう
  • GB 12034—89《しんいき交换よう汉字 32x32 てん仿宋たいしゅう及数すえしゅう
  • GB 12035—89《しんいき交换よう汉字 32x32 てん楷体しゅう及数すえしゅう
  • GB 12036—89《しんいき交换よう汉字 32x32 てんくろたいしゅう及数すえしゅう
  • GB 12037—89《しんいき交换よう汉字 36x36 てんそうたいしゅう及数すえしゅう
  • GB 12038—89《しんいき交换よう汉字 36x36 てん阵仿そうたいしゅう及数すえしゅう
  • GB 12039—89《しんいき交换よう汉字 36x36 てん阵楷たいしゅう及数すえしゅう
  • GB 12040—89《しんいき交换よう汉字 36x36 てん阵黑たいしゅう及数すえしゅう
  • GB 12041—89《しんいき交换よう汉字 48x48 てん阵宋たいしゅう及数すえしゅう
  • GB 12042—89《しんいき交换よう汉字 48x48 てん阵仿そうたいしゅう及数すえしゅう
  • GB 12043—89《しんいき交换よう汉字 48x48 てん阵楷たいしゅう及数すえしゅう
  • GB 12044—89《しんいき交换よう汉字 48x48 てん阵黑たいしゅう及数すえしゅう
  • GB/T 13443—92《しんいき交换よう汉字 128x128 てん阵楷たいしゅう及数すえしゅう
  • GB/T 13444—92《しんいき交换よう汉字 128x128 てん阵仿そうたいしゅう及数すえしゅう
  • GB/T 13445—92《しんいき交换よう汉字 256x256 てん阵楷たいしゅう及数すえしゅう
  • GB/T 13446—92《しんいき交换よう汉字 256x256 てん阵仿そうたいしゅう及数すえしゅう
  • GB/T 13844—92《图形しんいき交换ようりょう汉字单线そうたいしゅう及数すえしゅう
  • GB/T 13845—92《图形しんいき交换ようりょう汉字そうたいしゅう及数すえしゅう
  • GB/T 13846—92《图形しんいき交换ようりょう汉字仿宋たいしゅう及数すえしゅう
  • GB/T 13847—92《图形しんいき交换ようりょう汉字楷体しゅう及数すえしゅう
  • GB/T 13848—92《图形しんいき交换ようりょう汉字くろたいしゅう及数すえしゅう

注釋ちゅうしゃく

[编辑]
  1. ^ 2017ねん3がつ23にちおこりすえ2017ねんだい7ごう公告こうこく强制きょうせいせい标准整合せいごうせい简结论,该标じゅん化成かせい推荐せい标准,さい强制きょうせい执行,ゆかり「GB 2312—80」改称かいしょう为「GB/T 2312」。中国ちゅうごく国家こっか标准全文ぜんぶんこう开系统 - GB/T 2312-1980. 中国ちゅうごく国家こっか标准全文ぜんぶんこう开系统. [2020-03-30]. (原始げんし内容ないようそん档于2021-02-27). 
  2. ^ ɑ(U+0251)
    ḿ(U+1E3F;Unicode 3.0 はじめ開始かいし收納しゅうのう CP936 また未收みしゅう[1]
    ń(U+0144)
    ň(U+0148)
    ǹ(U+01F9;Unicode 3.0 はじめ開始かいし收納しゅうのう CP936 また未收みしゅう[2]
    ɡ(U+0261)

参考さんこう文献ぶんけん

[编辑]
  1. ^ Lunde, Ken. CJKV information processing: Chinese, Japanese, Korean & Vietnamese computing 2nd Ed. Sebastopol, Calif: O'Reilly & Associates. : 239. ISBN 9780596514471. 
  2. ^ RFC 1922 (1996)
  3. ^ 3.0 3.1 しなゆき. ちゅうぶん编码小知しょうち. 乎专栏. [2022-05-02] ちゅうぶん. 
  4. ^ 4.0 4.1 Lunde, Ken Roger. CJKV Information Processing だいはん. O'Reilly. 2008ねん十二月じゅうにがつ [2022-05-02]. ISBN 978-0-596-51447-1. (原始げんし内容ないようそん档于2011-08-29). 
  5. ^ HZ — A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII Characters. (原始げんし内容ないようそん档于2005-10-27). 
  6. ^ HZ-GB-2312ちゅうぶん编码详解 - うん+やしろ - 腾讯うん. cloud.tencent.com. [2022-05-02]. (原始げんし内容ないようそん档于2020-09-29). 
  7. ^ GB 2312-1980: Information technology—Chinese ideogram coded character set for information interchange (basic set). [2 October 2016]. 
  8. ^ 8.0 8.1 Haible, Bruno. GB2312 (Conversion Tables). [29 September 2016]. (原始げんし内容ないようそん于2016-10-20). 
  9. ^ Readme - MAPPINGS/OBSOLETE/EASTASIA. 9 August 2001 [29 September 2016]. (原始げんし内容ないようそん于2015-08-01). 
  10. ^ java-EUC_CN-1.3_P.ucm. [29 September 2016]. [永久えいきゅう失效しっこう連結れんけつ]
  11. ^ libiconv:lib/gb2312.h. GNU Savannah. [29 September 2016]. 
  12. ^ Issue 24036. Python Bug Tracker. [2015-04-24]. (原始げんし内容ないようそん于2016-03-04). 
  13. ^ Encoding § Names and labels. W3C. [29 September 2016]. (原始げんし内容ないようそん于2017-03-18). 

外部がいぶ链接

[编辑]

まいり

[编辑]