(Translated by https://www.hiragana.jp/)
IETF語言標籤 - 维基百科,自由的百科全书 とべ转到内容ないよう

IETFげんしるべくじ

维基百科ひゃっか自由じゆうてき百科ひゃっかぜん
重定しげさだこうIETF语言标签

かたりげん标签これかたりげんだいてき缩写表示ひょうじれいen表示ひょうじえい语,pt-BR表示ひょうじともえ西にし葡萄ぶどうきば语。ゆかり互联网工ほどにん务组(IETF)てきBCPえいBest Current Practice 47”ぶん系列けいれつてい义。现在标准为RFC 5646(引用いんようりょうしょう关的RFC 5645)あずかRFC 4647,IANA语言标签とう[1][2][3][4]使用しようてきかく成分せいぶんISO 639ISO 15924ISO 3166-1以及UN M.49

这种语言标签よう于许现代てき计算标准,包括ほうかつIETFてき互联网协议如HTTP[5][6]XML[7]以及PNG[8]SGMLUnicodeANSI以及ECMA。MicrosoftてきWindows操作そうさけい使用しよう代替だいたい过时てきLCID,らい表示ひょうじlocale

历史

[编辑]

IETF语言标签てき最早もはや版本はんぽん1995ねん3がつ发布てきRFC 1766。使用しようISO 639てき2字母じぼ语言だい码,ISO 3166てき2字母じぼ国家こっか地区ちくだい码,まこと许登记的标签携带variantある书写文字もじ标签。

2001ねん1がつ发布RFC 3066, 使用しようISO 639-2てき3字母じぼ语言だい码。

2006ねん9がつ发布RFC 4646 (规范てき主体しゅたい)あずかRFC 4647 (处理ひきはいぎょう为)。RFC 4646增加ぞうかりょう使用しようISO 15924 てき4字母じぼ书写文字もじだい码与UN M.49てき3数字すうじ地理ちりぶん码。

2009ねん9がつ发布RFC 5646,引入りょう3码的ISO 639-3あずか639-5さく为语げん标签。[9]

语言标签てき语法

[编辑]

语言标签よし一个或多个子标签(subtags)组成,よう连字ごう(-)ぶんへだた标签ただのうよし基本きほんひしげ丁字ていじははある数字すうじ组成。标签现顺じょ

  • 一个主语言子标签(primary language subtag),ISO 639-1 (2002)てき2字母じぼ语言だい码,ISO 639-2 (1998)あるISO 639-3 (2007)あるISO 639-5 (2008)てき3字母じぼ语言だい码, BCP 47とう记的5いた8个字ははてき语言だい码。应保持ほじどう样的大小だいしょううつし
  • 最多さいた3个可选的extended language subtagsまい个由3字母じぼ组成。实际じょう还没ゆう使用しよう
  • 1个可选的文字もじ标签(script subtag),ISO 15924てき4字母じぼ书写文字もじだい码,通常つうじょうtitle case。
  • 1个可选的地区ちく标签(region subtag),ISO 3166-1 alpha-2てき2字母じぼ地区ちくだい码(通常つうじょうだいうつし),あるUN M.49てき3数字すうじ地理ちりだい码。
  • 选的variant subtagsまい个为5いたり8个字ははあるもの4母后ぼこう跟1个数字すうじゆかりIANAとう记。
  • 选的extension subtagsまい个为单字まこと许“x”)开始(这称为singleton),きさき跟连あずか2いたり8个字组成てきぶんほん[10],[11]
  • 1个可选的private-use subtag, まい个为x-きさき跟1いたり8个字成文せいぶんほん

例外れいがいじょう况是x-ぜん缀开头的私用しよう语言标签,こうきさきけんようてきgrandfathered语言标签(包括ほうかつi-ぜん缀与以前いぜんとう记的ろうてき语言标签)。

上述じょうじゅつゆびあかりてき标签应该しょううつし。实际うえせい个语げん标签大小だいしょううつし无关てき

选的scriptあずかregion标签如果ぼつゆう提供ていきょうべん识信いき,则将ゆるがせりゃくれい如拉丁字ていじはは拼写てき西にしはんきばes-Latn日本にっぽんてきja-JP

并不所有しょゆう语言区域くいきゆう有效ゆうこうてき区域くいき标签:しゅ语言てき国内こくない方言ほうげんとう记为variant标签。れい如,valencia variant标签ようたい罗尼亚语てきともえりん西にし方言ほうげんよし于该方言ほうげん几乎ただよう于西はんきば国内こくない区域くいき标签ES通常つうじょうゆるがせりゃく

ひろし语言(macrolanguage)ちゅうてき语言だい码或しゃ直接ちょくせつよう语言标签表示ひょうじ,如普どおりcmnあるものよう语言-扩展标签てき组合,如zh-cmn

よう扩展标签,ぜん缀为sgn

あずか其他こく际标じゅんてき关系

[编辑]

虽然げんISOあるUNてき标准,ただし并不严格遵循。とく别是ISO 639, ISO 15924, ISO 3166, UN M.49とう标准撤回てっかいぼう些编码,甚至あらため变某些编码所ゆびてき时候,RFC 4646规定语言标签仍然保持ほじ最初さいしょ含义变。

ISO 639-3 あずか ISO 639-1

[编辑]

RFC 4646これぜんとう记的语言标签现在ぶん为"grandfathered"ある"redundant",视其满足目前もくぜんてき语法而定。并且过时てき。现在さいようISO 639-3语言标签。れい如,nanだいりょうzh-min-nan表示ひょうじ闽南语hakだいりょうi-hakzh-hakka表示ひょうじきゃくaseだいりょうsgn-US表示ひょうじ美國びくにしゅ

ISO 639-5 あずか ISO 639-2

[编辑]

ISO 639-5使用しよう3字母じぼ表示ひょうじ一个语言群中所有的语言。而ISO 639-2使用しよう3字母じぼ表示ひょうじ一个语言群中没有独立语言标签的那些语言。れい如,ISO 639-2だいafa表示ひょうじ"Afro-Asiatic (Other)",包含ほうがんおもねひしげはく语。而ISO 639-5ちゅうてき这个だい表示ひょうじ"Afro-Asiatic languages",包含ほうがん亚非语系所有しょゆう语言。这一变化发生在2009ねん[12]

ISO 639-5为了こうきさきけんようISO 639-2,对于这些ろうてきだい码,てい义了grouping type attribute。

BCP 47てい义了"Scope"属性ぞくせいよう于语げんしゅう标签てきべん别。ただしぼつ有定ありさだ义任なんinclusiveあるexclusive属性ぞくせい,也没ゆう使用しようISO 639-5てきgrouping type attribute。

ISO 639-5ぼつ有定ありさだ义哪些语げんぞく于某个语げんしゅうよし此RFC 5646けん使用しよう语言しゅうじょ些非特定とくていてき语言しゅう,如"Multiple languages"あずか "Undetermined"。

ISO 15924, ISO/IEC 10646 あずか Unicode

[编辑]

ぼう些主语言标签携带りょう属性ぞくせい"Suppress-Script",通常つうじょうぼう个书うつしけい统适よう于该语言。よし此会ゆるがせりゃくscript标签。れい如,yiだいりょうyi-Hebrいん意地いじ绪语总是使用しようまれはくらい字母じぼ书写。

另一个例zh-Hans-SG认为とう价于zh-Hansいん为新坡简たいちゅうぶんあずか其他简体ちゅうぶん几乎いち样。ただし,这里てきscript标签显然有意ゆうい义的。

ISO 3166-1 あずか UN M.49

[编辑]

とう语言てき地区ちく方言ほうげんゆう专门てき标签,这比使用しよう地区ちく标签さら优。れい如,ar-DZ应该arq代替だいたいらい表示ひょうじおもねしか及利おもねひしげはく

扩展

[编辑]

Extension标签(不要ふようあずかextended语言标签混淆こんこうまこと附加ふか额外てきしんいき,如locale,calendar,currency。

いたり2014ねん1がつやめ分配ぶんぱいりょう两种扩展。

Extension T

[编辑]

2012ねん2がつUnicode ConsortiumざいRFC 6497发布りょうExtension Tよう于语げん标签包含ほうがんしんいき关于おん译(transliterated),转写(transcribed),变换(transformed)。れい如,en-t-jpよう于从语翻译到えい语。

Extension U (Unicode Locale)

[编辑]

2010ねん12月,統一とういつ聯盟れんめいざいRFC 6067发布りょうExtension U,まこと许在通用つうよう當地とうちすうよりどころもうかそんちゅう嵌入かんにゅうりょう宽属せい表示ひょうじ很多區域くいき設置せっちすうすえしゅう

れい如:

Windows操作そうさけい统的使用しよう

[编辑]

Windows Vista及以きさき版本はんぽんさいようRFC 4646さく为locale标签,くし最大さいだい长度85,包含ほうがんりょう结尾てきれい

ただゆう语言标签,しょう中立ちゅうりつlocale(neutral locale)。じょう地区ちく标签,しょう为specific locale。格式かくしき为<language>-<Script>-<REGION>,れい如"uz-Latn-UZ"表示ひょうじ乌兹别克斯坦てき使用しようひしげ丁字ていじははてき乌兹别克语。

はいじょ规则应写为<language>-<Script>-<REGION>_<sort order>

まいり

[编辑]

参考さんこう文献ぶんけん

[编辑]
  1. ^ そん副本ふくほん. [2017-11-21]. (原始げんし内容ないようそん于2013-06-20). 
  2. ^ Language subtag lookup app:. r12a.github.io. [28 July 2015]. (原始げんし内容ないようそん于2015-07-31). 
  3. ^ そん副本ふくほん. [2017-11-21]. (原始げんし内容ないようそん于2013-06-26). 
  4. ^ IANA — Protocol Registries. iana.org. [28 July 2015]. (原始げんし内容ないようそん于2017-11-10). 
  5. ^ RFC 7231 - Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content. ietf.org. [28 July 2015]. (原始げんし内容ないようそん于2017-05-25). 
  6. ^ Language information and text direction. w3.org. [28 July 2015]. (原始げんし内容ないようそん于2008-09-04). 
  7. ^ Extensible Markup Language (XML) 1.0 (Fifth Edition). w3.org. [28 July 2015]. (原始げんし内容ないようそん于2009-04-01). 
  8. ^ Portable Network Graphics (PNG) Specification (Second Edition). w3.org. [28 July 2015]. (原始げんし内容ないようそん于2018-06-18). 
  9. ^ Language Tag Registry Update charter. [2017-11-21]. (原始げんし内容ないようそん于2007-02-10). 
  10. ^ Addison Phillips, Mark Davis. Tags for Identifying Languages (old draft for the revision of RFC 4646, now obsolete and may disappear soon). IETF WG LTRU. 2008 [2008-06-23]. (原始げんし内容ないようそん于2019-10-17). 
  11. ^ Doug Ewell. Update to the Language Subtag Registry (old draft for the revision of RFC 4645, now obsolete and may disappear soon) (1MB). IETF WG LTRU. 2008 [2008-06-23]. (原始げんし内容ないようそん于2019-10-17). 
  12. ^ ISO 639-2 Language Code List - Codes for the representation of names of languages (Library of Congress). loc.gov. [28 July 2015]. (原始げんし内容ないようそん于2018-09-17). 

外部がいぶ链接

[编辑]