(Translated by https://www.hiragana.jp/)
UTF-7 - 维基百科,自由的百科全书 とべ转到内容ないよう

UTF-7

本页使用了标题或全文手工转换
维基百科ひゃっか自由じゆうてき百科ひゃっかぜん

UTF-7ぜんしょう:7もとUnicode轉換てんかん格式かくしき一種可變長度字元編碼方式,よう以將UnicodeもとASCIIへん碼的もとくしらいていげん應用おうようざい電子でんし郵件つて輸之るいてき應用おうよう

SMTPため基本きほんてき電子でんし郵件つて標準ひょうじゅんいち,其指あかりりょうでん輸格しきためUS-ASCIIなみ且不允許いんきょ超過ちょうかASCIIしょ定義ていぎてきもと範圍はんい以外いがいてきもと值,也就せつ八位元的字串將無法正常的被傳輸。MIMERFC 2045 ~ 2049)擴展りょうもう郵件以支援しえん不同ふどうてき媒體ばいたい類型るいけい以及もとしゅう包含ほうがんUTF-8あずかUTF-16てきもとしゅうみな指定してい使用しようただしよし於MIMEなみ明確めいかくはたUnicode定義ていぎため支援しえんてきもとしゅうなみ且也ぼつゆう說明せつめい其應如何いかへん碼,這使とくすんでゆうてきSMTPでん輸架構下仍舊無法むほう保證ほしょう正確せいかくてき處理しょり8もと資料しりょうbase64へん碼也ゆう問題もんだいれい如甚いたりれんじゅん英文えいぶんてきUS-ASCII元也もとなり可能かのうかい變成へんせい不可ふかべんみとめいたり於像UTF-8あずかquoted-printableまとへん結合けつごうのり需要じゅよう6~9元來がんらいためASCIIてきもと(Unicodeてき基本きほんぶんしゅ平面へいめんちゅう定義ていぎてきもと進行しんこうへん碼,いたり於在基本きほんぶんしゅ平面へいめん(BMP)以外いがいてき原則げんそく需要じゅようたち12もとてきちょう才能さいのう完成かんせいへん碼。

簡介

[编辑]

UTF-7しゅ提出ていしゅつざい一個實驗性的通訊協定裏(RFC 1642,A Mail-Safe Transformation Format of Unicode),這份RFC(Request for Comments)提案ていあん後來こうらいいんRFC 2152てき提出ていしゅつ而被だい(RFC 2152本身ほんみため新聞しんぶんがた(informational)てき文案ぶんあん)。ざいRFC 2152とうちゅう明確めいかくてき指出さしで該份RFC本身ほんみ不為ふためもうぎわもうてき標準ひょうじゅん做出にんなん明確めいかくてき定義ていぎあきられつ於文あん前頭まえがしらてきStatus of this Memo)。儘管這份RFC 2152ざいIANA(Internet Assigned Numbers Authority)てきもとしゅうれつ表裏ひょうり引述ためUTF-7,しか而UTF-7本身ほんみなみUnicodeてき標準ひょうじゅんいちそく使ざい目前もくぜん最新さいしんてきUnicode 5.0うら也僅れつUTF-8、UTF-16UTF-32。

如同引言しょひっさげいたてきゆかり於在過去かこSMTPてきつて輸僅のう接受せつじゅ7もとてきもと,而當時とうじUnicodeなみ無法むほう直接ちょくせつ滿足まんぞくすんでゆうてきSMTPでん輸限せいざい這樣背景はいけいUTF-7提出ていしゅつ嚴格げんかくせつUTF-7不能ふのうさんUnicodeしょ定義ていぎてきもとしゅういち,較精かくてきらいせつ,UTF-7提供ていきょうりょういちしゅはたUnicode轉換てんかんため7もとUS-ASCIIもとてき轉換てんかん方式ほうしき

ゆう些字もと本身ほんみ直接ちょくせつ以單いちてきASCII元來がんらいていげんだいいちぐんぐみしょうさく「direct characters」,其中包含ほうがんりょう62數字すうじあずか英文えいぶん字母じぼ,以及包含ほうがんりょうきゅう符號ふごうもと' ( ) , - . / : ?。這些「direct characters」みとめため以很安全あんぜんてき直接ちょくせつざいぶんけんうらていげん。另一個主要的群組稱作「optional direct characters」,其中包含ほうがんりょう所有しょゆうれつしるしてきもと,這些もとざいU+0020~U+007Eあいだじょりょう~ \ +かず空白くうはくもと以外いがい。這些「optional direct characters」てき使用しよう雖可減少げんしょう空間くうかんてき使用しよう也可增加ぞうか人的じんてき閱讀せいただし卻會いんため一些不良設計的郵件閘道而會產生一些錯誤,しるべ必須ひっす使用しようがく外的がいてきとべ脫字だつじもと

空白くうはくもと、Tabもと、以及換ぎょうもと一般雖也可直接是為單一的ASCII元來がんらい使用しようしか而,わか郵件中有ちゅうう使用しようりょうへん碼過てきくしのり必須ひっす特別とくべつ注意ちゅうい這些もと有無うむ使用しようざい其他地方ちほう。而加ごうもと+てきいちしゅへん碼方しきこれ+-

其他てきもとのり必須ひっすへん碼成UTF-16しかこう轉換てんかんためおさむあらためてきBase64。這些かたまりてきひらきあたまかい+符號ふごうらい標示ひょうじ結尾けつびそく以任なん不在ふざいBase64うら定義ていぎてき元來がんらい標示ひょうじわかざいBase64かたまりこう使用しよう-(れん暨減ごう)標示ひょうじため結束けっそくてきばなしのりかい碼器かいしたがえもと繼續けいぞくかい碼,たんのりよう此字もととうBase64てきかたまりてきひらきあたま繼續けいぞくかい碼。

はんれい

[编辑]
  • "Hello, World!"かいへん碼為"Hello, World!"
  • "1 + 1 = 2"かいへん碼為"1 +- 1 +AD0 2"
  • "£1"かいへん碼為"+AKM-1".だいいちもと£(えい鎊的符號ふごうてきUnicode碼為U+00A3(ざいUTF-16そくため00A316),せっちょ轉換てんかんいたりおさむあらためてきBase64格式かくしき,如同下表かひょうひょうちゅうゆう兩個りゃんこもとりょう出來でき以0填補てんぽじょう
16しん 0 0 A 3  
2しん 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 0
索引さくいん 0 10 12
Base64へん A K M

手動しゅどうへん碼與かい碼UTF-7てき演算えんざんほう

[编辑]

へん

[编辑]

くびさき必須ひっすさき決定けってい哪些もとていげんためASCII格式かくしき,哪些もとてい現在げんざいUnicodeかたまり簡單かんたんてきへん碼器假設かせつ所有しょゆうてきもとみな以很安全あんぜんてき直接ちょくせつへん碼。しか而要はたはら本屬ほんぞく於UnicodeかたまりてきもとためASCIIらい以編碼的代價だいか需要じゅようがく外的がいてき2⅔もと

Unicode序列じょれつ一旦いったん認定にんてい,其必須以下面かめんてきほどじょらい以編碼,併以適當てきとうてき符號ふごう標注ひょうちゅう

わが們將使用しよう£† (0x00A3) (0x2020)もと序列じょれつらい作為さくい以下いかてきはんれい

  1. はたもとてきUnicodeすう值 (UTF-16)以しんていげん
    0x00A3 → 0000 0000 1010 0011
    0x2020 → 0010 0000 0010 0000
  2. はたしん序列じょれつ合併がっぺい
    0000 0000 1010 0011 及 0010 0000 0010 0000 → 0000 0000 1010 0011 0010 0000 0010 0000
  3. じゅうしんしょうしん序列じょれつ編組へんそ,以ろくすうためいちくみゆかりひだり開始かいし
    0000 0000 1010 0011 0010 0000 0010 0000 → 000000 001010 001100 100000 001000 00
  4. 如果最後さいごいちくみしょうろくすうのり不足ふそくてきすう以0補足ほそくすう
    0000 0000 1010 0011 0010 0000 0010 0000 → 000000 001010 001100 100000 001000 000000
  5. はたまい一組六位數的數值以對應的Base64碼取だい
    000000 001010 001100 100000 001000 000000 → AKMgIA

かい

[编辑]

くびさき訊息必須ひっす拆分いたじゅん文字もじあずかUnicodeかたまり,緊接ちょUnicodeかたまり必須ひっす以下いかめんてきほどじょらい進行しんこうかいやく使用しよう上面うわつらひっさげいたてきはんれい):

  1. はたまいいちBase64碼以二進位序列來描述,如下:
    AKMgIA → 000000 001010 001100 100000 001000 000000
  2. じゅうしんしょうしん編組へんそ,以使其16すういちくみしたがえひだり開始かいし
    000000 001010 001100 → 0000000010100011 0010000000100000 0000
  3. わかゆう其中いちくみ無法むほう完全かんぜん編成へんせい16すういちくみのりさき排除はいじょ它:
    0000000010100011 0010000000100000
  4. まいいち16もとてきいちくみしん碼為Unicode(UTF-16)てき數字すうじもとなみ且可以被あらためうつしため如下:
    0000 0000 1010 0011 ≡ 0x00A3 ≡ 16310

安全あんぜんせい

[编辑]

UTF-7よし允許いんきょしょうしょうどうらいみなもとてきくししたがえbase64てきしきたいらうつり,而顯どく安全あんぜんせい薄弱はくじゃく現今げんこんてき郵件あずかつて輸方しきよし於都やめ支援しえんUTF-8,UTF-7のりやめ走入はしり歷史れきし而很しょうさい使用しようそく便びん如此,現今げんこんてき應用おうよう軟體仍應さら考量こうりょう支援しえんさら安全あんぜんてきへん碼方しき

しか而,じょりょう郵件でん輸之がい,仍有しょうつて輸是採用さいようUTF-7へん碼來進行しんこうでん輸。こん較著めいてき安全あんぜんほら發生はっせいGoogleてきさがせひろほら[1],該漏ほらはじめいん不當ふとうてき使用しようUTF-7へん碼於もう訊上,とお端的たんてき攻擊こうげきはた可讀かどくあるおさむあらためもうぺーじ內容。

なおかんせい開發かいはつてきUTF-6UTF-5

[编辑]

ゆう些可應用おうよう電信でんしん電報でんぽう領域りょういきてきUTF-6UTF-5提案ていあんやめけい提出ていしゅつ[2][3]しか而,截至2006ねんやめ,這些提案ていあんなお正式せいしきてき制定せいてい出來でき

這些提案ていあんあずかPunycode並無ならびな相關そうかん

參考さんこう

[编辑]
  1. ^ http://www.kb.cert.org/vuls/id/989144页面そん档备份そん互联网档あん), Vulnerability Note VU#989144, Google Mini and Google Search Appliance vulnerable to cross-site scripting
  2. ^ Seng, James, UTF-5, a transformation format of Unicode and ISO 10646页面そん档备份そん互联网档あん), 28 Jan 2000, retrieved 23 Aug 2007
  3. ^ Welter, Mark; Brian W. Spolarich, WALID, Inc. UTF-6 - Yet Another ASCII-Compatible Encoding for IDN. Internet Engineering Task Force (IETF) INTERNET-DRAFT. The Internet Society. 2000-11-16 [2007-08-28]. (原始げんし内容ないようそん于2021-04-28). 

相關そうかん條目じょうもく

[编辑]