(Translated by https://www.hiragana.jp/)
UTF-EBCDIC - Wikipedia コンテンツにスキップ

UTF-EBCDIC

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

UTF-EBCDICUnicode文字もじ表現ひょうげん使つかわれる文字もじコードである。EBCDIC親和しんわせいがあり、メインフレームうえ動作どうさする従来じゅうらいEBCDICアプリケーションがおおきな困難こんなんなしに文字もじ処理しょりできるようにすることを意図いとしている。既存きそんのEBCDICベースのシステムにとっての利点りてんは、既存きそんASCIIベースシステムにとってのUTF-8利点りてん類似るいじする。UTF-EBCDICの詳細しょうさいはUnicode技術ぎじゅつ報告ほうこく #16で定義ていぎされている。

UTF-EBCDICで符号ふごうされたUnicode符号ふごう位置いちならびをるには、UTF-8にもとづいた符号ふごう (UTF-8-Modとばれる仕様しよう) をまず適用てきようする。この符号ふごうがUTF-8とおもことなるてんは、Unicode符号ふごう位置いちU+0080からU+009Fまで (C1制御せいぎょ文字もじ) を、あと対応たいおうするEBCDICの制御せいぎょ文字もじへマップするため1バイトで表現ひょうげんできるようにしているてんである。これを達成たっせいするため、10XXXXXXのわりに101XXXXXがマルチバイトシーケンスにおける後続こうぞくバイトの形式けいしきとして使つかわれる。これは1バイトあたり6ビット保持ほじできるUTF-8とことなり5ビットしか保持ほじできないため、一般いっぱんにUTF-EBCDICはおな入力にゅうりょくデータにたいしてUTF-8よりもおおきな出力しゅつりょく生成せいせいする。

この変換へんかんではデータはまだASCIIベースの形式けいしきであるため、おもて索引さくいんもちいて可逆かぎゃくなバイト単位たんい変換へんかんをこのデータに適用てきようし、可能かのうかぎ通常つうじょうのEBCDICコードページにちかづける。これらの手順てじゅんぎゃくにたどることにより容易よういにUnicode符号ふごう位置いち復元ふくげんできる。

一般いっぱんに、設計せっけい対象たいしょうであったEBCDICベースのメインフレームにおいてさえ、この符号ふごう形式けいしき滅多めった使つかわれない。z/OSのような、IBMせいのEBCDICベースのメインフレームのオペレーティングシステムは、通常つうじょう完全かんぜんなUnicodeサポートにUTF-16使用しようする。たとえば、DB2 UDB、COBOLPL/IJavaおよびIBM XMLツールキットはIBMのメインフレームじょうでUTF-16をサポートする。

参考さんこう資料しりょう

[編集へんしゅう]

用語ようご日本語にほんご表記ひょうき原則げんそくとしてつぎにならった。Unicode Terminology English - Japanese”. Unicode, Inc. 2010ねん1がつ1にち閲覧えつらん

外部がいぶリンク

[編集へんしゅう]