ISO/IEC 2022 (旧称 きゅうしょう ISO 2022 )は、
を規定 きてい するISO 規格 きかく である。JIS の対応 たいおう 規格 きかく はJIS X 0202 「情報 じょうほう 技術 ぎじゅつ -文字 もじ 符号 ふごう の構造 こうぞう 及 およ び拡張 かくちょう 法 ほう 」[1] 。Ecma International の対応 たいおう 規格 きかく はECMA-35 。
ISO/IEC 2022 の符号 ふごう 化 か 方式 ほうしき は、一般 いっぱん に、1文字 もじ に1バイトか2バイト以上 いじょう を使 つか う可変長 かへんちょう の文字 もじ 符号 ふごう 化 か 方式 ほうしき である。いくつかの符号 ふごう 化 か 表現 ひょうげん がISO/IEC 2022の機構 きこう を使 つか っている。たとえば、ISO-2022-JP は日本語 にほんご で広 ひろ く使 つか われている符号 ふごう 化 か 表現 ひょうげん であり、いわゆる「JISコード」というのもこれを指 さ すことが一般 いっぱん 的 てき である。
コンピュータによる文字 もじ 情報処理 じょうほうしょり が可能 かのう になって以来 いらい 、さまざまな言語 げんご のために、コンピュータ上 じょう で文字 もじ データを表現 ひょうげん したいという要求 ようきゅう を満 み たすため、多 おお くの符号 ふごう 化 か 文字 もじ 集合 しゅうごう が作 つく られてきた。複数 ふくすう の文字 もじ 集合 しゅうごう の存在 そんざい は、文字 もじ 集合 しゅうごう があらかじめ当事 とうじ 者 しゃ 間 あいだ で合意 ごうい されていなければ情報 じょうほう 交換 こうかん に支障 ししょう をきたす。また、情報 じょうほう 交換 こうかん 中 ちゅう に複数 ふくすう の文字 もじ 集合 しゅうごう を利用 りよう することも困難 こんなん である。ISO/IEC 2022は、複数 ふくすう の文字 もじ 集合 しゅうごう を単一 たんいつ の文字 もじ 符号 ふごう 化 か 方式 ほうしき の下 した で利用 りよう できるようにするための技術 ぎじゅつ として開発 かいはつ された。
ASCII は7ビットのラテンアルファベット 文字 もじ 集合 しゅうごう であり、最大 さいだい 94文字 もじ の図形 ずけい 文字 もじ (空白 くうはく 文字 もじ を除 のぞ く) しか収容 しゅうよう できない。ISO/IEC 646 (1967年 ねん 初版 しょはん )[2] では、図形 ずけい 文字 もじ の収容 しゅうよう 領域 りょういき を ASCII に倣 なら いつつ、12個 こ の符号 ふごう 位置 いち を各国 かっこく の国内 こくない 使用 しよう 目的 もくてき のために置 お き換 か えてよいこととし、さらにレパートリ として国 くに 別 べつ の文字 もじ 集合 しゅうごう を定義 ていぎ するという方法 ほうほう をとった。
ISO/IEC 2022 (1973年 ねん 初版 しょはん )[3] は、ISO/IEC 646 に準拠 じゅんきょ した複数 ふくすう の符号 ふごう 表 ひょう を切 き り替 か えて多言 たげん 語 ご の処理 しょり を実現 じつげん することを目的 もくてき に制定 せいてい された。しかし、ISO/IEC 646 の方式 ほうしき では、ラテンアルファベットの範囲 はんい に限 かぎ ってさえも、多数 たすう のダイアクリティカルマーク 付 つ き文字 もじ や、言語 げんご ごとに必要 ひつよう とされる記号 きごう 類 るい などを十分 じゅうぶん に収容 しゅうよう することができなかった。このため、ISO/IEC 646 と互換 ごかん 性 せい を保 たも ちつつ8ビット符号 ふごう を採用 さいよう した ISO/IEC 4873 (1979年 ねん 初版 しょはん )[4] が制定 せいてい された。特 とく にヨーロッパ では1980年代 ねんだい に入 はい って多言 たげん 語 ご のテキストデータを共通 きょうつう の仕様 しよう の下 した に処理 しょり できるようにしたいという要求 ようきゅう が高 たか まっており[5] 、1987年 ねん からは ISO/IEC 4873 に対応 たいおう した ISO/IEC 8859シリーズ が制定 せいてい されはじめた。ISO/IEC 8859シリーズでは、新 あら たに96文字 もじ の図形 ずけい 文字 もじ を収容 しゅうよう 可能 かのう にし、さらにレパートリとして言語 げんご 別 べつ の文字 もじ 集合 しゅうごう を定義 ていぎ するという方法 ほうほう をとった。
また、ギリシア語 ご 、ロシア語 ご 、アラビア語 ご 、もしくはヘブライ語 ご のような、ラテンアルファベット に基 もと づかない多 おお くの言語 げんご の文字 もじ も、歴史 れきし 的 てき に ISO/IEC 4873 に準拠 じゅんきょ した俗 ぞく に言 い う「拡張 かくちょう ASCII 」を用 もち いてコンピュータ上 じょう で表現 ひょうげん されてきたものが多 おお い (一部 いちぶ は後 のち に ISO/IEC 8859 シリーズにも規定 きてい されたほか、多 おお くの国 くに ・地域 ちいき の符号 ふごう 化 か 文字 もじ 集合 しゅうごう の規格 きかく が ISO/IEC 4873 に準拠 じゅんきょ している)。さらに、東 ひがし アジア言語 げんご 、とくに中国 ちゅうごく 語 ご 、日本語 にほんご 、および韓国 かんこく 語 ご の表記 ひょうき は、8ビット の1バイト で表現 ひょうげん 可能 かのう な範囲 はんい をはるかに超 こ えた数 かず の文字 もじ を使 つか い、言語 げんご 別 べつ の2バイト文字 もじ 集合 しゅうごう によって初 はじ めてコンピュータ上 じょう で表現 ひょうげん された。ISO/IEC 2022 は、これら複数 ふくすう の文字 もじ 集合 しゅうごう を単一 たんいつ の符号 ふごう 化 か 方式 ほうしき の下 した に扱 あつか うことを可能 かのう にしている。
ISO/IEC 2022に基 もと づく符号 ふごう 化 か 表現 ひょうげん は現在 げんざい も広 ひろ く使 つか われている。たとえば日本語 にほんご 電子 でんし メール用 よう のISO-2022-JP や、UNIX 環境 かんきょう で使 つか われるEUC-JP 、中国 ちゅうごく のGB 2312 ことEUC-CN、韓国 かんこく のEUC-KR などがそうである。ISO/IEC 8859シリーズもISO/IEC 2022の構造 こうぞう にしたがっている。一方 いっぽう で、この規格 きかく に則 のっと らない符号 ふごう 化 か 方式 ほうしき 、たとえばShift_JIS や台湾 たいわん のBig5 などもまた広 ひろ く使 つか われている。
第 だい 2次 じ 規格 きかく 以降 いこう の主 おも な改正 かいせい 点 てん [ 編集 へんしゅう ]
第 だい 2次 じ 規格 きかく 以降 いこう の主 おも な改正 かいせい 点 てん には次 つぎ のようなものがある。なお、用語 ようご については当 とう 項目 こうもく でこの後 のち 解説 かいせつ する。
第 だい 2次 じ 規格 きかく
8ビット符号 ふごう に対応 たいおう した。
バッファG2およびG3を新設 しんせつ した。
マルチバイト文字 もじ 集合 しゅうごう に対応 たいおう した。
第 だい 3次 じ 規格 きかく
96文字 もじ 集合 しゅうごう および96n 文字 もじ 集合 しゅうごう に対応 たいおう した。
(JISのみ)この版 はん からJIS X 0201を拡張 かくちょう する規格 きかく からISO/IEC 646を拡張 かくちょう する規格 きかく になったため、国際 こくさい 一致 いっち 規格 きかく になった。
第 だい 4次 じ 規格 きかく
7ビット符号 ふごう 中心 ちゅうしん の記述 きじゅつ から8ビット符号 ふごう 中心 ちゅうしん の記述 きじゅつ に改 あらた められた。
#表 ひょう 1 に、各 かく 版 はん ごとの規格 きかく 番号 ばんごう 、制定 せいてい 日 び などを示 しめ す。
表 ひょう 1 ISO/IEC 2022 の各 かく 版 はん ごとの規格 きかく 番号 ばんごう ・制定 せいてい 日 び 等 とう
版 はん
ISO規格 きかく 番号 ばんごう
ISO制定 せいてい ・改正 かいせい 日 び
JIS番号 ばんごう
JIS制定 せいてい ・改正 かいせい 日 び
第 だい 1次 じ 規格 きかく
ISO 2022:1973
1973年 ねん 5月 がつ 制定 せいてい
JIS C 6228:1975
1975年 ねん 3月 がつ 1日 にち 制定 せいてい
第 だい 2次 じ 規格 きかく
ISO 2022:1982
1982年 ねん 12月改正 かいせい
JIS C 6228:1984※
1984年 ねん 11月1日 にち 改正 かいせい
第 だい 3次 じ 規格 きかく
ISO 2022:1986
1986年 ねん 5月 がつ 改正 かいせい
JIS X 0202:1991
1991年 ねん 1月 がつ 1日 にち 改正 かいせい
第 だい 4次 じ 規格 きかく
ISO/IEC 2022:1994
1994年 ねん 12月改正 かいせい
JIS X 0202:1998
1998年 ねん 1月 がつ 20日 はつか 改正 かいせい
※ 1987年 ねん 3月 がつ 1日 にち 部門 ぶもん X(情報処理 じょうほうしょり )の新設 しんせつ に伴 ともな いJIS X 0202:1984 と改称 かいしょう された。
ISO/IEC 2022は当初 とうしょ ISO/IEC 646 に基 もと づいた7ビット符号 ふごう であったので、多 おお くのISO/IEC 646の特性 とくせい を持 も ち合 あ わせている。7ビット符号 ふごう では、各 かく バイトの最 さい 上位 じょうい 桁 けた ビット は使 つか われない。これにより、7ビットの伝送 でんそう 路 ろ を通 とお してISO/IEC 2022を伝送 でんそう することは(ISO/IEC 646と同様 どうよう )容易 ようい である。8ビット符号 ふごう では、最 さい 上位 じょうい 桁 けた ビットを GL領域 りょういき とGR領域 りょういき (後述 こうじゅつ ) の区別 くべつ に用 もち いるが、文字 もじ 集合 しゅうごう 中 ちゅう の文字 もじ を区別 くべつ するのには用 もち いない。この特性 とくせい はEUC 符号 ふごう 化 か の基本 きほん 原理 げんり にも利用 りよう されている。
ISO/IEC 2022の符号 ふごう 表 ひょう は、表示 ひょうじ や印字 いんじ される文字 もじ (図形 ずけい 文字 もじ ) の領域 りょういき と、制御 せいぎょ 機能 きのう に使 つか う文字 もじ (制御 せいぎょ 文字 もじ ) の領域 りょういき に分 わ けられている。7ビット符号 ふごう は、32個 こ の制御 せいぎょ 文字 もじ 基本 きほん 集合 しゅうごう の領域 りょういき (C0) と、94個 こ または96個 こ の図形 ずけい 文字 もじ 集合 しゅうごう の領域 りょういき (GL領域 りょういき ) を持 も つ。8ビット符号 ふごう は、これに加 くわ えて32個 こ の制御 せいぎょ 文字 もじ 補助 ほじょ 集合 しゅうごう の領域 りょういき (C1) と、94個 こ または96個 こ の図形 ずけい 文字 もじ 集合 しゅうごう の領域 りょういき (GR領域 りょういき ) を持 も つ。#図 ず 1 に、7ビットと8ビットの符号 ふごう 表 ひょう の構造 こうぞう を示 しめ す。符号 ふごう 表 ひょう 上 じょう の文字 もじ の位置 いち は、表 ひょう の行 くだり および列 れつ で表 あらわ す。たとえばASCIIの「Z」という文字 もじ は行列 ぎょうれつ で 05/10 にあたり、符号 ふごう のバイトの値 ね としては16進数 しんすう で 5A (10進数 しんすう で 90) となる。
複数 ふくすう バイトの文字 もじ 集合 しゅうごう では、複数 ふくすう のバイトで1文字 もじ を符号 ふごう 化 か する。たとえば94n 文字 もじ 集合 しゅうごう では、2バイトを使 つか って8836個 こ (94×94)までの文字 もじ を表現 ひょうげん できる。そして、3バイトを使 つか って830584個 こ (94×94×94)までの文字 もじ を表現 ひょうげん できる。2バイト文字 もじ 集合 しゅうごう では、各 かく 文字 もじ の符号 ふごう 位置 いち は区点 くてん (3バイト文字 もじ 集合 しゅうごう の場合 ばあい は面 めん 区点 くてん ) で(面 めん および)区 く および区内 くない の位置 いち を指定 してい する。つまり、94×94文字 もじ 集合 しゅうごう の場合 ばあい 、区 く および点 てん のそれぞれが 1 から 94 の範囲 はんい をとるので、それぞれを1バイトずつGL領域 りょういき の 02/01 から 07/14 (GR領域 りょういき ならば 10/01 から 15/14) に対応 たいおう させて2バイトとする。たとえば、JIS X 0208 の「字 じ 」は 27区 く 90点 てん (27-90) なので、GL領域 りょういき では 03/11 07/10、GR領域 りょういき では 11/11 15/10 と表現 ひょうげん される。
図 ず 1 ISO/IEC 2022の符号 ふごう 表 ひょう の構造 こうぞう
(a) 7ビット符号 ふごう
行 ぎょう \列 れつ
00
01
02
03
04
05
06
07
08
09
00
[b]
01
02
03
04
05
06
07
C0
GL
C1[d]
08
09
10
11
[a]
12
13
14
15
[c]
(b) 8ビット符号 ふごう
行 ぎょう \列 れつ
00
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
00
[b]
[e]
01
02
03
04
05
06
07
C0
GL
C1
GR
08
09
10
11
[a]
12
13
14
15
[c]
[e]
JIS X 0202:1998 を元 もと に作成 さくせい 。
符号 ふごう 表 ひょう 上 じょう の文字 もじ の位置 いち を行 くだり と列 れつ で示 しめ す。たとえば 01/11 (ESCAPE) は16進数 しんすう 値 ち では 1B にあたる。
a 常 つね に ESCAPE 制御 せいぎょ 文字 もじ 。
b GL領域 りょういき に94文字 もじ 集合 しゅうごう が呼 よ び出 だ されているときは SPACE (空白 くうはく 文字 もじ ) となる。
c GL領域 りょういき に94文字 もじ 集合 しゅうごう が呼 よ び出 だ されているときは DELETE 制御 せいぎょ 文字 もじ となる。
d 7ビット符号 ふごう では、C1制御 せいぎょ 文字 もじ は実際 じっさい には使用 しよう しない。代替 だいたい のエスケープシーケンスで表 あらわ す。
e GR領域 りょういき に94文字 もじ 集合 しゅうごう が呼 よ び出 だ されているときは、この2つの行列 ぎょうれつ は使用 しよう しない。
表 ひょう 2 ISO/IEC 2022 の制御 せいぎょ 機能 きのう (抜粋 ばっすい )
制御 せいぎょ 文字 もじ またはエスケープシーケンス
説明 せつめい
略号 りゃくごう
指示 しじ
01/11 02/01 I Ft
C0への制御 せいぎょ 機能 きのう 集合 しゅうごう の指示 しじ (呼 よ び出 だ しを含 ふく む)
CZD
01/11 02/02 I Ft
C1への制御 せいぎょ 機能 きのう 集合 しゅうごう の指示 しじ (呼 よ び出 だ しを含 ふく む)
C1D
01/11 02/08 I Ft
G0への94文字 もじ 集合 しゅうごう の指示 しじ
GZD4
01/11 02/09 I Ft
G1への94文字 もじ 集合 しゅうごう の指示 しじ
G1D4
01/11 02/10 I Ft
G2への94文字 もじ 集合 しゅうごう の指示 しじ
G2D4
01/11 02/11 I Ft
G3への94文字 もじ 集合 しゅうごう の指示 しじ
G3D4
01/11 02/13 I Ft
G1への96文字 もじ 集合 しゅうごう の指示 しじ
G1D6
01/11 02/14 I Ft
G2への96文字 もじ 集合 しゅうごう の指示 しじ
G2D6
01/11 02/15 I Ft
G3への96文字 もじ 集合 しゅうごう の指示 しじ
G3D6
01/11 02/04 02/08 Ft [a]
G0への94n 文字 もじ 集合 しゅうごう の指示 しじ
GZDM4
01/11 02/04 02/09 Ft
G1への94n 文字 もじ 集合 しゅうごう の指示 しじ
G1DM4
01/11 02/04 02/10 Ft
G2への94n 文字 もじ 集合 しゅうごう の指示 しじ
G2DM4
01/11 02/04 02/11 Ft
G3への94n 文字 もじ 集合 しゅうごう の指示 しじ
G3DM4
01/11 02/04 02/13 Ft
G1への96n 文字 もじ 集合 しゅうごう の指示 しじ
G1DM6
01/11 02/04 02/14 Ft
G2への96n 文字 もじ 集合 しゅうごう の指示 しじ
G2DM6
01/11 02/04 02/15 Ft
G3への96n 文字 もじ 集合 しゅうごう の指示 しじ
G3DM6
01/11 02/05 I Ft
他 た の符号 ふごう 化 か システムの指示 しじ
DOCS
01/11 02/06 F [b]
文字 もじ 集合 しゅうごう の改訂 かいてい 番号 ばんごう の識別 しきべつ
IRR
呼 よ び出 だ し (シフト)
00/15
GL領域 りょういき へのG0の呼 よ び出 だ し[c]
SI
00/15
GL領域 りょういき へのG0の呼 よ び出 だ し[d]
LS0
00/14
GL領域 りょういき へのG1の呼 よ び出 だ し[c]
SO
00/14
GL領域 りょういき へのG1の呼 よ び出 だ し[d]
LS1
01/11 06/14
GL領域 りょういき へのG2の呼 よ び出 だ し
LS2
01/11 06/15
GL領域 りょういき へのG3の呼 よ び出 だ し
LS3
01/11 07/14
GR領域 りょういき へのG1の呼 よ び出 だ し[d]
LS1R
01/11 07/13
GR領域 りょういき へのG2の呼 よ び出 だ し[d]
LS2R
01/11 07/12
GR領域 りょういき へのG3の呼 よ び出 だ し[d]
LS3R
01/11 04/14 または 08/14
GL領域 りょういき またはGR領域 りょういき へのG2の1文字 もじ 限 かぎ りの呼 よ び出 だ し[e] (シングルシフト)
SS2
01/11 04/15 または 08/15
GL領域 りょういき またはGR領域 りょういき へのG3の1文字 もじ 限 かぎ りの呼 よ び出 だ し[e] (シングルシフト)
SS3
アナウンス
01/11 02/00 F [f]
アナウンス機能 きのう
ACS
JIS X 0202:1998 および JIS X 0211-1994 を元 もと に作成 さくせい 。
符号 ふごう 表 ひょう 上 じょう の文字 もじ の位置 いち を行 くだり と列 れつ で示 しめ す。たとえば 01/11 (ESCAPE) は16進数 しんすう 値 ち では 1B にあたる。また、Ft または I Ft は、ISOの文字 もじ 集合 しゅうごう 国際 こくさい 登録 とうろく 簿 ぼ への登録 とうろく によって割 わ り当 あ てられたエスケープシーケンスの終端 しゅうたん バイト (および第 だい 2中間 ちゅうかん バイト) を表 あらわ す。
a ただし、Ft バイト が 04/00、04/01、04/02 の場合 ばあい は 02/08 を省略 しょうりゃく する。これは具体 ぐたい 的 てき には、JISC C 6226-1978 (JIS X 0208 の第 だい 一 いち 次 じ 規格 きかく )、GB 2312-80、JIS C 6226-1983 (同 どう 第 だい 二 に 次 じ 規格 きかく ) の文字 もじ 集合 しゅうごう を指示 しじ する場合 ばあい である。
b F バイトで、直後 ちょくご の指示 しじ 機能 きのう で指示 しじ される文字 もじ 集合 しゅうごう の改訂 かいてい 番号 ばんごう を識別 しきべつ する。
c 7ビット符号 ふごう でのみ用 もち いる。
d 8ビット符号 ふごう でのみ用 もち いる。
e 7ビット符号 ふごう ではエスケープシーケンスを使 つか う。8ビット符号 ふごう ではC1制御 せいぎょ 文字 もじ を使 つか うこともできる。
f F バイトによって、利用 りよう する機能 きのう を指定 してい する。
複数 ふくすう の文字 もじ 集合 しゅうごう を表現 ひょうげん するために、ISO/IEC 2022の文字 もじ 符号 ふごう 化 か 方式 ほうしき は、符号 ふごう の性質 せいしつ や扱 あつか う文字 もじ 集合 しゅうごう を指定 してい するための制御 せいぎょ 機能 きのう を含 ふく んでいる。制御 せいぎょ 機能 きのう の表現 ひょうげん には、7ビット符号 ふごう ではC0制御 せいぎょ 文字 もじ のほか、ESCAPE制御 せいぎょ 文字 もじ (01/11。十 じゅう 六 ろく 進数 しんすう の1B、十 じゅう 進数 しんすう の27)で始 はじ まる2バイトないし4バイトからなるエスケープシーケンス を用 もち いる[6] 。8ビット符号 ふごう ではさらに、C1 制御 せいぎょ 文字 もじ も用 もち いる。この文字 もじ 符号 ふごう 化 か 方式 ほうしき では、データの正 ただ しい解釈 かいしゃく が最後 さいご に出現 しゅつげん した制御 せいぎょ 機能 きのう に依存 いぞん するため、データを先頭 せんとう から順番 じゅんばん に処理 しょり する必要 ひつよう がある。#表 ひょう 2 に、ISO/IEC 2022 の制御 せいぎょ 機能 きのう の一部 いちぶ を示 しめ す。
ある文字 もじ 集合 しゅうごう を符号 ふごう 表 ひょう 上 じょう で使 つか うには、一般 いっぱん に指示 しじ (英 えい : designate ) と呼 よ び出 だ し (英 えい : invoke ) という2段階 だんかい の手続 てつづ きを必要 ひつよう とする。
ISO/IEC 2022 は、符号 ふごう 表 ひょう 上 じょう の4つの領域 りょういき C0、GL、C1、GRとは別 べつ に、仮想 かそう 的 てき なバッファをもっている。G0、G1、G2、G3という4つのバッファがある。
まず、指示 しじ のエスケープシーケンスによって、使 つか おうとしている文字 もじ 集合 しゅうごう を、4つのバッファのいずれかに対応付 たいおうづ ける。
指示 しじ のエスケープシーケンスは、どの文字 もじ 集合 しゅうごう を使 つか おうとしているか宣言 せんげん するのみならず、これらの文字 もじ 集合 しゅうごう の特性 とくせい をも知 し らせる。扱 あつか おうとしている文字 もじ 集合 しゅうごう が94文字 もじ 、96文字 もじ 、8836(94×94)文字 もじ 、830584(94×94×94)文字 もじ 、もしくは他 た のサイズのいずれであるかを伝 つた える。指示 しじ していない文字 もじ 集合 しゅうごう を使 つか うことはできない。また、5つ以上 いじょう の文字 もじ 集合 しゅうごう を一 いち 度 ど に指示 しじ しておくこともできない。
つぎに、呼 よ び出 だ し (シフト) の制御 せいぎょ 機能 きのう によって、G0、G1、G2、G3のいずれかを、符号 ふごう 表 ひょう 上 じょう のGL領域 りょういき かGR領域 りょういき に対応付 たいおうづ ける。指示 しじ した文字 もじ 集合 しゅうごう を呼 よ び出 だ ししてはじめて、その文字 もじ 集合 しゅうごう を符号 ふごう として使 つか うことができるようになる。7ビット符号 ふごう では2つ以上 いじょう 、8ビット符号 ふごう では3つ以上 いじょう のバッファを一 いち 度 ど に呼 よ び出 だ しておくことはできない。
呼 よ び出 だ しには、ロッキングシフト とシングルシフト がある。ロッキングシフトでは、いったん呼 よ び出 だ しされたものは、別 べつ の呼 よ び出 だ しがあるまで使 つか いつづけることができる[7] 。シングルシフトでは、呼 よ び出 だ しされたものは直後 ちょくご の1文字 もじ (シングルバイトの文字 もじ 集合 しゅうごう であれば1バイト、マルチバイトの文字 もじ 集合 しゅうごう であればそれぞれのバイト数 すう 分 ふん ) だけ使 つか え、そのあとは呼 よ び出 だ し前 まえ の状態 じょうたい に戻 もど る[8] 。
実際 じっさい には、文脈 ぶんみゃく や規約 きやく が特定 とくてい の文字 もじ 集合 しゅうごう を使 つか うよう指定 してい していれば、符号 ふごう 化 か の仕様 しよう を指定 してい する制御 せいぎょ 機能 きのう (アナウンス機能 きのう ) や初期 しょき の文字 もじ 集合 しゅうごう を指示 しじ する制御 せいぎょ 機能 きのう は省略 しょうりゃく することができる。ISO-2022-CNを定義 ていぎ しているRFC 1922 を例 れい に取 と ると、呼 よ び出 だ しにSIとSOの制御 せいぎょ 文字 もじ を使用 しよう するが、この仕様 しよう を宣言 せんげん するアナウンス機能 きのう のエスケープシーケンスを省略 しょうりゃく している。また、初期 しょき 状態 じょうたい ではG0にUS-ASCII 、G1にGB2312-80 を指示 しじ し、G0をGL領域 りょういき に呼 よ び出 だ しているが、指示 しじ のエスケープシーケンスも省略 しょうりゃく している。
ISO/IEC 2022は具体 ぐたい 的 てき な符号 ふごう 化 か 文字 もじ 集合 しゅうごう とは切 き り離 はな して規定 きてい されているため、実際 じっさい にこの規格 きかく を適用 てきよう するにあたってはエスケープシーケンスの終端 しゅうたん 文字 もじ と符号 ふごう 化 か 文字 もじ 集合 しゅうごう などとの具体 ぐたい 的 てき な対応 たいおう 関係 かんけい を定 さだ める必要 ひつよう があり、そのために符号 ふごう 化 か 文字 もじ 集合 しゅうごう のISO国際 こくさい 登録 とうろく 簿 ぼ が存在 そんざい する。これはエスケープシーケンスの終端 しゅうたん 文字 もじ についてそれぞれどの文字 もじ がどの符号 ふごう 化 か 文字 もじ 集合 しゅうごう などに対応 たいおう しているのかを定 さだ めたものである。符号 ふごう 化 か 文字 もじ 集合 しゅうごう のISO国際 こくさい 登録 とうろく 簿 ぼ と登録 とうろく 方法 ほうほう はISO/IEC 2375 Data Processing - Procedure for Registration of Escape Sequences (情報 じょうほう 技術 ぎじゅつ -エスケープシーケンス及 およ び符号 ふごう 化 か 文字 もじ 集合 しゅうごう の登録 とうろく 手順 てじゅん ) に規定 きてい されている。
ISO国際 こくさい 登録 とうろく 簿 ぼ への登録 とうろく 申請 しんせい を行 おこな うことが出来 でき るのは次 つぎ の者 もの に限定 げんてい される。
ISO/IEC(ISO/IEC JTC 1結成 けっせい 以前 いぜん はISO)の技術 ぎじゅつ 委員 いいん 会 かい (TC)または小 しょう 委員 いいん 会 かい (SC)
ISO TC 46/SC 4、ISO TC 97/SC 2、ISO TC 97/SC 21など
符号 ふごう 拡張 かくちょう またはエスケープシーケンスの使用 しよう 法 ほう を検討 けんとう するISO/IEC JTC/SC2(ISO/IEC JTC 1結成 けっせい 以前 いぜん はISO TC 97/SC 2)内 ない の作業 さぎょう グループ(WG)
ISO/IEC JTC 1/SC 2/WG 2、ISO/IEC JTC 1/SC 2/WG 3、ISO TC 97/SC 2/WG 4、ISO TC 97/SC 2/WG 7など。
ISO/IEC(ISO/IEC JTC 1結成 けっせい 以前 いぜん はISO)の会員 かいいん 団体 だんたい (各国 かっこく で1団体 だんたい ずつと決 き められている。)
米国 べいこく 規格 きかく 協会 きょうかい (ANSI )、日本 にっぽん 工業 こうぎょう 標準 ひょうじゅん 調査 ちょうさ 会 かい (JISC)、英国 えいこく 規格 きかく 協会 きょうかい (BSI)、ドイツ規格 きかく 協会 きょうかい (DIN )など。
ISO/IECの技術 ぎじゅつ 委員 いいん 会 かい または小 しょう 委員 いいん 会 かい と関連 かんれん のある国際 こくさい 機関 きかん
ヨーロッパ電子 でんし 計算 けいさん 機 き 工業 こうぎょう 会 かい (ECMA )、国際電気 こくさいでんき 通信 つうしん 連合 れんごう 電気 でんき 通信 つうしん 標準 ひょうじゅん 化 か 部門 ぶもん (ITU-T :旧 きゅう CCITT)など。
登録 とうろく の手続 てつづ きと国際 こくさい 登録 とうろく 簿 ぼ の維持 いじ 管理 かんり は登録 とうろく 事務 じむ 局 きょく (Registration Authority)がおこなうことになっている。現在 げんざい 、その事務 じむ 局 きょく は日本 にっぽん の情報処理 じょうほうしょり 学会 がっかい 情報 じょうほう 規格 きかく 調査 ちょうさ 会 かい (IPSJ/ITSCJ) が引 ひ き受 う けている(符号 ふごう 化 か 文字 もじ 集合 しゅうごう の国際 こくさい 登録 とうろく 簿 ぼ )。かつてはECMA(欧州 おうしゅう 計算 けいさん 機 き 製造 せいぞう 業者 ぎょうしゃ 協会 きょうかい 、現 げん Ecma International )が登録 とうろく 事務 じむ 局 きょく を引 ひ き受 う けていた[9] 。
終端 しゅうたん 文字 もじ は登録 とうろく 順 じゅん に16進数 しんすう の「4/0」から順 じゅん に割 わ り振 ふ っていくことになっている。終端 しゅうたん 文字 もじ の割 わ り振 ふ りは区分 くぶん ごとに行 おこな われることになっている。(そのため同 おな じ終端 しゅうたん 文字 もじ でも、どの区分 くぶん の終端 しゅうたん 文字 もじ であるのかによって指 さ し示 しめ す符号 ふごう 系 けい は異 こと なり、そのエスケープシーケンスがどの区分 くぶん の符号 ふごう 系 けい を指 さ し示 しめ すのかは中間 ちゅうかん 文字 もじ が何 なに であるのかによって識別 しきべつ できる。)
登録 とうろく 数 すう の最 もっと も多 おお い94文字 もじ 集合 しゅうごう については、当初 とうしょ の規格 きかく で用意 ようい されていた利用 りよう 可能 かのう な終端 しゅうたん 文字 もじ を使 つか い切 き ってしまったため、第 だい 三 さん 次 じ 規格 きかく において94文字 もじ 集合 しゅうごう を指 さ し示 しめ す新 あら たな中 なか 間 あいだ 文字 もじ を設 もう けてより多 おお くの94文字 もじ 集合 しゅうごう が登録 とうろく 出来 でき るように規定 きてい が改正 かいせい された。
なお、一 ひと つの規格 きかく で定 さだ められた符号 ふごう 系 けい であっても、文字 もじ の追加 ついか 変更 へんこう を含 ふく む改正 かいせい が行 おこな われたときには異 こと なる符号 ふごう 系 けい として扱 あつか われることになっており、そのために改 あらた めて登録 とうろく が行 おこな われ、新 あら たな登録 とうろく 番号 ばんごう と終端 しゅうたん 符号 ふごう が付与 ふよ されることになる。例 たと えばJIS X 0208は1978年 ねん 版 はん 、1983年 ねん 版 はん 、1990年 ねん 版 はん のそれぞれが、JIS X 0213 は2000年 ねん 版 はん と2004年 ねん 版 はん がそれぞれ異 こと なる符号 ふごう 系 けい として登録 とうろく されている。
7ビット符号 ふごう によるマルチバイト用 よう のキャラクタセット[ 編集 へんしゅう ]
ISO/IEC 2022の機構 きこう を使 つか う7ビット符号 ふごう のキャラクタセット には以下 いか のものが含 ふく まれる。次 つぎ のような特徴 とくちょう を持 も つ。
アナウンス機能 きのう のエスケープシーケンスは省略 しょうりゃく する。
7ビット符号 ふごう なので、GR領域 りょういき は使 つか わず、C1制御 せいぎょ 文字 もじ はエスケープシーケンスで表 あらわ す。
最初 さいしょ は、G0にASCII を指示 しじ し、G0をGL領域 りょういき に呼 よ び出 だ した状態 じょうたい で始 はじ まる (このための制御 せいぎょ 機能 きのう は省略 しょうりゃく する)。つまり、最初 さいしょ はUS-ASCIIで始 はじ まる。
行 くだり の終 お わりではASCIIに戻 もど さなければならない[10] 。
#表 ひょう 3 に、これらのキャラクタセットで用 もち いる符号 ふごう 化 か 文字 もじ 集合 しゅうごう と、その選択 せんたく のための制御 せいぎょ 機能 きのう を示 しめ す。
ISO-2022-JP での「日本語 にほんご 版 ばん Wikipedia」という文字 もじ 列 れつ の符号 ふごう 化 か を例 れい に説明 せつめい する (#表 ひょう 3 も参照 さんしょう )。
図 ず 2 ISO-2022-JPによる「日本語 にほんご 版 ばん Wikipedia」の符号 ふごう 化 か
文字 もじ
日 ひ
本 ほん
語 かたり
版 はん
W
i
k
i
p
e
d
i
a
機能 きのう 区点 くてん 行列 ぎょうれつ
JIS X 0208 を指示 しじ
38-92
43-60
24-76
40-39
ASCII を指示 しじ
05/07
06/09
06/11
06/09
07/00
06/05
06/04
06/09
06/01
符号 ふごう
01/11
02/04
04/02
04/06
07/12
04/11
05/12
03/08
06/12
04/08
04/07
01/11
02/08
04/02
05/07
06/09
06/11
06/09
07/00
06/05
06/04
06/09
06/01
ESC
$
B
F
|
K
\
8
l
H
G
ESC
(
B
W
i
k
i
p
e
d
i
a
上 うえ 図 ず で、上段 じょうだん が符号 ふごう 化 か したい文字 もじ 列 れつ である。「日本語 にほんご 版 ばん 」は JIS X 0208 に含 ふく まれる文字 もじ の列 れつ 、「Wikipedia」はASCIIに含 ふく まれる文字 もじ の列 れつ である。また、最初 さいしょ はASCIIで始 はじ まる。したがって、「日本語 にほんご 版 ばん 」の直前 ちょくぜん と「Wikipedia」の直前 ちょくぜん に文字 もじ 集合 しゅうごう を指示 しじ するエスケープシーケンスが必要 ひつよう になる (ISO-2022-JP では指示 しじ が呼 よ び出 だ しを兼 か ねるので、呼 よ び出 だ しの制御 せいぎょ 機能 きのう は必要 ひつよう ない)。マルチバイト文字 もじ は区点 くてん で、シングルバイト文字 もじ は行列 ぎょうれつ で表 あらわ すと、中段 ちゅうだん のようになる。区点 くてん を2バイトずつで表 あらわ し、全体 ぜんたい を7ビット符号 ふごう で表 あらわ すと、下段 げだん のように符号 ふごう 化 か される。
表 ひょう 3 7ビット符号 ふごう のマルチバイト用 よう キャラクタセットでの文字 もじ 集合 しゅうごう の選択 せんたく
キャラクタセット
対象 たいしょう 言語 げんご
文字 もじ 集合 しゅうごう
文字 もじ 集合 しゅうごう 選択 せんたく のための制御 せいぎょ 機能 きのう
指示 しじ
呼 よ び出 だ し
ISO-2022-JP
日本語 にほんご
ASCII
G0
01/11 02/08 04/02 ESC ( B
指示 しじ が兼 か ねる (ロッキングシフト)
JIS C 6220 -1976のラテン文字 もじ 集合 しゅうごう (ISO/IEC 646の日本 にっぽん 版 ばん )
01/11 02/08 04/10 ESC ( J
JIS C 6226 -1978
01/11 02/04 04/00 ESC $ @
JIS X 0208 -1983 または JIS X 0208:1990
01/11 02/04 04/02 ESC $ B
ISO-2022-JP-1
日本語 にほんご
ISO-2022-JP に以下 いか を追加 ついか
JIS X 0212 -1990
G0
01/11 02/04 02/08 04/04 ESC $ ( D
指示 しじ が兼 か ねる (ロッキングシフト)
ISO-2022-JP-2
多言 たげん 語 ご
ISO-2022-JP-1 に以下 いか を追加 ついか
GB 2312 -80
G0
01/11 02/04 04/01 ESC $ A
指示 しじ が兼 か ねる (ロッキングシフト)
KS X 1001 -1992
01/11 02/04 02/08 04/03 ESC $ ( C
ISO/IEC 8859-1 の右 みぎ 半分 はんぶん
G2
01/11 02/14 04/01 ESC . A
01/11 04/14 ESC N (シングルシフト)
ISO/IEC 8859-7 の右 みぎ 半分 はんぶん
01/11 02/14 04/06 ESC . F
ISO-2022-JP-3
日本語 にほんご
ISO-2022-JP に以下 いか を追加 ついか
JIS X 0213 :2000の1面 めん
G0
01/11 02/04 02/08 04/15 ESC $ ( O
指示 しじ が兼 か ねる (ロッキングシフト)
JIS X 0213:2000の2面 めん
01/11 02/04 02/08 04/16 ESC $ ( P
ISO-2022-JP-2004
日本語 にほんご
ISO-2022-JP-3 に以下 いか を追加 ついか
JIS X 0213:2004の1面 めん
G0
01/11 02/04 02/08 04/17 ESC $ ( Q
指示 しじ が兼 か ねる (ロッキングシフト)
ISO-2022-KR
韓国 かんこく 語 ご
ASCII
G0
初 はじ めから指示 しじ したまま
00/15 SI (ロッキングシフト)
KS X 1001 -1992
G1
01/11 02/04 02/09 04/03 ESC $ ) C ただし、行 くだり の初 はじ めに置 お く
00/14 SO (ロッキングシフト)
ISO-2022-CN
中国 ちゅうごく 語 ご
ASCII
G0
初 はじ めから指示 しじ したまま
00/15 SI (ロッキングシフト)
GB 2312 -80
G1
01/11 02/04 02/09 04/01 ESC $ ) A
00/14 SO (ロッキングシフト)
CNS 11643 -1992の1面 めん
01/11 02/04 02/09 04/07 ESC $ ) G
CNS 11643-1992の2面 めん
G2
01/11 02/04 02/10 04/08 ESC $ * H
01/11 04/14 ESC N (シングルシフト)
ISO-2022-CN-EXT
中国 ちゅうごく 語 ご
ISO-2022-CN に以下 いか を追加 ついか
ISO-IR-165
G1
01/11 02/04 02/09 04/05 ESC $ ) E
00/14 SO (ロッキングシフト)
GB 12345 -90
未定 みてい
GB 7589 -87
G2
未定 みてい
01/11 04/14 ESC N (シングルシフト)
GB 13131 -91
未定 みてい
GB 7590 -87
G3
未定 みてい
01/11 04/15 ESC O (シングルシフト)
GB 13132 -91
未定 みてい
CNS 11643-1992の3面 めん
01/11 02/04 02/11 04/09 ESC $ + I
CNS 11643-1992の4面 めん
01/11 02/04 02/11 04/10 ESC $ + J
CNS 11643-1992の5面 めん
01/11 02/04 02/11 04/11 ESC $ + K
CNS 11643-1992の6面 めん
01/11 02/04 02/11 04/12 ESC $ + L
CNS 11643-1992の7面 めん
01/11 02/04 02/11 04/13 ESC $ + M
ISO-2022-JP は、日本語 にほんご の電子 でんし メール などのための符号 ふごう 化 か 表現 ひょうげん として広 ひろ く使 つか われている。このキャラクタセットは、1986年 ねん 後半 こうはん ころに、当時 とうじ のJUNET で、ネットニューズや電子 でんし メールで日本語 にほんご を利用 りよう するための符号 ふごう 化 か の共通 きょうつう 仕様 しよう として成立 せいりつ し、のちにその仕様 しよう は RFC 1468 でInformational として発行 はっこう された。当初 とうしょ は「JISコード」、「JUNETコード」(junet-code ) などと呼 よ ばれたが、最終 さいしゅう 的 てき には同 どう RFCにおいて、MIME のためのキャラクタセット名 めい としてISO-2022-JPの名称 めいしょう が規定 きてい され[11] 、後 ご のIANA Character Sets にも収録 しゅうろく されている。
ISO/IEC 2022 に準拠 じゅんきょ した7ビットの符号 ふごう 化 か 表現 ひょうげん だが、次 つぎ のような特徴 とくちょう を持 も つ。
JIS X 0208 が指示 しじ (かつ呼 よ び出 だ し)されている状態 じょうたい では、SPACE (空白 くうはく ) や制御 せいぎょ 文字 もじ を使 つか ってはならない。
行末 ゆくすえ では指示 しじ (かつ呼 よ び出 だ し)をASCIIにもどさなければならない。つまり、行末 ゆくすえ の前 まえ に漢字 かんじ の文字 もじ 集合 しゅうごう が指示 しじ されていたら、ASCIIを指示 しじ してから改行 かいぎょう しなければならない[10] 。
JIS X 0208を指示 しじ するとき、改訂 かいてい 番号 ばんごう 識別 しきべつ のエスケープシーケンスを用 もち いずに1983年 ねん 版 ばん と1990年版 ねんばん のどちらを使 つか ってもよい。
JUNETコードの成立 せいりつ 当時 とうじ 、日本語 にほんご 対応 たいおう 端末 たんまつ などの機器 きき には「漢字 かんじ イン/漢字 かんじ アウト」理解 りかい [7] に基 もと づく動作 どうさ をするものが複数 ふくすう 存在 そんざい し、JIS X 0208の文字 もじ 要素 ようそ 並 なら びの途中 とちゅう にSPACE (空白 くうはく 02/00 ) や制御 せいぎょ 文字 もじ が現 あらわ れると正 まさ しく処理 しょり できなかった。改行 かいぎょう の処理 しょり についても、行末 ゆくすえ の制御 せいぎょ 文字 もじ の処理 しょり でASCIIにもどってしまうものがあった。こういった機器 きき は、ハードウェアの組込 くみこ みソフトウェアによって実現 じつげん されている例 れい も多 おお く、その挙動 きょどう を修正 しゅうせい することはしばしば困難 こんなん だった。そのため、情報 じょうほう 交換 こうかん 当事 とうじ 者 しゃ 間 あいだ の合意 ごうい として上記 じょうき の条件 じょうけん のもと符号 ふごう 化 か する。
また、ISO/IEC 2022 では、改訂 かいてい 後 ご の文字 もじ 集合 しゅうごう を指示 しじ する場合 ばあい には、指示 しじ のエスケープシーケンスの前 まえ に改訂 かいてい 番号 ばんごう を識別 しきべつ するエスケープシーケンス (IRR。#表 ひょう 2 参照 さんしょう ) を置 お くと定 さだ めている。たとえば、JIS X 0208:1990 (JIS X 0208 の1990年版 ねんばん ) は JIS C 6226-1983 (同 おな じく1983年版 ねんばん 。後 のち に JIS X 0208-1983に改称 かいしょう ) の改訂 かいてい である (漢字 かんじ 2文字 もじ が追加 ついか されている) ため、1990年版 ねんばん を指示 しじ する場合 ばあい は、指示 しじ のエスケープシーケンスの直前 ちょくぜん に 01/11 02/06 04/00 (ESC & @ ) を付加 ふか する。実際 じっさい にIRRを使用 しよう するかどうかは情報 じょうほう 交換 こうかん の仕様 しよう の中 なか で定 さだ められる。RFC 1468 では、1990年版 ねんばん を使 つか う場合 ばあい も IRR の付加 ふか をしないことを提案 ていあん している。
JIS X 0208 :1997では、附属 ふぞく 書 しょ 2「RFC1468符号 ふごう 化 か 表現 ひょうげん 」として ISO-2022-JP をJISの規定 きてい としたが、この符号 ふごう 化 か 表現 ひょうげん が「ISO/IEC 2022に適合 てきごう するものではない」[12] と付記 ふき している。
ISO-2022-JP は、マルチバイト文字 もじ 集合 しゅうごう を扱 あつか うものとしては初 はつ のMIME 用 よう キャラクタセット であった。これ以降 いこう 、中国 ちゅうごく 語 ご 、朝鮮 ちょうせん 語 ご 、あるいは多言 たげん 語 ご での利用 りよう を想定 そうてい したマルチバイトのキャラクタセットが、ISO-2022-○○という名称 めいしょう でいくつか提案 ていあん され、一部 いちぶ はRFC にもなった。これらは、ISO-2022-JP で採用 さいよう された ISO/IEC 2022 の7ビット符号 ふごう による符号 ふごう 化 か 方式 ほうしき を踏襲 とうしゅう していた。しかしその後 ご 、日本語 にほんご 以外 いがい の言語 げんご では、電子 でんし メールなどのキャラクタセットはEUC 符号 ふごう 化 か によるものなどが事実 じじつ 上 じょう の標準 ひょうじゅん となっていった。今日 きょう 、マルチバイトで7ビットのキャラクタセットとして一般 いっぱん 的 てき に使 つか われているものは、事実 じじつ 上 じょう 、日本語 にほんご 用 よう の ISO-2022-JP のみである。
Extended Unix Code (EUC) は、ISO/IEC 2022の機構 きこう に準 じゅん じた8ビット符号 ふごう の文字 もじ コード[13] である。これには以下 いか のものが含 ふく まれる。次 つぎ のような特徴 とくちょう を持 も つ。
アナウンス機能 きのう のエスケープシーケンスは省略 しょうりゃく する。
8ビット符号 ふごう なので、GR領域 りょういき も使 つか う。エスケープシーケンスは使 つか わない。
G0にASCIIを、G1にマルチバイト文字 もじ 集合 しゅうごう を、G2やG3に補助 ほじょ 的 てき な文字 もじ 集合 しゅうごう を (あれば) 指示 しじ し、G0をGL領域 りょういき に、G1をGR領域 りょういき に呼 よ び出 だ した状態 じょうたい で始 はじ まる (このための制御 せいぎょ 機能 きのう は省略 しょうりゃく する)。つまり、最初 さいしょ は7ビット符号 ふごう がASCII、8ビット符号 ふごう がマルチバイト文字 もじ 集合 しゅうごう で始 はじ まる。
指示 しじ の状態 じょうたい は固定 こてい 的 てき に決 き まっており、変更 へんこう は行 おこな わない。
呼 よ び出 だ しはシングルシフトのみで、G2かG3 (あれば) からGR領域 りょういき へのみ。
この結果 けっか 、ASCIIの文字 もじ は常 つね に7ビット、それ以外 いがい の文字 もじ 集合 しゅうごう の文字 もじ は常 つね に8ビットで符号 ふごう 化 か され、しかも、同 おな じ文字 もじ 集合 しゅうごう の文字 もじ は常 つね に同 おな じバイト数 すう で表現 ひょうげん されることになる。
#表 ひょう 4 に、これらの文字 もじ コードで用 もち いる符号 ふごう 化 か 文字 もじ 集合 しゅうごう と、その選択 せんたく のための制御 せいぎょ 機能 きのう を示 しめ す。
EUC-JP での「日本語 にほんご 版 ばん Wikipedia」という文字 もじ 列 れつ の符号 ふごう 化 か を例 れい に説明 せつめい する (#表 ひょう 4 も参照 さんしょう )。
図 ず 3 EUC-JPによる「日本語 にほんご 版 ばん Wikipedia」の符号 ふごう 化 か
文字 もじ
日 ひ
本 ほん
語 かたり
版 はん
W
i
k
i
p
e
d
i
a
区点 くてん 行列 ぎょうれつ
38-92
43-60
24-76
40-39
05/07
06/09
06/11
06/09
07/00
06/05
06/04
06/09
06/01
符号 ふごう
12/06
15/12
12/11
13/12
11/08
14/12
12/08
12/07
05/07
06/09
06/11
06/09
07/00
06/05
06/04
06/09
06/01
C6
FC
CB
DC
B8
EC
C8
C7
57
69
6B
69
70
65
64
69
61
上 うえ 図 ず で、上段 じょうだん が符号 ふごう 化 か したい文字 もじ 列 れつ である。「日本語 にほんご 版 ばん 」は JIS X 0208 に含 ふく まれる文字 もじ の列 れつ 、「Wikipedia」はASCIIに含 ふく まれる文字 もじ の列 れつ である。ASCIIはGL領域 りょういき に、JIS X 0208はGR領域 りょういき に呼 よ び出 だ されている。したがって、「日本語 にほんご 版 ばん 」を8ビットで、「Wikipedia」を7ビットで符号 ふごう 化 か すればよい。マルチバイト文字 もじ は区点 くてん で、シングルバイト文字 もじ は行列 ぎょうれつ で表 あらわ すと、中段 ちゅうだん のようになる。区点 くてん を2バイトずつで表 あらわ し、全体 ぜんたい を8ビット符号 ふごう か7ビット符号 ふごう で表 あらわ すと、下段 げだん のように符号 ふごう 化 か される。
表 ひょう 4 EUCでの文字 もじ 集合 しゅうごう の選択 せんたく
文字 もじ コード
対象 たいしょう 言語 げんご
文字 もじ 集合 しゅうごう
文字 もじ 集合 しゅうごう 選択 せんたく のための制御 せいぎょ 機能 きのう
指示 しじ
呼 よ び出 だ し
EUC-CN (GB2312)
中国 ちゅうごく 語 ご 簡体字 かんたいじ
ASCII
G0
指示 しじ したまま
GLのまま
GB 2312-80
G1
GRのまま
EUC-JP (AJEC)
日本語 にほんご
ASCII
G0
指示 しじ したまま
GLのまま
JIS X 0208 のいずれかの版 はん
G1
GRのまま
JIS X 0201-1976 の仮名 かめい 文字 もじ 集合 しゅうごう (実装 じっそう しなくてもよい)
G2
08/14
SS2
(シングルシフトGR)
JIS X 0212-1990 (実装 じっそう しなくてもよい)
G3
08/15
SS3
(シングルシフトGR)
EUC-JISX0213
日本語 にほんご
ASCII
G0
指示 しじ したまま
GLのまま
JIS X 0213:2000 の1面 めん
G1
GRのまま
JIS X 0201-1976 の仮名 かめい 文字 もじ 集合 しゅうごう (原則 げんそく として用 もち いない)
G2
08/14
SS2
(シングルシフトGR)
JIS X 0213:2000 の2面 めん
G3
08/15
SS3
(シングルシフトGR)
EUC-JIS-2004
日本語 にほんご
EUC-JISX0213 のG1とG3に、それぞれJIS X 0213:2004の1面 めん と2面 めん を指示 しじ したもの
EUC-KR
韓国 かんこく 語 ご
ASCII
G0
指示 しじ したまま
GLのまま
KS X 1001
G1
GRのまま
EUC-TW
中国 ちゅうごく 語 ご 伝統 でんとう 字 じ
ASCII
G0
指示 しじ したまま
GLのまま
CNS 11643 の1面 めん
G1
GRのまま
CNS 11643 の2面 めん 以降 いこう (面 めん 1バイトと区点 くてん 2バイト)
G2
08/14
SS2
(シングルシフトGR)
EUCは業界 ぎょうかい 標準 ひょうじゅん であるため、ベンダごとの独自 どくじ の実装 じっそう も包含 ほうがん するものとなっている。そのため、厳密 げんみつ に言 い えばISO/IEC 2022に準拠 じゅんきょ しているとは言 い えないものもある。
EUC-JP では、G1に指示 しじ する文字 もじ 集合 しゅうごう に JIS X 0208 のさまざまな版 はん を使 つか うものがある。1978年版 ねんばん (JIS C 6226-1978)、1983年版 ねんばん (JIS X 0208-1983)、1990年版 ねんばん (JIS X 0208:1990) は、ISO/IEC 2022に基 もと づく符号 ふごう 化 か 文字 もじ 集合 しゅうごう としてはそれぞれ異 こと なるものだが、いずれの文字 もじ 集合 しゅうごう を使 つか っているかはベンダによって異 こと なる。また、G2 のJIS X 0201 片仮名 かたかな 文字 もじ 集合 しゅうごう や、G3 のJIS X 0212 については、ベンダによっては実装 じっそう していないことがある。
EUC-TW では、CNS 11643 の2面 めん 以降 いこう の文字 もじ を、シングルシフト (SS2) の後 のち に面 めん 1バイト(10/02 A2 から11/00 B0 で2面 めん から16面 めん を表 あらわ す)と区点 くてん 2バイトの合計 ごうけい 4バイトで呼 よ び出 だ す。つまり、CNS 11643の2面 めん 以降 いこう をまとめてひとつの文字 もじ 集合 しゅうごう として扱 あつか っていることになる。ISO/IEC 2022に基 もと づく符号 ふごう 化 か 文字 もじ 集合 しゅうごう としては、各面 かくめん はそれぞれ異 こと なる文字 もじ 集合 しゅうごう である。
「拡張 かくちょう ASCII 」は俗称 ぞくしょう である。8ビット符号 ふごう を使 つか うシングルバイト文字 もじ 集合 しゅうごう で、ASCII に対 たい して上位 じょうい 互換 ごかん となっているものを指 さ す。#歴史 れきし で見 み たように、ISO/IEC 4873 に準拠 じゅんきょ した符号 ふごう 表 ひょう を持 も てばその文字 もじ 集合 しゅうごう は ISO/IEC 2022 に準拠 じゅんきょ していると言 い える。しかしここでは、ISO/IEC 2022 の側 がわ から見 み て解説 かいせつ する。
一般 いっぱん に、拡張 かくちょう ASCIIとはISO/IEC 2022準拠 じゅんきょ の符号 ふごう 表 ひょう を使 つか う文字 もじ 集合 しゅうごう の、つぎのような符号 ふごう 化 か 表現 ひょうげん であると考 かんが えることができる。
アナウンス機能 きのう のエスケープシーケンスは省略 しょうりゃく する。
G0に ISO/IEC 646 の各国 かっこく 版 ばん またはASCII を、G1にその他 た のシングルバイト文字 もじ 集合 しゅうごう を指示 しじ し、G0をGL領域 りょういき に、G1をGR領域 りょういき に呼 よ び出 だ した状態 じょうたい で始 はじ まる (このための制御 せいぎょ 機能 きのう は省略 しょうりゃく する)。
指示 しじ の状態 じょうたい も呼 よ び出 だ しの状態 じょうたい も固定 こてい 的 てき に決 き まっており、変更 へんこう は行 おこな わない。
この結果 けっか 、8ビット符号 ふごう で最大 さいだい 188個 こ ないし190個 こ の図形 ずけい 文字 もじ を利用 りよう することができ、しかもすべての文字 もじ が1バイトの固定 こてい 長 ちょう で表現 ひょうげん されることになる。なお、これらの多 おお くは、IANA がキャラクタセット として登録 とうろく している。
拡張 かくちょう ASCIIの例 れい としては次 つぎ のようなものがある。詳細 しょうさい は各 かく 項目 こうもく の解説 かいせつ を参照 さんしょう 。
ARMSCII
アルメニア文字 もじ 。
ASMO 449+
アラビア語 ご 用 よう のアラビア文字 もじ 。ISO/IEC 8859-6 と互換 ごかん 性 せい がある。
ISCII
インド の諸 しょ 言語 げんご の文字 もじ 。用字 ようじ 系 けい の切 き り替 か えや、結合 けつごう 文字 もじ の表現 ひょうげん のための特殊 とくしゅ な図形 ずけい 文字 もじ を持 も つ。
ISO/IEC 8859 シリーズ
ヨーロッパ の諸 しょ 言語 げんご (トルコ語 ご およびエスペラント を含 ふく む) のラテン文字 もじ 集合 しゅうごう を含 ふく み、さらにアラビア文字 もじ 、ギリシア文字 もじ 、キリル文字 もじ 、タイ文字 もじ 、ヘブライ文字 もじ の文字 もじ 集合 しゅうごう をも含 ふく む。
JIS X 0201
日本語 にほんご 用 よう の片仮名 かたかな 。
PASCII
アラビア文字 もじ (ウルドゥ語 ご 、シンド語 ご 、カシミール語 ご 、アラビア語 ご )。ISO/IEC 8859-6 とは互換 ごかん 性 せい がない。
TIS 620
タイ文字 もじ 。ISO/IEC 8859-11 と互換 ごかん 性 せい がある。
TSCII
タミル文字 もじ 。ISCIIのタミル文字 もじ とは互換 ごかん 性 せい がない。
拡張 かくちょう ASCIIの方法 ほうほう では、ラテン文字 もじ 以外 いがい の文字 もじ は最大 さいだい 96文字 もじ までしか収録 しゅうろく できない。またたとえラテン文字 もじ であっても、極 きわ めて多数 たすう のダイアクリティカルマーク 付 つ き文字 もじ を使 つか う言語 げんご では、ISO/IEC 2022の8ビット符号 ふごう でも文字数 もじすう が不足 ふそく する。かといって、マルチバイト文字 もじ 集合 しゅうごう を採用 さいよう するほど多 おお いわけでもない、という場合 ばあい 、図形 ずけい 文字 もじ をGR領域 りょういき やGL領域 りょういき の外 そと にまで配置 はいち することもある。
VISCII
ベトナム語 ご 用 よう 電子 でんし メール などで広 ひろ く使 つか われているキャラクタセットである。GL領域 りょういき はASCIIであるが、ダイアクリティカルマーク付 つ き文字 もじ のうち96文字 もじ をGR領域 りょういき に収容 しゅうよう し、残 のこ りを、C1の32文字 もじ すべて、さらにはC0のうち6文字 もじ にまで割 わ り当 あ てている。
KOI8 系 けい 文字 もじ 集合 しゅうごう
キリル文字 もじ 。ロシア語 ご 用 もちい およびブルガリア語 ご 用 よう に使 つか われるKOI8-R 、ウクライナ語 ご 用 よう に使 つか われるKOI8-U 、ウクライナ語 ご 、ベラルーシ語 ご 、ロシア語 ご 共通 きょうつう のKOI8-RU が代表 だいひょう 的 てき である。ほかにも、キリル文字 もじ を使 つか う多 おお くの言語 げんご 用 よう にKOI8の変種 へんしゅ が用 もち いられており、タジク語 ご 用 もちい (KOI8-T )、チェコ語 ご およびスロバキア語 ご 用 もちい (KOI8-CS )、モンゴル語 ご 用 よう などがある。C1領域 りょういき にも記号 きごう や罫線 けいせん 素 もと などを収容 しゅうよう している。
MS-DOS 、Windows 、その他 た パソコン に組 く み込 こ みのコードページ
これらのうち、シングルバイトのものの多 おお く。C1領域 りょういき にも記号 きごう や罫線 けいせん 素 もと などを収容 しゅうよう している。
Compound Text Encoding (CTEXT)[ 編集 へんしゅう ]
表 ひょう 5 Compound Text Encoding で拡張 かくちょう された制御 せいぎょ 機能 きのう
制御 せいぎょ 機能 きのう
説明 せつめい
01/11 02/05 02/15 03/00 M L [a]
可変長 かへんちょう の符号 ふごう 化 か システムの指示 しじ
01/11 02/05 02/15 03/01 M L [a]
1文字 もじ 1バイトの符号 ふごう 化 か システムの指示 しじ
01/11 02/05 02/15 03/02 M L [a]
1文字 もじ 2バイトの符号 ふごう 化 か システムの指示 しじ
01/11 02/05 02/15 03/03 M L [a]
1文字 もじ 3バイトの符号 ふごう 化 か システムの指示 しじ
01/11 02/05 02/15 03/04 M L [a]
1文字 もじ 4バイトの符号 ふごう 化 か システムの指示 しじ
01/11 02/05 04/07[b]
UTF-8に切 き り替 か える
01/11 02/05 04/00[b]
UTF-8から戻 もど る
09/11 03/01 05/13[c]
書 しょ 字 じ 方向 ほうこう を左 ひだり から右 みぎ とする
09/11 03/02 05/13[c]
書 しょ 字 じ 方向 ほうこう を右 みぎ から左 ひだり とする
09/11 05/13[c]
直近 ちょっきん に行 い った書 しょ 字 じ 方向 ほうこう の指定 してい から戻 もど る
a M L で指示 しじ の後 のち につづく要素 ようそ のバイト数 すう を示 しめ す。M と L の最 さい 上位 じょうい 桁 けた ビット (常 つね に1) を除 のぞ く合計 ごうけい 14ビットが表 あらわ す値 ね がバイト数 すう となる。要素 ようそ 内 ない は、符号 ふごう 化 か システムの名前 なまえ ではじまり、00/02 (STX ) で区切 くぎ ってその後 ご に実際 じっさい の符号 ふごう 化 か 文字 もじ 要素 ようそ が続 つづ く。
b XFree86 による拡張 かくちょう 。本来 ほんらい の Compound Text Encoding では ISO に登録 とうろく された「他 た の符号 ふごう 化 か システム」は使 つか わないことになっている。
c ISO/IEC 6429 の機能 きのう 。
Compound Text Encoding (CTEXT) は、ISO/IEC 2022およびISO/IEC 6429 の機構 きこう に準 じゅん じつつそれを拡張 かくちょう した8ビット符号 ふごう の符号 ふごう 化 か 方式 ほうしき である。X Window System において、クライアント間 あいだ のテキスト情報 じょうほう の伝達 でんたつ や、リソース 中 なか のテキスト情報 じょうほう の表現 ひょうげん に用 もち いる。次 つぎ のような特徴 とくちょう を持 も つ。
アナウンス機能 きのう のエスケープシーケンスは省略 しょうりゃく する。
8ビット符号 ふごう なので、GR領域 りょういき も使 つか う。
G0にASCIIを、G1にISO/IEC 8859-1 の右 みぎ 半分 はんぶん を指示 しじ し、G0をGL領域 りょういき に、G1をGR領域 りょういき に呼 よ び出 だ した状態 じょうたい で始 はじ まる (このための制御 せいぎょ 機能 きのう は省略 しょうりゃく する)。つまり、最初 さいしょ はISO/IEC 8859-1で始 はじ まる。
G0およびG1への指示 しじ がGL領域 りょういき およびGR領域 りょういき への呼 よ び出 だ しを兼 か ねる。呼 よ び出 だ しの制御 せいぎょ 機能 きのう は使 つか わない。つまり、文字 もじ 集合 しゅうごう の選択 せんたく は指示 しじ のエスケープシーケンスだけで行 おこな う。
ISO/IEC 2022のDOCS (#表 ひょう 2 参照 さんしょう ) と私用 しよう 終端 しゅうたん バイトにより、利用 りよう 者 しゃ 独自 どくじ の文字 もじ 集合 しゅうごう や、UTF-8 のようにISO/IEC 2022に準拠 じゅんきょ した構造 こうぞう の符号 ふごう 表 ひょう を持 も たない符号 ふごう 化 か システムを指示 しじ する (#表 ひょう 5 参照 さんしょう )。
ISO/IEC 6429のSDSにより書 しょ 字 じ 方向 ほうこう を指定 してい する (#表 ひょう 5 参照 さんしょう )。
また、つぎの点 てん で ISO/IEC 2022 に対 たい する拡張 かくちょう となっている。
指示 しじ のエスケープシーケンスでは、中間 なかま バイト02/08の省略 しょうりゃく (#表 ひょう 2 注 ちゅう 参照 さんしょう ) をしない。
この結果 けっか 、複数 ふくすう の符号 ふごう 化 か システムや文字 もじ 集合 しゅうごう が混在 こんざい する場合 ばあい でも、文字 もじ コード変換 へんかん による情報 じょうほう の劣化 れっか を起 お こさず、またクライアントが対応 たいおう していない符号 ふごう 化 か システムや文字 もじ 集合 しゅうごう の情報 じょうほう も伝達 でんたつ することが可能 かのう になっている。なお、これは異 こと なるアプリケーションの間 あいだ でのテキスト情報 じょうほう の交換 こうかん のための符号 ふごう 化 か 方式 ほうしき を定 さだ めたものであり、個々 ここ のアプリケーション内部 ないぶ でのテキスト処理 しょり の際 さい は、適当 てきとう な内部 ないぶ 形式 けいしき に変換 へんかん してから処理 しょり することが想定 そうてい されている。
^ 第 だい 3次 じ 規格 きかく までの標題 ひょうだい は「情報 じょうほう 交換 こうかん 用 よう 符号 ふごう の拡張 かくちょう 法 ほう 」であった。
^ 初版 しょはん 制定 せいてい 当時 とうじ の名称 めいしょう は ISO/R 646。その後 ご ISO 646、さらに ISO/IEC 646 と改称 かいしょう された。しかし、本 ほん 項 こう では原則 げんそく として ISO/IEC 646 と表記 ひょうき する。
^ 初版 しょはん 制定 せいてい 当時 とうじ の名称 めいしょう は ISO 2022:1973。その後 ご 1994年 ねん の第 だい 4版 はん で ISO/IEC 2022 と改称 かいしょう 。初版 しょはん に対 たい するJISの対応 たいおう 規格 きかく は JIS C 6228:1975。1982年 ねん 第 だい 2版 はん の JIS C 6228:1982 はその後 ご JIS X 0202:1982 と改称 かいしょう された。しかし、本 ほん 項 こう では原則 げんそく として ISO/IEC 2022 および JIS X 0202 と表記 ひょうき する。
^ 初版 しょはん 制定 せいてい 当時 とうじ の名称 めいしょう は ISO 4873。後 のち に ISO/IEC 4873 と改称 かいしょう された。しかし、本 ほん 項 こう では原則 げんそく として ISO/IEC 4873 と表記 ひょうき する。
^ これは今日 きょう では internationalization (i18n 。国際 こくさい 化 か ) あるいは multilingualization (m17n 。多 た 言語 げんご 化 か ) と呼 よ ばれる考 かんが えかたであるが、当時 とうじ はヨーロッパの諸 しょ 言語 げんご にまたがるという意味 いみ で harmonization (調和 ちょうわ ) と呼 よ ばれた。後 のち に ISO/IEC 8859 はヨーロッパ諸語 しょご 以外 いがい も包含 ほうがん するものになる。
^ 論理 ろんり 的 てき には5バイト以上 いじょう のエスケープシーケンスも用 もち いられ得 え るが、現時点 げんじてん では ISO/IEC 2022 で規定 きてい されているものはない。
^ a b ISO/IEC 2022が定 さだ められた当初 とうしょ は、呼 よ び出 だ しの制御 せいぎょ 機能 きのう には SI (G1からGL領域 りょういき への呼 よ び出 だ し) と SO (G0からGL領域 りょういき への呼 よ び出 だ し) しかなかった。そのため、SIを「漢字 かんじ イン」(制御 せいぎょ 文字 もじ やロ ろ ーマ字 まじ の符号 ふごう 表 ひょう から漢字 かんじ の符号 ふごう 表 ひょう にシフトする)、SOを「漢字 かんじ アウト」(漢字 かんじ の符号 ふごう 表 ひょう へのシフトから復 ふく する) とする理解 りかい が生 う まれ、ほかの呼 よ び出 だ し制御 せいぎょ 機能 きのう が定 さだ められた際 さい には混乱 こんらん を招 まね いた。実際 じっさい にはロッキングシフトでは、前 まえ の呼 よ び出 だ しを記憶 きおく しているわけではない。ちなみに、当時 とうじ 開発 かいはつ されたプリンタ記述 きじゅつ 言語 げんご (プリンタ を制御 せいぎょ するための通信 つうしん 手順 てじゅん ) には、この漢字 かんじ イン/漢字 かんじ アウトの発想 はっそう が残 のこ っているものがある。
^ シングルシフトには、G2かG3から呼 よ び出 だ しするものしかない。また、8ビット符号 ふごう の場合 ばあい 、GL領域 りょういき に呼 よ び出 だ すかGR領域 りょういき に呼 よ び出 だ すかは最初 さいしょ にアナウンス機能 きのう によって決定 けってい することになっている。
^ JIS X 0202:1991 解説 かいせつ 「登録 とうろく 」による
^ a b ISO-2022-JPの場合 ばあい は、JIS X 0201-1976のラテン文字 もじ 集合 しゅうごう でもよい。
^ 日本 にっぽん の国 くに コード JP が含 ふく まれる名称 めいしょう であるのは、ネットニューズのfj.*グループの利用 りよう 者 しゃ およびホストコンピュータのjpドメイン名 めい を電子 でんし メールアドレスに含 ふく む利用 りよう 者 しゃ らの議論 ぎろん による。なお文字 もじ 集合 しゅうごう として使 つか う JIS X 0208 は日本工業規格 にほんこうぎょうきかく であり、漢字 かんじ や仮名 かめい といった日本語 にほんご に必須 ひっす の文字 もじ 体系 たいけい のほかに、アラビア数字 すうじ や種々 しゅじゅ の記号 きごう とともに頭字 かしらじ 語 ご 用途 ようと を主 しゅ として[要 よう 出典 しゅってん ] 一部 いちぶ のラテン文字 もじ 、ギリシア文字 もじ 、キリル文字 もじ も含 ふく んでいる。そのため、日本語 にほんご 以外 いがい の言語 げんご を部分 ぶぶん 的 てき に表現 ひょうげん できる。RFC 1468 の表題 ひょうだい は Japanese Character Encoding for Internet Messages (インターネットメッセージのための日本語 にほんご 文字 もじ 符号 ふごう 化 か ) であることから、特 とく に日本 にっぽん 国内 こくない にかぎった利用 りよう を想定 そうてい していたわけでもなく、日本語 にほんご コミュニティでの利用 りよう を想定 そうてい していた。
^ JIS X 0208:1997 附属 ふぞく 書 しょ 2より引用 いんよう 。また、同 どう 解説 かいせつ 3.11 も参照 さんしょう 。
^ EUC では文字 もじ コード (英 えい : codeset )、JIS では符号 ふごう 化 か 表現 ひょうげん と呼 よ ぶ。また、一部 いちぶ はキャラクタセット としてIANAが登録 とうろく している。
全般 ぜんぱん 的 てき な記述 きじゅつ には以下 いか の文献 ぶんけん を参照 さんしょう した。
JIS X 0202:1998 『情報 じょうほう 技術 ぎじゅつ - 文字 もじ 符号 ふごう の構造 こうぞう 及 およ び拡張 かくちょう 法 ほう 』 日本 にっぽん 規格 きかく 協会 きょうかい 、1998年 ねん 。(ISO/IEC 2022:1994 Information technology - Character code structure and extension techniques 第 だい 4版 はん の国際 こくさい 一致 いっち 規格 きかく )
Lunde, Ken 『CJKV日 にち 中 ちゅう 韓 かん 越 えつ 情報処理 じょうほうしょり 』オライリー・ジャパン、2002年 ねん 。ISBN 4-87311-108-0 。 (原著 げんちょ Lunde, Ken (1998). CJKV Information Processing . Cambridge, Massachusetts: O'Reilly & Associates. ISBN 1-56592-224-7 )
さらに、節 ふし ごとの記述 きじゅつ で以下 いか の文献 ぶんけん を参照 さんしょう した。
#歴史 れきし (#第 だい 2次 じ 規格 きかく 以降 いこう の主 おも な改正 かいせい 点 てん 以外 いがい )
三上 みかみ 喜 き 貴 とうと 『文字 もじ 符号 ふごう の歴史 れきし - アジア編 へん -』共立 きょうりつ 出版 しゅっぱん 、2002年 ねん 3月 がつ 。ISBN 4-320-12040-X 。 特 とく に第 だい 3章 しょう 「ASCIIとその拡張 かくちょう 」を参照 さんしょう 。
#ISO国際 こくさい 登録 とうろく 簿 ぼ
ISO/IEC 2375:2003 Data Processing - Procedure for Registration of Escape Sequences
#応 おう 用例 ようれい
RFC 1468 Japanese Character Encoding for Internet Messages (『インターネットメッセージのための日本語 にほんご 文字 もじ 符号 ふごう 化 か 』), J. Murai 他 た 著 ちょ , 1993年 ねん 6月 がつ .
RFC 1554 ISO-2022-JP-2: Multilingual Extension of ISO-2022-JP (『ISO-2022-JP-2: ISO-2022-JPの多 た 言語 げんご 拡張 かくちょう 』), M. Ohta 他 た 著 ちょ , 1993年 ねん 12月.
RFC 1557 Korean Character Encoding for Internet Messages (『インターネットメッセージのための朝鮮 ちょうせん 語 ご 文字 もじ 符号 ふごう 化 か 』), U. Choi 他 た 著 ちょ , 1993年 ねん 12月.
RFC 1922 Chinese Character Encoding for Internet Messages (『インターネットメッセージのための中 なか 文 ぶん 文字 もじ 符号 ふごう 化 か 』), HF. Zhu 他 た 著 ちょ , 1996年 ねん 3月 がつ .
RFC 2237 Japanese Character Encoding for Internet Messages (『インターネットメッセージのための日本語 にほんご 文字 もじ 符号 ふごう 化 か 』), K. Tamaru 他 た 著 ちょ , 1997年 ねん 11月.
JIS X 0208 :1997 『7ビット及 およ び8ビットの2バイト情報 じょうほう 交換 こうかん 用 よう 符号 ふごう 化 か 漢字 かんじ 集合 しゅうごう 』 (7-bit and 8-bit double byte coded Kanji sets for information interchange ) 附属 ふぞく 書 しょ 2「RFC1468符号 ふごう 化 か 表現 ひょうげん 」 日本 にっぽん 規格 きかく 協会 きょうかい 、1997年 ねん 。
JIS X 0213 :2000 『7ビット及 およ び8ビットの2バイト情報 じょうほう 交換 こうかん 用 よう 符号 ふごう 化 か 拡張 かくちょう 漢字 かんじ 集合 しゅうごう 』 (7-bit and 8-bit double byte coded extended Kanji sets for information interchange ) 附属 ふぞく 書 しょ 2「ISO-2022-JP-3符号 ふごう 化 か 表現 ひょうげん 」 日本 にっぽん 規格 きかく 協会 きょうかい 、2000年 ねん 。
JIS X 0213:2000/AMENDMENT 1:2004 『7ビット及 およ び8ビットの2バイト情報 じょうほう 交換 こうかん 用 よう 符号 ふごう 化 か 拡張 かくちょう 漢字 かんじ 集合 しゅうごう (追 つい 補 ほ 1)』 (7-bit and 8-bit double byte coded extended Kanji sets for information interchange (Amendment 1) ) 附属 ふぞく 書 しょ 2「ISO-2022-JP-2004符号 ふごう 化 か 表現 ひょうげん 」 日本 にっぽん 規格 きかく 協会 きょうかい 、2004年 ねん 。
『UI-OSF-USLP 共同 きょうどう 技術 ぎじゅつ 資料 しりょう 日本語 にほんご EUCの定義 ていぎ と解説 かいせつ 』(Unapproved Draft 1.7) 1991年 ねん 12月
X Consortium Standard, Compound Text Encoding Version 1.1 , Robert W. Scheifler 著 ちょ , 1989年 ねん .
Very old fj.kanji discussion - JUNETコード成立 せいりつ のころの議論 ぎろん
Роман Чибора (1998年 ねん ). “The Cyrillic Charset Soup ”. 2007年 ねん 2月 がつ 11日 にち 閲覧 えつらん 。 - キリル文字 もじ 用 よう 文字 もじ コードの変遷 へんせん
日本語 にほんご 用 よう の文字 もじ コード
日本語 にほんご を含 ふく む多言 たげん 語 ご 文字 もじ 集合 しゅうごう
日本語 にほんご 以外 いがい 用 よう の文字 もじ 集合 しゅうごう
ソフトウェア 区分 くわ け概念 がいねん 関連 かんれん トピック
カテゴリ