文字 集合
コンピュータにおける文字 集合
コンピュータ
レパートリ
- Unicode Character Encoding Model (UTR#17)
抽象 文字 レパートリ (ACR: Abstract Character Repertoire)-符号 化 の対象 となる概念 上 の文字 の非 順序 集合 。- Character Model for the World Wide Web 1.0: Fundamentals (W3C
勧告 CharMod) - レパートリ (repertoire) -
符号 化 の対象 となる識別 された文字 の集合 。一 つ以上 の対象 言語 において、テキストを表現 し様々 なテキスト処理 を効果 的 に可能 にするため、実用 的 に文字 が選択 される。それらの文字 は利用 者 が文字 と理解 するものとは厳密 には一致 するとは限 らない。この文字 の集合 がレパートリと呼 ばれる。 - ISO/IEC 10646 (JIS X 0221)
- レパートリ (repertoire) -
符号 化 文字 集合 で表現 する文字 の指定 された集合 。 - JIS X 0208, JIS X 0213
等 - レパートリ (repertoire) -
符号 化 文字 集合 の一 つ以上 のビット組合 わせによって表現 される、規定 された文字 の集合 。 - IBMの
文字 データ表現 体系 (CDRA: "Character Data Representation Architecture") 文字 セット (CS: "character set") - コード化 表現 を前提 としない、文字 の定義 済 みセット。
符号 化 文字 集合
- ISO/IEC 646, ISO/IEC 8859, ANSI X3.4 (ASCII)
- coded character set; code - A set of unambiguous rules that establishes a character set and the one-to-one relationship between the characters of the set and their bit combinations.
- JIS X 0201, JIS X 0208, JIS X 0213
符号 化 文字 集合 (coded character set)、符号 (code) -文字 集合 を定 め、かつその集合 内 の文字 とビット組合 わせとを1対 1に関連付 ける、あいまいでない規則 の集合 。- ISO/IEC 10646 (JIS X 0221)
符号 化 文字 集合 (coded character set) -文字 集合 及 びその集合 の文字 と符号 化 表現 との間 の関係 を規定 するあいまいさのない規則 の集合 。
それ
- Unicode Character Encoding Model (UTR#17)
符号 化 文字 集合 (CCS: Coded Character Set) -概念 上 の文字 の集合 から非負 整数 の集合 への写像 として規定 される。この整数 の範囲 は連続 である必要 はない。Unicode標準 においてUnicodeスカラー値 (Unicode scalar value) の概念 は非 連続 な非負 整数 として明示 的 に定義 される。符号 化 文字 集合 が概念 上 の文字 から整数 への写像 であれば、ある概念 上 の文字 は符号 化 文字 集合 で規定 されることになる。- IABモデル (RFC2130)
符号 化 文字 集合 (CCS: Coded Character Set) -符号 化 文字 集合 は概念 上 の文字 の集合 から整数 の集合 への写像 である。- Character Model for the World Wide Web 1.0: Fundamentals (W3C
勧告 CharMod) 符号 化 文字 集合 (CCS: coded character set) - レパートリ中 の個々 の文字 は対応 する(数学 的 、抽象 的 な)非負 整数 、コードポイント(区点 位置 、面 区点 位置 、文字 番号 や符号 位置 等 )に関連付 けられる。その結果 、レパートリから非負 整数 の集合 への写像 が符号 化 文字 集合 (CCS) と呼 ばれる。- IBMの
文字 データ表現 体系 (CDRA) - コード・ページ (CP: "code page") - それぞれのグラフィック
文字 セットごと、またはグラフィック文字 セットの集 まりに対 する、コード・ポイント (code point) の指定 。一 つのコード・ページの中 で、コード・ポイントには特定 の意味 を一 つだけ持 たせることができる。
符号 化 文字 集合 と文字 符号 化 方式
ASCIIやISO/IEC 8859のような
ある
ISO/IEC 646, ISO/IEC 8859, ISO/IEC 2022 (JIS X 0202), JIS X 0201, JIS X 0208, JIS X 0213
関連 用語
出典
- ^
矢野 啓介 、2019、『[改訂 新版 ]プログラマのための文字 コード技術 入門 』、技術評論社 〈WEB+DB PRESS plus シリーズ〉 ISBN 978-4-297-10291-3 9頁
外部 リンク
- UTR#17: Character Encoding Model(Unicodeの
文字 符号 化 モデル) - RFC2130: The Report of the IAB Character Set Workshop held 29 February 1 March
- Character Data Representation Architecture Reference(IBMの
文字 データ表現 体系 (CDRA) リファレンス) - IBM Character set by GCSGID(IBMの
文字 セット登録 簿 ) - IBM Code page by CPGID(IBMのコード・ページ
登録 簿 )