出典 しゅってん : フリー百科 ひゃっか 事典 じてん 『ウィキペディア(Wikipedia)』
EUC-JP (E xtended U NIX C ode Packed Format for J ap anese、日本語 にほんご EUC )は日本語 にほんご の文字 もじ を扱 あつか う場合 ばあい に利用 りよう されてきた文字 もじ コード (符号 ふごう 化 か 方式 ほうしき )のひとつである。
1980年代 ねんだい 中頃 なかごろ 、当時 とうじ UNIX のライセンス事業 じぎょう を展開 てんかい していたAT&T がUNIXの日本語 にほんご 化 か に向 む けて、日本 にっぽん のUNIXベンダーをメンバーとする日本語 にほんご UNIXシステム諮問 しもん 委員 いいん 会 かい を設置 せっち 。ここでUNIXで日本語 にほんご を扱 あつか うための文字 もじ コードについて議論 ぎろん が行 おこな われ、議論 ぎろん の結果 けっか をもとに同 どう 委員 いいん 会 かい から報告 ほうこく 書 しょ がAT&T側 がわ へ出 だ され、AT&Tにより定 さだ められた日本語 にほんご 機能 きのう のガイドラインがEUC-JPの起 お こりである。この時 とき 、AT&TからExtended Unix Code (EUC ) として日本語 にほんご に限 かぎ らず多言 たげん 語 ご に対応 たいおう できるように定 さだ められ、EUCのうち日本語 にほんご を扱 あつか うものを特 とく にEUC-JPなどと呼 よ ぶ。他 た に、EUC-KR (韓国 かんこく 語 ご )、EUC-CN (簡体中国語 ちゅうごくご )等 とう がある。
EUC-JPはEUCのエンコード方式 ほうしき 上 うえ にASCII とJIS X 0208 文字 もじ 集合 しゅうごう を配置 はいち したもので、半角 はんかく カナ (JIS X 0201 ) とJIS補助 ほじょ 漢字 かんじ (JIS X 0212 ) も含 ふく むことができる。半角 はんかく カナと補助 ほじょ 漢字 かんじ を使用 しよう しない場合 ばあい は、JIS X 0208で規定 きてい されている符号 ふごう 化 か 方式 ほうしき 「国際 こくさい 基準 きじゅん 版 ばん ・漢字 かんじ 用 よう 8ビット符号 ふごう 」と同一 どういつ となる。ISO/IEC 2022 に適合 てきごう する。
日本語 にほんご 文字 もじ はJIS X 0208 をGR領域 りょういき に表現 ひょうげん したものを基本 きほん としており、2バイトで表現 ひょうげん され、1バイト目 め 、2バイト目 め ともに0x80 - 0xFFの範囲 はんい 内 ない にある。このため英数字 えいすうじ と日本語 にほんご 文字 もじ の区別 くべつ がしやすく、プログラム 上 うえ での扱 あつか いが楽 らく である。ただし、半角 はんかく カナはISO-2022-JP やShift_JIS と異 こと なり制御 せいぎょ 文字 もじ SS2(シングルシフトツー、0x8E)に続 つづ けて現 あらわ れるので都合 つごう 2バイト、補助 ほじょ 漢字 かんじ は制御 せいぎょ 文字 もじ SS3(シングルシフトスリー、0x8F)に続 つづ けて現 あらわ れるので都合 つごう 3バイトを要 よう する。
JIS X 0213 :2004に対応 たいおう するEUCコードはEUC-JIS-2004 (2000年 ねん 初版 しょはん 時 じ はEUC-JISX0213)。
UNIX系 けい OSの標準 ひょうじゅん 的 てき な文字 もじ エンコードとして使用 しよう されてきた。かつて、Webサーバ にUNIX系 けい OSが多 おお く用 もち いられていたことから日本語 にほんご のウェブサイトではShift_JISと並 なら んでEUC-JPが多 おお く使 つか われていたが、2006年 ねん 頃 ごろ から世界 せかい 的 てき にUTF-8 が普及 ふきゅう し始 はじ めている[1] 。全 ぜん 言語 げんご の主要 しゅよう なウェブサイトに占 し めるEUC-JPのシェアは、2010年 ねん から2019年 ねん にかけて0.7%から0.1%に低下 ていか している[2] 。
1984年 ねん 7月 がつ 、当時 とうじ UNIXのライセンスを販売 はんばい していたAT&Tが東 ひがし アジア・太平洋 たいへいよう 地域 ちいき でライセンス事業 じぎょう を展開 てんかい するため、子会社 こがいしゃ のAT&Tインターナショナル・ジャパンにUNIXシステム東京 とうきょう 事務所 じむしょ (AT&Tユニックス・パシフィック)を設立 せつりつ 。最初 さいしょ に日本 にっぽん で事業 じぎょう を展開 てんかい するにあたり、UNIXの日本語 にほんご 化 か に向 む けて石田 いしだ 晴久 はるひさ を委員 いいん 長 ちょう に、日本電信電話 にほんでんしんでんわ 公社 こうしゃ 、沖電気工業 おきでんきこうぎょう 、東芝 とうしば 、日本電気 にほんでんき 、日立製作所 ひたちせいさくしょ 、富士通 ふじつう 、三菱電機 みつびしでんき といった当時 とうじ のUNIXベンダーをメンバーとする日本語 にほんご UNIXシステム諮問 しもん 委員 いいん 会 かい を設置 せっち した。ここでUNIXで日本語 にほんご を扱 あつか うための文字 もじ コードや機能 きのう について議論 ぎろん が行 おこな われ、その結果 けっか をもとに1985年 ねん 4月 がつ 30日 にち 付 づ けで同 どう 委員 いいん 会 かい から報告 ほうこく 書 しょ 『UNIXシステム日本語 にほんご 機能 きのう の提案 ていあん にあたって』がAT&T側 がわ へ提出 ていしゅつ された[3] 。日本語 にほんご EUCとしてのベースはこの報告 ほうこく 書 しょ で概 おおむ ね出来上 できあ がっていたが、AT&Tはこれを国際 こくさい 的 てき に通用 つうよう するよう、国際 こくさい 機能 きのう と各国 かっこく 語 ご 機能 きのう に分 わ けて定義 ていぎ した。そして1986年 ねん 2月 がつ にアナハイム で開催 かいさい されたUNIXカンファレンス UniForum にて、各国 かっこく 語 ご 機能 きのう のサポート第 だい 1弾 だん として Japanese Application Environment (JAE; 日本語 にほんご アプリケーション・エンバイロメント) を発表 はっぴょう 。この中 なか に文字 もじ コードの構造 こうぞう (EUC) と日本語 にほんご 機能 きのう で使用 しよう される文字 もじ セットが定 さだ められた[4] 。
1990年 ねん にJIS X 0212 で補助 ほじょ 漢字 かんじ が制定 せいてい されたことを受 う けて定義 ていぎ を拡張 かくちょう する必要 ひつよう が生 しょう じたため、1991年 ねん 12月、Open Software Foundation (OSF) とUNIX International (UI)、UNIXシステムラボラトリーズ・パシフィック (USLP) はUNIX上 じょう の共通 きょうつう 日本語 にほんご 文字 もじ コードとして日本語 にほんご EUC を定義 ていぎ した[5] 。
EUC-JPには亜種 あしゅ が存在 そんざい する。二 に 種類 しゅるい を以下 いか に解説 かいせつ する。
eucJP-ms は、オープン・グループ 及 およ び日本 にっぽん ベンダ協議 きょうぎ 会 かい が策定 さくてい した文字 もじ 符号 ふごう 化 か 方式 ほうしき 。実装 じっそう 例 れい はMySQL v5.0以降 いこう 等 とう 。
CP51932 はマイクロソフト がWindows で使用 しよう しているWindows-31J のEUC-JP互換 ごかん 表現 ひょうげん 。実装 じっそう 例 れい はInternet Explorer 4.0以降 いこう 、EmEditor 、秀 しゅう 丸 まる エディタ等 ひとし 。このコードはNEC のPC-9800シリーズ の漢字 かんじ コード(9区 く から12区 く の特殊 とくしゅ 文字 もじ を除外 じょがい したもの)をGR表現 ひょうげん したような体裁 ていさい を持 も つ。ただし、PC-9800シリーズの漢字 かんじ コードはJIS C 6226 -1978をベースにするのに対 たい して、CP51932はJIS X 0208 -1990をベースとする点 てん が異 こと なる。
CP51932
eucJP-ms
面 めん &区 く 番号 ばんごう
1バイト目 め
2バイト目 め
面 めん &区 く 番号 ばんごう
1バイト目 め
2バイト目 め
3バイト目 め
JIS X 0208-1990 (ひらがな・カタカナ等 とう )
1面 めん 1区 く - 8区 く
0xA1 - 0xA8
0xA1 - 0xFE
1面 めん 1区 く - 8区 く
0xA1 - 0xA8
0xA1 - 0xFE
―
NEC特殊 とくしゅ 文字 もじ
1面 めん 13区 く
0xAD
1面 めん 13区 く
0xAD
JIS X 0208-1990 (第 だい 一 いち ・第 だい 二 に 水準 すいじゅん 漢字 かんじ )
1面 めん 14区 く - 84区 く
0xB0 - 0xF4
1面 めん 14区 く - 84区 く
0xB0 - 0xF4
NEC選定 せんてい IBM拡張 かくちょう 文字 もじ
1面 めん 89区 く - 92区 く
0xF9 - 0xFC
―
―
―
ユーザ定義 ていぎ 文字 もじ (前半 ぜんはん )
―
―
―
1面 めん 85区 く - 94区 く
0xF5 - 0xFE
0xA1 - 0xFE
JIS X 0212-1990 (前半 ぜんはん )
2面 めん 1区 く - 11区 く
0x8F
0xA1 - 0xAB
0xA1 - 0xFE
JIS X 0212-1990 (後半 こうはん )
2面 めん 16区 く - 77区 く
0xB0 - 0xED
IBM拡張 かくちょう 文字 もじ (JIS X 0212 以外 いがい )
2面 めん 83区 く - 84区 く
0xF3 - 0xF4
ユーザ定義 ていぎ 文字 もじ (後半 こうはん )
2面 めん 85区 く - 94区 く
0xF5 - 0xFE
『UNIX System V 日本語 にほんご アプリケーション・エンバイロメント リリース 1.0 機能 きのう 導入 どうにゅう 説明 せつめい 書 しょ 』AT&Tユニックス・パシフィック、1986年 ねん 。
中原 なかはら , 康 かん 「III. 日本語 にほんご 処理 しょり 技術 ぎじゅつ 」『電氣 でんき 學會 がっかい 雜誌 ざっし 』第 だい 106巻 かん 第 だい 12号 ごう 、1986年 ねん 、1198-1202頁 ぺーじ 、ISSN 0020-2878 。
小野 おの 芳彦 よしひこ : UNIXの日本語 にほんご 化 か の実現 じつげん 方法 ほうほう , 情報処理 じょうほうしょり , Vol.27, No.12 (1986年 ねん 12月 がつ ), pp.1393-1400.
中原 なかはら 康 やすし : 日本語 にほんご EUCの定義 ていぎ と解説 かいせつ , Revision 1.7, UI-OSF-USLP共同 きょうどう 技術 ぎじゅつ 資料 しりょう (1991年 ねん 12月10日 にち ).
日本語 にほんご 用 よう の文字 もじ コード
日本語 にほんご を含 ふく む多言 たげん 語 ご 文字 もじ 集合 しゅうごう
日本語 にほんご 以外 いがい 用 よう の文字 もじ 集合 しゅうごう
ソフトウェア 区分 くわ け概念 がいねん 関連 かんれん トピック
カテゴリ