(Translated by https://www.hiragana.jp/)
EUC-JP - Wikipedia コンテンツにスキップ

EUC-JP

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
EUC-JISX0213から転送てんそう

EUC-JPExtended UNIX Code Packed Format for Japanese、日本語にほんごEUC)は日本語にほんご文字もじあつか場合ばあい利用りようされてきた文字もじコード符号ふごう方式ほうしき)のひとつである。

1980年代ねんだい中頃なかごろ当時とうじUNIXのライセンス事業じぎょう展開てんかいしていたAT&TがUNIXの日本語にほんごけて、日本にっぽんのUNIXベンダーをメンバーとする日本語にほんごUNIXシステム諮問しもん委員いいんかい設置せっち。ここでUNIXで日本語にほんごあつかうための文字もじコードについて議論ぎろんおこなわれ、議論ぎろん結果けっかをもとにどう委員いいんかいから報告ほうこくしょがAT&Tがわされ、AT&Tによりさだめられた日本語にほんご機能きのうのガイドラインがEUC-JPのこりである。このとき、AT&TからExtended Unix Code (EUC) として日本語にほんごかぎらず多言たげん対応たいおうできるようにさだめられ、EUCのうち日本語にほんごあつかうものをとくにEUC-JPなどとぶ。に、EUC-KR韓国かんこく)、EUC-CN(簡体中国語ちゅうごくごとうがある。

EUC-JPはEUCのエンコード方式ほうしきうえASCIIJIS X 0208文字もじ集合しゅうごう配置はいちしたもので、半角はんかくカナ (JIS X 0201) とJIS補助ほじょ漢字かんじ (JIS X 0212) もふくむことができる。半角はんかくカナと補助ほじょ漢字かんじ使用しようしない場合ばあいは、JIS X 0208で規定きていされている符号ふごう方式ほうしき国際こくさい基準きじゅんばん漢字かんじよう8ビット符号ふごう」と同一どういつとなる。ISO/IEC 2022適合てきごうする。

日本語にほんご文字もじJIS X 0208GR領域りょういき表現ひょうげんしたものを基本きほんとしており、2バイトで表現ひょうげんされ、1バイト、2バイトともに0x80 - 0xFFの範囲はんいないにある。このため英数字えいすうじ日本語にほんご文字もじ区別くべつがしやすく、プログラムうえでのあつかいがらくである。ただし、半角はんかくカナはISO-2022-JPShift_JISことなり制御せいぎょ文字もじSS2(シングルシフトツー、0x8E)につづけてあらわれるので都合つごう2バイト、補助ほじょ漢字かんじ制御せいぎょ文字もじSS3(シングルシフトスリー、0x8F)につづけてあらわれるので都合つごう3バイトをようする。

JIS X 0213:2004に対応たいおうするEUCコードはEUC-JIS-2004(2000ねん初版しょはんはEUC-JISX0213)。

UNIXけいOSの標準ひょうじゅんてき文字もじエンコードとして使用しようされてきた。かつて、WebサーバにUNIXけいOSがおおもちいられていたことから日本語にほんごのウェブサイトではShift_JISとならんでEUC-JPがおお使つかわれていたが、2006ねんごろから世界せかいてきUTF-8普及ふきゅうはじめている[1]ぜん言語げんご主要しゅようなウェブサイトにめるEUC-JPのシェアは、2010ねんから2019ねんにかけて0.7%から0.1%に低下ていかしている[2]

制定せいてい経緯けいい

[編集へんしゅう]

1984ねん7がつ当時とうじUNIXのライセンスを販売はんばいしていたAT&Tがひがしアジア・太平洋たいへいよう地域ちいきでライセンス事業じぎょう展開てんかいするため、子会社こがいしゃのAT&Tインターナショナル・ジャパンにUNIXシステム東京とうきょう事務所じむしょ(AT&Tユニックス・パシフィック)を設立せつりつ最初さいしょ日本にっぽん事業じぎょう展開てんかいするにあたり、UNIXの日本語にほんごけて石田いしだ晴久はるひさ委員いいんちょうに、日本電信電話にほんでんしんでんわ公社こうしゃ沖電気工業おきでんきこうぎょう東芝とうしば日本電気にほんでんき日立製作所ひたちせいさくしょ富士通ふじつう三菱電機みつびしでんきといった当時とうじのUNIXベンダーをメンバーとする日本語にほんごUNIXシステム諮問しもん委員いいんかい設置せっちした。ここでUNIXで日本語にほんごあつかうための文字もじコードや機能きのうについて議論ぎろんおこなわれ、その結果けっかをもとに1985ねん4がつ30にちけでどう委員いいんかいから報告ほうこくしょ『UNIXシステム日本語にほんご機能きのう提案ていあんにあたって』がAT&Tがわ提出ていしゅつされた[3]日本語にほんごEUCとしてのベースはこの報告ほうこくしょおおむ出来上できあがっていたが、AT&Tはこれを国際こくさいてき通用つうようするよう、国際こくさい機能きのう各国かっこく機能きのうけて定義ていぎした。そして1986ねん2がつアナハイム開催かいさいされたUNIXカンファレンス UniForum にて、各国かっこく機能きのうのサポートだい1だんとして Japanese Application Environment (JAE; 日本語にほんごアプリケーション・エンバイロメント) を発表はっぴょう。このなか文字もじコードの構造こうぞう (EUC) と日本語にほんご機能きのう使用しようされる文字もじセットがさだめられた[4]

1990ねんJIS X 0212補助ほじょ漢字かんじ制定せいていされたことをけて定義ていぎ拡張かくちょうする必要ひつようしょうじたため、1991ねん12月、Open Software Foundation (OSF) とUNIX International (UI)、UNIXシステムラボラトリーズ・パシフィック (USLP) はUNIXじょう共通きょうつう日本語にほんご文字もじコードとして日本語にほんごEUC定義ていぎした[5]

EUC-JPの亜種あしゅ

[編集へんしゅう]

EUC-JPには亜種あしゅ存在そんざいする。種類しゅるい以下いか解説かいせつする。

eucJP-msは、オープン・グループおよ日本にっぽんベンダ協議きょうぎかい策定さくていした文字もじ符号ふごう方式ほうしき実装じっそうれいMySQL v5.0以降いこうとう

CP51932マイクロソフトWindows使用しようしているWindows-31JのEUC-JP互換ごかん表現ひょうげん実装じっそうれいInternet Explorer4.0以降いこうEmEditorしゅうまるエディタひとし。このコードはNECPC-9800シリーズ漢字かんじコード(9から12特殊とくしゅ文字もじ除外じょがいしたもの)をGR表現ひょうげんしたような体裁ていさいつ。ただし、PC-9800シリーズの漢字かんじコードはJIS C 6226-1978をベースにするのにたいして、CP51932はJIS X 0208-1990をベースとするてんことなる。

  CP51932 eucJP-ms
めん番号ばんごう 1バイト 2バイト めん番号ばんごう 1バイト 2バイト 3バイト
JIS X 0208-1990
(ひらがな・カタカナとう)
1めん1 - 8 0xA1 - 0xA8 0xA1 - 0xFE 1めん1 - 8 0xA1 - 0xA8 0xA1 - 0xFE
NEC特殊とくしゅ文字もじ 1めん13 0xAD 1めん13 0xAD
JIS X 0208-1990
(だいいちだい水準すいじゅん漢字かんじ)
1めん14 - 84 0xB0 - 0xF4 1めん14 - 84 0xB0 - 0xF4
NEC選定せんていIBM拡張かくちょう文字もじ 1めん89 - 92 0xF9 - 0xFC
ユーザ定義ていぎ文字もじ
(前半ぜんはん)
1めん85 - 94 0xF5 - 0xFE 0xA1 - 0xFE
JIS X 0212-1990
(前半ぜんはん)
2めん1 - 11 0x8F 0xA1 - 0xAB 0xA1 - 0xFE
JIS X 0212-1990
(後半こうはん)
2めん16 - 77 0xB0 - 0xED
IBM拡張かくちょう文字もじ
(JIS X 0212 以外いがい)
2めん83 - 84 0xF3 - 0xF4
ユーザ定義ていぎ文字もじ
(後半こうはん)
2めん85 - 94 0xF5 - 0xFE

脚注きゃくちゅう

[編集へんしゅう]
  1. ^ Davis, Mark (2012ねん2がつ3にち). “Unicode over 60 percent of the web” (英語えいご). Official Google Blog. 2023ねん2がつ5にち閲覧えつらん
  2. ^ Historical yearly trends in the usage statistics of character encodings for websites”. W3Techs. 2021ねん6がつ8にち時点じてんオリジナルよりアーカイブ。2023ねん2がつ5にち閲覧えつらん
  3. ^ AT&Tユニックス・パシフィック「AT&Tおよび日本にっぽん企業きぎょうによるUNIXシステムV日本語にほんご機能きのう開発かいはつについて」『情報じょうほう科学かがくだい21かんだい5ごう情報じょうほう科学かがく研究所けんきゅうじょ、1985ねん、46-62ぺーじISSN 0368-3354 
  4. ^ 門田かどた, 次郎じろう日本にっぽん市場いちばにおけるAT&TのUNIX戦略せんりゃく―これからのシステムV日本語にほんご機能きのう展開てんかい」『コンピュートピア』だい20かんだい236ごう、コンピュータ・エージしゃ、1986ねん、72-75ぺーじISSN 0010-4906 
  5. ^ 「UNIXの標準ひょうじゅん2団体だんたい日本語にほんごEUC共通きょうつう」『標準ひょうじゅんジャーナル』だい22かんだい3ごう日本にっぽん規格きかく協会きょうかい、1992ねん、90ぺーじISSN 0285-600X 

参考さんこう文献ぶんけん

[編集へんしゅう]
  • 『UNIX System V 日本語にほんごアプリケーション・エンバイロメント リリース 1.0 機能きのう導入どうにゅう説明せつめいしょ』AT&Tユニックス・パシフィック、1986ねん 
  • 中原なかはら, かんIII. 日本語にほんご処理しょり技術ぎじゅつ」『電氣でんき學會がっかい雜誌ざっしだい106かんだい12ごう、1986ねん、1198-1202ぺーじISSN 0020-2878 
  • 小野おの芳彦よしひこ: UNIXの日本語にほんご実現じつげん方法ほうほう, 情報処理じょうほうしょり, Vol.27, No.12 (1986ねん12がつ), pp.1393-1400.
  • 中原なかはらやすし: 日本語にほんごEUCの定義ていぎ解説かいせつ, Revision 1.7, UI-OSF-USLP共同きょうどう技術ぎじゅつ資料しりょう (1991ねん12月10にち).