(Translated by https://www.hiragana.jp/)
Microsoftコードページ932 - Wikipedia

Microsoftコードページ932

CP932から転送てんそう

Microsoft コードページ 932(マイクロソフト コードページ 932)は(以下いか CP932)、マイクロソフトおよび、MS-DOSOEMベンダがShift_JIS独自どくじ拡張かくちょうした文字もじコードである。また、同時どうじにCP932は、Shift_JISのWindowsアプリケーションにおける「実装じっそう」を用語ようごであるともえる。

MS932とその日本語にほんご関連かんれんした文字もじ集合しゅうごうとの関係かんけいオイラー

このこうでは、おもにShift_JISにおけるマイクロソフトおよびかくベンダの独自どくじ拡張かくちょう部分ぶぶんについて言及げんきゅうする。ベンダ独自どくじ拡張かくちょう部分ぶぶん以外いがい内容ないようについては、Shift_JIS参照さんしょうされたい。

また、マイクロソフト標準ひょうじゅんキャラクタセット項目こうもくあわせて参照さんしょうされたい。

CP932の呼称こしょう別名べつめい)の整理せいり

編集へんしゅう
Windows-31J
Windows 3.1 (J) のリリースにわせて、マイクロソフトが IBM日本電気にほんでんき (NEC) のコードを統合とうごうしてつくった符号ふごう文字もじ集合しゅうごう。1993 ねん以降いこう、マイクロソフトが自社じしゃのドキュメントとうで「CP932」という用語ようご使つかってあらわしている対象たいしょうは、つねにこの「Windows-31J」である。この名前なまえIANA登録とうろくされている。
MS932
Java で、「IBM のコードページ 932」と「Windows-31J」を区別くべつするための用語ようご。Windows-31Jをす。
CP932
MS-DOSとWindowsにおける日本語にほんごコードページをあらわ用語ようご。「Windows-31J」が制定せいていされるまでは、OEMベンダによって文字もじ集合しゅうごうちがう。
MS 漢字かんじコード
「CP932」とほぼおな意味いみ用語ようごである。マイクロソフトが(Shift_JIS という符号ふごう方式ほうしきを)策定さくていしたというてんや、マイクロソフトが(JIS X 0208という文字もじ集合しゅうごうたいして)文字もじ独自どくじ追加ついかしたてん強調きょうちょうしたい場合ばあいもちいられる。また、たんに「シフトJIS」のことをしている場合ばあいもある。
OEM コードページ 932
Windows 3.1 日本語にほんごばん発売はつばい以前いぜんにおける、OEMベンダ各自かくじ拡張かくちょうゆるした仕様しよう文字もじセット。

以下いかは、マイクロソフトからはなれ、現在げんざいでは公的こうてき機関きかんからもみとめられた文字もじ符号ふごう方式ほうしき用語ようごである。

シフトJIS
JIS X 0208符号ふごう文字もじ集合しゅうごう一定いってい規則きそくしたがってシフトした文字もじ符号ふごう方式ほうしき具体ぐたいてき内容ないようはJIS X 0208:1997に「シフト符号ふごう表現ひょうげん」として記載きさいがある。しかし、文脈ぶんみゃくによってはベンダ拡張かくちょうされたコードセットをしている場合ばあいもある。
Shift_JIS
「シフトJIS」のIANA登録とうろくめい
SJIS
Shift_JIS短縮形たんしゅくけい。JavaではShift_JISと同義語どうぎご

構造こうぞう

編集へんしゅう
だい1バイト
0 1 2 3 4 5 6 7 8 9 A B C D E F
0
1
2 ! " # $ % & ' ( ) * + , - . /
3 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4 @ A B C D E F G H I J K L M N O
5 P Q R S T U V W X Y Z [ ¥ ] ^ _
6 ` a b c d e f g h i j k l m n o
7 p q r s t u v w x y z { | }
8
9
A
B ソ
C
D
E
F
だい2バイト
0 1 2 3 4 5 6 7 8 9 A B C D E F
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
 
ASCII制御せいぎょ文字もじ
ASCIIと同一どういつ文字もじ
ASCIIとことなる文字もじ
半角はんかくカナ
2バイト文字もじだい1バイト
2バイト文字もじだい2バイト(番号ばんごう奇数きすう場合ばあい
2バイト文字もじだい2バイト(番号ばんごう偶数ぐうすう場合ばあい
使用しよう

Shift_JISでは領域りょういき使用しようであった13(874016 - 879E16)、89 - 92(ED4016 - EEFC16)、115 - 119(FA4016 - FC9E16)に合計ごうけい845文字もじ追加ついか。ただしおな文字もじ互換ごかんせいのため重複じゅうふくしてふくまれており実質じっしつ447文字もじ追加ついかである。また、95 - 114(F04016 - F9FC16)も利用りようしゃ定義ていぎ領域りょういき外字がいじ領域りょういき)となっている。

CP932 の誕生たんじょう発展はってん

編集へんしゅう

CP932が、現在げんざいの「Windows-31J」のかたちとして完成かんせいいたるまでには複雑ふくざつ経緯けいいがある。

1982ねん(JIS X 0208-1983策定さくてい前年ぜんねん)、JIS C 6226(JIS X 0208)複雑ふくざつにシフトさせた文字もじ符号ふごう方式ほうしきとしてShift_JIS誕生たんじょうした。この符号ふごう方式ほうしき(を利用りようした拡張かくちょう符号ふごう文字もじ集合しゅうごう)は、マイクロソフトによりMS-DOSにおける標準ひょうじゅん日本語にほんごコードとして採用さいようされ、「コードページ 932 (CP932)」という管理かんり番号ばんごうあたえられた。

しかし、マイクロソフトは、MS-DOSにおける唯一ゆいいつ日本語にほんごようコードページである「CP932」を、OEMメーカーの自由じゆうまかせていた。そのため、NECのPC-9800シリーズ、IBMのPS/55 シリーズ富士通ふじつうFMRシリーズなどはすべて、MS-DOSを搭載とうさい文字もじ符号ふごう方式ほうしきもShift_JISを採用さいようしているコンピュータであるにもかかわらず、登録とうろくされている文字もじ集合しゅうごうがバラバラだった。

以下いか代表だいひょうてきな2つの実装じっそう解説かいせつする。

1983ねん、IBMは、日本語にほんご処理しょり重点じゅうてんいたデスクトップコンピュータ「マルチステーション5550」を発売はつばいするさい利用りようする符号ふごう文字もじ集合しゅうごう以下いかのようにさだめた。

  • Shift_JISをベースとする。
  • JIS C 6226が規定きていする94 × 94てん領域りょういき拡張かくちょう文字もじ追加ついかおこなわない。
  • 95 - 114をユーザ外字がいじ領域りょういきとする。
  • 115 - 119にJIS C 6226に登録とうろくDBCS-Host[1]文字もじ登録とうろくすることで、DBCS-Hostの文字もじセット全体ぜんたい表現ひょうげんする。
  • 2バイト文字もじ部分ぶぶんだけの符号ふごう文字もじ集合しゅうごう名称めいしょうをDBCS-PCとし、コードページ番号ばんごう[2]として「301」をてる。
  • 1バイト・2バイト文字もじ全体ぜんたい符号ふごう文字もじ集合しゅうごうのコードページ番号ばんごうとして「932」をてる。

こうしてできたDBCS-PCは1990ねん発売はつばいDOS/Vにもがれることとなる。

一方いっぽうNECは、1983ねんに PC-9800シリーズの漢字かんじ処理しょりオプション提供ていきょう開始かいしした。とくに、MS-DOSおよびCP/M-86搭載とうさいにおける漢字かんじROM収容しゅうようする文字もじ集合しゅうごう以下いかのようにさだめた。

  • Shift_JISをベースとする。
  • JIPS[3]の9 - 13特殊とくしゅ文字もじ領域りょういきをそのままの区点くてん番号ばんごう配置はいち
  • JIS C 6226-1978 漢字かんじだいいち水準すいじゅん漢字かんじだい水準すいじゅん漢字かんじはそのままの字形じけいで、そのままの区点くてん番号ばんごう配置はいち
  • IBM のメインフレームの「IBM 漢字かんじ (DBCS-Host)」のなかでJIS C 6226に登録とうろく漢字かんじをIBMのDBCS-PCと同様どうようならびで89 - 92配置はいち[4]。DBCS-PCとちがい、115 - 119ではなく、GL表現ひょうげん可能かのうなように追加ついか文字もじすべてを 94区内くないすべ配置はいちした。

OEMコードページの統合とうごう

編集へんしゅう

マイクロソフトは1993ねん、Windows 3.1の日本語にほんごばんすにあたり、「CP932の誕生たんじょう発展はってんふしべたように多様たようした「CP932」の仕様しようをOEMメーカーの自由じゆうまかせるという方針ほうしん撤回てっかいした。日本にっぽんパーソナルコンピュータ市場いちばで、とくおおきなシェアを上記じょうき2しゃ統合とうごうコードをWindowsにおける日本語にほんご標準ひょうじゅんコードとし、また、これをIANAに「Windows-31J」という登録とうろくした。IANA登録とうろくめいの「Windows-31J」とは、んでのごとく、「Windows3.1 Japanese」を意味いみしている。IBMはマイクロソフトによる「CP932」の統合とうごうけて、「Windows-31J」とかく文字もじのコードポイントまで同一どういつにした「CP943」を策定さくていし、同社どうしゃのOSであるOS/2AIXDBMSであるDB2などに搭載とうさいしている。

統合とうごう概要がいよう以下いかのとおりである。

マイクロソフトによるIBM & NEC統合とうごう概要がいよう
  • ベースとなる符号ふごう文字もじ集合しゅうごうとしてJIS X 0208-1990を採用さいよう
  • NECが9 - 13登録とうろくしていた特殊とくしゅ文字もじうち、13のものだけを継承けいしょう。この 13登録とうろくの 83文字もじのことを「NEC特殊とくしゅ文字もじ」と命名めいめい
  • NECが89 - 92登録とうろくしていた漢字かんじ漢字かんじすべ継承けいしょう。このエリアの374文字もじのことを「NEC選定せんていIBM拡張かくちょう文字もじ」と命名めいめい
  • IBMが115 - 119登録とうろくしていた漢字かんじ漢字かんじすべ継承けいしょう。このエリアの388文字もじのことを「IBM拡張かくちょう文字もじ」と命名めいめい

上記じょうき統合とうごう以後いごは、「CP932」とえば、マイクロソフトの技術ぎじゅつ文書ぶんしょ以外いがいでも、一般いっぱんてきに「Windows-31J」をすようになった。しかし、統合とうごうまえ文字もじセットがまった利用りようされなくなったというわけではない。れいとして、Javaでは、「CP932」がIBMの「CP932」をし、「MS932」が「Windows-31J」をす。JDK 1.4.1以降いこうでは「MS932」のわりに「Windows-31J」というキーワードでも「Windows-31J」文字もじセットを指定していできるようになっている。

Windows-31J に重複じゅうふく登録とうろくされたコード

編集へんしゅう

前節ぜんせつれたように、「Windows-31J」はNECとIBMのそれぞれのコードを統合とうごうして(互換ごかんせい維持いじするかたちで)つくられた経緯けいいがあるため文字もじ重複じゅうふくがあり、おおまかにえば「NEC選定せんていIBM拡張かくちょう文字もじ」と「IBM拡張かくちょう文字もじ」がほぼまるごと重複じゅうふくしている。漢字かんじ部分ぶぶんについていえば、すべての漢字かんじがきっかり2つずつ登録とうろくされている。

以下いか拡張かくちょう文字もじを(符号ふごう文字もじ集合しゅうごうとしてくわしくると、まずNEC選定せんていIBM拡張かくちょう漢字かんじ360文字もじ小文字こもじのローマ数字すうじ「ⅰ」‐「ⅹ」、および「¬」「¦」「'」「"」構成こうせいされるが、これらはすべてIBM拡張かくちょうふくまれる。IBM拡張かくちょうはこのNEC選定せんていIBM拡張かくちょうに、大文字おおもじのローマ数字すうじ「Ⅰ」‐「Ⅹ」「㈱」「№」「℡」「∵」けい14文字もじくわえたものである。そしてこの差分さぶんの14文字もじはすべてNEC特殊とくしゅ文字もじにもふくまれており、NEC特殊とくしゅ文字もじはこの14文字もじと、IBM拡張かくちょう・NEC選定せんていIBM拡張かくちょうのいずれにもふくまれない69文字もじ構成こうせいされる。したがってNEC選定せんていIBM拡張かくちょう文字もじとNEC特殊とくしゅ文字もじわせると、過不足かふそくのない拡張かくちょう文字もじ集合しゅうごう全体ぜんたいになる。また、これらのうちでJIS X 0208:1990と重複じゅうふくするのは漢字かんじのみであり、それは3重複じゅうふくである「¬」「∵」の2文字もじと、NEC特殊とくしゅ文字もじとの2重複じゅうふくである「≒」「≡」「∫」「√」「⊥」「∠」「∩」「∪」の8文字もじである。なお、JIS X 0208:1990のつこれら10文字もじ重複じゅうふくはすべて、JIS X 0208:1983の段階だんかい追加ついかされた文字もじである。

Windows-31Jが符号ふごう対象たいしょうとする文字もじ集合しゅうごう
IBM拡張かくちょう文字もじ(388文字もじ
NEC選定せんていIBM拡張かくちょう文字もじ(374文字もじ NEC特殊とくしゅ文字もじ(83文字もじ
373文字もじ

ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ¦'"
纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖侒侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝﨎咜咊咩哿喆坙坥垬埈埇﨏塚ぞう墲夋奓奛奝奣妤妺孖寀甯寘ひろし尞岦岺峵崧嵓﨑嵂嵭嶸嶹巐弡弴彧德忞恝えつ悊惞惕愠惲愑愷愰憘戓抦揵摠撝擎敎昀昕昻昉昮昞昤晥晗晙はれ晳暙暠暲暿曺朎朗杦枻桒柀栁桄棏﨓楨﨔榘槢樰橫橆橳橾櫢櫤毖氿汜沆汯泚洄涇浯涖涬淏淸淲淼渹湜渧渼溿澈澵濵瀅瀇炅炫焏焄煜煆煇凞燁燾犱犾猤猪獷玽珉珖珣珒琇珵琦琪琩琮瑢璉璟甁畯皂皜皞皛皦えき睆劯砡硎硤硺礰礼かみさち禔福禛竑竧靖竫箞せい絈絜綷綠いとぐち繒罇羡羽茁荢荿菇菶葈蒴蕓蕙蕫﨟薰蘒﨡蠇裵訒訷詹誧誾諟しょ諶譓譿賰よりゆき贒赶﨣軏﨤逸遧郞鄕鄧釚釗釞釭釮釤釥鈆鈐鈊鈺鉀鈼鉎鉙鉑鈹鉧銧鉷鉸鋧鋗鋙鋐﨧鋕鋠鋓錥錡鋻﨨錞鋿錝錂鍰鍗鎤鏆鏞鏸鐱鑅鑈あいだたかし﨩隝隯霳霻靃靍靏あお靕顗顥飯飼餧かん馞驎髙髜魵魲鮏鮱鮻鰀鵰鵫づる鸙黑

13文字もじ

ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ№℡㈱

61文字もじ

①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡㍻〝〟㏍㊤㊥㊦㊧㊨㈲㈹㍾㍽㍼∮∑∟⊿

1文字もじ
1文字もじ
8文字もじ
≒≡∫√⊥∠∩∪
6869文字もじ
省略しょうりゃく
JIS X 0208:1990(6879文字もじ)

重複じゅうふく文字もじふくまれる領域りょういき

編集へんしゅう

重複じゅうふく文字もじふくまれる領域りょういき以下いかひょうのとおりである。

文字種もじしゅめい コードポイント(16進数しんすう表記ひょうき 番号ばんごう 重複じゅうふく文字数もじすう
JIS X 0208の漢字かんじ(1983ねん追加ついか文字もじ)の一部いちぶ - 2 10文字もじ
NEC特殊とくしゅ文字もじ 8740 - 879C 13 22文字もじ
NEC選定せんていIBM拡張かくちょう文字もじ ED40 - EEFC 89 - 92 374文字もじ全部ぜんぶ
IBM拡張かくちょう文字もじ FA40 - FC4B 115 - 119 388文字もじ全部ぜんぶ

文字もじコード変換へんかん重複じゅうふく文字もじ影響えいきょう

編集へんしゅう

文字もじコード変換へんかんおこなさいには、この重複じゅうふく文字もじというのは厄介やっかいになる。べつ文字もじコードから、「Windows-31J」に変換へんかんする場合ばあいに、重複じゅうふくするどちらの文字もじへと変換へんかんするべきかが問題もんだいになる。

それにかんして、WindowsのAPIの仕様しようにおける優先ゆうせん順位じゅんいは、以下いかのようになっている。

  1. JIS X 0208-1990登録とうろく文字もじである場合ばあいは、これに統一とういつ
    • れい : 「(ルート)」、「(なぜならば)」、「否定ひてい)」
  2. 「NEC特殊とくしゅ文字もじ」「IBM拡張かくちょう文字もじ」が重複じゅうふくする場合ばあいは、「NEC特殊とくしゅ文字もじ」に統一とういつ
    • れい : 「(ナンバー)」 、「(かっこかぶ)」、「大文字おおもじローマ数字すうじの3)」
  3. 「NEC選定せんていIBM拡張かくちょう文字もじ」「IBM拡張かくちょう文字もじ」が重複じゅうふくする場合ばあいは、「IBM拡張かくちょう文字もじ」に統一とういつ
    • れい : 「(たちざき)」 、「(はしごだか)」 、「小文字こもじローマ数字すうじの 3)」

この基準きじゅんしたがって、Microsoft IME によって、「(かっこかぶ)」を入力にゅうりょくしようとした場合ばあいには、IBM 拡張かくちょう文字もじのコードである FA5816しん ではなく、NEC 特殊とくしゅ文字もじとしてのコードである 878A16しんてられる。

文字種もじしゅべつ 文字数もじすう Windows-31J変換へんかんのこ文字数もじすう
NEC特殊とくしゅ文字もじ 83文字もじ漢字かんじ83文字もじ 74文字もじ
NEC選定せんていIBM拡張かくちょう文字もじ 374文字もじ漢字かんじ14文字もじ漢字かんじ360文字もじ 0文字もじ
IBM拡張かくちょう文字もじ 388文字もじ漢字かんじ28文字もじ漢字かんじ360文字もじ 373文字もじ
合計ごうけい - 447文字もじ漢字かんじ87文字もじ漢字かんじ360文字もじ

JIS X 0208-1990の登録とうろく文字もじ10文字もじ(「≒」「≡」「∫」「√」「⊥」「∠」「∵」「∩」「∪」「¬」)をJIS78を基準きじゅんした場合ばあい機種きしゅ依存いぞん文字もじとしてあつか場合ばあいがある。 [5][6]

インターネットじょうでの Windows-31J の利用りようについて

編集へんしゅう

IANAのcharset登録とうろく簿には「Windows-31J」が登録とうろくされているが、「限定げんていされた、または特殊とくしゅ使用しようのためのもの」とされており、インターネットじょうもちいることが推奨すいしょうされるまでにはいたっていない。ただし、文字もじ符号ふごう方式ほうしきとしてShift_JISもちいてデータを交換こうかんしあうしゃあいだにおいて、明示めいじてき使用しよう合意ごういされている場合ばあいは、Windows-31Jを使つかっても問題もんだいい。

Unicode範囲はんい完全かんぜん表現ひょうげん可能かのうUTF-8ひとし文字もじ符号ふごう方式ほうしきもちいてデータの交換こうかんをする場合ばあいは、はなし若干じゃっかんややこしくなる。IBM拡張かくちょう文字もじとうのWindows-31J独自どくじ追加ついか文字もじは、JIS X 0208登録とうろくCJK統合とうごう漢字かんじくらべて、機種きしゅ(OS / アプリケーション)あいだでのデータ交換こうかんを、文字もじこしたりせずにデータのやりりが正常せいじょうおこなえるかくりつたかいからである。これについては、デスクトップOSとしてのWindowsの普及ふきゅうりつ非常ひじょうたかいことも理由りゆうの1つである。機種きしゅ依存いぞん文字もじこうあわせて参照さんしょうのこと。

とはえ、UTF-8などのようなUnicodeの登録とうろく文字もじすべ利用りようできる文字もじ符号ふごう方式ほうしき利用りようしている場合ばあいであっても、あえてJIS X 0208登録とうろく文字もじだけをもちいてデータ交換こうかんおこなったほうが、問題もんだいこりにくい。

また、Unicodeに変換へんかんしたさい一部いちぶ文字もじがShift_JISとはことなるコードにてられていることでの文字もじけをこすことがある。Unicode#なみダッシュ・全角ぜんかくチルダ問題もんだいおよびなみダッシュ#Unicodeに関連かんれんする問題もんだい参照さんしょうのこと。

文字もじ集合しゅうごうへの影響えいきょう

編集へんしゅう

NEC特殊とくしゅ文字もじ・IBM拡張かくちょう文字もじ

編集へんしゅう

NEC特殊とくしゅ文字もじや IBM拡張かくちょう文字もじはもともとベンダの独断どくだんつくられた文字もじセットであるが、これがデファクトスタンダードとしての影響えいきょうりょくった結果けっかとして[よう出典しゅってん]現在げんざいでは各種かくしゅ公的こうてき規格きかくでも全部ぜんぶまたは一部いちぶ採用さいようされている。

NEC特殊とくしゅ文字もじ

編集へんしゅう
Windows-31J
ぜん83文字もじを、13収録しゅうろく
「≒」「≡」「∫」「√」「⊥」「∠」「∵」「∩」「∪」の9文字もじは2にも重複じゅうふくして収録しゅうろく
「∵」の1文字もじはさらに115にも重複じゅうふくして収録しゅうろく
Unicode
83文字もじすべてを基本きほん多言たげん (BMP) めん収録しゅうろく
JIS X 0212-1990
「№」の1文字もじを281てん収録しゅうろく
JIS X 0213:2004
「≒」「≡」「∫」「√」「⊥」「∠」「∵」「∩」「∪」の9文字もじは2収録しゅうろく
(N-ARY SUMMATION)」の1文字もじ収録しゅうろくされていない。618てんのギリシャ大文字おおもじシグマ「Σしぐま」で代用だいようできるため。
上記じょうき以外いがいの 73文字もじはWindows-31Jと同一どういつ区点くてん(1 じょう収録しゅうろく

IBM拡張かくちょう文字もじ

編集へんしゅう
Windows-31J
ぜん388文字もじを、2ないし 3重複じゅうふくして収録しゅうろく
Unicode
388文字もじすべてを基本きほん多言たげんめん (BMP) に収録しゅうろく。ただし、はね」「」「せい」「さちなどその一部いちぶCJK互換ごかん漢字かんじとしての採用さいようであり、統合とうごう漢字かんじにおいてべつ字体じたい標準ひょうじゅんとするコードポイントに包摂ほうせつされているものである。Unicodeにもとづいてこれらの字体じたい特定とくていてき使用しようしたい場合ばあいには、統合とうごう漢字かんじIVSもちいることが推奨すいしょうされている。
JIS X 0212-1990
ぜん388文字もじちゅう280文字もじ収録しゅうろく
このうち漢字かんじ部分ぶぶんぜん360文字もじちゅう279文字もじ収録しゅうろく
JIS X 0213:2004
ぜん388文字もじちゅう304文字もじ収録しゅうろく
このうち漢字かんじ部分ぶぶんぜん360文字もじちゅう276文字もじ収録しゅうろく
富士通ふじつう JEF
388文字もじすべてを収録しゅうろく
NEC JIPS
388文字もじすべてを収録しゅうろく
日立製作所ひたちせいさくしょ KEIS (90)
「'」「"」以外いがいの386文字もじ収録しゅうろく
IBM DBCS-Host
388文字もじすべてを収録しゅうろく
三菱電機みつびしでんき JSII
388文字もじすべてを収録しゅうろく
BIPROGY Lets-J
388文字もじちゅう 328文字もじ収録しゅうろく

JIS X 0208以外いがい公的こうてき規格きかくにて登録とうろくのあるNEC特殊とくしゅ文字もじ一覧いちらん

編集へんしゅう

JIS X 0212-1990に登録とうろくされているNEC特殊とくしゅ文字もじ全部ぜんぶ

編集へんしゅう

JIS X 0213:2004 に登録とうろくされているNEC特殊とくしゅ文字もじ全部ぜんぶ

編集へんしゅう

① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ ⑪ ⑫ ⑬ ⑭ ⑮ ⑯ ⑰ ⑱ ⑲ ⑳ Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ㍉ ㌔ ㌢ ㍍ ㌘ ㌧ ㌃ ㌶ ㍑ ㍗ ㌍ ㌦ ㌣ ㌫ ㍊ ㌻ ㎜ ㎝ ㎞ ㎎ ㎏ ㏄ ㎡ ㍻ 〝 〟 № ㏍ ℡ ㊤ ㊥ ㊦ ㊧ ㊨ ㈱ ㈲ ㈹ ㍾ ㍽ ㍼ ≒ ≡ ∫ ∮ √ ⊥ ∠ ∟ ⊿ ∵ ∩ ∪

JIS X 0208以外いがい公的こうてき規格きかくにて登録とうろくのあるIBM拡張かくちょう文字もじ一覧いちらん

編集へんしゅう

人名じんめいよう漢字かんじ(2004ねん改正かいせい)に登録とうろくされているIBM拡張かくちょう文字もじ全部ぜんぶ

編集へんしゅう

ひろし かおる ぞう とく よりゆき ろう よこ くろ いとぐち しょ さち かみ ふく ろう

JIS X 0212-1990に登録とうろくされているIBM拡張かくちょう文字もじ全部ぜんぶ

編集へんしゅう

№ 丨 仡 伀 伃 伹 佖 侊 侒 侔 侚 俉 俍 俿 倞 倢 偀 偂 偆 偰 傔 僘 兊 兤 冝 冾 刕 劜 劦 劯 勀 勛 匀 卲 厓 厲 叝 咜 咩 哿 喆 坥 垬 埇 埈 墲 夋 奓 奛 奝 奣 妤 妺 孖 寀 寘 尞 岦 岺 崧 嵂 嵭 嶸 嶹 巐 弡 弴 彅 彧 忞 恝 悊 惕 惞 惲 愑 愰 愷 憘 戓 抦 揵 摠 撝 擎 昀 昉 昕 昞 昤 昮 昱 晗 晙 曻 晳 暙 暠 暲 暿 曺 朎 杦 枻 柀 桒 桄 棈 棏 楨 榘 槢 樰 橆 橳 橾 櫤 毖 氿 汜 汯 沆 泚 洄 浯 涇 涖 涬 淏 淼 渧 渹 渼 湜 溿 澈 澵 濵 瀅 瀇 炅 炫 焄 焏 煆 煇 煜 燁 燾 犱 犾 猤 獷 玽 珉 珒 珖 珣 珵 琇 琦 琩 琪 琮 瑢 璉 璟 甯 畯 皛 皜 皦 睆 砡 硎 硤 硺 禔 禛 竑 竫 箞 絈 絜 綷 繒 纊 罇 羡 茁 荿 菇 菶 葈 蒴 蓜 蕓 蕙 蕫 裵 褜 訒 訷 詹 誧 誾 諟 諶 譓 賰 贒 軏 遧 鄧 釗 釚 釞 釤 釥 釭 釮 鈆 鈊 鈐 鈹 鈺 鈼 鉀 鉎 鉑 鉙 鉧 鉷 鉸 銈 銧 鋐 鋓 鋕 鋗 鋙 鋠 鋧 鋹 鋻 鋿 錂 錝 錞 錡 錥 鍈 鍗 鍰 鎤 鏆 鏞 鏸 鐱 鑅 鑈 隝 隯 霳 靃 靏 靕 顗 顥 餧 驎 髜 魵 鮏 鮱 鮻 鰀 鵫 鵰 鸙

JIS X 0213:2004に登録とうろくされているIBM拡張かくちょう文字もじ全部ぜんぶ

編集へんしゅう

ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ¬ ¦ ' " ㈱ № ℡ ∵ 丨 仡 伃 佖 侊 侔 俉 偀 傔 兊 冝 刕 勛 匀 匇 厓 厲 咜 咩 哿 喆 﨏 埇 埈 づか ぞう 奝 妤 孖 寘 ひろし 尞 岺 崧 﨑 嵓 嵭 嶸 弴 彅 彧 とく 忞 惕 愰 愷 揵 摠 擎 昀 昉 昕 昞 昤 昱 曻 晙 晥 晳 暠 暲 曺 ろう 杦 枻 柀 栁 桒 棈 楨 﨔 槢 よこ 橳 櫤 毖 汜 沆 洄 涇 涬 淼 湜 澈 濵 瀅 炅 炫 焏 煆 煇 煜 凞 燁 燾 犾 いのしし 珉 珖 珣 琇 琦 琪 琮 瑢 璉 璟 びん 甯 畯 皛 皞 皦 睆 硎 かみ さち ぶく 竫 箞 絈 絜 みどり いとぐち 繒 纊 罇 茁 荢 菇 葈 蒴 蕙 﨟 かおる 裵 褜 訒 訷 詹 誧 諟 諶 しょ よりゆきろう 鄕 鄧 釗 釤 釥 釭 鈐 鈹 鈺 鈼 鉀 鉸 銈 鋓 鋠 鋿 錡 錥 鍈 鍰 鏆 鏞 たかし 隝 霳 霻 靍 靏 顗 顥 馞 驎 魲 魵 鮏 鰀 鵰 くろ 伀 侒 侚 倞 倢 偂 偆 偰 劦 劯 匤 咊 垬 夋 奛 寀 岦 嵂 嶹 悊 惲 憘 抦 撝 晗 暙 暿 桄 﨓 棏 榘 樰 橆 橾 氿 泚 淏 渧 渼 溿 澵 瀇 炻 焄 犱 獷 皜 砡 硤 礰 禔 禛 竑 竧 綷 荿 蓜 蕓 蘒 﨡 誾 譿 賰 﨤 釚 釮 鈊 鉎 鉑 鉙 鉧 銧 鋐 鋗 鋙 鋧 鋹 鋻 錂 錝 錞 鍗 鑅 隯 靕 髜 鮱 鵫 鸙

CP932に定義ていぎされているが、JIS X 0212・JIS X 0213にない文字もじ

編集へんしゅう

JIS X 0213で字形じけい包摂ほうせつされているものもふくむ。

∑ 仼 僴 凬 坙 峵 えつきょう 昻 櫢 淲 きよし 皂 蠇 赶 あいだ あお 髙 﨎 はれ えきやすし せい いっ 﨧 﨨 﨩 めしかん

CP932の利用りようしゃ定義ていぎ領域りょういき

編集へんしゅう

CP932においては、95 - 114までの1880文字もじ領域りょういきが「利用りようしゃ定義ていぎ領域りょういき外字がいじ領域りょういき)」となっている。

Unicodeとの変換へんかんについて、Windows API仕様しようでは、BMPめん私用しよう領域りょういき 6400文字もじぶん領域りょういき先頭せんとうから1880文字もじまでと、95 - 114とう領域りょういきを1たい1の写像しゃぞう変換へんかんするようになっている。

Windows-31J以外いがいのベンダ拡張かくちょうシフトJIS

編集へんしゅう

アップルコンピュータのシフトJIS

編集へんしゅう

Apple Computer自社じしゃのコンピュータのOSとしてMS-DOSやCP/M-86を採用さいようしなかったが、Macintoshもちいる文字もじコードとしてシフトJISを利用りようした。

そのMacintosh(漢字かんじ Talk 7.1 以降いこう搭載とうさいのシフトJISの9 - 15にはアップルコンピュータ独自どくじ特殊とくしゅ文字もじ登録とうろくされている。このエリアには13ふくまれるため、Windows-31Jの「NEC特殊とくしゅ文字もじ領域りょういきこうむっている。文字もじれいげれば、NEC特殊とくしゅ文字もじの「」は Apple特殊とくしゅ文字もじの「」がおなコードポイント登録とうろくされている。さらに、117に「たてよう文字もじ」が登録とうろくされているてんも Windows-31J とことなる。IBM拡張かくちょう文字もじ領域りょういき存在そんざいしない[7]。この文字もじコードについては、MacJapanese参照さんしょうのこと。

漢字かんじTalk 6以前いぜんのMacintosh では、NEC互換ごかんのシフトJISが使つかわれており、13のNEC特殊とくしゅ文字もじもMacintoshじょう利用りようできた。macOS標準ひょうじゅんウェブブラウザSafariでは、MacようシフトJIS (MacJapanese) で表示ひょうじするのか、Windows-31Jで表示ひょうじするのかを選択せんたくできる。

富士通ふじつうのシフトJIS

編集へんしゅう

富士通ふじつうのMS-DOS搭載とうさいコンピュータのOEMコードページ932として使つかわれる文字もじコードに、「R90」というものがある。これはFMRシリーズで利用りようされた。この符号ふごう文字もじ集合しゅうごう特徴とくちょうは、87 - 93に「OASYS 拡張かくちょう文字もじ」の領域りょういきつことである。ベースとなる文字もじ集合しゅうごうJIS X 0208-1990であるが、だいいち水準すいじゅん漢字かんじなかで「78⇔83いれがえ文字もじ」でない漢字かんじ(203文字もじ)の字形じけいをJIS C 6226-1978にわせてあるてん特色とくしょくがある。なお、富士通ふじつうのマニュアルとうでは、「R90」のことを「SJIS (R90)」とび、「Windows-31J」のことを「SJIS (MS)」とんで区別くべつしている。

iモードのシフトJIS

編集へんしゅう

NTTドコモiモード標準ひょうじゅん日本語にほんごコードにシフトJISを採用さいようしている。この文字もじ集合しゅうごうにおいてはJIS X 0208-1990以下いかのように拡張かくちょうしている。

  • 13にPC-9800シリーズよう特殊とくしゅ文字もじ搭載とうさいされている。NEC選定せんていIBM 拡張かくちょう文字もじ搭載とうさいされていない。
  • 112 - 114絵文字えもじ登録とうろくしている。この 112 - 114というのは、CP932における 95 - 114にある1880文字もじのユーザ外字がいじ登録とうろく領域りょういきさい後尾こうび位置いちたる。

きょうセラ・AH-K3001V のシフトJIS

編集へんしゅう

きょうセラPHSAH-K3001V搭載とうさいするシフトJIS は、9 - 13にPC-9800シリーズよう特殊とくしゅ文字もじ搭載とうさいされている。

文字もじコード 5C と 7E の文字もじについて

編集へんしゅう

文字もじコード 5C と 7E については、ASCII とも JIS X 0201 ともちが文字もじ登録とうろくされている[よう検証けんしょう]日本人にっぽんじんおおくが「ASCII文字もじ」とんでいるものはじつは、「Windows-31J 文字もじ」であるということもわれている。(しかしすくなくともIANAにおける Windows-31J の定義ていぎJIS X 0201をもちいるものである)

5C 7E
ASCII \バックスラッシュ ˜ (チルダ
JIS X 0201 ¥ (えん記号きごう ¯ (オーバーライン
Windows-31J ¥ (えん記号きごう ˜ (チルダ)

マイクロソフトが規定きていするCP932に関連かんれんがあるコード

編集へんしゅう

Eいーメールでもちいるために7ビットコードで「Windows-31J」の文字もじ集合しゅうごう(=マイクロソフト標準ひょうじゅんキャラクタセット[8])を表現ひょうげんした「CP50220」や、GR領域りょういきにマイクロソフト標準ひょうじゅんキャラクタセットを表現ひょうげんした「CP51932」というものがある。これらは、マイクロソフトのInternet Explorerや、EmEditorしゅうまるエディタなどのWindowsアプリケーションで利用りようされている。

Internet Explorer 6.0(日本語にほんごばん)における表記ひょうきと Microsoft コードページの対応たいおう
IE6.0における表記ひょうき マイクロソフトのコードページ 文字もじ集合しゅうごう符号ふごう方式ほうしき
日本語にほんご(シフト JIS) CP932 マイクロソフト標準ひょうじゅんキャラクタセットをシフト符号ふごう表現ひょうげん
日本語にほんご (JIS) CP50220 マイクロソフト標準ひょうじゅんキャラクタセットをRFC1468符号ふごう表現ひょうげん
日本語にほんご (EUC) CP51932 マイクロソフト標準ひょうじゅんキャラクタセットをGR表現ひょうげん[9]
Unicode CP1200 UnicodeUTF-16 (Little Endian) で符号ふごう
Unicode (Big-Endian) CP1201 UnicodeをUTF-16 (Big Endian) で符号ふごう
Unicode (UTF-8) CP65001 UnicodeをUTF-8符号ふごう

脚注きゃくちゅう

編集へんしゅう
  1. ^ メインフレームにて搭載とうさいされている符号ふごう文字もじ集合しゅうごうたんに「IBM漢字かんじ」とばれることもおおい。IBM コードページ300という管理かんり番号ばんごうられている。日本語にほんごカナばんEBCDIC(IBMコードページ290)とわせて IBMコードページ930 としてもちいられたり、日本語にほんごえい小文字こもじばんEBCDIC(IBMコードページ1027)とわせてIBMコードページ939としてもちいられることがおおい。
  2. ^ マイクロソフトおよびIBMは、それぞれ独自どくじに「コードページ###(#は数字すうじ)」というかたちで、符号ふごう文字もじ集合しゅうごう管理かんりしている。また、おな番号ばんごうのコードページ同士どうしおな文字もじ集合しゅうごうしているわけではない。
  3. ^ JIPSは、NECが1979ねん開発かいはつしたメインフレームよう日本語にほんご処理しょりシステムの名前なまえだが、ここではそのシステムで使つかわれる符号ふごう文字もじ集合しゅうごうを以ってJIPSとぶ。JIPSでは「JIS C 6226-1978」がGLにされ、その9 - 13特殊とくしゅ文字もじ実装じっそうされ、また、GR領域りょういきに「G1集合しゅうごう」とばれる拡張かくちょう漢字かんじ領域りょういき実装じっそうされている。
  4. ^ NECとしては、JIPSのG1集合しゅうごうおさめるほう建前たてまえとしてかったのかもしれない。しかし、CP/M-86やMS-DOSなどのオペレーティングシステム (OS) 搭載とうさいにおいては、符号ふごう方式ほうしきとしてシフトJISが前提ぜんていだった。G1集合しゅうごう部分ぶぶんおさめるには配置はいち制約せいやくおおきくけることになるため断念だんねんしたものとかんがえられる。また、漢字かんじROM容量ようりょう都合つごうじょう、G1集合しゅうごう部分ぶぶんおさめても利用りようすることは不可能ふかのうだったともかんがえられる。
  5. ^ Shift_JIS(CP932)でCSVダウンロードできるかな?(Windows機種きしゅ依存いぞん文字もじ) | Chibineko
  6. ^ 既存きそんCOBOL資産しさん有効ゆうこう活用かつようした事例じれい紹介しょうかい
  7. ^ マイクロソフトはこのコードにたいして、コードページ10001という管理かんり番号ばんごう付与ふよしている。
  8. ^ 本節ほんぶしでは、マイクロソフト標準ひょうじゅんキャラクタセットが JIS X 0208 のコードポイントを拡張かくちょうするかたち表現ひょうげんされているものと仮定かていした場合ばあい説明せつめいおこなっている。
  9. ^ マイクロソフトは「CP51932」のほかに「CP20932」という EUC-JPたコードページをゆうしている。「CP20932」は上位じょういバイト A016しん - FE16しん下位かいバイト 2016しん - 7E16しん という 2 バイトのわせを利用りようすることで補助ほじょ漢字かんじ表現ひょうげんする。eucJP-openとの対応たいおうにおいては、「CP51932」よりも「CP20932」のほうが、レパートリ一致いっちたかい。

関連かんれん項目こうもく

編集へんしゅう

外部がいぶリンク

編集へんしゅう