ISO/IEC 8859

ISO 8859-1（より正式せいしきにはISO/IEC 8859-1）はISO/IEC 8859の第だい一部いちぶで定さだめられた文字もじコード。ヨーロッパの言語げんごで用もちいられるラテンアルファベットの大だい部分ぶぶんを含ふくんでいる。くだけたい方いかたではLatin-1とも呼よばれる。

ISO 8859-1に追加ついかの文字もじを（16進しん符号ふごう0x00-0x1Fの「C0領域りょういき」と、0x80-0x9F「C1領域りょういき」の範囲はんいに）割わり当あてた文字もじコードにISO-8859-1（余分よぶんなハイフンに注意ちゅうい）とWindows-1252がある（後述こうじゅつ）。

ISO 8859-1は、当初とうしょはISOによって開発かいはつされたが、後のちにISOとIECによって合同ごうどうで保守ほしゅされた。2004年ねん6月がつ、8ビット符号ふごう化か文字もじ集合しゅうごうの整備せいびを担当たんとうするISO/IECの作業さぎょう部会ぶかいは、国際こくさい符号ふごう化か文字もじ集合しゅうごう (UCS) とUnicodeの開発かいはつに専念せんねんするために解散かいさんし、ISO 8859-1を含ふくむすべてのISO 8859の整備せいびを中止ちゅうしした。コンピュータアプリケーションにおいては、（UTF-8やUTF-16のような）完全かんぜんなUCSサポートを提供ていきょうするエンコーディングが、ISO 8859-1に基もとづくエンコーディングよりもますます多おおく使つかわれるようになりつつある。

網羅もうら範囲はんい

ISO 8859-1が符号ふごう化かしているものは「ラテン文字もじ第だい1部ぶ」と呼よばれ、ラテン用字ようじ系けいの191文字もじからなる。この文字もじエンコーディングはアメリカ州しゅう、西にしヨーロッパ、オセアニア、およびアフリカの多おおくで使つかわれている。東ひがしアジア言語げんごのほとんどの標準ひょうじゅんロろーマ字まじ表記ひょうきでも広ひろく使つかわれている。

各かく文字もじは単一たんいつの8ビット符号ふごう値ちで符号ふごう化かされる。これらの符号ふごう値ちは、データ交換こうかんシステムが以下いかのヨーロッパ言語げんごで通信つうしんする際さいの需要じゅようをほぼ満みたすが、足たりない文字もじのためにわずかな例外れいがいがある。これについては注記ちゅうきを参照さんしょうされたい。

現代げんだいのアルファベットを完全かんぜんに網羅もうらしている言語げんご

アフリカーンス語ごアルバニア語ごブルトン語ごデンマーク語ご英語えいご（アメリカ合衆国あめりかがっしゅうこくと現代げんだいイギリス）フェロー語ごガリシア語ごドイツ語ご	アイスランド語ごアイルランド語ご（新あたらしい正書法せいしょほう）イタリア語ごラテン語らてんご（基本きほん的てきな古典こてん的てき正書法せいしょほう）ルクセンブルク語ご（基本きほん的てきな古典こてん的てき正書法せいしょほう）ノルウェー語ご（ブークモールとニーノシュク）オック語ごポルトガル語ご（ヨーロッパのポルトガル語ごとブラジル・ポルトガル語ご）	レト・ロマンス語ごスコットランド・ゲール語ごスペイン語ごスワヒリ語ごスウェーデン語ごワロン語ご日本語にほんご (訓令くんれい式しきロろーマ字まじ)

アルファベットをほぼ完全かんぜんにカバーしているため広ひろく対応たいおうしている言語げんご

オランダ語ご（「Ĳ」「ĳ」が足たりないがこれらは電子でんし形式けいしきでは常つねに「IJ」や「ij」として表現ひょうげんされるべきである）
エストニア語ご（外来がいらい語ごで使つかわれる「Š」「š」「Ž」「ž」が足たりない）
- Windows-1252とISO/IEC 8859-15はこれらを含ふくむことに注意ちゅうい
フランス語ふらんすご（「Œ」「œ」およびきわめてまれな「Ÿ」が足たりない; これらは一般いっぱんに通常つうじょうは必要ひつようなリガチャなしで「OE」や「oe」に置おき換かえられ、トレマなしで「Y」に置おき換かえられる）
- Windows-1252とISO-8859-15はこれらを含ふくむことに注意ちゅうい
フィンランド語ご（外来がいらい語ごで使つかわれる「Š」「š」「Ž」「ž」が足たりない）
- Windows-1252とISO-8859-15はこれらを含ふくむことに注意ちゅうい

約やく物ものと引用いんよう符ふの範囲はんい

引用いんよう符ふとしては「«」「»」、「"」「'」のみを含ふくみ、上述じょうじゅつの言語げんごの印刷いんさつで用もちいられていた引用いんよう符ふを含ふくまない。

また、このエンコーディングはアポストロフィーと方向ほうこう付つき単たん引用いんよう符ふを提供ていきょうしない。

しかし、テキスト中ちゅうで6型がた/9型がたの引用いんよう符ふやアポストロフィーの代かわりに前進ぜんしん付つきグレイヴ・アクセントと前進ぜんしん付つきアキュート・アクセント（これらはどちらもISO 8859-1に含ふくまれる）を使つかうやりかたもある。なお、このやりかただと、これらの文字もじが傾かたむいたくさび型がたのグリフで表示ひょうじされる書体しょたいでもうまく表示ひょうじできる。

→「ラテン文字もじ一覧いちらん」も参照さんしょう

歴史れきし

ISO 8859-1はDECの有名ゆうめいなVT220（英語えいご版ばん）端末たんまつで使つかわれていたMultinational Character Set（英語えいご版ばん）をもとに作つくられた。開発かいはつは欧州おうしゅう電子でんし計算けいさん機き工業こうぎょう会かい（ECMA、現げんEcmaインターナショナル）と米国べいこく国家こっか規格きかく協会きょうかいが共同きょうどうで行おこない、1984年ねん12月がつECMA-94として制定せいてい、1985年ねん3月がつにECMA-94として出版しゅっぱんされた。ただし、この時点じてんのECMA-94は、13/07「×」と15/07「÷」を含ふくんでいなかった。1986年ねん6月がつにECMA-94は改定かいていされており、 ECMA-94 第だい二に版はんは規格きかくの一部いちぶとしてISO/IEC 8859-2、ISO/IEC 8859-3、およびISO/IEC 8859-4をも含ふくんでいる。

ECMA-94の一部いちぶであるISO 8859-1およびISO 8859-2は、1987年ねん2月がつ15日にちにISOの国際こくさい規格きかくとして制定せいていされた。また、ISO 8859-3およびISO 8859-4は、少すこし遅おくれて1988年ねん4月がつ15日にちに制定せいていされている。

ISO/IEC 8859-15との関係かんけい

ISO/IEC 8859-1にはほとんどのフランス語ふらんすごテキストの表記ひょうきに十分じゅうぶんな文字もじが含ふくまれているが、使用しよう頻度ひんどの低ひくい少数しょうすうの文字もじが欠かけている。文字もじ Ĳ の単一たんいつグリフによる表現ひょうげん、外国がいこくの固有名詞こゆうめいしや少数しょうすうの外来がいらい語ごで使つかわれるフィンランド語ごの文字もじ（ŠとŽ）、印刷いんさつ用ようの引用いんよう符ふ、ダッシュ、およびユーロ記号きごう (en) (€) やダガー (†) のようなよく使つかわれる記号きごうも不足ふそくしている。

ISO/IEC 8859-15はISO/IEC 8859-1の更新こうしん版ばんとして開発かいはつされ、これらの文字もじのいくつかを提供ていきょうした。しかしそのためには、ISO/IEC 8859-1からあまり使つかわれない文字もじをいくつか取とり除のぞく必要ひつようがあった。取とり除のぞかれた文字もじは以下いかの通とおりで、分数ぶんすう記号きごうや単独たんどくのダイアクリティカルマークが含ふくまれる。¤, ¦, ¨, ´, ¸, ¼, ½, ¾ である。

符号ふごう表ひょう

ISO/IEC 8859-1によって符号ふごう化かされる191文字もじはすべて「図形ずけい」（graphic。制御せいぎょ符号ふごうでない文字もじを表あらわすISOの用語ようご）であり、かつほとんどのWebブラウザと互換ごかん性せいがあるため、以下いかの表ひょうでグリフとして示しめすことができる。空白くうはく、ノーブレークスペース、およびソフトハイフン文字もじは通常つうじょう不可視ふかしなので、その名前なまえの省略形しょうりゃくけいによって表現ひょうげんしてある。すべての他ほかの文字もじはそのまま表現ひょうげんしてある。行くだり見出みだしと列れつ見出みだしは8ビット符号ふごう値ちを作つくり出だすための16進数しんすうによる桁けたの組くみ合あわせを示しめす。たとえば、文字もじ L は符号ふごう値ち 4C である。

ISO/IEC 8859-1
	x0	x1	x2	x3	x4	x5	x6	x7	x8	x9	xA	xB	xC	xD	xE	xF
0x	未み使用しよう
1x	未み使用しよう
2x	SP	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
3x	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
4x	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5x	P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
6x	`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7x	p	q	r	s	t	u	v	w	x	y	z	{	\|	}	~
8x	未み使用しよう
9x	未み使用しよう
Ax	NBSP	¡	¢	£	¤	¥	¦	§	¨	©	ª	«	¬	SHY	®	¯
Bx	°	±	²	³	´	µ	¶	·	¸	¹	º	»	¼	½	¾	¿
Cx	À	Á	Â	Ã	Ä	Å	Æ	Ç	È	É	Ê	Ë	Ì	Í	Î	Ï
Dx	Ð	Ñ	Ò	Ó	Ô	Õ	Ö	×	Ø	Ù	Ú	Û	Ü	Ý	Þ	ß
Ex	à	á	â	ã	ä	å	æ	ç	è	é	ê	ë	ì	í	î	ï
Fx	ð	ñ	ò	ó	ô	õ	ö	÷	ø	ù	ú	û	ü	ý	þ	ÿ

符号ふごう値ち00–1F, 7F–9FはISO/IEC 8859-1では文字もじを割わり当あてていない。

下位かい領域りょういきの20から7E（G0部分ぶぶん集合しゅうごう）はISO 646 US版ばん（通称つうしょうASCII）のG0部分ぶぶん集合しゅうごうと正確せいかくに同おなじマッピングである。ISO 2022の指示しじシーケンスは"ESC ( B"。上位じょうい領域りょういきのA0からFF（G1部分ぶぶん集合しゅうごう）はISO 2022のシーケンス"ESC . A"で指示しじされる部分ぶぶん集合しゅうごうと正確せいかくに同おなじマッピングである。

関連かんれんする文字もじマッピング

ISO/IEC 8859-1標準ひょうじゅんは、長ながい間あいだ多数たすうの 文字もじマッピング（別名べつめいキャラクタセット、charsets、もしくはコードページ）の基盤きばんとなってきた。キャラクタセットのうちもっとも有名ゆうめいなものは ISO-8859-1とWindows-1252である。これらのマッピングはどちらもISO/IEC 8859-1の上位じょうい集合しゅうごうである。すなわち、これらは00–1F, 7F, および 80〜9F範囲はんいにある符号ふごう値ちの少すくなくとも一部いちぶに追加ついかの文字もじをマッピングすることにより、標準ひょうじゅんの191文字もじに割わり当あてを追加ついかする。

ISO-8859-1

1992年ねん、Internet Assigned Numbers Authorityは文字もじマッピングISO_8859-1:1987をインターネットで使つかうために登録とうろくした。ISO_8859-1:1987はISO 8859-1の上位じょうい集合しゅうごうであり、その推奨すいしょうMIME名なISO-8859-1（ISO 8859-1に余分よぶんなハイフンが付ついていることに注意ちゅうい）でより広ひろく知しられている。この写像しゃぞうはC0およびC1制御せいぎょ文字もじを符号ふごう値ち00–1F, 7F, および80–9Fに割わり当あてている。8ビットで可能かのうなあらゆる値ねに割わり当あてをしているため、256文字もじを提供ていきょうしていることになる。

ISO-8859-1は（少すくなくとも規格きかくによると）HTTP経由けいゆで配信はいしんされ、"text/"で始はじまるMIMEタイプの文書ぶんしょにおける既定きていのエンコーディングである。ISO-8859-1はある種しゅの記述きじゅつ的てきなHTTPヘッダの値ねの既定きていのエンコーディングであり、この文字もじ集合しゅうごうを使つかうロケールのほとんどのUNIXマシン上じょうでX Window Systemによって使つかわれる標準ひょうじゅんエンコーディングである。ISO-8859-1はさらにHTML 3.2文書ぶんしょで許ゆるされる文字もじレパートリの基もとになっている（しかしながら、HTML 4.0はUnicodeに基もとづく）。

エスケープシーケンス（ISO/IEC 6429やISO/IEC 2022に由来ゆらいする）はISO-8859-1で符号ふごう化かされているとラベル付らべるつけされた文書ぶんしょでは解釈かいしゃくされない。上述じょうじゅつの正式せいしき名称めいしょうや推奨すいしょうMIME名めいばかりでなく、以下いかのような別名べつめいがISO-8859-1のために登録とうろくされている: ISO_8859-1, ISO-8859-1, iso-ir-100, csISOLatin1, latin1, l1, IBM819, CP819. ISO-8859-1はISO/IEC 10646とUnicodeの最初さいしょの256個この符号ふごう位置いちにも組くみ込こまれた。

符号ふごう値ち	制御せいぎょ文字もじ	省略形しょうりゃくけい
00	空文字くうもじ Null character	NUL
01	ヘッダ開始かいし Start of Heading	SOH
02	テキスト開始かいし Start of Text	STX
03	テキスト終了しゅうりょう End of Text	ETX
04	伝送でんそう終了しゅうりょう End of Transmission	EOT
05	問とい合あわせ Enquiry	ENQ
06	肯定こうてい応答おうとう Acknowledge character\|Acknowledge	ACK
07	ベル Bell character	BEL
08	1文字もじ後退こうたい Backspace	BS
09	水平すいへいタブ Tab	TAB
0A	改行かいぎょう Line Feed	LF
0B	垂直すいちょくタブ Vertical Tab	VT
0C	書式しょしき送おくり Form Feed	FF
0D	復帰ふっき Carriage Return	CR
0E	シフトアウト Shift Out	SO
0F	シフトイン Shift In	SI
10	データリンク拡張かくちょう Data Link Escape	DLE
11	装置そうち制御せいぎょ1 Device Control 1	DC1
12	装置そうち制御せいぎょ2 Device Control 2	DC2
13	装置そうち制御せいぎょ3 Device Control 3	DC3
14	装置そうち制御せいぎょ4 Device Control 4	DC4
15	否定ひてい応答おうとう Negative-acknowledge character	NAK
16	同期どうき信号しんごう Synchronous Idle	SYN
17	伝送でんそうブロック終了しゅうりょう End of Transmission Block	ETB:
18	キャンセル Cancel character	CAN
19	媒体ばいたい終端しゅうたん End of Medium	EM
1A	置換ちかん Substitute (character)	SUB
1B	エスケープ Escape character	ESC
1C	ファイルセパレータ File Separator	FS
1D	グループセパレータ Group Separator	GS
1E	レコードセパレータ Record Separator	RS
1F	ユニットセパレータ Unit Separator	US
7F	削除さくじょ Delete	DEL

符号ふごう値ち	制御せいぎょ文字もじ	省略形しょうりゃくけい
80	Padding Character	PAD
81	High Octet Preset	HOP
82	Break Permitted Here	BPH
83	No Break Here	NBH
84	Index	IND
85	Next Line	NEL
86	Start of Selected Area	SSA
87	End of Selected Area	ESA
88	Character Tabulation Set	HTS
89	Character Tabulation with Justification	HTJ
8A	Line Tabulation Set	VTS
8B	Partial Line Forward	PLD
8C	Partial Line Backward	PLU
8D	Reverse Line Feed	RI
8E	Single Shift 2	SS2
8F	Single Shift 3	SS3
90	Device Control String	DCS
91	Private Use 1	PU1
92	Private Use 2	PU2
93	Set Transmit State	STS
94	Cancel Character	CCH
95	Message Waiting	MW
96	Start of Guarded Area	SPA
97	End of Guarded Area	EPA
98	Start of String	SOS
99	Single Graphic Character Introducer	SGCI
9A	Single Character Introducer	SCI
9B	Control Sequence Introducer	CSI
9C	String Terminator	ST
9D	Operating System Command	OSC
9E	Privacy Message	PM
9F	Application Program Command	APC

注ちゅう: これらの制御せいぎょ文字もじのほとんどは、移植いしょく可能かのうなISO-8859-1で符号ふごう化かされたプレーンテキスト文書ぶんしょで使つかうために設計せっけいされたわけではなく、動作どうさが標準ひょうじゅん化かされている数個すうこの文字もじを例外れいがいとして、特定とくていのプロトコルや機器ききでのみ使つかわれる。例外れいがいは次つぎの通とおり。TAB (09), LF (0A), CR (0D), NEL (85)。TAB以外いがいは行くだりの終おわりや段落だんらくの区切くぎりを符号ふごう化かするために使つかわれ、TABはしばしばホワイトスペースと等価とうかであるとみなされる。しかしながら FF (0C) もプレーンテキスト文書ぶんしょを解釈かいしゃくするいくつかのアプリケーションで追加ついかの無視むし可能かのうな行頭ぎょうとうのホワイトスペースとして広ひろく受うけ入いれられ、印刷いんさつ時じの明示めいじ的てきな改あらためページ位置いちを示しめすために使つかわれる。

また、いくつかのエンコーディングでは、BS (08) を使つかって印刷いんさつ機器きき上じょうでの複数ふくすう文字もじの重かさね打うちをエミュレートすることによって追加ついかの文字もじを作成さくせいすることを認みとめている。

いくつかのISO標準ひょうじゅん（たとえば ISO 2022）ではいくつかの制御せいぎょ記号きごうに特定とくていの機能きのうを割わり当あてている。 SO (0E), SI (0F), DLE (10), ESC (1B) および SS2 (8E) が後続こうぞくの文字もじエンコーディングの制御せいぎょや、複数ふくすうのエンコーディング間あいだでの切きり替かえに使つかわれる。

NUL文字もじ (00) はいくつかのプログラミング言語げんごにおける文字もじ列れつの終端しゅうたん子こやデータベースレコードの埋うめ草くさとして広ひろく使つかわれ、無視むしされなければならず、符号ふごう化かされたテキストの一部いちぶではない。STX (02) とETX (03) はいくつかの伝送でんそうプロトコルでフレームの区切くぎりとして広ひろく使つかわれる。SUB (1A) も入力にゅうりょく伝送でんそうストリームで検出けんしゅつされたエラーを示しめすために広ひろく使つかわれ、図形ずけい的てきに描画びょうがされることもある。DC1 (11) とDC3 (13) はXON/XOFFプロトコルで伝送でんそう速度そくどの制御せいぎょに広ひろく使つかわれる。最後さいごに、EM (19) やEOT (04) はいくつかのテキストファイル形式けいしきでファイル終端しゅうたんマーカーとして使つかわれることがある。

ISO-8859-1とWindows-1252の取とり違ちがえ

実際じっさいにはWindows-1252で符号ふごう化かされているのに、誤あやまってキャラクタセットISO-8859-1のラベルを付つけることは、きわめてよくある誤あやまりである。Windows-1252では、0x80から0x9Fの間あいだの符号ふごうは文字もじと約やく物ものに使つかわれるが、ISO-8859-1では制御せいぎょ符号ふごうである。多おおくのWebブラウザや電子でんしメールクライアントはこのようなラベル付らべるつけの誤あやまりに対応たいおうするため、ISO-8859-1の制御せいぎょ符号ふごうをWindows-1252の文字もじと解釈かいしゃくするが、これは標準ひょうじゅんに準拠じゅんきょした振ふる舞まいではなく、ISO-8859-1とラベル付らべるつけされた内容ないようではこういった文字もじを生成せいせいすることを避さけるよう注意ちゅういが払はらわれるべきである。

類似るいじのキャラクタセット

→詳細しょうさいは「西欧せいおうのラテン文字もじ集合しゅうごう (コンピュータ)（英語えいご版ばん）」を参照さんしょう

Apple MacintoshコンピュータはMac OS Roman（英語えいご版ばん）と呼よばれる文字もじエンコーディングを、1984年ねんに導入どうにゅうした。Mac Romanは西欧せいおうのDTPに適切てきせつであることを意図いとしていた。Mac RomanはISO-8859-1と同様どうようASCIIの上位じょうい集合しゅうごうであり、ISO-8859-1の文字もじをほとんど含ふくんでいるが、文字もじの配列はいれつは完全かんぜんに異ことなる。Internet Assigned Numbers Authorityが "Macintosh" として登録とうろくした後継こうけいバージョンは国際こくさい通貨つうか記号きごう ¤ をユーロ記号きごう € で置おき換かえた。ISO 8859-1に含ふくまれるがこの集合しゅうごうに含ふくまれないわずかな文字もじは、しばしば古ふるいMacintoshブラウザ（Internet Explorer for Macの最終さいしゅう版ばんを含ふくむ）でWebサイト上じょうのテキストを編集へんしゅうするとき、トラブルの元もととなる。しかしながらMacRomanでは、Windows-1252がC1符号ふごう値ちの範囲はんいに持もつ追加ついかの文字もじにはすべて対応たいおうしており、わずかに不足ふそくしている少数しょうすうの文字もじを除のぞき、グリフの符号ふごう値ち番号ばんごうをマッピングし直なおすことによって、MacintoshでISO-8859-1（C1制御せいぎょ文字もじを含ふくむ）やWindows-1252として符号ふごう化か/マークされたファイル (および電子でんしメール) を送受信そうじゅしんできる。

DOSにはコードページ850が存在そんざいし、これはISO-8859-1が持もつすべての印字いんじ可能かのう文字もじを (配列はいれつは完全かんぜんに異ことなるものの) 持もち、加くわえてコードページ437の最もっとも広ひろく使つかわれる図形ずけい文字もじも含ふくむ。

外部がいぶリンク

ISO/IEC 8859-1:1998（英語えいご）
ISO/IEC 8859-1:1998 - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)（英語えいご）
Standard ECMA-94: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)（英語えいご）
ISO-IR 100 Right-Hand Part of Latin Alphabet No.1 (February 1, 1986)（英語えいご）
Windows Code pages （英語えいご）
Differences between ANSI, ISO-8859-1 and MacRoman Character Sets（英語えいご）
The Letter Database（英語えいご）
ASCII - ISO 8859-1 Table with HTML Entity Names（英語えいご）
The ISO 8859 Alphabet Soup - Roman CzyborraによるISOキャラクタセットのまとめ（英語えいご）