整数せいすう型がた

整数せいすう型がた（せいすうがた、英えい: integer type / integral type）は、コンピュータのプログラムなどのデータ型がたの1つまたは1群ぐんであり、整数せいすうを取とり扱あつかう。コンピュータで扱あつかうもっとも単純たんじゅんな部類ぶるいのデータ型がたのひとつである。C言語げんごやJavaなどの多おおくのプログラミング言語げんごでは、整数せいすう型がたは固定こてい長ちょうであり、その固定こていサイズで表現ひょうげん可能かのうな範囲はんいの、整数せいすうの有限ゆうげんな部分ぶぶん集合しゅうごうの要素ようそを値ねとする型かたである。また多おおくの言語げんごにおいて、より大おおきな範囲はんいの整数せいすう値ちを表現ひょうげん可能かのうなデータ型がたを扱あつかうことができる、標準ひょうじゅんあるいは第三者だいさんしゃによるライブラリが提供ていきょうされている。

パスカルによる機械きかい式しき計算けいさん機きなどが数かずをその処理しょりの対象たいしょうとしていたことを考かんがえれば、計算けいさん機械きかいの歴史れきしにおいて、整数せいすうを扱あつかうことはコンピュータ以前いぜんからの存在そんざいである。

種類しゅるい

「コンピュータの数値すうち表現ひょうげん」も参照さんしょう

精度せいど

コンピュータ上じょうで実数じっすうを表現ひょうげんするためによく利用りようされるのは浮動ふどう小数点しょうすうてん数すうだが、有限ゆうげんのビット幅はばで表現ひょうげんされる浮動ふどう小数点しょうすうてん数すうは、数学すうがくや現実げんじつ世界せかいにおける実数じっすうを正確せいかくに表現ひょうげんできない。そのため、コンピュータで扱あつかう実数じっすうは誤差ごさを含ふくんだ近似きんじ値ちとなる。一方いっぽう、整数せいすうに関かんしては誤差ごさはない。ただし、有限ゆうげんのビット幅はばでは、表現ひょうげん可能かのうな整数せいすうの範囲はんいは限定げんていされる。表現ひょうげん可能かのうな範囲はんいを超こえてしまうと算術さんじゅつオーバーフローを起おこす。

精度せいどに関かんしては「正せい確度かくどと精度せいど」の記事きじも参照さんしょう。

固定こてい長ちょうと可変長かへんちょう

多おおくのプログラミング言語げんごにおける組くみ込こみの整数せいすう型がたは固定こてい長ちょうであり、通例つうれい、8ビット・16ビット・32ビット・64ビットといった、8の倍数ばいすう（オクテット）のビット幅はばを持もつ。また、C言語げんごの組くみ込こみ整数せいすう型がたは処理しょり系けい依存いぞんとなっており、特とくにint型かたやlong型かたはプロセッサのレジスタのワード幅はばなどに合あわせたサイズがよく用もちいられる。これらの組くみ込こみ型がたは通例つうれいプロセッサの機械きかい語ご命令めいれいに直接ちょくせつ対応たいおうするデータ型がたであり、コンピュータ上じょうで高速こうそくに扱あつかうことができる。多おおくの場合ばあい、目的もくてきに合あわせて、いくつかの固定こてい長ちょうサイズの整数せいすう型がたがある（後述こうじゅつ）。

一方いっぽう、整数せいすうの任意にんいの値ねを扱あつかうことができる、可変長かへんちょうの整数せいすうというものもある。一般いっぱんにプロセッサが直接ちょくせつ扱あつかうことはできないため、多おおくのプログラミング言語げんごではライブラリを利用りようする。言語げんご仕様しようとしてそのようなデータ型がたが用意よういされている言語げんごもあり、一部いちぶの言語げんご^{[要よう説明せつめい]}では計算けいさん結果けっかに応おうじてシームレスに固定こてい長ちょうと切きり替かわる（プログラマからは隠蔽いんぺいされている）。大おおきい数かずを扱あつかえることから BigNum あるいは整数せいすうであることを示しめす BigInt、日本語にほんごでは多倍たばい長ちょうなどといった名前なまえで呼よばれている。任意にんい精度せいど演算えんざんの記事きじも参照さんしょうのこと。

符号ふごう付つきと符号ふごう無なし

正負せいふ両方りょうほうの整数せいすうを表あらわせる符号ふごう付つき整数せいすう型がた^{[注ちゅう 1]}と、非負ひふ（0または正せい）の整数せいすうだけを表あらわせる符号ふごう無なし整数せいすう型がた^{[注ちゅう 2]}とがある。固定こてい長ちょうでは、符号ふごう付つき整数せいすう型がたは、負数ふすうを表あらわせるかわりに、表あらわせる値ねの範囲はんいの約やく半分はんぶんが負まけの側がわに移動いどうする。

詳細しょうさいは「符号ふごう付づけ数値すうち表現ひょうげん」および「符号ふごう属性ぞくせい」を参照さんしょう

符号ふごう無なし整数せいすうは、ビットの並ならびをそのまま数値すうちとして解釈かいしゃくするが、符号ふごう付つき整数せいすうでは、負まけの値ねの表現ひょうげん方法ほうほうにいくつか種類しゅるいが存在そんざいする。また、「グレイコード」など、ビットの並ならびをそのまま数値すうちとして解釈かいしゃくするのではない整数せいすうの表現ひょうげん法ほうもいくつもある。

長ながさ

可変長かへんちょうの整数せいすう型がたは任意にんいの長ながさとなる。固定こてい長ちょうの整数せいすう型がたは、通例つうれい処理しょり系けいの都合つごうによって定義ていぎされる。従来じゅうらいからあるC言語げんごおよびC++の組くみ込こみ整数せいすう型がたにはintのほかにshort (short int) とlong (long int) があるが、<limits.h>にて表現ひょうげん可能かのうな上下じょうげ限げん値ちが規定きていされているだけで、shortの長ながさはintの長ながさ以下いかであればよく、longの長ながさはintの長ながさ以上いじょうであればよい、という緩ゆるい規定きていしかない（符号ふごう無なし型がたも同様どうよう）。また内部ないぶ表現ひょうげんも規定きていされていなかった（大だい多数たすうの処理しょり系けいでは2の補数ほすう表現ひょうげんが採用さいようされているが、C17/C18以前いぜんおよびC++17以前いぜんの規格きかくでは規定きていされていない^[1]）。しかし時代じだいの変化へんかにより、のちのC/C++標準ひょうじゅん規格きかくではビット数すうと内部ないぶ表現ひょうげんを明確めいかく化かした型かたが別途べっと用意よういされるようになった。C99/C++11 では int64_t などの固定こてい幅はば整数せいすう型がたが標準ひょうじゅん化かされている。このような型かたは特とくにAPIなど、移植いしょく性せいや相互そうご運用うんよう性せいが重視じゅうしされるケースで有用ゆうようであるが、規格きかくではオプション扱あつかいであり、実際じっさいに固定こてい幅はば整数せいすう型がたを定義ていぎ（サポート）するかどうかは処理しょり系けいに委ゆだねられているため、必かならずしも利用りようできるとは限かぎらない^[2]。nビット整数せいすう型がた、nバイト整数せいすう型がたといった用語ようごもある。#データモデルも参照さんしょう。なお、JavaやC#といった後発こうはつ言語げんごでは、最初さいしょから各かく組くみ込こみ整数せいすう型がたのビット幅はばと内部ないぶ表現ひょうげんを標準ひょうじゅん仕様しようによって規定きていしている。C++20では、符号ふごう付つき整数せいすう型がたが2の補数ほすう表現ひょうげんであることが規定きていされた^[3]。同様どうようにC23では、符号ふごう付つき整数せいすう型がたが2の補数ほすう表現ひょうげんであることが規定きていされる予定よていである^[4]。

暗号あんごうなどで1024ビットや2048ビットといった程度ていどの大おおきさの整数せいすうを扱あつかうことがある。プログラムを書かくだけであれば汎用はんよう的てきな可変長かへんちょう整数せいすうで扱あつかえるが、暗号あんごうでは通信つうしんのスループットやレイテンシ向上こうじょうのために性能せいのうを求もとめる場合ばあいもあり、そういう場合ばあいにはそのような固定こていサイズのデータ型がたを、組くみ込こみ型がたの集合しゅうごうすなわち配列はいれつや構造こうぞう体たいのような集成しゅうせい体たいによって表現ひょうげんし、その処理しょりに特とく化かした関数かんすうやマクロ等とうを定義ていぎして使つかうこともある。

バイト (byte) のサイズやワード (word) のサイズ（異ことなるバイトがあることについては「バイト (情報じょうほう) 」の記事きじを参照さんしょう）が文脈ぶんみゃくによって明確めいかくな場合ばあいに限かぎられるが、バイト型がた・ワード型がた・ダブルワード型がた、などという言いいかたでも明確めいかくに表現ひょうげんできる。なお、ワードのサイズが不ふ明確めいかくな場合ばあいでも、（具体ぐたい的てきなビット数すうは不明ふめいだが）少すくなくとも「ダブルワード」はワードの倍ばいだということはわかる。

固定こてい小数点しょうすうてん

固定こてい小数点しょうすうてん表現ひょうげんは、整数せいすうのあるビットとビットの間あいだに固定こていされた小数点しょうすうてんがあるものとして扱あつかうことによる小数しょうすうの表現ひょうげん法ほうであり、一般いっぱんにプログラマが整数せいすう演算えんざんを適宜てきぎ組くみ合あわせながら実装じっそうする。

文字もじ型がた

ASCII文字もじコード体系たいけいでは、7ビットですべての文字もじを表現ひょうげん可能かのうなことから、1文字もじを1バイトの整数せいすう型がたとして扱あつかうことが可能かのうである。英語えいご圏けんのみに限かぎれば、ASCIIで十分じゅうぶんであった。しかし、日本語にほんご・中国ちゅうごく語ご・韓国かんこく語ごなど、文字種もじしゅ別べつの多おおい言語げんごでは、1文字もじを1バイトで表現ひょうげんすることは不可能ふかのうであり、1文字もじを複数ふくすうバイトで表あらわす符号ふごう化か方式ほうしき（マルチバイトエンコーディング）が言語げんごごとに考案こうあんされた。さらに国際こくさい化か対応たいおうの観点かんてんから、言語げんご別べつの符号ふごう化か方式ほうしきではなく、統一とういつされたユニバーサルな符号ふごう化か方式ほうしきとしてUnicodeが考案こうあんされた。Javaは当初とうしょ、先進せんしん的てきな設計せっけいとしてUnicode 1.0を取とり入いれ、char型かたをUCS-2を表現ひょうげんする16ビットの型かたとしたが、のちにUnicode 2.0（1996年ねん）で導入どうにゅうされたサロゲートペアのために、1文字もじにchar2個こを費ついやす場合ばあいが発生はっせいすることになった。国際こくさい化か対応たいおうの観点かんてんからは、Unicodeの異体いたい字じセレクタのことなども考慮こうりょすれば、"文字もじ"という概念がいねんを単純たんじゅんな整数せいすう型がたの一種いっしゅとして扱あつかうのは無謀むぼうである。

なおC言語げんごのchar型かたについては、何なにがあろうと sizeof(char) が1になる型かたと、標準ひょうじゅんで決きめられている。極端きょくたんな例れいとしては、メモリのアドレス付づけがバイト単位たんいではなく、16ビットのワード単位たんいのアーキテクチャでも、CHAR_BIT は16になるが、sizeof(char) は1で、32ビットのintは sizeof(int) が2になる。このように、charという名前なまえではあるが「文字もじ型がた」ではなく、メモリのアドレッシングの最小さいしょう単位たんいを示しめす型かたがcharである、という役割やくわりがある。なお、C/C++のワイド文字もじ型かたwchar_tは長ながさがchar以上いじょうであることが求もとめられているだけであり、エンコーディングに関かんしても規定きていはない。

ブーリアン型がた

論理ろんり演算えんざんに使つかわれるブーリアン型がたは、C/C++では整数せいすう型がたの一種いっしゅとして規定きていされている。C99で追加ついかされた_Bool型かたは、サイズは規定きていされていないが、標準ひょうじゅん符号ふごう無なし整数せいすう型がた (standard unsigned integer type) のひとつである^[5]。C++のbool型かたは、サイズは規定きていされておらず、また値ねとしてtrueまたはfalseのいずれかをとることが標準ひょうじゅん規格きかくで保証ほしょうされているが、各種かくしゅ文字もじ型がたや符号ふごう付つき・符号ふごう無なし整数せいすう型がたと併あわせて、integral type (integer type) と総称そうしょうされている^[6]。

Cでは論理ろんり演算えんざん式しきの結果けっかはint型かたの1（真しん）または0（偽にせ）となり、もともとブーリアン型がたは用意よういされていなかった。そのため、サードパーティ製せいのライブラリやAPIではコードの意図いとを明確めいかく化かするなどの目的もくてきで、typedefを使つかって何なんらかの組くみ込こみ整数せいすう型がたに別名べつめい（エイリアス）を与あたえ、独自どくじのブーリアン型がた（BOOLやBOOLEANなど）として定義ていぎすることがよくあった^[7]。

ただしJavaやC#などの後発こうはつの言語げんごでは、（内部ないぶ的てきな表現ひょうげんはともかくとして）言語げんご仕様しよう上じょうは整数せいすう型がたとは独立どくりつした別べつの型かたとして定義ていぎされていることも多おおく、整数せいすう型がたとの暗黙あんもく的てきな相互そうご変換へんかん（代入だいにゅう）が許可きょかされない。

列挙れっきょ型がた

有限ゆうげんの集合しゅうごうを管理かんりする列挙れっきょ型がたは、Cでは整数せいすう型がたの一種いっしゅである^[5]。C++では列挙れっきょ型がたは整数せいすう型がたではなく、そのため従来じゅうらいのスコープ無なし列挙れっきょ型がたであってもC++11以降いこうのスコープ付つき列挙れっきょ型がたであっても、列挙れっきょ型がたの変数へんすうに整数せいすう値ちを暗黙あんもく的てきに代入だいにゅうすることはできないようになっているが、汎ひろし整数せいすう昇格しょうかくによって、整数せいすう型がたの変数へんすうに従来じゅうらいの列挙れっきょ値ちを暗黙あんもく的てきに代入だいにゅうすることはできる^[6]。

Javaの列挙れっきょ型がたは参照さんしょう型がた（クラス型がた）の一種いっしゅであり、整数せいすう型がたではないが、Enum.ordinal()によって列挙れっきょ定数ていすうの序じょ数すうを取得しゅとくすることはできる。C#の列挙れっきょ型がたは値ね型がたの一種いっしゅであり、明示めいじ的てきなキャストによって整数せいすう型がたとの相互そうご変換へんかんが可能かのうである^[8]。

ポインタ

ポインタはメモリアドレスを抽象ちゅうしょう化かした概念がいねんだが、ポインタ型がたと整数せいすう型がたは同一どういつではない。C言語げんごにおいて、ポインタから整数せいすうおよび整数せいすうからポインタへの変換へんかんは処理しょり系けい定義ていぎである^[9]。C/C++では、2つのポインタ間あいだの減算げんざんの結果けっかを格納かくのうする符号ふごう付つき整数せいすう型がたとして、ptrdiff_tが定義ていぎされている。C99およびC++11規格きかくではvoidへのポインタと相互そうご変換へんかん可能かのうな整数せいすう型がたとして、intptr_tおよびuintptr_tが定義ていぎされている。

各種かくしゅコンピュータ言語げんごにおける標準ひょうじゅん整数せいすう型がた

いくつかのコンピュータ言語げんごにおける標準ひょうじゅん整数せいすう型がたの対応たいおう表ひょうを以下いかに示しめす。

整数せいすう型がたの型名かためい一覧いちらん
ビット数すう	符号ふごう	最小さいしょう値ち	最大さいだい値ち	C/C++ (C99, C++11)	C/C++ (ILP32, LLP64)	C/C++ (LP64)	Java	C#	SQL	Go	Rust
8	あり	-(2⁷)	2⁷ - 1	int8_t	signed char^{[注釈ちゅうしゃく 1]}		byte	sbyte	tinyint	int8	i8
8	なし	0	2⁸ - 1	uint8_t	unsigned char^{[注釈ちゅうしゃく 1]}		N/A	byte	unsigned tinyint	uint8	u8
16	あり	-(2¹⁵)	2¹⁵ - 1	int16_t	short		short	short	smallint	int16	i16
16	なし	0	2¹⁶ - 1	uint16_t	unsigned short		char	ushort	unsigned smallint	uint16	u16
32	あり	-(2³¹)	2³¹ - 1	int32_t	int long	int	int	int	int	int32 int^{[注釈ちゅうしゃく 2]}	i32 isize^{[注釈ちゅうしゃく 2]}
32	なし	0	2³² - 1	uint32_t	unsigned int unsigned long	unsigned int	N/A	uint	unsigned int	uint32 uint^{[注釈ちゅうしゃく 2]}	u32 usize^{[注釈ちゅうしゃく 2]}
64	あり	-(2⁶³)	2⁶³ - 1	int64_t	long long	long long long	long	long	bigint	int64 int^{[注釈ちゅうしゃく 2]}	i64 isize^{[注釈ちゅうしゃく 2]}
64	なし	0	2⁶⁴ - 1	uint64_t	unsigned long long	unsigned long unsigned long long	N/A	ulong	unsigned bigint	uint64 uint^{[注釈ちゅうしゃく 2]}	u64 usize^{[注釈ちゅうしゃく 2]}
128	あり	-(2¹²⁷)	2¹²⁷ - 1	N/A	N/A	N/A	N/A	N/A	N/A	N/A	i128
128	なし	0	2¹²⁸ - 1	N/A	N/A	N/A	N/A	N/A	N/A	N/A	u128
$n$	あり	-(2^{$n$ - 1})	2^{$n$ - 1} - 1	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A
$n$	なし	0	2 $n$ - 1	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A

^ ^a ^b C/C++ では単たんなる char 型がたの符号ふごう有ゆう/無むについては規定きていされておらず、処理しょり系けいによって異ことなる。
^ ^a ^b ^c ^d ^e ^f ^g ^h システムのアーキテクチャのビット幅はばに依存いぞんする。

データモデル

C言語げんごにおいて、ビット数すうを標準ひょうじゅんで定さだめていない型かたに対たいする、具体ぐたい的てきなビット数すうの割わり当あて方かたをデータモデルという。

特とくにマイクロプロセッサの64ビット化かにおいて、intとlongとポインタの扱あつかいが環境かんきょうによって分わかれ、さらに64ビット以上いじょうの整数せいすう値ちを表現ひょうげん可能かのうなlong long型かたを導入どうにゅうする処理しょり系けいが増ふえたことから、それぞれの環境かんきょうごとのデータモデルを指さす用語ようごが広ひろく使つかわれている。多おおくの32ビット環境かんきょうではintとlongとポインタはいずれも32ビットのILP32モデルだったが、Microsoft Windows 64ビット環境かんきょうではintとlongが32ビットでポインタが64ビット、すなわちIL32P64モデルが使用しようされている。なおlong longとポインタが64ビットであることから、LLP64モデルとも呼よばれる。一方いっぽう、Unix系けいなどの他ほかの64ビット環境かんきょうではI32LP64（別名べつめい：LP64）モデルが使用しようされている^[10]。また、Crayのようにintも64ビットであるようなILP64モデルもある。

またその他たの例れいとしては、16ビット時代じだいのパーソナルコンピュータ用ようなどで、intが16ビットということがある。マイコン用ようなどでintが8ビットというものもあった（ただし、これはC言語げんご標準ひょうじゅんが要求ようきゅうしている値ねの範囲はんいを満みたさない）。GE-600シリーズなどでは1バイトが9ビットのためcharが9ビットで、整数せいすう型がたは全すべて36ビットだった（これはC言語げんご規格きかく違反いはんではない）。

脚注きゃくちゅう

[脚注きゃくちゅうの使つかい方かた]

注釈ちゅうしゃく

^ 「符号ふごうあり整数せいすう型がた」と表記ひょうきされることもあるが、ここでは「JIS X 3010:2003 プログラム言語げんごC」における表記ひょうきに従したがった。
^ 「JIS X 3014:2003 プログラム言語げんごC++」や「JIS X 3015:2008 プログラム言語げんごC#」では「符号ふごうなし整数せいすう型がた」と表記ひょうきされているが、ここでは「JIS X 3010:2003 プログラム言語げんごC」における表記ひょうきに従したがった。