NVIDIA Tesla

NVIDIA Tesla（エヌビディアテスラ）は、NVIDIAのデータセンター用ようのGPU製品せいひんシリーズ。GeForceやQuadroをベースとしており、NVIDIA初はつのGPGPU専用せんよう製品せいひんである。2017年ねんのVoltaマイクロアーキテクチャ以降いこうは Tesla という名称めいしょうが消きえ、単たんに頭あたまに NVIDIA が付つくだけになった。

概要がいよう

汎用はんようCPUに比くらべて浮動ふどう小数点しょうすうてん演算えんざん性能せいのうが高たかく、高性能こうせいのう計算けいさん市場いちばでの使用しようを意図いとした製品せいひんであり、TOP500のスーパーコンピュータでも多数たすう採用さいようされている。主おもな用途ようとは機械きかい学習がくしゅうのディープラーニング、シミュレーション、大だい規模きぼな計算けいさん（特とくに浮動ふどう小数点しょうすうてん演算えんざん）、高こう品質ひんしつの画像がぞう生成せいせいなどで、APIとしてCUDAやOpenCL、DirectComputeを使用しようする。

なお同社どうしゃ製せいグラフィックス製品せいひんであるGeForceやQuadroとは異ことなり、TeslaシリーズはC2050/C2070などの一部いちぶを除のぞいてディスプレイ出力しゅつりょくを持もたず、完全かんぜんに演算えんざん用途ようとに特とく化かしている。

競合きょうごうとなるのはAMDのAMD FireStream（AMD FirePro Sシリーズ）である。

Kepler世代せだい以降いこうのTeslaは353.06ドライバでOpenCL 1.2に対応たいおうしている^[1]が、それ以前いぜんのG80からFermiまではOpenCL 1.1までの対応たいおうとなる。

仕様しようと構成こうせい

表ひょう中ちゅうの性能せいのう欄らんは、単精度たんせいど／倍精度ばいせいど浮動ふどう小数点しょうすうてんの理論りろん演算えんざん性能せいのう（ピーク時じ）である。

Teslaマイクロアーキテクチャ

2007年ねん 6月がつ20日はつか発表はっぴょう^[2]。G80ベースのx870シリーズは単精度たんせいど浮動ふどう小数点しょうすうてん演算えんざんのみの対応たいおうであり、倍精度ばいせいど浮動ふどう小数点しょうすうてん演算えんざんは実行じっこうできない^[3]。

構成こうせい	機種きしゅ名めい	GPU数すう	グラフィックスクロック (MHz)	CUDA		メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
構成こうせい	機種きしゅ名めい	GPU数すう	グラフィックスクロック (MHz)	CUDAコア数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
GPUコンピューティングプロセッサ¹	C870	1	600	128	1350	77	GDDR3	384	1.5	1.6	0.519	N/A	フルハイトビデオカード
デスクサイト・スーパーコンピュータ¹	D870	2	600	256	1350	154	GDDR3	384	3	1.6	1.037	N/A	デスクサイドシステム/ラックマウント装置そうち
GPUコンピューティングサーバ¹	S870	4	600	512	1350	307	GDDR3	384	6	1.6	2.074	N/A	1Uラック
C1060 コンピューティングプロセッサ² ^[4]	C1060	1	602	240	1296	102	GDDR3	512	4	0.800	0.933	0.078	フルハイトビデオカード IEEE 754r 機能きのう
S1070 1U GPUコンピューティングサーバ² ^[5] ^[6]	S1070	4	602	960 (240×4)	1296/1440	408 (102×4)	GDDR3	512	16 (4×4)	?	3.73/4.14	0.311/0.345	1Uラック IEEE 754r 機能きのう

注釈ちゅうしゃく

¹ NVIDIAが明あきらかにしていない仕様しようについては、GeForce 8800 GTXからの推測すいそく。
² NVIDIAが明あきらかにしていない仕様しようについては、GeForce GTX 280からの推測すいそく。

Fermiマイクロアーキテクチャ

2009年ねん 11月6日にち発表はっぴょう^[7]。ハーフレートの倍精度ばいせいど演算えんざん性能せいのうを実現じつげんしている（倍精度ばいせいどの理論りろん演算えんざん性能せいのうは単精度たんせいどの場合ばあいの1/2になっている）。

機種きしゅ名めい	GPU数すう	グラフィックスクロック (MHz)	CUDA		メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	グラフィックスクロック (MHz)	CUDAコア数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
C2050^{3, 5} ^[8]	1	575	448	1150	144	GDDR5	384	3	1.5	1.03	0.515	フルハイトビデオカード IEEE 754r 機能きのう画面がめん出力しゅつりょく機能きのう付つき
C2070^{3, 5}	1	575	448	1150	144	GDDR5	384	6	1.5	1.03	0.515
C2075^{3, 6} ^[9]	1	575	448	1150	144	GDDR5	384	6	1.5	1.03	0.515
M2050	1	575	448	1150	148	GDDR5	384	3	1.546	1.03	0.515	フルハイト/ パッシブ・ヒートシンク型がた
M2070	1	575	448	1150	150	GDDR5	384	6	1.566	1.03	0.515
M2090	1	650	512	1300	177	GDDR5	384	6	1.85	1.331	0.665
S2050	4	575	1792	1150	148	GDDR5	384	12	1.55	4.13	2.06	1Uラック

注釈ちゅうしゃく

³ NVIDIAが明あきらかにしていない仕様しようについては、Quadro 6000からの推測すいそく。
⁵ GF100 (Quadro 6000/GeForce GTX 480) ベース^{[要よう出典しゅってん]}
⁶ GF110 (GeForce GTX 580^{[要よう出典しゅってん]}) ベース

Keplerマイクロアーキテクチャ

最初さいしょの製品せいひんであるTesla K10は2012年ねん 5月16日にちに発表はっぴょうされた^[10]。GK104ベースのK10は単精度たんせいどの理論りろん演算えんざん性能せいのうは高たかいものの、倍精度ばいせいどの理論りろん演算えんざん性能せいのうが極端きょくたんに低ひくく（単精度たんせいどの場合ばあいの1/24^[11]）、科学かがく技術ぎじゅつ計算けいさん向むけではなく信号しんごう処理しょり・画像がぞう処理しょり向むけのソリューションという位置付いちづけになっている^[12]。なおGK110ベースとなるK20およびK40、そしてGK210ベースとなるK80における倍精度ばいせいどの理論りろん演算えんざん性能せいのうは単精度たんせいどの場合ばあいの1/3となっている^[13] ^[14] ^[15]。2014年ねんに発表はっぴょうされたTesla K8もGK104ベース^[16]だが、K8はTeslaシリーズ初はつの1スロット省しょうスペース製品せいひんとなる^[17]。

Fermiマイクロアーキテクチャでは SM（ストリーミング・マルチプロセッサー）と呼よばれていた概念がいねんが、KeplerマイクロアーキテクチャではSMXという名称めいしょうになった。GK104/GK110の各かくSMXが搭載とうさいする代表だいひょう的てきなユニットは下記かきである^[18] ^[19]。

192 CUDAコア。16 CUDAコアを1グループとして、12グループ搭載とうさいする。
64K個この32ビットレジスタ。合計ごうけい256KB。
L1キャッシュ 64KB。このうち 16KB/32KB/48KB を共有きょうゆうメモリとして使用しよう。共有きょうゆうメモリからは1サイクルで最大さいだい256B読よみ出だせる。
読よみ取とり専用せんようキャッシュ 48KB。
特殊とくしゅ関数かんすうユニット (SFU) 32個こ。三角さんかく関数かんすう、対数たいすう関数かんすうなどを計算けいさん。

Fermi同様どうよう、各かくスレッド（コア）はワープ (warp) 単位たんいで動作どうささせる（1ワープは32スレッド）。ワープ内ないのスレッドは同期どうきし、それぞれ同おなじ命令めいれいを実行じっこうする。16 CUDAコアを1グループとしているので、32スレッドに命令めいれいが行いき渡わたるには2サイクル以上いじょう必要ひつようとなる。その他た、Kepler世代せだいではワープ内ないで共有きょうゆうメモリを介かいすることなくデータ交換こうかんを可能かのうにするシャッフル命令めいれいが実装じっそうされている。なおCompute capability (CC) に関かんしては、GK104はCC 3.0、GK110はCC 3.5、そしてGK210はCC 3.7^[20]となるが、CC 3.5以上いじょうではDynamic ParallelismやHyper-Qといった機能きのうを備そなえている^[21]。

フルスペックGK104では512KB、またフルスペックGK110/GK210では 1536KB (1.5MB) の L2 キャッシュを全ぜん SMX で共有きょうゆうし、このキャッシュを経由けいゆして DRAM にアクセスする。なおインテルの第だい1世代せだいXeon Phiは30MB前後ぜんこうの L2 キャッシュを搭載とうさいしており、この点てんが設計せっけいの違ちがいの一ひとつとなる^{[独自どくじ研究けんきゅう?]}。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SMX数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
K8 ⁷	1	1536	8	693 811 (Boost)	160	GDDR5	256	8	2.5	2.13 2.49 (Boost)	0.09 0.10 (Boost)	フルハイト/1スロット型がた
K10 ⁸	2	3072 (1536x2)	8x2	745	320 (160x2)	GDDR5	256	8 (4x2)	2.5	4.577 (2.288x2)	0.191 (0.095x2)	フルハイト/ パッシブ・ヒートシンク型がた
K20	1	2496	13	706	208	GDDR5	320	5	2.6	3.52	1.17
K20X	1	2688	14	732	250	GDDR5	384	6	2.6	3.95	1.31
K40	1	2880	15	745 875 (Boost)	288	GDDR5	384	12	3	4.29 5 (Boost)	1.43
K80	2	4992 (2496x2)	13x2	562 875 (Boost)	480 (240x2)	GDDR5	384	24	2.5	5.6 8.74 (Boost)	1.87

注釈ちゅうしゃく

⁷ GK104ベース
⁸ GK104 (GeForce GTX 690) ベース

Maxwellマイクロアーキテクチャ

MaxwellではKeplerよりもさらに倍精度ばいせいどサポートが削けずられている（単精度たんせいどの場合ばあいの1/32）。M4/M40は主おもに機械きかい学習がくしゅう・ディープラーニング向むけのソリューションとして提供ていきょうされている^[22] ^[23] ^[24] ^[25]。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SM数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
M6 ^[26]	1	1536	12	950 1051 (Boost)	147.3	GDDR5	256	8	2.5	3.6 (Boost)	0.11 (Boost)	MXM
M60 ^[27]	2	4096 (2048x2)	32 (16x2)	899 1178 (Boost)	320 (160x2)	GDDR5	256	16 (8x2)	2.5	9.65 (4.825x2)	0.3 (0.15x2)	フルハイト
M4 ^[28]	1	1024	8	517 1074 (Boost)	88	GDDR5	128	4	2.75	2.2 (Boost)	0.07 (Boost)	ロープロファイル/ パッシブ
M40 ^[29]	1	3072	24	948 1114 (Boost)	288	GDDR5	384	12	3	5.8 6.8 (Boost)	0.18 0.21 (Boost)	フルハイト/ パッシブ・ヒートシンク型がた

Pascalマイクロアーキテクチャ

最初さいしょの製品せいひんであるTesla P100は2016年ねん4月がつに発表はっぴょうされた^[30]。16nmプロセスルールを採用さいよう。GP100ベースのP100では、Fermi世代せだいのようなハーフレートの倍精度ばいせいど対応たいおうのほか、ダブルレートの半はん精度せいど対応たいおうも実現じつげんされている（半はん精度せいどの理論りろん演算えんざん性能せいのうは単精度たんせいどの場合ばあいの2倍ばいになっている）。メモリに第だい2世代せだいのHigh Bandwidth Memory (HBM2) を採用さいようする。NVIDIA独自どくじのインターコネクト規格きかくであるNVLinkにも対応たいおうし、これまでプロセッサ間あいだの通信つうしんボトルネックとなっていたPCI Expressを大幅おおはばに超こえる伝送でんそう帯域たいいき幅はばを実現じつげんできる。

GP102ベースのP40およびGP104ベースのP4では、倍精度ばいせいどの理論りろん演算えんざん性能せいのうは単精度たんせいどの場合ばあいの1/32になっている^[31]。また、SMあたりのCUDAコア数すうは128、共有きょうゆうメモリも96KBとなっており、Maxwellアーキテクチャに近ちかい^[32]。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SM数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
P4 ^[33]	1	2560	20	810 1063 (Boost)	192	GDDR5	256	8	3	4.15 5.44 (Boost)	0.13 0.17 (Boost)	ロープロファイル
P40 ^[34]	1	3840	30	1303 1531 (Boost)	346	GDDR5	384	24	7.25	10.01 11.76 (Boost)	0.31 0.36(Boost)	フルハイト
P100 PCIe ^[35]	1	3584	56	1189 1328 (Boost)	540 / 720	HBM2	4096	12 / 16	0.715	9.5 (Boost)	4.8 (Boost)	フルハイト/ パッシブ
P100 SXM2 ^[36]	1	3583	56	1328 1480 (Boost)	720	HBM2	4096	16	0.715	10.6 (Boost)	5.3 (Boost)	NVLink/ パッシブ

Voltaマイクロアーキテクチャ^[37]

最初さいしょの製品せいひんであるTesla V100は2017年ねん5月がつに発表はっぴょうされた^[38]。12nmプロセスルールを採用さいよう。行列ぎょうれつ演算えんざんを実行じっこうするための専用せんようプロセッサ「Tensor Core」を搭載とうさいする。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SM数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
V100 PCIe	1	5120	80	1245 1380 (Boost)	900	HBM2	4096	16	0.876	14 (Boost)	7 (Boost)	フルハイト/ パッシブ
V100 SXM2	1	5120	80	1312 1530 (Boost)	900	HBM2	4096	16	0.876	15 (Boost)	7.5 (Boost)	NVLink/ パッシブ

Turingマイクロアーキテクチャ

Tesla T4が2018年ねん9月がつに発売はつばいされた。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SM数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
T4	1	2560	40	585 1590 (Boost)	320	GDDR6	256	16	1.25	8.1	不明ふめい	フルハイト

Ampereマイクロアーキテクチャ

最初さいしょの製品せいひんであるTesla A100は2020年ねん5月がつに発売はつばいされた。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SM数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
A2	1	1280	不明ふめい	1440 1770 (Boost)	200	GDDR6	128	16	6.25	4.531	0.14	ハーフハイト
A10	1	9216	84	885 1695 (Boost)	600	GDDR6	384	24	不明ふめい	31.24	0.976	フルハイト
A16	4	5120 (1280x4)	20	885 1695 (Boost)	800 (200x4)	GDDR6	128x4	64 (16x4)	6.25	18.432 (4.608x4)	1.0848	フルハイト/ 2スロット
A30	1	3584	128	930 1440 (Boost)	933	HBM2	3072	24	1.215	10.32	5.161	フルハイト/ 2スロット
A40	1	10752	84	1305 1740 (Boost)	696	GDDR6	384	48	7.251	37.42	1.168	フルハイト/ 2スロット
A100 PCIe	1	6912	108	765 1410 (Boost)	1555	HBM2	5120	40 / 80	不明ふめい	19.5	9.7	フルハイト/ 2スロット
A100 SXM	1	6912	108	765 1410 (Boost)	1555 2039	HBM2	5120	40 / 80	不明ふめい	19.5	9.7	SXM（英語えいご版ばん）

Hopperマイクロアーキテクチャ

最初さいしょの製品せいひんであるTesla H100は2022年ねん3月がつに発売はつばいされた。

機種きしゅ名めい	GPU数すう	CUDA			メモリ					性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
機種きしゅ名めい	GPU数すう	CUDAコア数すう	SM数すう	CUDAコアクロック (MHz)	最大さいだい帯域たいいき幅はば (GB/s)	バス規格きかく	バス幅はば (bit)	総そう容量ようりょう (GiB)	クロック (GHz)	性能せいのう単精度たんせいど (TFLOPS)	性能せいのう倍精度ばいせいど (TFLOPS)	形状けいじょうなど
H100 PCIe	1	14592	114	1065 1650 (Boost)	2000	HBM2e	5120	80	不明ふめい	48	24	フルハイト/ 2スロット
H100 SXM	1	16896	132	1065 1650 (Boost)	3350	HBM3	5120	80	不明ふめい	60	30	SXM（英語えいご版ばん）
H200 SXM					4800	HBM3e		141	不明ふめい	67	34	SXM

脚注きゃくちゅう

外部がいぶリンク

[1] Release 352 Quadro, NVS, Tesla, GRID, & Notebook Drivers - Version 353.06; RN-WQ35306-01_v01 | June 1, 2015; Windows 7, Windows 8, & Windows 8.1; Release Notes

[2] NVIDIA、G80ベースのHPC向むけGPU「Tesla」

[3] Tesla Technical Brief (PDF)

[4] NVIDIA Tesla C1060コンピューティングプロセッサ―ワークステーション向むけメニーコアスーパーコンピューティング

[5] NVIDIA Tesla S1070 1Uコンピューティングシステム― データーセンター向むけの測定そくてい可能かのうなメニーコアスーパーコンピューティング

[6] NVIDIA Tesla S1070 - 株式会社かぶしきがいしゃエルザジャパン

[7] NVIDIA、Fermi採用さいようの並列へいれつプロセッサ「NVIDIA Tesla 20シリーズ」発表はっぴょう - ITmedia エンタープライズ

[8] Tesla C2050 / C2070 GPUコンピューティングプロセッサ

[9] NVIDIA Tesla C2075 | 株式会社かぶしきがいしゃエルザジャパン

[10] NVIDIA Tesla K10 GPU、石油せきゆ・ガスの探査たんさや防衛ぼうえい産業さんぎょう向むけ信号しんごう処理しょり・画像がぞう処理しょりを高速こうそく化か | NVIDIA

[11] 4Gamer.net ― 「GeForce GTX TITAN」登場とうじょう。500円えん玉だまより大おおきなモンスターGPUの“性能せいのう以外いがい”を徹底てってい解説かいせつ

[12] 4Gamer.net ― NVIDIA，Keplerベースの新しん世代せだいTeslaを発表はっぴょう。「GK110」コア採用さいようの「Tesla K20」が年内ねんないに登場とうじょう予定よてい

[13] AnandTech | NVIDIA Launches Tesla K80, GK210 GPU

[14] NVIDIA，新型しんがたGPUコア「GK210」搭載とうさいのHPC向むけデュアルGPUカード「Tesla K80」を発表はっぴょう - 4Gamer.net

[15] NVIDIA® Tesla® GPU Accelerators Datasheet - nvidia-tesla-kepler-family-datasheet.pdf

[16] Tesla-K8-Board-Spec-BD-07228-001-v03.pdf

[17] NVIDIA Tesla K8 | 株式会社かぶしきがいしゃエルザジャパン

[18] 【後藤ごとう弘ひろし茂しげるのWeekly海外かいがいニュース】 NVIDIAが次世代じせだいGPUアーキテクチャ「Kepler」のベールを剥むいだ

[19] ホワイトペーパー NVIDIAの次世代じせだい型がたCUDA コンピュート・アーキテクチャ Kepler GK110

[20] Whitepaper; NVIDIA’s Next Generation CUDA™ Compute Architecture: Kepler™ GK110/210

[21] Kepler Tuning Guide :: CUDA Toolkit Documentation

[22] NVIDIA，Maxwellベースの数値すうち演算えんざんアクセラレータ「Tesla M40」「Tesla M4」を発表はっぴょう - 4Gamer.net

[23] NVIDIA、Maxwellベースで7TFLOPSを実現じつげんする機械きかい学習がくしゅう向むけ「Tesla M40」～Low Profileの1スロットの「Tesla M4」も - PC Watch

[24] NVIDIA Tesla M60 and Tesla M6 Accelerators To Power Grid 2.0 - M60 Featuring Dual-GM204 GPUs

[25] NVIDIA Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning

[26] Tesla M6 Product Brief

[27] Tesla M60 Product Brief

[28] Data Sheet: Tesla M4

[29] NVIDIA Tesla M40 | 株式会社かぶしきがいしゃエルザジャパン

[30] ［GTC 2016］西川にしかわ善よし司しの3DGE：Teslaとして登場とうじょうした新しん世代せだいGPU「Pascal」，その詳細しょうさいに迫せまる - 4Gamer.net

[31] NVIDIA，ディープラーニング向むけ数値すうち演算えんざんアクセラレータ「Tesla P40」「Tesla P4」を発表はっぴょう - 4Gamer.net

[32] PASCAL: 最新さいしんGPUアーキテクチャ

[33] NVIDIA Tesla P4 GPU Datasheet

[34] Data Sheet: Tesla P40

[35] Data Sheet: Tesla P100

[36] Data Sheet: Tesla P100

[37] NVIDIA TESLA V100 GPU ACCELERATOR

[38] ［GTC 2017］西川にしかわ善よし司しの3DGE：Volta世代せだいのGPU「GV100」は，これまでと大おおきく異ことなるプロセッサだ――いったい何なにが？ - 4Gamer.net

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

NVIDIA Tesla

目次もくじ

概要がいよう

仕様しようと構成こうせい

Teslaマイクロアーキテクチャ

Fermiマイクロアーキテクチャ

Keplerマイクロアーキテクチャ

Maxwellマイクロアーキテクチャ

Pascalマイクロアーキテクチャ

Voltaマイクロアーキテクチャ^[37]

Turingマイクロアーキテクチャ

Ampereマイクロアーキテクチャ

Hopperマイクロアーキテクチャ

脚注きゃくちゅう

関連かんれん項目こうもく

外部がいぶリンク

NVIDIA Tesla

概要がいよう

仕様しようと構成こうせい

Teslaマイクロアーキテクチャ

Fermiマイクロアーキテクチャ

Keplerマイクロアーキテクチャ

Maxwellマイクロアーキテクチャ

Pascalマイクロアーキテクチャ

Voltaマイクロアーキテクチャ[37]

Turingマイクロアーキテクチャ

Ampereマイクロアーキテクチャ

Hopperマイクロアーキテクチャ

脚注きゃくちゅう

関連かんれん項目こうもく

外部がいぶリンク

Voltaマイクロアーキテクチャ^[37]