(Translated by https://www.hiragana.jp/)
NEC SX - Wikipedia

SXシリーズは、日本電気にほんでんき (NEC) が開発かいはつ提供ていきょうしているスーパーコンピュータのシリーズで、主戦しゅせんりょくきゅうベクトルがたスーパーコンピュータとして、世界せかい唯一ゆいいつのこっているシリーズである。2019ねん現在げんざい最新さいしんモデルはSX-Aurora TSUBASAつづ番号ばんごうとしてはSX-11に相当そうとう)である。

1983ねんにSX-2と下位かいモデルのSX-1を発表はっぴょう、1985ねん出荷しゅっかしたのがシリーズのはじまりである。さらに廉価れんかばんのSX-0もラインナップされた。その主力しゅりょくしん世代せだいごとに、末尾まつび数字すうじを1つずつやしていた。サフィックスの数字すうじ英字えいじは、サブモデルや改良かいりょうばん(SX-2A、SX-3Rなど)やサーバモデル(SX-4B、SX-5S)や小型こがたモデル(SX-6i、SX-8i)とうしめす。

TOP500首位しゅい話題わだいとなった地球ちきゅうシミュレータ初代しょだいシステムはほんシリーズのSX-5、2代目だいめシステムはSX-9/E、3代目だいめはSX-ACE、4代目だいめ現行げんこうSX-Aurora TSUBASAがベースである。

1983ねん昭和しょうわ58ねん)4がつ発表はっぴょう。SXシリーズで最初さいしょ登場とうじょうしたのはSX-2である(1985ねん出荷しゅっか)。SX-2の下位かいモデルとして、SX-1,SX-0が提供ていきょうされた。改良かいりょうばんとして、SX-2Aとう開発かいはつ出荷しゅっかされた。SX-2は世界せかい最初さいしょGFLOPSえたスーパーコンピュータで、Cray-2かれるまでのひとときであったが世界せかい最高さいこうそくであった。

1989ねん平成へいせい元年がんねん)4がつ発表はっぴょうOSを、ACOS-4(メインフレームよう)ベースのSX-OSから、UnixベースのSUPER-UXえたモデルである。その、1990ねんてい価格かかくモデル、1992ねん1がつ改良かいりょうがたモデル(SX-3 R)を発表はっぴょう最大さいだい4つのAPが構成こうせいできる。メモリ共有きょうゆうして動作どうさする。CPも2つ構成こうせいできる。ベクトルレジスタの容量ようりょうパイプライン本数ほんすう、とAPの台数だいすうによって、1Lから44まで、10のサブモデルがあった。

1994ねん平成へいせい6ねん)11月発表はっぴょう。SX-3まではバイポーラ論理ろんりLSIを使つかっていたが、SX-4ではCMOS論理ろんりLSIを使つかうようになった。このためサイクルタイムはSX-3Rの2.5nsから8nsにおそくなったが、消費しょうひ電力でんりょく発熱はつねつ低下ていかによる空冷くうれいと、CPUモジュール1個いっこのチップすう37、面積めんせき38.6cm x 45.7cmというたか実装じっそう密度みつどにより、コストパフォーマンスは向上こうじょうしている。

計算けいさん性能せいのうは、ノードあたり64GFLOPS、システムあたり最大さいだい1024GFLOPSとなった。SX-3同様どうようノード単位たんいメモリ共有きょうゆうするが、ノードあいだでは分散ぶんさんしたシステムあいだ協調きょうちょう動作どうさおこなう。コンパクトモデル、シングルノードモデル、マルチノードモデルがあった。(1ノードは1つの処理しょり単位たんい、いいかえればオペレーティングシステム (OS) が動作どうさする単位たんいである)

 
SX-5外観がいかん

1998ねん平成へいせい10ねん)6がつ発表はっぴょう。シングルノード最大さいだいCPUかずは16(128GFLOPS)、最大さいだい共有きょうゆうメモリ容量ようりょうは128GB、しゅ記憶きおく転送てんそう速度そくどは1024GB/sであった。

SX-4と同様どうようにCMOSを採用さいよう集積しゅうせきすすめチップの処理しょり速度そくど向上こうじょう施策しさくともはいねつ設計せっけい/多層たそう配線はいせんなどにより全体ぜんたい処理しょり速度そくど向上こうじょうはかったモデルがSX-5であり、クロックが4ns(250MHz)、ベクトル命令めいれいパイプラインが16ほんと、SX-4にくらべCPUモジュール1あたりの性能せいのうが4ばいの8GFLOPSとなった。この32チップで構成こうせいされたCPUモジュールを1チップLSIしたのが初代しょだい地球ちきゅうシミュレータのCPUである。

1999ねん5がつに、ベクトルパイプラインが半分はんぶんの8ほんのサーバモデルSX-5Sを発表はっぴょう。2000ねん6がつクロックをやく3.2nsに向上こうじょうさせた1CPUモジュール10GFLOPSのモデルを発表はっぴょう。このCPU演算えんざん性能せいのう強化きょうかモデルではシングルノードの最大さいだい演算えんざん性能せいのうは160GFLOPSと向上こうじょうしたがしゅ記憶きおく転送てんそう速度そくどは640GB/sに低下ていかした。

2001ねん平成へいせい13ねん)10がつ発表はっぴょう。シングルノードの最大さいだいCPUすうは8(64GFLOPS)、最大さいだい共有きょうゆうメモリ容量ようりょうは64GB、しゅ記憶きおく転送てんそう速度そくどは256GB/sであった。地球ちきゅうシミュレータのシングルノードを改良かいりょう(メモリ容量ようりょうが2ばい)したものをもちいている。従来じゅうらいはスカラーとベクトル同期どうき動作どうさだったが、地球ちきゅうシミュレータ同様どうようにベクトルがスカラー倍速ばいそく動作どうさするように改良かいりょうされた。クロック2ns(500MHz)で動作どうさするスカラ演算えんざんユニットと、クロックが1ns(1GHz)で動作どうさする8ほんのベクトルパイプラインをつ、1チップベクトルプロセッサから構成こうせいされている。0.15μみゅーmCMOSプロセスを採用さいようしている。

2001ねん11月にデスクサイドモデルSX-6i(1CPU、メモリ最大さいだい搭載とうさいりょう8GB)を発表はっぴょう

2003ねん9がつに9GFLOPS CPUとシングルノードたりの最大さいだいメモリ容量ようりょうが2ばい(128GB,しゅ記憶きおく転送てんそう速度そくど289GB/s)の機種きしゅ発表はっぴょう

2002ねん平成へいせい14ねん)10がつ発表はっぴょう。シングルノードの最大さいだいCPUすうは32(282GFLOPS)、最大さいだい共有きょうゆうメモリ容量ようりょうは256GB、しゅ記憶きおく転送てんそう速度そくどは1131GB/sである。基本きほんてきにはSX-6のシングルノードないのCPUすう最大さいだい共有きょうゆうメモリりょう拡張かくちょうしたモデル。0.15μみゅーmCMOSプロセスを採用さいよう

2004ねん平成へいせい16ねん)10がつ発表はっぴょう。シングルノードの最大さいだいCPUすうは8(128GFLOPS)、最大さいだい共有きょうゆうメモリ容量ようりょうは64GB(FCRAM)/128GB(DDR2-SDRAM)、しゅ記憶きおく転送てんそう速度そくどは512GB/sである。1ノード1モジュールを達成たっせいしCPUとメモリモジュールあいだにSX-6/7までった同軸どうじく布線ふせん20,000ほんはいしカード(ケーブルレス)を高密度こうみつど実装じっそう(15インチUXGAディスプレイの画素がそおな密度みつど外部がいぶ接続せつぞくピン密度みつど)をもちいて実現じつげんした。90nmCMOSプロセスを採用さいよう。クロックが SX-62ばい、スカラ演算えんざんユニット1ns(1GHz), ベクトル演算えんざんユニット0.5ns(2GHz)となり1CPUあたり16GFLOPSを達成たっせい。SXシリーズとしてははつのSQRT命令めいれいのハードウェアサポートを実現じつげん

2005ねん9がつ、SX-6iの後継こうけい相当そうとうのデスクサイドモデルSX-8i発表はっぴょう。SX-6iで不評ふひょうだった最大さいだい搭載とうさいメモリりょうを32GBと大幅おおはば拡大かくだいし、しゅ記憶きおく転送てんそう速度そくどは64GB/s。

2006ねん平成へいせい18ねん)10がつ発表はっぴょう。ベクトルプロセッサ(CPU)の中枢ちゅうすう機能きのうであるベクトル加算かさん乗算じょうざん倍増ばいぞうし、CPUたりの性能せいのう従来じゅうらいくらべ2ばい以上いじょうの35.2GFLOPS(従来じゅうらいは16GFLOPS)に向上こうじょうした。同時どうじに、1CPU(シングルコア)たりの最大さいだいベクトル性能せいのうで100GFLOPSをえる1チップベクトルプロセッサを搭載とうさいした次期じきベクトルスーパーコンピュータを開発かいはつちゅうであることを表明ひょうめいした。

2007ねん平成へいせい19ねん)10がつ発表はっぴょう。ペタフロップス時代じだい視野しや開発かいはつされた。当初とうしょ予定よていどおり1チップベクトルプロセッサを採用さいようし、プロセッサたりの性能せいのうは100GFLOPSをえる。(発表はっぴょう時点じてんではシングルプロセッサとして世界せかい最高さいこう性能せいのう)これにともない、性能せいのうたりの電力でんりょく効率こうりつ大幅おおはば向上こうじょうさせている。65nm CMOSプロセス、11そうどう配線はいせん採用さいよう最大さいだいで8192だいのCPUを接続せつぞくできる。ノードあいだ接続せつぞく速度そくど見直みなおされ、回線かいせん交換こうかん方式ほうしきからパケット交換こうかん方式ほうしき変更へんこう最大さいだいで256GB/S(128GB/S×2)となった。オペレーティングシステムはSUPER-UXを継続けいぞく採用さいようしている。

2011ねん平成へいせい23ねん)11月に開発かいはつ開始かいし発表はっぴょう[1]。SX-9と比較ひかくし、性能せいのうたりの消費しょうひ電力でんりょくを1/10に、設置せっち面積めんせきを1/5に、CPUコア性能せいのうを64GFLOPSに、データ転送てんそう速度そくどをCPUコアたり64GB/sにすること目指めざすとしていた。SXシリーズとしてはじめて複数ふくすうのCPUコアを1チップじょう集積しゅうせきするマルチCPUコアのLSIを採用さいようした。

名称めいしょうについては、2013ねん4がつのCool Chips 16ではまっていないとのことでNGVとんでいたが、筐体きょうたい写真しゃしんにはSX-Xとあった[2](なお、SX-Xという仮称かしょうはSX-3の開発かいはつちゅうなどで使つかっているれいがある[3])。発売はつばいにSX-ACEとして発表はっぴょうされた。

2013ねん11月発売はつばい、SC13で展示てんじもおこなわれた。「SX-10」は商標しょうひょう登録とうろくされており使つかえなかったためえたとのことである。[4]。ACEのは16しんほうなどで10に使つか記号きごうであるAを意識いしきしている。[5]

SX-Aurora TSUBASA

編集へんしゅう

2017ねん10がつ25にちに、発売はつばい予定よてい発表はっぴょうした[6]演算えんざん周辺しゅうへんぜん世代せだいまでと同様どうようのパイプライン演算えんざんだが、ノードをPCIeカードに実装じっそうし、それを1まい使用しようするデスクサイドマシン形態けいたい最小さいしょう構成こうせいから、多数たすう使用しようするラック実装じっそうのスーパコンピュータセンタけまでをそろえている(地球ちきゅうシミュレータの更新こうしんが2020年代ねんだい前半ぜんはんにあるとおもわれるが、それとの関連かんれんについての情報じょうほうは2018ねんまつ時点じてんではい)。そしてPCIeにともない、管理かんりがわのシステムが変更へんこうされ、ハードウェアのめんでは管理かんりがわ(NECでは、演算えんざんがわの「ベクトルエンジン」にたいし「ベクトルホスト」とんでいる)が独自どくじ専用せんようアーキテクチャからx86ベースに、ソフトウェアのめんではOSはSUPER-UXから、Unixけいであるてんおなじだが[7]Linuxに更新こうしんされた。8コアのベクトルエンジンは、SX-ACEと比較ひかくし、性能せいのうたりの消費しょうひ電力でんりょくを1/5に、設置せっち面積めんせきを1/10に、CPUコア性能せいのうを307GFLOPSに、データ転送てんそう速度そくどをCPUコアたり150GB/sとした[6]

2019ねん12月、VE-10AEを搭載とうさいしたSX-Aurora TSUBASA A412-8発表はっぴょう大学だいがく共同きょうどう利用りよう機関きかん法人ほうじん 自然しぜん科学かがく研究けんきゅう機構きこう かく融合ゆうごう科学かがく研究所けんきゅうじょプラズマシミュレータ雷神らいじん搭載とうさい[8]

2020ねん6がつ、VE-20を搭載とうさいしたSX-Aurora TSUBASA B401-8発表はっぴょうだい4世代せだい地球ちきゅうシミュレータ[9]東北大学とうほくだいがくサーバーサイエンスセンターのAOBA-A[10]搭載とうさい

2022ねん10がつ8にちに、VE-30を搭載とうさいしたSX-Aurora TSUBASA C401-8発表はっぴょう[11]

アーキテクチャ

編集へんしゅう
 
SX概要がいよう

アーキテクチャはSX-3以前いぜん(SX-2まで)とそれ以降いこう多少たしょうはあるが、ここでは全体ぜんたいてき特徴とくちょうについて説明せつめいする。おおきくけて2つのユニットから構成こうせいされている、非対称ひたいしょうみつ結合けつごうマルチプロセッサ構成こうせいをとっている。またどう時期じき開発かいはつされた系統けいとう機種きしゅ比較ひかくすると、日立ひたちのもの(HITAC S-810)と対照たいしょうてきで、S-810は既存きそんメインフレームの拡張かくちょうという形態けいたいであるのにたいし、SXシリーズでは制御せいぎょのメインフレームとは分離ぶんり独立どくりつした形態けいたいをとった[12]

また、モデルごと高速こうそくをはかる機能きのう追加ついかされてきている。たとえば、パイプライン増加ぞうか命令めいれいセット強化きょうか(8バイト演算えんざん命令めいれい追加ついかなど)、データのロード/ストアようのバスの分離ぶんり強化きょうかなどがあげられる。

制御せいぎょプロセッサ(CP)

編集へんしゅう

SX-2までのアーキテクチャ

編集へんしゅう

いわゆる汎用はんようコンピュータてき仕事しごとをするところである。オペレーティングシステム (OS) はこのプロセッサじょう実行じっこうされる。データの入出力にゅうしゅつりょくプログラム編集へんしゅうコンパイル作業さぎょうなどをおこなう。SX-2まではACOS-4けい汎用はんようコンピュータである。CPはさらに、通常つうじょう演算えんざんおこなうEPUとシステム制御せいぎょ(SCU)から構成こうせいされる。入出力にゅうしゅつりょくおこなうIOPもSCUから接続せつぞくされる。

SX-3以降いこうのアーキテクチャ

編集へんしゅう

SX-3以降いこうUP4800ひとしUNIXサーバとなった。CP単独たんどく処理しょりをする、というようなイメージではなくなった。APの制御せいぎょ入出力にゅうしゅつりょく処理しょり制御せいぎょおこなうためのプロセッサという役割やくわりになった。

演算えんざんプロセッサ(AP)

編集へんしゅう

数値すうち演算えんざんのプログラムを実行じっこうするだけのプロセッサである。アーキテクチャはSXシリーズようあらたに開発かいはつされた。RISC形式けいしきふう命令めいれいセットであり、1命令めいれいは4バイトまたは8バイトである。基本きほんてきに64ビットマシンである。おおきくけてスカラ[よう曖昧あいまい回避かいひ]演算えんざんユニット(SU)、ベクトル演算えんざんユニット(VU)とインターフェースユニット(IU)から構成こうせいされる。

APはSX-2,SX-1,SX-0は1システムに1ユニットであるが、SX-3以降いこうは1システムに複数ふくすうユニット構成こうせいできるようになった。そのため、かくAPは共有きょうゆうメモリがたマルチプロセッサを構成こうせいしている。

数値すうち演算えんざん高速こうそくおこなうために、ベクトル演算えんざん機能きのう用意よういされている。スカラ演算えんざんは、RISCふうのため、SX-2シリーズにおいては、同社どうしゃ当時とうじ最新さいしん汎用はんようコンピュータ S1000の3.5ばい以上いじょう目標もくひょう設計せっけいされていた。ベクトル演算えんざん機能きのうとスカラ演算えんざん機能きのう(汎用はんようレジスタ)は独立どくりつしているため、並行へいこう動作どうさ可能かのうである。キャッシュメモリは、命令めいれいキャッシュとオペランドキャッシュが独立どくりつしている。

データを高速こうそく処理しょりするための工夫くふう用意よういされている。たとえば、SX-2,1においては、メモリは512ウェイインターレース(最大さいだい)構成こうせいをとっていて、6nsクロックのスピードとともに、最大さいだい11Gバイト/sのデータ転送てんそう能力のうりょく(SX-2において)、1.3G FLOPS(SX-2)の性能せいのうほこる。クロックはSX-3Rで2.5nsまで高速こうそくされたが、SX-4ではデバイスがCMOSになったため、8nsまでおそくなった。

SX-2のレジスタはおおよそ以下いかのとおりである。なお、SX-1ではベクトル関係かんけいのレジスタはSX-2の半分はんぶんになる。SX-3以降いこう基本きほんてきにはこの構成こうせいをとっている。

ベクトル演算えんざん機能きのう
編集へんしゅう

ベクトル演算えんざん機能きのうは4つのパイプライン(SX-3まで、SX-4は最大さいだい8つ、モデルによって本数ほんすうわる)をっている。そのため、1サイクルで複数ふくすう演算えんざん同時どうじおこなうことが出来できる。また、ベクトル演算えんざん機能きのうは、加算かさん乗算じょうざん論理ろんり演算えんざんシフト演算えんざんの4つの演算えんざん機能きのう別々べつべつ用意よういされている。そのため、それぞれの演算えんざん独立どくりつしておこなうことが出来できる。たとえば、

   DO 100 I = 1, 100
     C(I) = A(I) + B(I)
 100 CONTINUE

というようなDOループはベクトル演算えんざん命令めいれいの1マシン命令めいれいコンパイルされ、実行じっこうされる(ベクトルくわしくはベクトルのページを参照さんしょうのこと)。もちろん、浮動ふどう小数点しょうすうてんすうだけではなく整数せいすうたいしてもベクトル処理しょり可能かのうである。

また、ベクトルマスク機能きのう使つかい、ベクトルない演算えんざん対象たいしょうのものだけをふるいけたり、ベクトルをマスクのあたいによって圧縮あっしゅく伸張しんちょうするような演算えんざんおこなうことが出来できる。そのため、より高速こうそく演算えんざん可能かのうである。この機能きのうは、DOループうちにあるIFぶんうちのベクトル演算えんざん(条件じょうけん演算えんざん)を高速こうそくおこなうために用意よういされている。

そのほか、るい高速こうそくもとめる機能きのうや、浮動ふどう小数点しょうすうてんすうの0.5ばい/2ばい高速こうそくおこな機能きのう用意よういされている。

スカラ演算えんざん機能きのう
編集へんしゅう

スカラ演算えんざん機能きのうパイプライン高速こうそくされている。

さらに、SX-3では、命令めいれいアウト・オブ・オーダー実行じっこう機能きのうくわわった。

SX-4ではスーパースカラーされている。同時どうじに2命令めいれいのデコード、フェッチと分岐ぶんきふくめ、最大さいだい4命令めいれい同時どうじ実行じっこう可能かのうである。固定こてい小数点しょうすうてんすう演算えんざんよう演算えんざんが2つ、浮動ふどう小数点しょうすうてんすう演算えんざんよう演算えんざんが1つ、乗算じょうざんうつわが1つある。固定こてい小数点しょうすうてんすう演算えんざんは1マシンサイクル、浮動ふどう小数点しょうすうてんすう演算えんざんも2マシンサイクルで実行じっこう可能かのうであり、きわめて高速こうそく演算えんざん可能かのうになっている。

命令めいれいセット

編集へんしゅう

命令めいれいセットは3オペランド形式けいしきである。演算えんざんはすべてレジスタおこなわれる。RISCふうのため、演算えんざん命令めいれいとロード/ストア命令めいれいかれている(メモリじょうのデータをレジスタじょう演算えんざんおこな命令めいれいはない)。

スカラ[よう曖昧あいまい回避かいひ]演算えんざんよう命令めいれいベクトル演算えんざんよう命令めいれいかれている。スカラ演算えんざんよう命令めいれい(RXがた)は1命令めいれい1ワード(4バイト)または2ワード(8バイト)である。1バイトのオペコードのちに、3つのオペランドがつづく。オペランドはレジスタ、インデックスレジスタ、あるいは即値そくちである。

ベクトル演算えんざんよう命令めいれい(RRがた/RVがた)も、1バイトのオペコードののちに3つのオペランドがつづく。おも命令めいれい

などが用意よういされている。演算えんざんは、ベクトルとベクトルの演算えんざんだけではなく、ベクトルとスカラーの演算えんざんなども用意よういされている。このため、ベクトルに特定とくていあたいしたりけたりするようなDOループが、ハードウェアてきな1命令めいれい実行じっこうできる。

また、数値すうち演算えんざん専用せんようのプロセッサのため、いわゆる10しん演算えんざんとう命令めいれい用意よういされていない。基本きほんてきにワード(64ビット)単位たんい処理しょりであるが、ロード/ストア命令めいれいについてはバイト/16ビット単位たんいのものが用意よういされている。

SX-3では、64ビット整数せいすう演算えんざん命令めいれい最大さいだい/最小さいしょう検索けんさく命令めいれいとう追加ついかされている。

SX-4では、浮動ふどう小数点しょうすうてん演算えんざんに、IBM形式けいしきCRAY形式けいしきほかに、IEEE形式けいしきもサポートするようになった。

ベクトル命令めいれいは、複数ふくすうのオペランドをつが、1つのベクトルのオペランドをすべ処理しょりしてからつぎのベクトル命令めいれい実行じっこうすると処理しょりおそくなる。SXシリーズでは、1つのベクトルのオペランドが演算えんざんえたのちつぎのベクトル命令めいれい処理しょり開始かいしする機能きのうがハードウェアによって用意よういされている。このため、ベクトル命令めいれい高速こうそく可能かのうである。

実装じっそう

編集へんしゅう

筐体きょうたい形状けいじょう

編集へんしゅう

SX-2(SX-1をふくむ)では、配線はいせん最適さいてきするために、APとメモリ部分ぶぶんがYがたになっている。APのさきに、CPやIOPが接続せつぞくされる。冷却れいきゃく機構きこうべつ筐体きょうたいである。水冷すいれいのため、SX-2本体ほんたいはそばによってもねつかんじず、ひんやりとして、おとしずかであるが、冷却れいきゃく機構きこう空気くうきこう(機構きこう上部じょうぶ)は猛烈もうれつあつふうげている。

SX-3ではかく筐体きょうたい平行へいこうならび、その装置そうちあいだをインタフェースユニットが接続せつぞくしている。

SX-4では、1つのユニットの筐体きょうたいひとかたちた、非常ひじょう特徴とくちょうのある形状けいじょうになっている。

水冷すいれい方式ほうしき

編集へんしゅう

SX-2以降いこう、AP、CPとも主要しゅよう部分ぶぶん水冷すいれい方式ほうしきとなっている。SX-2では複数ふくすうのICを集積しゅうせきしたICモジュールに10cm四方しほう水冷すいれいユニットがけられている。 SX-3では、APのみLCM(リキッドクーリングモジュール)とばれる30×20cm程度ていどのモジュールが採用さいようされ複数ふくすう集積しゅうせき回路かいろ水冷すいれい機構きこう一体いったいとなっている。CPはUNIXサーバとなったため空冷くうれいとなり、外部がいぶ設置せっちする設備せつび大幅おおはば縮小しゅくしょう可能かのうとなった。

SX-4ではチップがCMOSになったため、空冷くうれいになっている。

ソフトウェア

編集へんしゅう

SX-2、SX-1は、ACOS-4をベースとしたSX-OSというオペレーティングシステム (OS)で動作どうさしている。 ACOS-4けい提供ていきょうされている機能きのうがほとんどすべて動作どうさ可能かのうである。また、ACOS-4/MVP XE とうと結合けつごうマルチプロセッサ構成こうせいをとることが出来できる(ディスクの共有きょうゆう)。

さらに、チェックポイントリスタート機能きのうゆうしている。この機能きのう使つかうことで、長期間ちょうきかん処理しょりおこなジョブ分割ぶんかつして実行じっこうしたり、出力しゅつりょく制限せいげんえてしまってアボートしたジョブのリスタートも可能かのうになる。なが数値すうち計算けいさんおこな処理しょりには便利べんりである。

SX-3以降いこうのOS

編集へんしゅう

SX-3以降いこうは、メインフレームベースのオペレーティングシステム (OS) をやめ、UNIXベース(System Vベース)のOS、SUPER-UXとなった。ベースは System V ではあるが、4.3BSD機能きのうれ、ネットワーク関係かんけいとう強化きょうかされているTCP/IPだけではなく、OSIへの対応たいおうもなされている。そのほかの特徴とくちょう以下いかのとおり。

マルチプロセッサ対応たいおう
カーネルマルチスレッドおこなっている。
2つのページサイズ
32Kバイトと1Mバイトのページサイズを提供ていきょうしている。UNIXコマンドのようなちいさなプログラムは32Kバイト、科学かがく技術ぎじゅつ計算けいさんには1Mバイトのページサイズをてている。どちらを使つかうかは、実行じっこう可能かのうバイナリファイルに設定せっていされている。
オーバレイ機能きのう
メモリを効率こうりつてき使つかうため、サブルーチン単位たんいにオーバレイ機能きのう使つかうことが出来できる。この機能きのうソースプログラム変更へんこうすることなく実行じっこう可能かのうである。
スケジューリング機能きのう大幅おおはば変更へんこう
通常つうじょう処理しょり(UNIXコマンドによる対話たいわてき処理しょり)と、数値すうち演算えんざんのようなバッチてき処理しょりのスケジューリングを適切てきせつおこなうために、ドメイン、スケジューリンググループという機能きのう用意よういしている。
ドメイン
会話かいわ処理しょりドメインとバッチ処理しょりドメインが用意よういされている。それぞれにたいして、CPU配分はいぶん、メモリ配分はいぶん設定せっていできる。
スケジューリンググループ
ユーザごとにスケジュール方法ほうほう設定せっていできる。従来じゅうらいのUNIXふうのスケジュール方法ほうほうほかに、固定こていてきにスケジュールを設定せっていする機能きのうも、バッチてき処理しょりのために用意よういされている。
ファイルシステム改良かいりょう
ファイルシステムはs5fs(System V固有こゆうのファイルシステム)をベースに改良かいりょうしたSFS (Supercomputing File System) である。このファイルシステムは、基本きほんてきなUNIXのファイルシステムをベースに、大量たいりょう入出力にゅうしゅつりょく (I/O) に対応たいおうするように改良かいりょうされている。たとえば、I/O単位たんいがブロックをまとめたクラスタ単位たんいである、カーネルバッファ使つかわず、直接ちょくせつユーザアプリケーションとI/Oをおこなう、仮想かそうボリューム機能きのうもちいて、ディスク容量ようりょうよりおおきなファイル作成さくせいできるなどである。
NQS機能きのう
バッチ処理しょり効率こうりつてきおこなうために、NQS(Network Queuing System)というジョブ管理かんりシステムが提供ていきょうされている。

SX-4対応たいおうのOSでは、SVR4.2MP (System V Release 4.2 MP) 対応たいおうになった。また、並列へいれつ処理しょりも、SX-3ではタスクライブラリというFortran指向しこうのライブラリを用意よういしていたが、SX-4ではPOSIXスレッド使つかえるようになった。また、より並列へいれつがるように、つぶ向上こうじょうしたり、アトミック命令めいれい追加ついかされている。

SX-2、SX-1では、APじょう実行じっこうするバイナリを生成せいせいする FORTRAN77/SXと、CPじょう実行じっこう可能かのうなバイナリを生成せいせいするFORTRAN77が提供ていきょうされている。CPじょうでは、FORTRAN77以外いがいにもCOBOLPL/Iなど、言語げんごもコンパイル、実行じっこう可能かのうである。しかし、APじょう処理しょり可能かのう高水準こうすいじゅん言語げんごは、FORTRAN77しかない。

CPじょう実行じっこう可能かのうなFORTRANは、デバッグ用途ようとである。また、FORTRANのソースコード整形せいけいするBEAUTIFIERや、動作どうさ解析かいせきする(動的どうてき/静的せいてき)ANALIZER/SX、対話たいわてきベクトル推進すいしんするVECTRIZER/SXも用意よういされている。

SX-3以降いこう

編集へんしゅう

SX-3以降いこうSUPER-UXけには、あたらしいハードウェア対応たいおうして、コンパイラ機能きのう強化きょうかされている。たとえば、8バイト整数せいすうベクトル[よう曖昧あいまい回避かいひ]レジスタ容量ようりょう拡大かくだい対応たいおうなどである。機能きのうてきにも、外部がいぶ手続てつづきをインラインで展開てんかいしたり、行列ぎょうれつ演算えんざん認識にんしきして、関数かんすうしにえたり、ループかずらして、ループない演算えんざんやして(ループアンローリング)、メモリアクセスの軽減けいげん、ベクトルレジスタの効率こうりつてき利用りようをはかるように改良かいりょうされている。

さらに、APが複数ふくすうあることを利用りようし、並列へいれつ実行じっこうおこな機能きのう用意よういされている。並列へいれつ実行じっこうは、サブルーチンレベルで並列へいれつおこなう、マクロタスク機能きのう、ループない演算えんざん並列へいれつする、マイクロタスク機能きのうがある。マクロタスク機能きのうはソースコードレベルでの修正しゅうせい必要ひつようだが、マイクロタスク機能きのう機能きのうでは自動的じどうてき並列へいれつおこなわれる。さらに、より高度こうど並列へいれつおこなうために、並列へいれつ指示しじするような命令めいれいや、並列へいれつ実行じっこうのための補助ほじょてき命令めいれい追加ついかされている。

また、SUPER-UXでベースとなっているオペレーティングシステム (OS) がUNIXであるので、UNIXに関係かんけいふかC言語げんごもサポートしている。C言語げんごでもFORTRAN同様どうようベクトル機能きのう有効ゆうこう使つかえるようなコード生成せいせいくだりなえるようになっている。

性能せいのう向上こうじょうのためのツールは、あらたに、ANALIZER-P/SXと、PARALLELIZER/SXが提供ていきょうされている。

SX-4からはFORTRAN90が提供ていきょうされている。 また、SX-4ようのコンパイラは、SX-4であらたに追加ついかされた命令めいれいや、高速こうそくのためのアーキテクチャ改良かいりょうんで最適さいてきおこなっている。さらに、マルチノードにも対応たいおうしている。

アメリカによるダンピング課税かぜい問題もんだい

編集へんしゅう

SXシリーズは、アメリカ合衆国あめりかがっしゅうこく (米国べいこく) においてダンピングおこなっていると大幅おおはば課税かぜいされたことがある。これは、当時とうじ米国べいこくしゃせいスーパーコンピュータくらべ、SX-3とう価格かかくやすかったためでもある。当時とうじ米国べいこくにはSX-3はほとん輸出ゆしゅつされておらず、もっぱ米国べいこく国外こくがいでSX-3の出荷しゅっか順調じゅんちょうすすみ、米国べいこくしゃせいのスーパーコンピュータの販売はんばいがしにくくなったためでもある。

米国べいこくなどのスーパーコンピュータメーカでは制御せいぎょけい専用せんようマシンでおぎなわなければならないためこの製作せいさく高額こうがくであった。これにたい日本にっぽんメーカーは自社じしゃ汎用はんようマシンでおぎない、さらに、SX-3とうでは小型こがた汎用はんようサーバにえることにより大幅おおはば価格かかくしょうじる結果けっかとなった。

米国べいこくでは軍事ぐんじ産業さんぎょう保護ほご観点かんてんからスーパーコンピュータも保護ほごすべき対象たいしょうとなっていたため安価あんかであった日本にっぽんのスーパーコンピュータの導入どうにゅう一向いっこうすすまなかった。 のちに、米国べいこく国内こくないでも安価あんかなスーパーコンピュータが使つかえないこと抗議こうぎこえがり、この問題もんだいることとなった。2001ねん2がつ28にちに、日本電気にほんでんき (NEC) はクレイしゃにSXシリーズをOEMすることで合意ごういしている。なお、くわしい経緯けいいについては日米にちべいスパコン貿易ぼうえき摩擦まさつ参照さんしょうされたい。


SX シリーズ システム

編集へんしゅう

SX-4, SXシリーズ以降いこうのスーパーコンピュータはじゅう並列へいれつ構成こうせいである。複数ふくすうCPU並列へいれつベクトル処理しょりノードに配置はいちされる。 これらのノードは標準ひょうじゅんてきSMP構成こうせいである。

シングルノード SX システム
SX-2 SX-3 SX-4 SX-5 SX-6 SX-7 SX-8 SX-8R SX-9 SX-ACE
最大さいだいCPUの個数こすう 1 4 32 16 8 32 8 8 16 1
ピーク CPU GFLOPS 1.3 5.5 2 8 8 8.83 16 35.2 102.4 256
ピークシステム GFLOPS 1.3 22 64 128 64 282 128 281.6 1638 256
最大さいだいぬしメモリ 256 MB GB 16 GB 128 GB 64 GB 256 GB 128 GB 256 GB TB TB
システムメモリ帯域たいいきはば (GB/s) 11 44 512 1,024 256 1,129 512 563.2 4,096 256
CPUごとのメモリ帯域たいいきはば (GB/s) 11 22 16 64 32 35.3 64 70.4 256 256
マルチノード SX システム
SX-4 SX-4A SX-5 SX-6 SX-8 SX-8R SX-9 SX-ACE
最大さいだいノードすう 16 16 32 128 512 512 512 512
最大さいだいCPUの個数こすう 512 256 512 1,024 4,096 4,096 8,192 512
ピーク TFLOPS 1 0.5 4 8 65 140.8 839 131
最大さいだいぬしメモリ 256 GB 512 GB 4 TB 8 TB 64 TB 128 TB 512 TB 32 TB
合計ごうけいメモリ帯域たいいきはば (TB/s) 8 4 32 32 131 281.6 2,048 131

参考さんこう文献ぶんけん

編集へんしゅう
  • SXシステムの開発かいはつ背景はいけい、NECわざむくい,Vol39 No1/1986
  • SXシステムの概要がいよう、NECわざむくい,Vol39 No1/1986
  • SXシステムの科学かがく演算えんざん処理しょり装置そうち、NECわざむくい,Vol39 No1/1986
  • SXシステムの制御せいぎょプログラム、NECわざむくい,Vol39 No1/1986
  • SX-3シリーズの開発かいはつ背景はいけい概要がいよう、NECわざむくい,Vol45 No2/1992
  • SX-3シリーズのハードウェア構成こうせい、NECわざむくい,Vol45 No2/1992
  • オペレーティングシステム SUPER-UX NECわざむくい,Vol45 No2/1992
  • SX-3シリーズの言語げんごプロセッサと開発かいはつ支援しえんツール、NECわざむくい,Vol45 No2/1992
  • SX-4シリーズの開発かいはつ背景はいけい概要がいよう NECわざむくい,Vol48 No11/1995
  • SX-4シリーズのハードウェア構成こうせい NECわざむくい,Vol48 No11/1995
  • オペレーティングシステム SUPER-UX NECわざむくい,Vol48 No11/1992
  • SX-4シリーズの言語げんごプロセッサと開発かいはつ支援しえんツール、NECわざむくい,Vol48 No11/1992

脚注きゃくちゅう

編集へんしゅう
  1. ^ 次世代じせだいベクトルがたスーパコンピュータの製品せいひんについて ~世界せかいトップクラスのしょうエネスパコンを目指めざす~
  2. ^ Hisa Ando、2013ねん4がつ26にち、Cool Chips 16 - 分散ぶんさんメモリとなるNECの次世代じせだいベクトルスパコン(後編こうへん) | マイナビニュース 2014ねん2がつ11にち閲覧えつらん
  3. ^ "Packaging technology for the NEC SX-3/SX-X Supercomputer" (doi:10.1109/ECTC.1990.122238) など
  4. ^ Hisa Ando、2013ねん12月12にち、スパコン最大さいだい学会がっかい「SC13」に先端せんたん技術ぎじゅつ (6) SC13 - NECが次世代じせだいベクトルがたスパコン「SX-ACE」を発表はっぴょう | マイナビニュース
  5. ^ http://www.hpcwire.jp/archives/1265
  6. ^ a b NEC、デジタル産業さんぎょう革命かくめい進展しんてん加速かそくさせるしんプラットフォーム「SX-Aurora TSUBASA」を発売はつばい~AI・ビッグデータ解析かいせき領域りょういきへの利用りよう拡大かくだい[1]
  7. ^ 商標しょうひょうである「UNIX」を名乗なのるには、2016ねん現在げんざいThe Open Groupによる認証にんしょう必要ひつようだが、Linuxカーネル使用しようしているおおくのシステムは認証にんしょうけていないことがおおく、(公式こうしきには)「UNIX」ではないことがおおい。
  8. ^ プレスリリース / 自然しぜん科学かがく研究けんきゅう機構きこう かく融合ゆうごう科学かがく研究所けんきゅうじょ”. www.nifs.ac.jp. 2022ねん10がつ10日とおか閲覧えつらん
  9. ^ 日経にっけいクロステック(xTECH). “地球ちきゅうシミュレータだい4世代せだいへ、台風たいふうたまご発見はっけん月間げっかん天気てんき予報よほう視野しや”. 日経にっけいクロステック(xTECH). 2022ねん10がつ10日とおか閲覧えつらん
  10. ^ 管理かんりしゃ (2021ねん4がつ9にち). “サブシステム AOBA-A”. 東北大学とうほくだいがくサイバーサイエンスセンター. 2022ねん10がつ10日とおか閲覧えつらん
  11. ^ 株式会社かぶしきがいしゃインプレス (2022ねん10がつ8にち). “NEC、性能せいのう2.5ばい/電力でんりょく効率こうりつ2ばい達成たっせいしたスパコン「SX-Aurora TSUBASA C401-8」”. PC Watch. 2022ねん10がつ9にち閲覧えつらん
  12. ^ くわしくれば、この時期じき日本にっぽんかくコンピュータメーカーのスーパーコンピュータのアーキテクチャには、種々しゅじゅちがいがある( http://olab.is.s.u-tokyo.ac.jp/~oyanagi/reports/vc-history.txt の、§2.2 などを参照さんしょうのこと)

外部がいぶリンク

編集へんしゅう