(Translated by https://www.hiragana.jp/)
後藤弘茂のWeekly海外ニュース


後藤ごとうひろししげるのWeekly海外かいがいニュース

AMDのつぎのサーバープラットフォーム「Maranello」




●DDR3メモリの成熟せいじゅくわせてプラットフォーム計画けいかく変更へんこう

 AMDは、2010ねんに12コアのハイエンドサーバーけCPU「Magny-Cours(マニクール)」を投入とうにゅうする。Magny-Coursは、AMDが「Direct Connect Module」とぶMCM(Multi-Chip Module)技術ぎじゅつ使つかい、2の6コアCPU「Sao Paulo(サンパウロ)」を1つのパッケージにふうじとめする。Magny-Cours世代せだいからは、CPUソケットも「Socket G34」になり、4リンクのHyperTransport 3.0とネイティブDDR3インターフェイスがサポートされる。

 前回ぜんかいのニュースでつたえたとおり、AMDはサーバーロードマップをおおきく変更へんこうした。Magny-Coursの投入とうにゅうで、AMDが2010ねん予定よていしていた、ネイティブ8コアのサーバーCPU「Sandtiger(サンドタイガー)」は、うしろにずれんだ。Intelと同様どうように、4コアと8コアのあいだにネイティブ6コアCPUをって計画けいかくとなった。

サーバーロードマップ新旧しんきゅうプラン比較ひかく
PDFばんこちら

 Intelの6コアCPU「Dunnington(ダニングトン)」は今年ことし(2008ねん)後半こうはんなので、来年らいねん(2009ねん)後半こうはんのAMDの6コアCPU「Istanbul(イスタンブール)」は1ねんおくれることになる。しかし、日本にっぽんAMDは「Intelの6コアは当初とうしょはMP(Multi-Processor)けだけで、競合きょうごうしない部分ぶぶんおおい」と説明せつめいする。もっとも、Intelは2009ねんまつから2010ねんにかけて、DP(Dual-Processor)以下いか市場いちばにも32nmプロセスの6コア「Westmere(ウエストミア)」を投入とうにゅうするとられている。

 日本にっぽんAMDによると、ネイティブ8コアのSandtigerの計画けいかくはキャンセルになったわけではなく、3ねんのロードマップからはえなくなっただけだという。Sandtigerからは、CPUコアのマイクロアーキテクチャが一新いっしんされ「Bulldozer(ブルドーザ)」コアになる。オリジナルプランのSandtigerは45nm製品せいひんだったが、しんプランでは32nmになるとられる。

 そのため、マイクロアーキテクチャ自体じたいはSao Paulo/Magny-Coursまで、現行げんこうのK10(Barcelona)コアが継承けいしょうされる。ただし、多少たしょう拡張かくちょうおこなわれるほか、Sao Paulo/Magny-Coursではキャッシュスヌープをフィルタする「Probe Filter」が実装じっそうされる。Probe Filterでは、マルチプロセッサシステムで、かくプロセッサのキャッシュのタグ内容ないようをコピーしてつとおもわれる。従来じゅうらいのIntel CPUなどの構成こうせいでは、フィルタはCPUのハブとなるチップセットがわ実装じっそうした。しかし、プロセッサをダイレクトコネクトする場合ばあいには、タグをかくプロセッサにコピーしなければならない。どういった実装じっそうになるのか、まだわからない。

 今回こんかいのロードマップ変更へんこうで、Bulldozerから実装じっそうされるしん命令めいれい拡張かくちょう「SSE5」も2011ねん以降いこうにずれんだ。Intelはどう時期じきのCPU「Sandy Bridge(サンディブリッジ)」に実装じっそうするしん命令めいれい拡張かくちょう「AVX」で256-bitちょうのSIMDをサポートする。AMDが、Bulldozerをおくらせたことで、同様どうよう拡張かくちょう実装じっそうしてるかどうかが注目ちゅうもくされる。

 ただし、日本にっぽんAMDは、今回こんかいのロードマップ変更へんこうは、Bulldozerの開発かいはつ問題もんだいになったわけではなく、DDR3プラットフォームがどの時点じてん成熟せいじゅくするか、その移行いこう時期じき見極みきわめたことによる変更へんこうだという。DDR3のサポートは、オリジナルプランでは2009ねん前半ぜんはん導入どうにゅうする予定よていたった「Montreal(モントリオール)」からだったが、現在げんざいは2010ねん前半ぜんはんのSao PauloとMagny-Coursからとなっている。DDR3プラットフォームを1ねんずらしたことになる。ただし、DRAMベンダーは2009ねん焦点しょうてんわせてDDR3メモリの準備じゅんびすすめている。

Intelとのサーバーロードマップ比較ひかく
PDFばんこちら

●キャンセルとなったG3MXメモリバッファチップ

 サーバーでのDDR3は、メモリ搭載とうさいりょうをいかに確保かくほするかが重要じゅうよう課題かだいとなっている。DDR3では、RDIMMであっても4 Rank DIMMで1チャネル2DIMMまでに制限せいげんされるからだ。1チャネルたりに接続せつぞくできるDIMM枚数まいすう制約せいやくされるため、メモリ搭載とうさいりょう重要じゅうようとなる上位じょういのサーバーではメモリチャネルすうやす必要ひつようがある。また、1個いっこのCPUに搭載とうさいされるCPUコアすうきゅうピッチにえてくため、CPUパフォーマンスの向上こうじょう見合みあった、メモリ帯域たいいき拡張かくちょう要求ようきゅうされている。

 こうした問題もんだいたいするため、AMDは、Montrealで採用さいようする「Socket G3」で、メモリシステムのおおきな変更へんこう予定よていしていた。Socket G3では、ネイティブDDR3とともにメモリバッファ「G3MX(G3 Memory Extender)」をサポートする予定よていだった。

 Socket G3 CPUでは、ネイティブDDR3にはデュアルチャネルインターフェイスだが、G3MXによって4チャネルのメモリサポートが可能かのうとなるとされていた。また、昨秋さくしゅう当時とうじAMDのCTOだったPhil Hester(フィル・へスター)にインタビューしたさいには、かくチャネルに2のG3MXチップを接続せつぞくすることで、最大さいだい8チャネルの構成こうせい可能かのうだと説明せつめいされた。

 だが、AMDはしんロードマップのSocket G34ではG3MXサポートをりやめ、DDR3のみのサポートにえた。G3MXをりやめた理由りゆうについて、日本にっぽんAMDの山野やまの洋幸ひろゆき(マーケティング本部ほんぶプロダクトマーケティング部長ぶちょう)はつぎのように説明せつめいする。

 「G3MXソリューションは、いったんキャンセルした。DDR3になると(チャネルたりのメモリ搭載とうさいりょうに)制約せいやくがあるため、よりおおくのメモリをみたいというニーズがあった。また、よりハイエンドのシステムを構成こうせいをしたいというOEMの要求ようきゅうもあった。そこで、(だい容量ようりょう構成こうせいと)フレキシブルにシステム対応たいおうできるソリューションとしてG3MXを提案ていあんした。

 しかし、ききとりしてみると実際じっさいのデマンドはおおくなかった。いまっているアーキテクチャでカバーできる範囲はんいでDDR3(世代せだい)でも、だいたいのマーケットをカバーできるとかんがえた。たしかに、もっとたくさんのメモリを搭載とうさいしたいという、顧客こきゃくもあるが、そうしたニーズにはサードパーティのソリューションもてくるかもしれない」

 こうした背景はいけいから、AMDは、Socket G3とG3MXをりやめ、Socket G34 CPUではネイティブDDR3インターフェイスにした模様もようだ。Socket G34では、Registered DIMM(RDIMM)とUnbuffered DIMM(UDIMM)の両方りょうほうをサポートする。これは、IntelのNehalem(ネハーレン)と同様どうようだ。

●4チャネルのDDR3インターフェイスを搭載とうさいするSocket G34 CPU

 Socket G34 CPUでは、4チャネルのネイティブDDR3インターフェイスを実装じっそうするとわれている。Socket G3のデュアルチャネルネイティブDDR3くらべると、メモリ帯域たいいき最大さいだいメモリ搭載とうさいりょうは2ばいになる。もともと、Socket G3では、G3MXにはメモリインターフェイスをDDR3の2ばい帯域たいいき稼働かどうさせる仕様しようとなっていた。そのため、スペックじょうのピークメモリ帯域たいいきはネイティブ4チャネルDDR3と、G3MXベースのDDR3でわらないことになる。4チャネルDDR3では、DDR3-800に25.6GB/sec、予定よてい最高さいこう転送てんそうレートであるDDR3-1600に51.2GB/secの広帯域こうたいいきとなる。

AMDのMontrealのG3MXソューション
PDFばんこちら

AMDのSocket G34
PDFばんこちら

 Socket G34では、ネイティブ4チャネルDDR3になったことで、ボードベンダはコストぞうとなるバッファチップを使つかわなくても4チャネルのメモリ帯域たいいきとメモリ容量ようりょうられるようになった。メモリレイテンシのめんでも、バッファチップを使つか場合ばあいより有利ゆうりとなる。

 また、たいIntelでは、ネイティブ3チャネルDDR3となるクアッドコアのNehalem(ネハーレン)にたいして、メモリ帯域たいいきとメモリ容量ようりょう利点りてんつ。Nehalemは、DRAMインターフェイスを統合とうごうし、3チャネルと広帯域こうたいいきのDDR3インターフェイスをそなえることで、浮動ふどう小数点しょうすうてん演算えんざんパフォーマンスを飛躍ひやくさせる。それに対抗たいこうするためには、ネイティブ4チャネルDDR3が必要ひつようだと判断はんだんしたともかんがえられる。

 ちなみに、Intelの8コアサーバーCPU「Nehalem EX(Beckton:ベックトン)」は4チャネルのFB-DIMM2インターフェイスをそなえ、メモリバッファチップでDDR3 RDIMMをサポートする。Nehalem EXにたいしては、メモリバッファチップを使つかわないことで、コストとレイテンシで有利ゆうりにできる可能かのうせいがある。

 しかし、ネイティブDDR3によって犠牲ぎせいになるものもある。メモリソケットの配置はいちのフレキシビリティと、最大さいだい構成こうせいのメモリ容量ようりょうだ。インターフェイスはばが64-bitとひろいネイティブDDR3を4チャネルすことは、配線はいせんじょう非常ひじょうむずかしく、ボードレイアウトも限定げんていされる。Hester説明せつめいしたようなかくチャネルに2のG3MXの構成こうせいでは1 CPUたり最大さいだい16まいのDDR3 DIMMを接続せつぞくできる。Socket G34のネイティブ4チャネルでは、そこまでは実現じつげんできない。ただし、従来じゅうらい同様どうようにサードパーティがメモリバッファを提供ていきょうすることはできる。

●サーバーけチップセットRD890SをSocket G34に導入どうにゅう

 Socket G34プラットフォームには「Maranello(マラネロ)」というコードネームがつけられている。これもF1シリーズで、フェラーリ本社ほんしゃがあるイタリア都市としだ。ちなみにSocket G3プラットフォームは「Piranha(ピラニア)」だった。こちらもF1に由来ゆらいする。

 AMDは、Socket G34プラットフォームをサポートするサーバーけチップセットとして「RD890S」と「RD870S」を投入とうにゅうする。AMDは、OpteronではサーバーけチップセットはNVIDIAとBroadcomにたよっていた。しかし、Socket G34ではふたた自社じしゃチップセットでささえる態勢たいせいもどす。

 RD890Sの特徴とくちょうは、PCI Express Gen 2.0を多数たすうレーンそなえることと、I/O仮想かそう支援しえんハードウェア「IOMMU(I/O Memory Mapped Unit)」をそなえること。また、サーバーけに高度こうどなRASフィーチャもそなえる見込みこみだ。IOMMUではI/Oアドレスが物理ぶつりアドレススペースではなく、仮想かそうアドレススペースベースになる。メモリアドレスマッピングのオーバヘッドをらすために、RD890Sはかなりのりょうのキャッシュメモリも内蔵ないぞうするとわれている。

 RD890SのPCI Express Gen2のレーンすうは42。このほか、サウスブリッジチップとの接続せつぞくもPCI Express x4を使つかっているため、厳密げんみつには46レーンのPCI Expressとなる。

RD890S I/O Hub (North Bridge)
PDFばんこちら

 RD890SのかくPCI Expressレーンは、用途ようと最適さいてきされた5つのPCI Expressインターフェイスコアに分割ぶんかつされている。2つのコアは広帯域こうたいいきのチップ接続せつぞくのために最適さいてきされており、そのほかにちゅうてい帯域たいいきのチップ接続せつぞく最適さいてきされたコアが2つ、サウスブリッジチップ接続せつぞくのために最適さいてきされたコアが1つある。

 広帯域こうたいいきのチップ接続せつぞくのための2つの「GPP0」コアは、それぞれ16レーンと2エンジンをそなえる。そのため、それぞれが1のx16または2のx8の構成こうせい可能かのうだ。つまり、RD890Sでは、2のx16や4のx8、あるいは1のx16と2のx8という、広帯域こうたいいきリンクの構成こうせいることができる。

 ちゅうてい帯域たいいきのチップ接続せつぞくけのコア「GPP1」は6レーンとかずすくないが、6エンジンをそなえる。そのため、6のx1から1のx4と1のx2のわせまで、フレキシブルなインターフェイス構成こうせいることができる。ちゅうてい帯域たいいきのもう1つのコア「GPP2」は、4レーンでエンジンは1つだけ。基本きほんてきには1のx4のためのコアとなっている。サウスブリッジチップようの「NB/SB」コアも基本きほん同様どうようで4レーンに1エンジン。x4リンクでサウスブリッジチップと接続せつぞくする。

 RD890SのPCI Expressの構成こうせいは、従来じゅうらいのノースブリッジチップのPCI Expressインターフェイスと、サウスブリッジチップのPCI Expressインターフェイスの両方りょうほうそなえたものとなっている。AMDチップセットのソリューションでは、PCI Express接続せつぞくはノースブリッジに集中しゅうちゅうさせ、サウスブリッジチップがわ低速ていそくI/Oだけに限定げんていするようだ。プロセス技術ぎじゅつ進歩しんぽによって、それだけのPCI Expressをノースブリッジがわあつめることができるようになった。ちなみに、RD890SはTSMCの65nmプロセスで製造せいぞうされるという。

 Socket G34からは、CPUがわのHyperTransportが4リンクとなる。そのため、4way以上いじょうのマルチプロセッサ構成こうせいのメモリホップすうらすことが可能かのうだ。また、チップセットを多数たすう搭載とうさいした構成こうせい容易よういになる。

RD890Sシステム構成こうせいれい
PDFばんこちら

関連かんれん記事きじ
【5がつ13にち】【後藤ごとう】Intelへの対抗たいこうせまられたAMDのサーバーCPUロードマップ
http://pc.watch.impress.co.jp/docs/2008/0513/kaigai439.htm
【5がつ8にち】AMD、12コアOpteronなどサーバーロードマップを更新こうしん
http://pc.watch.impress.co.jp/docs/2008/0508/amd.htm
【2007ねん12月27にち】【海外かいがい】Bulldozerが後退こうたいしたAMDのロードマップの意味いみ
http://pc.watch.impress.co.jp/docs/2007/1227/kaigai410.htm

バックナンバー

(2008ねん5がつ20日はつか)

[Reported by 後藤ごとう ひろししげる(Hiroshige Goto)]


【PC Watchホームページ】


PC Watch編集へんしゅう pc-watch-info@impress.co.jp 質問しつもんたいして、個別こべつにご回答かいとうはいたしません

Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.