3DNow!

3DNow!（據よりどころ說せつ是ぜ“3D No Waiting!”的てき縮寫しゅくしゃ）是ぜ由ゆかりAMD開發かいはつ的てき一いち套SIMD 多た媒體ばいたい指令しれい集しゅう，支持しじ單精度たんせいど浮點數すう的矢まとや量りょう運算うんざん，用よう於增强ぞうきょうx86架か構的電腦でんのう在ざい三维圖像處理上的性能。

历史

1996年ねんIntel首くび先さき推出了りょう支持しじMMX的てきPentium处理器き，极大地ち提ひさげ高だか了りょうCPU处理多た媒体ばいたい数すう据すえ的てき能力のうりょく，被ひ广泛地ち应用于语音合成ごうせい、语音识别、音おと频视频编解かい码、图像处理和わ串くし流りゅう媒体ばいたい等とう领域。但ただし是ぜMMX只ただ支持しじ整数せいすう运算，浮点数すう运算仍然要よう使用しよう传统的てきx87协处理り器き指令しれい。由よし于MMX与あずかx87的てき寄よせ存そん器き相互そうご重じゅう叠，在ざいMMX代だい码中插入そうにゅうx87指令しれい时必须先执行EMMS指令しれい清しん除じょMMX状じょう态，频繁地ち切きり换状态将严重影かげ响性能せいのう。这限制せい了りょうMMX指令しれい在ざい需要じゅよう大量たいりょう浮点运算的てき程ほど序じょ，如三さん维几何なん变换、裁たっ剪和投影とうえい中ちゅう的てき应用。

另一方面ほうめん，由ゆかり于x87古こ怪かい的てき堆うずたか栈式しき暫存器き结构，使つかい得とく硬かた件けん上じょう将はた其流水りゅうすい线化か和わ软件上じょう合理ごうり调度指令しれい都と很困难，这成为提高だかx86架か构浮点てん性能せいのう的てき一いち个瓶颈。

为了解りょうかい决以上じょう这两个问题，AMD公司こうし于1998年ねん推出了りょう包含ほうがん21条じょう指令しれい的てき3DNow!指令しれい集しゅう，并在其K6-2处理器き中ちゅう实现。K6-2是ぜ第だい一个能执行浮点SIMD指令しれい的てきx86处理器き，也是第だい一个支持水平浮点寄存器模型的x86处理器き。借か助じょ3DNow!，K6-2实现了りょうx86处理器き上じょう最さい快かい的てき浮点单元，在ざい每まい个时钟周期き内ない最多さいた可か得え到いた4个单精度せいど浮点数すう结果，是ぜ传统x87协处理り器き的てき4倍ばい。许多游ゆう戏厂商しょう为3DNow!优化了りょう程ほど序じょ，微ほろ软的てきDirectX 7也为3DNow!做了优化，AMD处理器き的てき游ゆう戏性能せいのう第だい一いち次じ超ちょう过Intel，这大大だい提ひさげ升ます了りょうAMD在ざい消けし费者心しん目め中ちゅう的てき地位ちい。K6-2和わ随ずい后きさき的てきK6-III成なり为市场上的てき热门货。

1999年ねん，随ずい着ぎAthlon处理器き的てき推出，AMD为3DNow!增加ぞうか了りょう5条じょう新しん的てき指令しれい，用よう于增强ぞうきょう其在DSP方面ほうめん的てき性能せいのう，它们被ひ称しょう为“扩展3DNow!”（Extended 3DNow!）。

为了对抗3DNow!，Intel公司こうし于1999年ねん推出了りょうSSE指令しれい集しゅう。SSE几乎能のう提供ていきょう3DNow!的てき所有しょゆう功こう能のう，而且能のう在ざい一条指令中处理两倍多的单精度浮点数；同どう时，SSE完全かんぜん支持しじIEEE 754，在ざい处理单精度せいど浮点数すう时可以完全ぜん代替だいたいx87。这迅速そく瓦解がかい了りょう3DNow!的てき优势。

1999年ねん后きさき，随ずい着ぎ主流しゅりゅう操作そうさ系けい统和かず软件都と开始支持しじSSE并为SSE优化，AMD在ざい其2000年ねん发布的てき代だい号ごう为“Thunderbird”的てきAthlon处理器き中ちゅう添加てんか了りょう对SSE的てき完全かんぜん支持しじ（“经典”的てきAthlon或あるK7只ただ支持しじSSE中ちゅう与あずかMMX有ゆう关的部分ぶぶん，AMD称しょう之の为“扩展MMX”即そくExtended MMX）。随ずい后きさき，AMD致力于AMD64架か构的开发；在ざいSIMD指令しれい集しゅう方面ほうめん，AMD跟随Intel，为自己じこ的てき处理器き添加てんかSSE2和わSSE3支持しじ，而不再さい改あらため进3DNow!。

2010年ねん八はち月がつ，AMD宣布せんぷ将はた在ざい新しん一代处理器中取消除了两条数据预取指令之外3DNow!指令しれい的てき支持しじ，并鼓励开发者将しょう3DNow!代だい码重新用しんようSSE实现。

支持しじ检测

支持しじ3DNow!的てきCPU的てきCPUID扩展功こう能のう字じ（EAX=80000001h时执行ぎょうCPUID指令しれい得え到いた的てきEDX的てき内容ないよう）的てき（从低位い到いた高位こうい）第だい31位い为1。支持しじ扩展3DNow!的てきCPU的てきCPUID扩展功こう能のう字じ的てき（从低位い到いた高位こうい）第だい30位い为1。

K6-2至いたりK10之これ间AMD所有しょゆう的てきx86处理器き都と支持しじ3DNow!，包括ほうかつAthlon 64、Opteron和わSempron处理器き；AMD将しょう3DNow!从Ryzen、AMD FX處理しょり器き移うつり除じょ；Cyrix等とう一些其他厂家生产的某些处理器也支持3DNow!；但ただしIntel生せい产的所有しょゆう处理器き都と不ふ支持しじ3DNow!。

执行环境

3DNow!指令しれい的てき执行环境与あずかMMX一いち样，都みやこ是ただし将しょう8个x87寄よせ存そん器きST0～ST7的てき低てい64位い重じゅう命名めいめい为MMX寄よせ存そん器きMM0～MM7，并依平坦へいたん模も式しき进行操作そうさ（即そく指令しれい可か以任意にんい访问这8个寄存そん器き中ちゅう的てき任にん何なん一个而不必使用堆栈）。

由よし于3DNow!使用しよう的てき寄よせ存そん器き与あずかx87寄よせ存そん器き重じゅう叠，任にん务切换时，保存ほぞんx87寄よせ存そん器き状じょう态的同どう时也保存ほぞん了りょう3DNow!的てき状じょう态，所以ゆえん3DNow!不ふ需要じゅよう操作そうさ系けい统的额外支持しじ。只ただ要ようCPU支持しじ3DNow!，含有がんゆう3DNow!代だい码的程ほど序じょ可か以在只ただ考こう虑到x87状じょう态的原はら有ゆう的てき操作そうさ系けい统上不ふ加か修おさむ改あらため地ち运行。

由よし于3DNow!依よ平坦へいたん模も式しき访问寄よせ存そん器き，对3DNow!浮点单元的てき管かん线化变得容易ようい，这也利り于编译器生成せいせい高だか效こう的てき浮点代だい码。

3DNow!指令しれい集しゅう

3DNow!和かず扩展3DNow!的てき26条じょう指令しれい从功能のう上じょう可か以分为以下か五ご类。

单精度せいど浮点运算指令しれい

此类指令しれい的てき操作そうさ数すう均ひとし为64位い，其高32位い和かず低てい32位い分ぶん别是IEEE 754格式かくしき的てき单精度せいど浮点数すう。大だい部分ぶぶん指令しれい一次可接受两个这样的操作数，并得到いた两个单精度せいど浮点数すう的てき结果。它们的てき汇编语言助じょ记符都と以PF开头。

3DNow!还包含有がんゆう计算单精度せいど倒たおせ数すう和わ开方倒たおせ数すう的てき指令しれい，并可以依程ほど序じょ需要じゅよう，得とく到いた12位い精度せいど和わ24位い精度せいど的てき结果。这些指令しれい一次只能处理一个单精度浮点数。

3DNow!的てき一个特色是可以将同一寄存器內的64位い操作そうさ数すう中ちゅう的てき两个单精度せいど浮点数すう相そう加か或ある相乘そうじょう，这在复数运算和わ内ない积运算さん中ちゅう非常ひじょう有用ゆうよう。Intel直ちょく到いた最近さいきん才ざい在ざいSSE3指令しれい集中しゅうちゅう增加ぞうか了りょう这项功こう能のう，称しょう之の为“水平すいへい操作そうさ”。

为了保ほ证与旧きゅう有ゆう操作そうさ系けい统的兼けん容よう性せい，与あずかMMX指令しれい一いち样，3DNow!指令しれい不ふ引发任にん何なに算さん术异常つね。3DNow!指令しれい不ふ会かい生成せいせい也不能ふのう正せい确处理りNaN和わ非ひ规格化か数すう，也不支持しじ指定してい捨入模も式しき。因よし此3DNow!并不是ぜIEEE 754的てき一个完整实现，即そく使し是ぜ只ただ涉わたる及单精度せいど浮点数すう时也不能ふのう完全かんぜん代替だいたいx87。

增强ぞうきょう的てきMMX指令しれい

PAVGUSB用よう于求64位い紧缩字じ节（8×8位い字じ节）的てき平均へいきん值，可用かよう于视频编码中的てき像ぞう素もと平均へいきん和わ图像缩放等とう。可能かのう是ぜ意い识到这个功こう能のう的てき重要じゅうよう性せい，Intel在ざいSSE中ちゅう添加てんか了りょう功こう能のう完全かんぜん相しょう同どう的てきPAVGB指令しれい。

PMULHRW则用来らい补充MMX指令しれいPMULHW的てき不足ふそく，在ざい紧缩字じ（4×16位い字じ）相乘そうじょう时可以得到いた比ひ后きさき者しゃ更さら准じゅん确的结果。Intel直ちょく到いた最近さいきん才ざい在ざいSSSE3中ちゅう增加ぞうか了りょう功こう能のう相似そうじ的てき指令しれいPMULHRSW。

PSWAPD指令しれい用よう于交换紧缩双字じ（2×32位い字じ）中ちゅう两个双そう字数じすう据すえ的てき位置いち。

数かず据すえ类型转换指令しれい

PF2ID、PI2FD等とう4条じょう指令しれい用よう于完成かんせい整数せいすう和わ单精度せいど浮点数すう之の间的相互そうご转换。

数かず据すえ预取指令しれい

PREFETCH/PREFETCHW指令しれい用よう于把将はた要よう使用しよう到いた的てき数すう据すえ从主しゅ記憶きおく體たい提ひさげ前まえ載の入いれ快かい取と中なか，以减少しょう访问主ぬし記憶きおく體たい的てき指令しれい执行时的延のべ迟。Intel在ざいSSE中ちゅう添加てんか了りょう类似的てきPREFETCHTx指令しれい

快速かいそく退出たいしゅつMMX状じょう态指令れい

FEMMS指令しれい与あずかMMX中ちゅう的てきEMMS功こう能のう相しょう同どう，用よう于退出たいしゅつMMX状じょう态。在ざいK6-2和わK6-III处理器き中ちゅう，FEMMS比ひEMMS更さら快かい；在ざいAthlon及更新こうしん的てき处理器き中ちゅう，FEMMS等ひとし同どう于EMMS。

外部がいぶ链接

AMD 3DNow! Instruction Porting Guide（页面存そん档备份，存そん于互联网档案あん馆）
3DNow!™Technology Manual（页面存そん档备份，存そん于互联网档案あん馆）
AMD Extensions to the 3DNow!™ and MMX™ Instruction Sets Manual（页面存そん档备份，存そん于互联网档案あん馆）