热点推荐
ZOL首页 > CPU频道 > CPU新闻 > 业界评论 > 轰鸣声渐渐接近 AMD推土机亮相前探秘

轰鸣声渐渐接近 AMD推土机亮相前探秘


CBSi中国·ZOL 作者:中关村在线 郑成龙 责任编辑:刘搏 【原创】 2011年04月15日 06:31 评论
产品:FX 8130P AMD CPU 回到顶部阅读

推土机架构-AMD翻身的救命稻草

    自从推土机架构计划被AMD提上日程之后,关于这款连纸面都没有发布架构的留言就没有停止过。随着时间的推移,推土机架构跳票的次数也越来越多。其传言也因跳票而越来越多。近期,更有媒体爆料推土机架构将在6月7日正式发布。虽然这则消息目前真假我们还难以判断,但可以肯定的是,距离推土机架构发布的日子已经越来越近了。在推土机即将发布之前,我们将已知的关于推土机架构处理器的资料进行汇总,算作是对该架构发布前最后的憧憬吧。


    最近关于推土机架构发布的传言不断,在发布这些消息的IT媒体中更有甚者给出了最为详尽的发布日期,6月7日发布。推土机架构也再一次成为了硬件爱好者们谈论的对象。也难怪,这一在07年年中就已经被AMD确认的新一代架构,在经过了4年漫长等待之后依然不见踪影。而竞争对手在这四年之中厚积薄发,相继推出了三代工艺架构产品。AMD在K8架构时代所积攒的下来的“家底儿”也随着推土机的持久不能发布而“赔光”。也许是不想再看到一家独大的时代再次来临,所以推土机架构被广大的硬件爱好者视作AMD打翻身仗的“救命稻草”。而推土机能够成为近期芯片领域的焦点新闻也就不足为奇了。


轰鸣声渐渐接近 AMD推土机亮相前探秘
ATI-Forum的报道给出了详细时间6月7日Computex发布

    为何推土机被人们视作AMD打翻身仗的救命稻草呢?其实从AMD的产品线中我们就可以看出所以然。从Intel发布45nm酷睿架构处理器之后,AMD的高端产品就一步一步的被对手所蚕食。在Nehalem架构处理器推出之后,AMD更是退出了2000元以上高端产品的竞争,即便是最高端的六核处理器也仅能够稳定在1500元左右。这让以性能为主要竞争对象的芯片厂商很是难堪,即便是依靠低廉价格赚取了大众的广泛支持。

轰鸣声渐渐接近 AMD推土机亮相前探秘
以现在的工艺还无法让APU实现更高的性能

    也许有人又要问了,AMD不是还有一个Llano A系高性能APU吗,有他做后盾还怕比不过Intel吗?其实您这样的话并没有错,Llano A系高性能APU确实也是AMD坚实的后盾,但也仅仅是后盾而已。由于工艺问题,融合了GPU功能的APU性能还无法与竞争对手的主力产品抗衡。作为大众化产品还是值得肯定的。但是如果要拿到高性能领域去竞争的话,APU显然不是一个明智的选择。而推土机架构作为高性能设计的代表被AMD寄予厚望,用它来与Intel的高端处理器进行竞争才是最为明确之举。

轰鸣声渐渐接近 AMD推土机亮相前探秘
更多的核心,更高的主频以及更为合理的架构是推土机高性能的三板斧

    推土机架构是凭借什么样的本领被人们所关注的呢?简单的核心堆砌?更先进的制程提升?再或者是数以亿计的晶体管叠加?其实直至今日AMD都没有给出一个关于推土机架构的详细官方资料。今天我们将对目前已知的信息对这款AMD即将发布的神秘架构进行一次探索。

产品:FX 8130P AMD CPU 回到顶部阅读

模块化8核心设计树立AMD的里程碑

    想必推土机架构最值得关心的就要数核心数量了。没错,在进入多核处理器时代之后,核心数量基本上就代表了处理器的性能高低。虽然这样的评价并不准确,但至少可以通过核心数量的情况来掌握推土机架构的部分细节及市场定位。那么桌面级推土机架构会是几个核心呢?现有的资料告诉我们是8核。


轰鸣声渐渐接近 AMD推土机亮相前探秘
推土机架构采用的是原生4模块8核心设计

    不过需要向您指出的是,并不是所有的推土机架构处理器都会采用8核心设计。据AMD的内部文档显示。首批发布的推土机架构处理器将一共有8款。其中包括四款四模块8核心的FX8000系列、两款三模块6核心的FX-6000系列、两款双模块4核心的FX-4000系列,其中四款会在第二季度首发,另外四款则要到年底第四季度才会到来。目前我们不了解的是,非8核心的推土机架构处理器是否是采用原生数量核心,倘若再与当前的K10架构一样是通过屏蔽部分模块来实现6核心或者是4核心而来的话,推土机架构很有可能还会继续开核的历史。如果这是真的,那么新架构竞争时代可就好玩了。

轰鸣声渐渐接近 AMD推土机亮相前探秘
8核心推土机架构与8核心SNB架构处理器核心对比

    说道了推土机的核心,就必须要聊一聊推土机的模块化设计。上幅图为推土机架构处理器核心照片与Sandy Bridge脚骨处理器核心照片对比。两者均为8核心处理器,其中左侧的为推土机脚骨。通过对比可以发现,推土机架构的核心面积要比Sandy Bridge架构核心面积小了一些。这主要是Sandy Bridge架构采用了相同核心叠加的策略来实现多核心架构。而推土机则使用了模块化内不同双核心,然后将模块翻倍实现多核心的目的。说的简单一些,就是推土机架构是将两个不同的核心捆绑,然后进行翻倍的。所以单位面积的提升也就不同于Sandy Bridge架构了。当然,Sandy Bridge架构的大容量缓存和GPU也需要占用一部分晶体管,单位面积大一些也就不足为奇了。

轰鸣声渐渐接近 AMD推土机亮相前探秘
推土机架构的核心模块

    好了,我们来详细介绍一些推土机架构的模块化设计。推土机架构之所以备受瞩目还有另外一个特点,那就是采用了名为Bulldozer的模块化设计。推土机架构的每一个模块中有2个整数运算的内核,每个内核有4个整数运算通道。4个通道内,2个ALU和AGU为一组,而现在AMD的架构是3个ALU和AGU为一组,最大能实现3个x86整数运算命令。Bulldozer模块的指令获取和解码,每个周期可处理4条指令,而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令(uOPs),整数运算管道中ALU和AGU则两两成对,正好吻合。这样的设计据AMD官方资料说将比现有架构更有效率。性能更可以提升50%以上。

产品:FX 8130P AMD CPU 回到顶部阅读

支持新指令集改进浮点运算技术

    我们暂且不说AMD官方资料的真实性,就单论模块化设计而言,推土机架构确实已经有了里程碑似的意义。当然除了这些新的设计之外。指令集的添加也是不可或缺的。要知道Intel新推出的Sandy Bridge架构在添加了新指令集之后。其游戏和多媒体性能得到了倍增。仅凭架构上的改变推土机架构显然还不足以与竞争对手对抗。那么他都加入了哪些指令集呢?


轰鸣声渐渐接近 AMD推土机亮相前探秘
Snady Bridge架构中的AVX指令集也被推土机所使用了

    推土机架构加入支持的指令集有,SSSE3、SSE 4.1/4.2、AVX、AES、FMA4、XOP、PCLMULQDQ等等,其中最关键的就是AVX。

    AVX指令集在Sandy Bridge架构中我们已经进行过反复介绍了。但作为一款新产品,笔者认为还是有必要在这里介绍一些AVX指令集的。AVX,即Advanced Vector Extensions高级矢量扩展指令。AVX的特点由以下几个方面展现:

  >>从128bit扩展到256bit的SIMD运算单元;
  >>增强的数据重排,单个操作可同时处理8个32-bit共256bit数据
  >>单条指令支持3操作数和4操作数
  >>支持弹性的访存地址不对齐   
  >>AVX指令支持VEX前缀

    AVX指令集可以执行256位浮点指令,但需要澄清的是,并没有什么所谓的“256位命令”。单精度命令都是32位的,双精度则是64位。使用今天标准的128位浮点单元,可以在一个时钟周期内并行执行四个单精度命令或者两个双精度命令。有了AVX效率就可以翻一番,亦即每时钟周期内执行八个32位单精度命令,或者两个64位双精度命令。AVX指令集的加入目的非常明确,就是为了提高处理器的浮点运算能力。当然为了配合这一指令集,推土机架构也进行了一些相关的改进。

轰鸣声渐渐接近 AMD推土机亮相前探秘
Bulldozer单元内部运算原理

  在浮点运算单元方面,推土机架构准备了两个整合的128bit SIMD单元,这将兼容Intel的256bit AVX指令集,AVX将在这两个128bit SIMD单元中执行。AMD已经确定改变了原有在Bulldozer上的SSE5计划,将支持英特尔的256bit的SIMD指令集AVX。而对于浮点运算单元来说,每个时钟循环中都可以在两个处理器核心之间单独或共享使用。

轰鸣声渐渐接近 AMD推土机亮相前探秘
推土机架构改进了其FPU(浮点单元)

    除了通过指令集来提升浮点运算性能外,推土机架构还改进了其FPU(浮点单元),将其升级为了Flex FP。据AMD官方表示,每个Flex FP均拥有自己的调度器,并不依赖整数调度器来调度FP指令,或者会使用整数资源来调度256-bit执行。这将有助于确保FP单元在浮点指令发生时保持完整。Flex FP的最大优势在于其单个256-bit FPU可被2个整数核心共享。每一个循环任何一个核心将可以通过2条128-bit指令或者一条256-bit指令运行256 bits并行数据,或者每个整数核心能够同时执行128-bit指令。

产品:FX 8130P AMD CPU 回到顶部阅读

32nm工艺动态加速2.0助力推土机

    说过了推土机架构和指令集上的特点,我们在来说一个用户在使用中能够直接感受到的技术。Turbo Core动态加速技术。在推土机架构上这一技术已经升级到了2.0版本。为什么会叫做2.0版本呢?其实答案很简单,因为在之前的K10架构羿龙II X6处理器中已经开始了这项技术的应用。但由于K10架构并不是原生采用这项新技术的产品。所以K10架构在Turbo Core技术的支持上还存在不少的问题。而作为原生支持Turbo Core 2.0技术的产品,推土机架构将直接与Intel的睿频加速2.0技术抗衡。


轰鸣声渐渐接近 AMD推土机亮相前探秘
第一代Turbo Core技术解析

    第二代Turbo Core技术能够更好地挖掘热设计功耗允许空间,通过监视处理器功耗来自动调整频率,最高可以达到热设计功耗指标,而且会在过于接近时再次自动降频,从而在功耗允许的情况下最大程度地提高频率。在所有核心开启的情况下,推土机处理器的Turbo Core最大加速幅度就能达到500MHz。如果按照AMD官方数据推断的话,那么8核心的推土机架构也将会有全部核心500MHz的主频提升。倘若属实的话笔者推论要么推土机架构的默认频率很低,要么就是功耗特别大。如此之大的全部核心自动超频很难让人信服。需要指出的是,推土机处理器发布后将全部标注两个频率,一是原始基准频率,二是Turbo Core加速最高频率。

轰鸣声渐渐接近 AMD推土机亮相前探秘
32nm SOI工艺测试晶圆

    就处理器的升级能力而言,AMD并不比Intel弱。然而在生产环节上AMD则技不如人了。毕竟现在AMD是一家纯粹的芯片设计公司,自从生产工厂剥离出去之后,生产工艺的掌控就全部交由代工工厂来决定了。虽然有IBM这样的巨头支持,但毕竟技术还是原生的好。好在AMD所用的代工工厂GlobalFoundries实力也不弱,目前已经完成了32nm工艺的升级,接下来就剩下制造这一个环节了。据笔者了解,推土机架构将使用32nm SOI高K金属栅极(HKMG)工艺,11个铜金属层和低K电介质、基于硅锗的拉伸硅、第二代沉浸式光刻技术。从AMD的内部文档来看,推土机架构的每一个模块将由2.13亿个晶体管构成,如果算上四个模块的话将会达到8.52亿个晶体管。再加上北桥和三级缓存等模块所占资源的话,推土机架构的晶体管数量将会超过10亿个。这一数字与当前Intel最高端酷睿i7六核处理器的晶体管数量大体相同。

轰鸣声渐渐接近 AMD推土机亮相前探秘
推土机架构各个模块布局

    也许是之前的K10架构产品吃了缓存方面的亏,推土机架构深刻意识到了缓存的重要性。8核心推土机架构处理器的二级缓存容量高达8MB(每一个模块拥有2MB二级缓存),三级缓存容量也被提升至了8MB,总计高达16MB。即便是首批上市的最低端四核型号二级/三级缓存总容量也在12MB。可见AMD已经在缓存容量不足上吃亏吃怕了。推土机架构可以算作是AMD版的亡羊补牢。

产品:FX 8130P AMD CPU 回到顶部阅读

即将发布的推土机架构型号有哪些

    说到这里,想必您对推土机架构已经有一个初步的了解了。遗憾的是,AMD官方目前给出的关于推土机架构的技术文档并不多。笔者搜罗了近期的各大媒体资料也仅整理出来了这些。关于更为深度的技术消息,我们恐怕也只有在推土机正式上市之后才能了解到了。不过关于推土机架构上市产品的型号和大概参数AMD倒是给出了具体消息。

     推土机家族的桌面版本“赞比西河”(Zambezi)将分为三个子系列,分别是八核心的FX-8000、六核心的FX-6000、四核心的FX-4000。首发型号四款,包括两款八核心、一款六核心和一款四核心;到年底的时候还会追加另外四款,主要是频率上的提升。


轰鸣声渐渐接近 AMD推土机亮相前探秘
推土机架构产品将采用全新设计包装

赞比西河都采用GlobalFoundries 32nm SOI工艺制造,Socket AM3+封装接口,首批四款都支持Turbo Core动态加速,而且全部属于Black Edition黑盒版,开放超频,内存支持均为双通道DDR3,频率最高达到了1866MHz。

最高端的是“FX-8130P”,四模块八核心,二级缓存8MB(每模块2MB),三级缓存最大8MB,热设计功耗125W;之下是同样八核心的“FX-8110”,应该是频率略有降低,热设计功耗也降至95W,其他相同。

六核心是“FX-6110”,三模块,二级缓存相应地减至6MB,四核心则是“FX-4110”,双模块,二级缓存4MB,热设计功耗都是95W。

具体的原始频率都不清楚,估计最高应该在3.5GHz左右,再配合Turbo Core动态加速突破4GHz不成问题。


型号

FX-8130P FX-8110 FX-6110 FX-4110
核心 8 8 6 4
二级缓存 8MB 8MB 6MB 4MB
三级缓存 最大8MB 最大8MB 最大8MB 最大8MB
热设计功耗 125W 95W 95W 95W
DDR3内存频率 1866MHz 1866MHz 1866MHz 1866MHz
黑盒版
Turbo Core加速 支持 支持 支持 支持
封装接口 AM3+ AM3+ AM3+ AM3+
制造工艺 32nm SOI 32nm SOI 32nm SOI

32nm SOI

特别值得注意的是,推土机家族将不再使用羿龙(Phenom)、速龙(Athlon)等产品品牌,而是简单地称之为FX系列,配合Fusion APU融合处理器的A/C/E/G系列。AMD意在通过此举淡化产品品牌,而强调公司品牌AMD和平台品牌VISION。

赞比西河处理器定位于整机价格700美元以上市场,竞争对手直指Sandy Bridge架构的Core i7-2600、Core i5-2500系列,不过到年底的时候Intel又会拿出发烧级平台Sandy Bridge E,不知道AMD届时如何应付,仅仅是提升频率还是继续避其锋芒?

根据AMD的产品转换计划,到今年年底的时候,推土机架构型号再桌面处理器总出货量中的比例将达到大约10%。

    注:斜体部分文字引自驱动之家

产品:FX 8130P AMD CPU 回到顶部阅读

挡在推土机面前的困难有多少

    虽然推土机架构从计划提出至今遇到了重重困难,也跳票了多次,但这并不妨碍他将成为AMD的翻身大作。当然在实力得到检验前我们都可以这样认为。倘若推土机架构真的一夜成名的话,那么对AMD来讲就不仅仅是设计上的里程碑意义了,更是让他重返高端市场与Intel展开厮杀的利剑。不过关于推土机架构处理器的市场前景笔者认为主要有以下几点需要考虑。


轰鸣声渐渐接近 AMD推土机亮相前探秘  轰鸣声渐渐接近 AMD推土机亮相前探秘
ZOL网友曝光的推土机架构处理器实物

其一:推土机架构的性能

    市场前景好不好,性能是最重要的因素,即便是价格高到令人震惊,但只要性能表现无敌,一切竞争对手都是浮云。想必这一点AMD自己是非常了解的。毕竟999美元一颗的旗舰级处理器购买者还是一抓一大把的。虽然目前关于推土机架构的传言不断,并且都宣扬推土机强于酷睿i7多少多少,但有实力的第三方测试数据到至今位置也没有见到。不是笔者给AMD泼冷水,因为在这之前AMD的处理器确实出现过自称性能极强,而上市却令人大跌眼镜的情况。所以推土机市场前景如何,还是要靠实力说话的,否则的话就只能靠价格战来打拼了,想必这是AMD不愿意看到的。不过就目前的技术分析来看,推土机应该不会令人失望。

其二:竞争对手的表现

    推土机就要来了,Intel肯定不会坐以待毙的,必定会推出各种的政策来应对推土机的到来。基本上可以认定的Intel对策有两种,第一种是提前打响价格战,使用价格与市场普及优势来争夺更多的消费者。这一点已经得到了市场的验证,目前Intel的SNB架构和LGA1366平台价格都已经出现了大幅下跌。另外一个对策就是推出新的高性能产品来应对推土机架构的挑战。当然了,这有一个前提,就是推土机架构性能表现必须超过Intel的现有产品,否则的话Intel是不愿意提前将自己的杀手锏拿出来亮相的。

其三:自身定价如何   

    其实最后一项因素的影响力主要看前边两项的表现,倘若推土机性能发挥优秀的话,那么定价就已经不再是问题。如果推土机能与Intel的SNB打平的话,那么适当的调低价格可以吸引更多的消费者。但如果推土机的性能不幸落后于SNB的话,那么价格也就成为AMD抢夺市场的唯一办法了。

写在最后

    作为AMD打好翻身战的一张王牌,推土机架构肩负了非常重要的使命。但竞争对手的实力仍然不可小嘘。毕竟在长达数年的时间里Intel一直把控着大部分的市场份额。这一点也是AMD自身实力不济造成的。如今眼看一员新的猛将杀来,Intel肯定不会坐以待毙,一场血的较量即将拉开序幕。作为消费者的我们,谨希望AMD的这员猛将能够斩断Intel的垄断之手,让广大的普通消费者受益。

查看本文作者 郑成龙 的其他文章>>
相关搜索:AMD 
给文章打分 5分为满分(共0人参与) 查看排行>>
频道热词:AMD  散热器  intel  
视觉焦点
AMD FX-8130P
  • 商家报价:
  • 厂商品牌:AMD
  • ZOL评分:0
  • 网友口碑:0
  • 查看详细>>
CPU新闻热点
排行 文章标题
TOP10周热门CPU排行榜
  • 热门
  • 新品
查看完整榜单>>