热点推荐

AMD Opteron处理器 架构完全剖析

http://www.hothardware.com/ 03年04月28日 【编译】 作者: 炼金术士 [评论36]

   多处理器的圣地

   鉴于K7是AMD在桌面领域的旗舰级处理器,K8则带有优秀的企业级处理器的传奇色彩。基于这种思想,似乎K8核心非常适合多处理器的环境。

    为了更好地理解K8(和Opteron)是怎么样完美地运行在MP的环境,你需要理解传统处理器架构的限制。Athlon MP 废除了传统MP Intel 架构的限制--共享FSB。无论你具有1,2或者4个处理器,它们都共享相同的64-bit宽FSB 连接到CPU ,其余的则保留给系统使用。这里,瓶颈就出来了,你采用越多的处理器,每个处理器所分得的FSB带宽就越少。

    AMD 的Athlon MP 则没有了这个限制,它给每个CPU连接到北桥的独立64-bit宽,它是首个使用点到点FSB协议的x86处理器。AMD的方案比Intel的具有更加优秀的性能,但你需要更多的花费; 另外760MP芯片的花费相当昂贵,并且仅支持2-way配置。AMD从来都没有生产过4-way的Athlon MP 芯片,因为市场需求潜力不大。

    在K8里,AMD引进了更多先进的功能,并且提供比MP更高性能的解决方案,更具吸引力的是,它的价格将更加低。AMD 在这里倡导的技术称为Hyper Transport。Hyper Transport 是串行的点到点总线,AMD使用该总线桥接所有的I/O控制器到AGP/PCI,当然还有CPU。

    Opteron具有3个16-bit宽的HT连接功能,每个方向的连接提供多达3.2GB/s的带宽(每个连接总共提供6.4GB/s的带宽)。每个Opteron CPU能够使用3个连接中的2个连接到其它Opteron CPU,第3个连接则用来与其它I/O芯片的连接。

Opteron 的多处理器处理能力


2-way

4-way

8-way

    每个CPU有独立内存控制器所带来的影响是,内存带宽会随着CPU数量的变化而动态地调整。反之,传统MP架构的CPU会如它们在FSB总线般,分享内存的带宽;而Opteron,每个CPU都有专注的128-bit DDR 内存带宽。在多处理器系统,每个CPU都使用自己的内存控制器吞吐数据,因此能够极至地提升内存带宽的效率。例如,Opteron目前支持最大DDR333 SDRAM内存,能够获得最高5.3GB/s的峰值带宽。CPU能够以n-way 3.2GB/s的速度和其它内存控制器进行数据交换,所以HT 连接能够在不同的CPU间获得最大的传输效率。

    为了能够完全释放出Opteron MP 巨量的内存吞吐优势,必须使用强大的操作系统来适当地支配内存。操作系统应该能够把数据存储在内存里,并且根据本地和非本地的内存访问来对它进行优化。例如,在一个4-way的Opteron服务器里,每个CPU装配1GB内存,如果它处理的数据量为512MB,那么它将不会只在单一的CUP和内存 里处理数据----而是4个CPU都分别这个数据。它的数据也将被复制到4部分内存,或者数据被平分到所有的CPU,CPU因此就能够以全速5.3GB/s的速率处理数据。这种类型的内存访问称之为NUMA,它的意思是:非统一内存访问机制;Windows 2003 Server 支持NUMA。

    K8核心(Opteron)的处理器能够随着系统CPU数量的增长而达到性能的最优化,这点它比Intel的处理器要优秀很多。

 

   在使用双CPU之后,Xeon仅获得了11%的性能增长,而Opteron的性能获得了惊人的24%增长。看来AMD对Opteron的多处理环境进行了严肃的设计。我们想,在4-way系统应该有更加理想的性能。

   K8架构另外一件有趣的事情是它的多芯设计。AMD的韦伯(Fred)向我们提到了逻辑的多芯设计,单核心Opteron处理器已经被证实了会有这个机制,但是目前还不可用。其实这个处理过程是相当简单的;AMD生产2个Opteron核心,然后把Hyper Transport 连接给移除,最后把它们组件为单一的核心。 根据韦伯的说法,AMD能够根据它们的需要轻易地可以实现这个功能,但是采用多芯机制之后,要再使它们的核心面积保持在120平方毫米是相当高难度的。所以要使双Opteron核心的面积保持在120平方毫米之下,AMD必须使用65纳米制程。

价格及相关信息不准请拨打 ZOL(7 X 8)小时免费投诉电话:400-678-0068-6 免费拨打ZOL客务电话
文章评论
笔记本,台式机 拨打800-858-2339,为您量身打造!