■AMD ATHLON64/FX与Opteron的相关芯片组
从2004年第四季开始,所有AMD架构的芯片组供货商,均转移到支持新一代PCI Express总线规格。目前市场的K8主力芯片组,有NVIDIA的nForce4 SLI、nForce4 Ultra芯片组,ATI的Radeon Xpress200/200P芯片组,均是相当知名且占有率极高的K8 PCI-E芯片组。矽统(SIS)的756与整合型760、761GX芯片组,则在低价市场上有所斩获。
而像威盛(VIA)、宇力(ULi)则是采同时支持PCI Express 16x扩充槽,以及AGP 8x绘图加速端口双图形扩充规格,形成进可攻、退可守的PCI-E 16x+AGP 8x双重规格,在目前AGP 8x转换PCI-E的时期,抢占OEM/SI以及零售通路的玩家升级市场。
于去年(2004年)9月30日发表的威盛K8T890芯片组,由933ball BGA封装的K8T890北桥芯片,可搭539ball BGA的VT8237南桥芯片或VT8251南桥芯片。K8T890支持Socket754单通道架构的ATHLON64、Sempron处理器,以及Socket939、Socket940双通道DDR架构的Athlon64、athlon64X2、Athlon64 FX与Opteron处理器。提供异步总线频率架构(Asynchronous bus architecture),16bit上下传输宽度、800MHz/1GHz双向HyperTransport总线。以及一组PCI-E 16x扩充槽,外拉四组PCI-E 1x扩充槽的能力。
▲威盛K8T890芯片组
与K8T890、PT894、PT894 Pro等北桥芯片搭配的VT8237南桥芯片,可提供六组32bit PCI扩充槽,八个USB 2.0埠,两组ATA133以及两组SerialATA 1X(150KB/s)磁盘端口,提供JBOD磁盘容量合并、RAID 0,RAID 1,RAID 0+1等级的磁盘阵列映像、加速的能力。VT8237内建Vinyl六声道AC''97音效控制器,10/100Mbps以太网络控制器,对外可搭配威盛Vinyl Gold八声道的PCI音效芯片与威盛Velocity Gigabit以太网络控制芯片。
威盛下一代真正支持PCI Express架构的VT8251南桥芯片,额外提供两组PCI-E 1x的扩充槽,并提供两组IDE连接埠、四组具备Advanced Host Controller Interface(AHCI)功能的SerialATAⅡ磁盘控制器,可支持最新一代提供NCQ(Native Command Queue原生磁盘命令序列)的SATAⅡ接口硬盘。VT8251南桥芯片也提供八组USB2.0埠,内进10/100Mbps以太网络控制器,192kHz/24bit取样频率、7.1声道环场音效输出的高传真音效电路。
▲矽统756/966芯片组
矽统科技(SIS)在去年第四季,针对AMD ATHLON64/FX推出支持PCI-E总线架构的SIS756独立型K8 PCI-E芯片组,以及整合型的SIS761GX。SIS756支持Socket940、Socket939以及Socket754架构的Opteron、ATHLON64/FX以及Sempron处理器,预定第四季结束前开始量产供货。而761GX则是整合了矽统Mirage 1图形芯片,支持硬件DirectX7以及软件DirectX9规格,并可外接PCI-E 16x扩充槽。
而所搭配的SIS966、966L南桥芯片,则提供四组PCI-E 1x扩充槽、八组USB2.0端口、两组IDE/PATA磁盘端口与四组SerialATA(SATA)连接埠,并提供JBOD、RAID 0,1,0+1等功能,及新增的192KHz/24bit取样、7.1声道HD Audio音效电路,而966则内建1Gbps Fast Ethernet以太网络控制器,而966L仅内建10/100M以太网络控制器功能。
▲nForce4 SLI芯片组
而nVIDIA也推出针对Socket939架构Athlon64、Athlon64 FX处理器架构开发的nForce4 Ultra、nForce4 SLI单芯片。nForce4 Ultra/SLI支持16位宽度、双向1GHz频率的HyperTransport总线频率,并支持Socket940架构的Opteron,Socket939架构的ATHLON64、ATHLON64 FX以及最新Athlon64X2处理器等。
▲nForce4 SLI单芯片方块图
nForce4 SLI/Ultra单芯片具备20 PCI-E线道(20lanes)的设计,nForce4 Ultra可设计拉出一组PCI-E 16X的PEG插槽搭四组PCI-E 1x扩充槽,更强悍的nForce4 SLI芯片,可设计、对外拉出两组双PCI-E 16x长度的PEG绘图扩充槽,可以搭配两张自家的GeForce6600/6800 GT等级的显示卡,以两组PCI-E 8x频宽模式做SLI平行3D运算,以倍增3D影像运算的效能。
另外,nForce4芯片也内建八组USB 2.0连接埠、四组SerialATAⅡ连接埠,支持300MB/s的传输速率以及AHCI/NCQ控制模式。同时nForce4 Ultra/SLI也内建高达1Gbps Ethernet以太网络控制器,以及ActiveArmor防护等级的硬件防火墙机制加速电路机制的设计。
ATI于2004年11月8日发表内建绘图芯片的RADEON XPRESS 200整合型PCI-E芯片组,与外接PCI-E16x的RADEON XPRESS 200P独立型芯片组。两者均支持Socket 754单通道架构的Athlon64、Sempron处理器,以及Socket 939、Socket 940双通道DDR架构的Athlon64、Athlon64X2、Athlon64 FX与Opteron处理器,并支持800MHz~1GHz双向HyperTransport总线。两者均内建20条PCI-Express线路(Lanes),可提供一组PCI-E 16x的绘图卡扩充埠(4GB/s),以及对外提供四组PCI-E 1x扩充埠。
RADEON XPRESS 200内建真正DirectX 9硬件加速规格的RADEON X300图形处理器核心,333MHz GPU核心频率与内存频率,并支持LFB、LFB+UMA或UMA三种影像内存模式,供OEM/ODM依效能或成本弹性化的设计K8系统平台。
▲ATI RADEON XPRESS 200芯片组
可跟RADEON XPRESS 200、200P北桥芯片搭配的南桥芯片,有ATI自行开发的SB400,以及宇力(Uli)开发的M1573。ATI的SB400芯片,设计上支持PCI-E 4x的南北桥互连频宽(双向2GB/s),提供7组PCI扩充槽、内建SiliconImage(晶像)等级SiI3112A PATA/SATA控制器芯片线路,可支持4组SerialATA埠与2组传统IDE连接埠,并供RAID 0/RAID 1/RAID 0+1等级的磁盘阵列映像能力。并可搭配可信赖运算组织Trust Platform Module(TPM v1.1 & v1.2)规范,支持TPM 1.1或1.2的实时编码芯片。SB400南桥芯片也内建10/100Mbps以太网络控制器,仅提供v2.3,5.1环场音效的AC''97音效控制线路。
部份采ATI芯片组设计的主机板厂商,则倾向选择搭配ULi/ALi(宇力/扬智)的M1573南桥芯片,提供搭配HD Audio的7.1八声道音效芯片的能力,以补足这方面的缺憾。
▲宇力M1695+M1567 TGi芯片组
宇力(ULi)针对AMD K8架构开发的TGi(Tri Graphic interface,TGi)芯片组,为M1695北桥芯片搭配独立提供AGP 8x的M1567南桥芯片组合,可以提供PCI-E、PCI以及AGP 8x三种绘图扩充接口,M1695支持Socket754、Socket939与Socket940的Sempron、Athlon64/Athlon64X2、Opteron处理器,提供一组PCI-E 16x扩充槽以及两组PCI-E 1x扩充槽,或两组PCI-E 16x PEG扩充槽的设计,并且以16bit双向传输、2GB/s的HyperTransport总线跟南桥芯片相连接。
跟M1695北桥芯片搭配的M1567南桥芯片,除了提供一组AGP 8x绘图加速端口控制电路,所支持的USB2.0连接埠数、PCI扩充槽数,以及其它规格未明。预料它会支持7.1声道的HD Audio等级音效控制电路,预定今年下半年可以开始量产供货。
■双核心处理器架构的进一步探索
▲Intel的Pentium XE、Pentium D的硅晶电路
Pentium XE与Pentium D处理器,其实硅芯片的核心均为90纳米制程的Smithfield核心。均采单硅芯片双核心的设计。Pentium XE与Pentium D的差别,在于Pentium XE特别将每个子核心开启HyperThreading(HT超执行绪)功能,而Pentium D并没有。因此插上Pentium XE同时打开HT情况下,操作系统将会认出有四颗逻辑处理器,所以我们可以称Pentium XE为双核四执行绪的处理器。
▲AMD Athlon64x2硅晶电路图
而Pentium D、Athlon64X2在软件的眼光中,跟一般仅提供HT的单核Pentium4 5xx/6xx系列一样,出现两颗逻辑处理器的画面,所以可以称之为双核双执行绪的处理器。
那无论是Pentium XE、Pentium D,或Athlon64X2、Opteron这种双核心的处理器,跟以往已经具备HT超执行绪、可以执行两个执行绪的Pentium4处理器相比,又有何差别呢?
在以往单核、开启超执行绪的Pentium4处理器,即使可以开启、仿真两个逻辑处理器,由于实体处理器只有一组整数、一组浮点运算单元,当两个执行绪同时使用到整数或浮点单元时,很容易因为两个执行绪的指令码,由于互抢有限的硬件执行单元,需要超执行绪电路加以仲裁、等待,造成了执行管线停滞(pipeline stall)的情形。
▲单核超执行绪的Pentium4执行线绪流程,出向互抢执行单元而停滞的情形
当两个程序执行绪的执行环境,转移到真正具备双核心、双执行绪的Opteron、Athlon64X2或Pentium D处理器平台下,同样是开启、仿真两个逻辑处理器,两个执行绪可以分派到不同的处理器核心,由该处理器的整数或浮点运算单元来负责执行,自然不会相互抢夺执行单元而需要排队等待,也不会造成执行管线停滞情形。
▲双核双绪的CPU,两个执行绪各自有独立执行单元
如果在开启了HT超执行绪技术的Pentium XE处理器环境下,此时系统将侦测出多达四组逻辑处理器分身,只要操作系统分配得宜,当分派四个执行绪时,把它们派到不同处理器核心的执行管线,由不同的执行单元去负责,一样具有流畅执行而不造成管线停滞的情况。
▲双核四绪Pentium Extreme Edition 840执行线绪流程
除非有超过两个以上的执行绪,同时抢夺相同的整数或浮点执行单元的资源时,才会有管线暂时停滞的情况。但一般多线绪程序的设计原则,尽量以要分派工作属性、性质不一样的线绪,到不同的逻辑处理器去工作,同时操作系统也会依照处理器的硬件单元的设计,做一些最佳化的分派与调度,一般说会开启到四个执行绪执行,而又让这四个执行绪同时抢资源而停滞的情况并不多见。在大多数情况下,执行越多执行绪,平行处理效能越可以提升。
双核心处理器由于具备有两套完整处理器核心的执行资源,即使执行效能会不会是单核心处理器两倍,但执行效能绝对优于开启HT超执行绪的假双CPU分身。
以英特尔公布的官方效能数据,以单核心、关掉HT(单执行绪)的Pentium4处理器执行效能当作1.0,打开HT的单核心双执行绪的Pentium4处理器,效能提升比大约为1.3,而真正双核心双执行绪的Pentium D处理器,效能提升比1.9X,以1.9/1.3来计算,双核双线绪的Pentium D,差不多是单核开启HT的双绪pentium4处理器效能的1.462倍。
若是执行双核四线绪的Pentium XE处理器,即使未经过软件编译器最佳化的情况下,执行效能也能提升到1.7倍,不过在效能表现上,远不如不如关掉HT、直接以两个核心分配两个执行绪的Pentium D的执行表现;若配合着新版本语言编译器的协助,针对多核心、多线绪的撰写最佳化,只要平衡分派四线绪于双核心Pentium XE处理器,理想的效能提升比例可达2.25,相当于Pentium D效能的1.18倍(2.25/1.9)。
- 第1页:双核心x86处理器的先驱——超微Opteron
- 第2页:AMD ATHLON64/FX与Opteron的相关芯片组