导语:Intel公司是全球最大的半导体芯片制造商,成立于1968年,具有35年产品创新和市场领导的历史。1971年,英特尔推出全球第一个微处理器,2006年推出酷睿(Core)双核处理器,这一举措不仅改变了公司未来,而且对整个工业产生了深远的影响。微处理器所带来的计算机和互联网革命,改变了世界......
目前市场经常见到的酷睿处理器有三类,我们可以在卖场中看到不少柜台有酷睿2 E8400等45纳米工艺制程 酷睿2 系列处理器在销售,我们也可以在很多更多的柜台里看到32纳米工艺制程的SNB架构酷睿i3、酷睿i5,我们更能够在卖场每个角落都咨询到22纳米工艺制程主流IVB第三代酷睿处理器的价格以及产品。其实从2006年的第一代酷睿双核处理器诞生至今酷睿处理器已经更新了“6”代,今天我们对比三代酷睿处理器淡淡Intel近年来的主线产品——酷睿家族。
◇ 回顾酷睿处理器起源
在芯片设计和制造领域中,Intel并非一帆风顺。1994年的时候,Intel曾经因为奔腾芯片浮点运算器问题遭受过市场的质疑。相似的情况又从2004年末开始,相比前一次因为Intel自己身的处理器问题,从2004年开始Intel却是因为自身的傲慢而让另外一家芯片制造商迅速的扩大了市场份额,几乎要打破Intel一直保持的技术神话。2005年英特尔研发投入52亿美元,2006年追加到61亿美元。2006年Intel新品“Core”(扣肉)处理器(E4400、E6320、E6420)诞生标志着Intel真正意义上进入“酷睿”时代。
◇ 熟悉而陌生的“Conroe”
Intel针对桌面、移动和服务器市场的处理器,是基于不同的架构,在2006年,Intel第一次在所有平台上使用了统一的构架,即Core微体系架构,其针对桌面、笔记本和服务器推出的产品代号分别是,Conroe、Merom和Woodcrest,都拥有64位处理能力,并且是双核产品。
由于发音的缘故,中国的许多网友喜欢称Conroe为扣肉,非常亲切的名字。但您知道Conroe、Merom、Woodcrest三个单词究竟是什么意思么?其实这些代表了开发部门所在地的名称,Conroe位于德克萨斯,Woodcrest位于加利福尼亚,而Merom则是以色列一个古老的湖泊的名字,这和之前Intel处理器内部代号的命名方式是相同的。
2Core处理器神话:效能提升40%
◇ Core处理器神话:效能提升40%
如今CPU性能发展步伐没有减慢但在性能上想提升40%并非易事,“Core 2 Duo”处理器诞生时Intel强调其性能相比上代奔腾处理器提升近40%。“Core 2 Duo”沿用了LGA775接口,并且老的芯片组都可以支持该处理器,甚至包括了年代久远的i865。不过“Core 2 Duo”处理器对主板的供电模块提出了新的要求,这使很多老主板无法支持“Core 2 Duo”处理器。更高的主板要求没有给想购买酷睿处理器的用户带来阻力,好在酷睿处理器拥有更低的功耗设计以及更高的性能体现。
“Core 2 Dou”处理器架构图
记得2007年,笔者第一台电脑选用的就是奔腾D双核处理器,奔腾D处理器的高功耗和发热量大让我无奈。当时正是酷睿处理器流行的时候,酷睿处理器定位高端电脑其运行时可以保持在低温度给我留下很深的印象。
Intel Core 2 Duo E4000系列双核心处理器拥有主流特色技术,诸如“Enhanced Halt State (C1E) Technology增强型C1E停顿状态技术”、“Enhanced Intel Speedstep增强型动态节能技术”、“Execute Disable Bit硬件防病毒技术”、“Intel EM64T扩展64-bit内存技术”以及“Intel Thermal Monitor 2过热保护技术”等,均在Core 2 Duo E4000系列双核心处理器的支持范围之内。
◇ 神秘的E6x50
超频潜能是LGA775接口酷睿处理器的杀手锏,让不少玩家爱上DIY专研如何挑战CPU极限。Core 2处理器中曾经拥有神秘的系列:E6x50,该系列处理器维持65纳米制程,型号分别为E6540(2.33 GHz)、E6550(2.33 GHz)、E6750(2.67 GHz)以及E6850(3.0 GHz);工程样本已送到部分传媒手上进行测试。由于倍频下降的关系,有不少玩家反映并批评该系列处理器超频难度增加,对用户造成不便。
从图中我们会发现第一代酷睿 2 Extreme系列顶级产品,该系列CPU用以取代奔4 Extreme Edition及双核版奔腾Extreme Edition,Intel将酷睿顶级处理器发售期计划定在2009年7月29日推出。第一颗Core 2 Extreme型号为X6800,这款酷睿 2 Extreme默认主频采用2.93 GHz设计(1066 MT/s FSB),功耗TDP值为75W至80W,透过SpeedStep技术,它的倍频能任意升降,可以看成是高端超频玩具。
Intel酷睿2 Q6600处理器采用了65纳米制程工艺,Kentsfield核心,主频2.40GHz,外频为266MHz,倍频为9,二级缓存为4MB*2,其前端总线为1066MHz,供电需符合05B标准,支持MMX、SSE、SSE2、SSE3、SSSE3、X86-64等指令集。
Intel 酷睿2 QX6850处理器具备3.0GHz主频和8MB大容量缓存,外频为333MHz,倍频可以在6-9之间调整。产品核心为Kentsfield,制程为65纳米,支持MMX、SSE、SSE2、SSE3、SSSE3以及EM64T,具备VT虚拟技术以及LT硬件保护功能,具备C1E/EIST节电技术。该处理器工作电压为1.3V,可被P965以及P35主板支持。
3Macro-Fusion技术
◇ Macro-Fusion技术
第一代酷睿处理器单位性能相比奔腾单位性能提升40%,Intel酷睿架构为在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,使用这种宏融合(Macro-Fusion)技术后大概每十个指令可以省下来一个,被整合到下一个指令去,从而让处理器在更短的时间内处理更多的指令。此外,Core 2架构拥有4组解码器相比奔腾处理器多出一组解码器,每个内核就可以同时处理更多的指令。
指令融合技术
Intel酷睿处理器改良了算术逻辑单元ALU目的是为了支持宏融合技术。Intel让两个指令所组合的新指令直接被一同执行,或是只执行普通的指令。这些指令融合技术可以显著的帮助增加每一个核心的处理效率,因为融合起来的指令也是另一种型态的指令,通过宏融合技术Intel酷睿处理器处理性能得到了很大提升。
◇ "Core 2 Duo"加入低K栅:
可以进一步降低功耗,优化电源使用,从而为服务器、台式机和笔记本电脑提供个更高的每瓦特性能。新一代处理器在制程技术方面做出优化,采用了先进的65nm应变硅技术、加入低K栅介质及增加金属层,相比上代90nm制程减少漏电达1000倍。
Intel在降低功耗上下足了功夫,抓住了降低每一执行指令所需耗费的能量让“Core 2 Duo”处理器功耗减小这个细节,当然也能够凭借着好的能源管理来助一臂之力,Intel在65奈米制程在晶体管电路的效率上做到了很大的优化,智能降频和休眠晶体管的设计能够让单一晶体管不需完全保持停止,处理器内部电压也可以变化调整。“Core 2 Duo”处理器凭借全新的设计理念以及节能技术让其相比奔腾D处理器在功耗上降低40%,同时在性能上提升40%。
4第二代酷睿"Penryn"工艺大飞跃
◇ 第二代酷睿“Penryn”工艺大飞跃
如果将65纳米的第一代酷睿处理器看成Intel酷睿的“启明星”,那么第二代酷睿处理器将会在第一代酷睿处理器的性能基础上如何发展呢?可以说酷睿E4400让很多用户看到了希望,转眼间到了07年,Intel开始严格遵守“Tick-Tock”研发计划实施,可以说07年Intel酷睿处理器成为市场绝对的主流CPU。笔者也于07年顺利考上大学计划攒机,当时DIY卖场四处悬挂着全新45纳米酷睿处理器的宣传广告。
Intel开始走Tick-Tock
“Wolfdale”是双核“Penryn”处理器的核心代号,“Yorkfield”就是四核处理器的核心代号。“Wolfdale”采用了先进的45nm制造工艺,相比上代65纳米工艺制程的“Core”处理器“Wolfdale”单位面积下可以集成更多的晶体管。
“Penryn”处理器分为2007年发布的双核和四核处理器两种,两种处理器代号分别为:“Wolfdale”和“Yorkfield”采用了相同的处理器内核,“Yorkfield”可以理解为将两个“Wolfdale”一起被封到一个芯片上,例如下图中的Intel酷睿Q6600处理器。我们可以把“Wolfdale”看作是整个“Penryn”家族的基础。
“Wolfdale”的L2缓存也增加至6MB,同时支持1333mhz前端总线,以及虚拟化技术和信任式执行技术等多项Intel处理器技术,当年市场热卖的45纳米双核酷睿处理器有:酷睿E7200、酷睿E7400、酷睿E8200、酷睿E8400。
Intel酷睿QX9650超越65纳米酷睿2 Extreme QX6850,在时钟频率以及前端总线等硬性规格均一致的前提下,仅凭借处理器微架构改良所带来的效能增益仍十分显著,尤亦多媒体编码以及3D游戏应用得增幅最大,多数已经达到近20%的水准,而在最能释放其效能的SSE4多媒体指令集软件应用中,效能增益幅度甚至接近70%。
5高-k金属栅极晶体管技术
◇ 高-k金属栅极晶体管技术
跟上一代“Conroe”处理器的65nm工艺相比,45纳米“Penryn”处理器创新地加入了高-k制程技术,该技术可以将晶体管数量提高近2倍(“Penryn”Intel酷睿2四核处理器将采用8.2亿个晶体管)。借助新发明的高-k金属栅极晶体管技术,这8.2亿个晶体管能够以光速更快高效地进行开关,晶体管切换速度提升了20% 以上,实现了更高的内核速度,并增加了每个时钟周期的指令数。
高-k金属栅极晶体管技术(图片来源于网络)
双核处理器中的硅核尺寸为107平方毫米,比Intel上一代65纳米酷睿处理器硅核面积小了25%,大约仅为普通邮票的四分之一大小,为添加新的特性、实现更高性能提供了更多自由空间。同时,由于减少了漏电流,因而可以降低功耗,同英特尔现有的双核处理器相比,新一代处理器能够以相同甚至更低的功耗运行,如“Penryn”处理器的散热TDP功耗是:40瓦/65瓦/80瓦(双核);50瓦/80瓦/120瓦(四核)。
◇ SSE4指令集
“Wolfdale”与“Conroe”除了制程相异,最大的不同在于加入了SSE4指令集,以增加多媒体影音编码处理能力。此外wolfdale的l2快取也增加至6mb,并支持1333mhz前端总线,以及虚拟化技术(vt)和信任式执行技术(txt)等多项Intel处理器技术。SSE4指令集是非常重要的媒体指令集架构改进之一,除了将延续多年的32位架构升级至64位之外,还加入了图形、视频编码、处理、三维成像及游戏应用等众多指令,使得处理器在音频、图像、数据压缩算法等多方面性能大幅度提升。
6酷睿"Nehalem"智能杰作
◇ 酷睿“Nehalem”智能杰作
Intel在奔腾4时代也使用过“Nehalem”的代号,该代号后来改计划取消。“Nehalem”微架构尽管与“Netburst”架构不是一个时代的产物,但是两者之间有一些共同的技术和特点,例如:两者都支持超线程、高默认主频等。“Nehalem”系列处理器能效比依然比“Penryn”系列处理器要高。
“Nehalem”架构图
“Nehalem”是开启酷睿智能时代大门的钥匙,在制程工艺保持45纳米的情况下,Nehalem新增了超线程技术、SSE4.2、Turbo Boost、QPI快速通道互联(改用QPI/DMI直连式总线)、集成北桥、支持DDR3、支持虚拟化。这些新技术也奠定了智能酷睿的未来。“Nehalem”让Intel再次证明了多核心处理器才是主流产品,打消了人们对四核处理器的怀疑。
用户对Intel Nehalem处理器型号命名感到多少有些新鲜,至于型号中的字面“i”以及数字“7”,Intel从语音学的角度简单解释了一下。Intel称,Core i7的整体发音非常好,听起来也很悦耳,实际上,“i”并不代表什么,“7”也不是什么第七代,其实那只是个数字。从上图中我们可以看到酷睿i7与酷睿i5系列处理器均支持DDR3内存,TDP热功耗均为95W。
酷睿i7-975处理器原生四核心设计、支持超线程技术,该处理器默认主频采用3.30GHz,拥有更优秀超频能力(3.3GHz-3.6GHz智能睿频)。同时,酷睿i7-975依旧是通过QPI直接与内存交换数据,因此CPU内部集成了内存控制器,并支持三通道DDR3内存规格。与此同时,酷睿i7-975还拥有了全新的缓存架构,4个核心除了共享8MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存,另外还为每颗核心配备了与酷睿架构极为类似的64KB L1缓存。
7QPI总线和SMT技术
◇ QPI总线和SMT技术
Nehalem采用了四核八线程的设计,并且有两条QPI链路电路(Quick Path Interconnect),分别与北桥和PCI-E控制器通讯,Nehalem使用的QPI总线是基于数据包传输、高带宽、低延迟的点到点互连技术,速度达到6.4GT/s。每一条连接是20bit位宽的接口,使用高速的差分信号和专用的时钟通道,这些时钟通道具有失效备援。
高速高效的QPI总线
Nehalem的同步多线程采用双路设计,每核心可以同时执行两个线程。这样设计可以减小单线程运行时的数据延迟,SMT可以在多任务的情况下提供显著的性能提升。
◇ 处理器内置图形芯片
“Westmere”图形核心采用了45nm制程工艺,而“Westmere”处理核心采用了32nm制程工艺,因此两者仅是安置在同一基板上,并非真正意义上封装在同一核心内。它可以完成高清视频的流畅解码播放,丰富了多媒体应用。
Intel HD Graphics
◇ Turbo Boost加速技术
Intel智能加速技术是一个英特尔新一代的能效管理方案,与以前一味的降低主频以达到控制能耗的想法不同,Turbo Boost的主旨在于——在不超过总TDP的前提下,尽量挖掘CPU的性能潜力。
Turbo Boost加速技术基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些闲置的核心,供电给剩下运行中核心并提升其运行频率,瞬间提升处理器性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响CPU的热设计功耗情况下,能把核心工作频率调得更高。
8酷睿“Westmere”六核集结号
◇ 酷睿“Westmere”六核集结号
Intel在2010年将推出“Westmere”架构处理器,“Westmere”接替“Nehalem”处理器将采用32纳米的工艺制程,值得用户感到兴奋的是:“Westmere”第一次让酷睿i7处理器迈进原生六核心时代,拥有奢侈的12MB L3缓存、同时加入对多线程技术的支持,这样的话“Westmere”处理器将拥有6核心12线程。
“Westmere”架构图
“Westmere”是45nm工艺“Nehalem”微架构的新工艺升级版,并增加了AES指令集等新特性。“Westmere”家族首批产品在双核心,命名为酷睿i3/i5系列;接下来发布核心代号“Gulftown”原生采用六核心设计属于酷睿i7系列。
Intel提供的数据表明:原生六核心设计的“Gulftown”酷睿i7集成11.7亿个晶体管,不过核心面积为240平方毫米,基本是双核心“Clarkdale”的三倍。
Intel 酷睿i7-980X的核心代号为“Gulftown”,采用32纳米工艺制程,原生拥有6个核心同时支持超线程技术,(可通过超线程技术支持12线程同时工作)。由于基于改进自“Nehalem”的“Westmere”微架构研发。因此,Intel酷睿i7-980X继承了“Nehalem”架构酷睿i7的睿频技术、超线程技术、三通道DDR3内存控制器、以及QPI总线等。
9"SNB"走酷睿整合路线
◇ 酷睿“Sandy Bridge”
2010年Intel迎来CPU“Tock”年,Intel推出代号为“Sandy Bridge”的处理器,该处理器采用32nm工艺制程。“Sandy Bridge”是“Nehalem”接班人。“Sandy Bridge”其L2缓存设计大小仍为512KB,LLC缓存扩容至16MB。而“Sandy Bridge”最主要特点则是加入了AVX(Advanced Vectors Extensions)技术,使用AVX技术进行矩阵计算的时候将比SSE技术快90%。
“SNB”核心架构图
SNB处理器采用32纳米工艺制程,其内部加入全新核芯显卡HD Graphics 2000/Graphics 3000系列核芯显卡,新核芯显卡支持高清播放,具有不错的上网娱乐功能。SNB系列处理器给用户带来了全新的整合处理器,满足了数码达人对视频编译及转码的需求。
Intel在SNB处理器设计上保留了睿频技术以及超线程技术,同时对超频进行了“限制”,喜欢超频的用户可以选择酷睿i5-2500K、酷睿i7-2600K、酷睿i7-2700K三款处理器,且该三款处理器均内置HD Graphics 3000核芯显卡。
Intel酷睿i7-3960X采用SNB-E架构设计,该处理器工艺制程22纳米。它原生六核心支持超线程技术,无倍频锁设计让超频玩家对其进行超频操作。该处理器默认主频为3.30G,开启睿频加速情况下,处理器可以根据程序需求将主频自动提升至3.9GHz。
10新的提升——AVX指令集
◇ 新的提升——AVX指令集
Intel AVX指令集在SIMD计算性能增强的同时也沿用了的MMX/SSE指令集,不过和MMX/SSE的不同点在于增强AVX从指令的格式上就发生了很大的变化。x86(IA-32/Intel 64)架构的基础上增加了prefix(Prefix),所以实现了新的命令,也实现了更加复杂的指令得以实现,从而提升了SNB架构处理器的性能。
AVX指令集
Intel全新的发展战略也表明,从2010年开始软件和新指令也将有更好的兼容,而SIMD浮点运算并非决定因素,所以CPU的性能就变得更加困难。而性能增强的同时,SIMD浮点运算在已有编码的基础上也必须会有更大的提升空间,特别是scalar整数运算部分。
◇ 32纳米工艺制程的核芯显卡
SNB处理器中,图形核心采用了工艺制程更为先进的32nm制程工艺,真正与处理核心整合为一体,这就是核芯显卡。它可提供高效的图形处理性能,并支持显卡切换、DX10、SM4.0、OpenGL2.0、以及全高清Full HD MPEG2/H.264/VC-1格式解码等一系列优势技术。
“SNB”处理器内置的核芯显卡拥有诸多优势技术,可以带来充足的图形处理能力,相较前一代产品其性能的进步十分明显。核芯显卡可支持DX10、SM4.0、OpenGL2.0、以及全高清Full HD MPEG2/H.264/VC-1格式解码等技术,即将加入的性能动态调节更可大幅提升核芯显卡的处理能力,令其完全满足于普通用户的需求。
1122纳米"牵手"3D晶体管
◇ 22纳米“牵手”3D晶体管
2012年4月24日,英特尔在北京天文馆召开第三代智能酷睿处理器“Ivy Bridge”发布会。首批处理器包括两款全新智能酷睿i7处理器、四款酷睿i5处理器。与上一代“Sandy Bridge”相比,“Ivy Bridge”结合了22纳米工艺制程设计与“3-D三栅极”晶体管技术,在大幅度提高晶体管密度的同时,核芯显卡等部分性能甚至有了一倍以上的提升。
“Ivy Bridge”架构图
从微架构上来看,“SNB”酷睿处理器的晶体管数量是9.9亿,“IVB”酷睿处理器的晶体管数量则达到了14亿之多,其中增加的晶体管数量绝大部分被增加到了核芯显卡当中,在前面我们就说过HD4000核芯显卡的渲染单元相比HD3000增加了不少,而HD4000核芯显卡在核心架构方面也领先于HD3000核芯显卡,因此其晶体管数量的增加也就不难令人理解了。
Intel酷睿i7-3770K 四核八线程处理器
Intel酷睿i7-3770K处理器是IVB四核处理器中主频最高的处理器(3.5GHz),其原生四核心设计支持超线程,内置核芯显卡HD Graphics 4000,支持DX11。该处理器采用22纳米工艺制程设计其内部第一次加入3-D 三栅极晶体管,使得酷睿i7-3770K处理器相比以往酷睿处理器拥有更低的漏电率与更高的效能。
12"3-D三栅极"晶体管
◇ “3-D三栅极”晶体管
IVB之前的桌面级处理器所使用的所有半导体晶体管集成电路都是2D的,即半导体晶体只生在平面内,而3D晶体管却生长上3维中,不仅集成度提高,而且可以减少50%以上的漏电流,这样的设计在理论上所有半导体芯片今后可以减少一半的功耗。
3-D晶体管显微图
3-D晶体管代表着从2-D平面晶体管结构的根本性转变。实际上科学家们早就意识到3-D结构对延续摩尔定律的重要意义:因为面对非常小的设备尺寸,物理定律成为晶体管技术进步的障碍。3D的架构则意味着平面到空间的转换,以线动成面、面动成空间的基本常识来说,3-D晶体管可以看做是一种晶体管架构的大幅度进化。
◇ 核芯显卡支持DX11
早在32纳米工艺制程“Sandy Bridge”已经实现了处理器、核芯显卡、视频引擎的单芯片封装过程。其中图形核心拥有最多12个执行单元,支持DX10.1、OpenGL 2.1,性能可达“Westmere”酷睿 i3/i5集显的2倍。在此基础上,22纳米工艺制程“Ivy Bridge”会将执行单元的数量翻一番,达到最多24个,自然会带来性能上的进一步跃进。此前还有消息称,“Ivy Bridge”终于加入对DX11的支持。
Ivy Bridge处理器集成的核心显卡将会进一步调整,比如采用更多的16EU计算单元,性能要比Sandy Bridge处理器集显要好,同时配备蓝光2.0高清硬解、DirectX11、OpenGL 3.1以及OpenCL 1.1等新特性。
【总结】
从Intel官方给出的性能数据来看,由于优化指令集运算、工艺制程大跨越、加入低-k栅极、原生四核心架构四大技术革新让酷睿处理器第一代至第三代平均每代性能综合提升为40%,从第四代酷睿开始至第六代酷睿,高-k栅极、3-D晶体管、22纳米工艺制程、睿频加速技术、加入核芯显卡、支持AVX指令集等让后三代酷睿处理器综合性能保持在15%左右。酷睿IVB处理器较老奔腾处理器性能(综合性能)提升417%。
酷睿处理器经过Intel 六年的不断研发与技术革新,已经让人们对多核心处理器改变了想法,也让人们生活、工作变得更高效。酷睿处理器的设计理念就是尽最大可能挖掘性能,让处理器研发始终保持“Tick-Tock”节奏。每代酷睿处理器都有很大的性能提升,每两代酷睿处理器功耗设计也都有明显降低。如今,酷睿处理器已经发展到22纳米工艺制程融合时代,未来酷睿处理器将会沿着智能路线继续发展下去。
推荐经销商