前言
2006年7月份,英特尔终于在万众期待下发布了其新一代Core微体系架构桌面处理器——Conroe。Core微体系架构彻底抛弃了使用多年的NetBurst微架构,执行效率更高,而功耗却大幅降低。其实,作为半导体业界领袖的英特尔,在38年(英特尔创立于1968 年)的公司历程中曾生产出无数的经典产品,今天笔者就给大家介绍和回顾一下英特尔最具代表性的处理器。
CPU的发展可谓翻天覆地,从单核心过度到双核心
CPU发展的速度
在过去的时间里,处理器发展的脚步跑相当快!从1977年英特尔的第一颗处理器——4044首次登台露面,它由2300个晶体管构成;今天英特尔的Pentium Extreme Edition 840处理器,晶体管数量已经增加至230,000,000个!足足增加了100,000倍!
CPU发展过程中的变革
2006年,英特尔的LGA775平台已经成为市场主流;双核心也加入了CPU这个大家庭。无疑,大家手中的CPU越来越“快”了。本次,我们比较了从CPU诞生到现今CPU,从Sokect 370到LGA775,时钟频率从1MHz出头到现在最高的3.8GHz!
介绍完了一些CPU发展的背景知识,现在就带大家去看看CPU是怎样从无到有,并且一步步发展起来的。根据网络的记忆,笔者把它分为了几个发展阶段。注意,这并非按照教科书去划分,而是根据我们的记忆。
微处理器发展的初级阶段
CPU发展的初级阶段
1971年1月,英特尔公司的霍夫(Marcian E.Hoff)研制成功4位微处理器芯片Intel 4004,标志着第一代微处理器问世,微处理器和微机时代从此开始。正因为发明了微处理器,霍夫被英国《经济学家》杂志列为“二战以来最有影响力的7位科学家”之一。
4004当时只有2300个晶体管,是个四位系统,时钟频率仅为108KHz,每秒执行6万条指令(0.06 MIPs)。功能比较弱,而且计算速度较慢,只能用在Busicom计算器上。
1972年4月,霍夫等人开发出第一个8位微处理器英特尔8008。由于8008采用的是P沟道MOS微处理器,因此仍属第一代微处理器。
1976年,Intel 发布8085处理器
1973年8月,霍夫等人研制出八位微处理器英特尔8080,以N沟道MOS电路取代了P沟道,新一代微处理器就此诞生。主频2MHz的8080处理器运算速度比8008快10倍,可存取64KB存储器,使用了6微米技术,共有6000个晶体管,处理速度为0.64MIPS。
摩尔预言:“晶体管的密度每过18个月就会翻一番,但价格却下降一半”这就是著名的摩尔定律。
第三代微处理器代表产品
1978年6月,英特尔推出4.77MHz的8086处理器,标志着第三代微处理器问世。它采用16位寄存器、16位数据总线和29000个3微米技术的晶体管,售价高达360美元。不过当时由于360美元过于昂贵,大部分人都没有足够的钱购买使用此芯片的电脑,于是英特尔在1年之后,推出4.77MHz的8位微处理器8088。IBM公司1981年生产的第一台电脑就是使用的这种芯片。这也标志着x86架构和IBM PC兼容电脑的产生。
发布的时候,8086的时钟频率有4.77MHz,8MHz和10MHz三个版本,包括了具有300个操作的指令集。其中8MHz版本包含了大约28,000个晶体管,具备0.8MIPs的能力。
1979年6月1日,英特尔推出4.77MHz的准16位微处理器8088,它是8086的廉价版本,价格为大众所接受。在性能方面,它在内部以16位运行,但支持8位数据总线,采用现有的8位设备控制芯片,包含29000个3微米技术的晶体管,可访问1MB内存地址,速度为0.33MIPS。
1981年:80186和80188发布。这两款微处理器内部均以16位工作,在外部输入输出上80186采用16位,而80188和8088一样均是采用8位工作。这是一颗性能介于8088,80286之间的的CPU。但事实上80186从来都没有在PC中应用,它仅仅存在于一个小范围的圈子中,作为一个小型的控制器出现。
1982年2月1日:在80186发布后的几周,80286就发布了。80286处理器集成了大约13.4万个晶体管,最大主频为20MHz,采用16位资料总线和24位位址总线。与8086相比,80186/80188增强了部分软硬件功能 80286增加了实存(24位地址)和虚拟存储器管理,可以在两种不同的模式下工作,一种叫实模式,另一种叫保护方式。80286开始正式采用一种被称为PGA的正方形包装。
具有异常处理机制;虚拟86模式可以同时模拟多个8086处理器来加强多任务处理能力。80386的广泛应用,将PC机从16位时代带入了32位时代。此外它还具有比80286更多的指令集。发布时,80386的最快速版本的主频为20MHz,具备6.0MIPs,包含275,000个晶体管。
1988年6月16日:80386SX发布,它是80386DX的廉价版本,只有16-bit总线宽度。
崭新篇章 奔腾浮出水面
1989年4月,英特尔推出25MHz 486微处理器。1989年5月10日:我们大家耳熟能详的80486芯片由英特尔推出。这款经过四年开发和3亿美元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个晶体管,使用1微米的制造工艺。其实486就是80386+80387协处理器+8KB一级缓存,是超级版本的386。
1991年5月22日:80486DX的廉价版本80486SX发布,它和DX的区别是没有整合FPU。
1993年3月22日:全面超越486的新一代586 CPU问世,为了摆脱486时代微处理器名称混乱的困扰,英特尔公司把自己的新一代产品命名为Pentium(奔腾)以区别AMD和Cyrix的产品。AMD和Cyrix也分别推出了K5和6x86微处理器来对付芯片巨人,但是由于奔腾微处理器的性能最佳,英特尔逐渐占据了大部分市场。Pentum 处理器的性能接近主要的RISC CPU并兼容80x86,同时继承了长期积累下来的价值约500亿美元的庞大软件资源。
Pentium最初级的CPU是Pentium 60和Pentium 66,分别工作在与系统总线频率相同的60MHz和66MHz两种频率下,没有我们现在所说的倍频设置。
-
1994年3月7日:英特尔发布90和100MHz 的Pentium 处理器
-
1994年10月10日:英特尔发布75MHz 版本的Pentium 处理器
-
1995年3月27日:英特尔发布120MHz 的Pentium 处理器
-
1995年6月1日:英特尔发布133MHz 版本Pentium 处理器
英特尔推出Pentium Pro微处理器,采用了一种新的总线接口Socket 8。新的处理器对多媒体功能提供了很好的支持。
1995年11月1日,英特尔推出了Pentium Pro处理器。Pentium Pro的工作频率有150/166/180和200MHz四种,都具有16KB的一级缓存和256KB的二级缓存。它是基于Pentium完全相同的指令集和兼容性,达到了440 MIPs 的处理能力和5.5 M个晶体管。这几乎相当于比4004处理器的晶体管提升了2400倍。值得一提的是Pentium Pro采用了“PPGA” 封装技术。即一个256KB的二级缓存芯片与Pentium Pro芯片封装在一起,两个芯片之间用高带宽的内部总线互连,处理器与高速缓存的连接线路也被安置在该封装中,这样就使高速缓存能更容易地运行在更高的频率上。
例如Pentium Pro 200MHz CPU的L2 Cache就是运行在200MHz,也就是工作在与处理器相同的频率上,这在当时可以算得上是CPU技术的一个创新。Pentium Pro的推出,为以后Intel推出PⅡ奠定了基础。
-
1996年1月4日:英特尔发布150&166 MHz Pentium 处理器,包括了越3.3M个晶体管
-
1996年10月6日:英特尔发布200MHz Pentium 处理器
Intel Pentium MMX
1997年1月8日:英特尔在1996年推出的Pentium系列的改进版本,内部代号P55C,也就是我们平常所说的Pentium MMX。Pentium MMX在原Pentium的基础上进行了重大的改进,增加了片内16KB数据缓存和16KB指令缓存,4路写缓存以及从Pentium Pro、Cyrix而来的分支预测单元和返回堆栈技术,特别是新增加的57条MMX多媒体指令。
MMX技术是Intel最新发明的一项多媒体增强指令集技术,它的英文全称可以翻译成“多媒体扩展指令集”。使得Pentium MMX即使在运行非MMX优化的程序时也比同主频的Pentium CPU要快的多。57条MMX指令专门用来处理音频、视频等数据,这些指令可以大大缩短CPU在处理多媒体数据时的等待时间,使CPU拥有更强大的数据处理能力。MMX CPU比普通CPU在运行含有MMX指令的程序时,处理多媒体的能力提高了60%左右。MMX技术开创了CPU开发的新纪元。
Pentium MMX系列的频率只有三种:166MHz、200MHz、233MHz,一级缓存从Pentium的16KB增加到了32KB,核心电压2.8v,倍频分别为2.5、3、3.5。插槽都是Socket 7。
1997年4月7日 。英特尔发布了Pentium II处理器。内部集成了750万个晶体管,并整合了MMX指令集技术。此时,英特尔 Pentium II架构已经从Socket 7转成Slot 1,并首次引入了S.E.C封装(Single Edge Contact)技术,将高速缓存与处理器整合在一块PCB板上。Slot 1的Pentium II晶体管数为900万,并且具有两种版本的核心:Klamath与Deschutes。
-
1997年6月2日: Intel发布233MHz Pentium MMX
-
1998年2月:Intel 发布333MHz Pentium II处理器,开发代号为Deschutes,并且首次采用了0.25微米制造工艺,在低发热量的情况下提供比以前产品更快的速度。
经典延续 英特尔奔腾III发布
1999年1月,英特尔推出奔腾III处理器,它采用0.25微米制造工艺,拥有32K一级缓存和512K二级缓存(运行在芯片核心速度的一半下),包含MMX指令和Intel自己的“ 3D”指令SSE,最初发行的PIII有450和500MHz两种规格,其系统总线频率为100MHz。此外其身份代码还可通过Internet读取。
1999年10月,Intel推出了基于0.18微米工艺制造的Pentium III处理器,这款Pentium III处理器有256K在二级高速缓存,代码名为Coppermine。Coppermine以733MHz登台。随着工艺尺寸从0.25微米减少到0.18微米,不仅提高了Pentium III处理器的时钟速度,也使的Intel在技术上能够推出了集成的二级高速缓存。虽然集成的二级高速缓存只有老式Pentium III处理器的一半,但在处理器全速下运行,性能仍有显著提高。
其后Intel推出了Pentium III Xeon处理器。作为Pentium II Xeon的后继者,除了在内核架构上采纳全新设计以外,也继承了Pentium III处理器新增的70条指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,Pentium III Xeon加强了电子商务应用与高阶商务计算的能力。Intel还将Xeon分为两个部分,低端Xeon和高端Xeon。其中,低端Xeon和普通的Coppermine一样,仅装备256KB二级缓存,并且不支持多处理器。这样低端Xeon和普通的Pentium III的性能差距很小,价格也相差不多;而高端Xeon还是具有以前的特征,支持更大的缓存和多处理器。
-
2000年3月8日: Intel 限量供应1GHz Pentium III 处理器
2000年11月20日,英特尔正式发布了下一代处理器——奔腾4。这不仅仅是一款新产品的发布,它还标志着一个处理器新时代的开始,奔腾4可以说对英特尔至关重要。最早的Pentium 4使用的是SOCKET 423接口,后来转变为SOCKET 478接口,接下来又过渡到现金主流的LGA775接口。奔腾4处理器经过了几年的核心变迁,性能也获得了显著提升。
423接口Pentium4处理器原始代号为Willamette,采用0.18微米铝导线工艺,配合低温半导体介质(Low-Kdiclcctric)技术制成,是一颗具有超级深层次管线化架构的处理器。
Pentium 4处理器最主要的特点就是抛弃了Intel沿用了多年的P6结构,采用了新的NetBurst CPU结构 。NetBurst结构具有不少明显的优点:20段的超级流水线、高效的乱序执行功能、2倍速的ALU、新型的片上缓存、SSE2指令扩展集和400MHz的前端总线等等。
- 新的处理器系统总线(FSB)
英特尔近来在前端系统总线(FSB)方面一直不敌AMD:Pentium Ⅲ最高为133MHz的FSB和内存频率(外频);而AMD雷鸟用的 是100MHz的内存频率(外频)和266MHz的FSB(类似于CPU倍频的方式来连接这两个频率)。
Pentium 4终于有了突破:虽然Pentium 4系统总线仅为100Mhz,并且也是64位数据宽度,但由于利用与 APG4X 相同的原理“四倍泵速”,因此可传输高达8位*100百万次/秒 *4=3,200MB/秒的数据传输速度。明显地远超过AMD公布的Athlon总线数据传输速度。Athlon总线速度为133Mhz,64位、2倍速,提供8 位 * 133 百万次/秒 * 2 =2,133 MB/秒的数据传输率。
这项特色使得Pentium 4传输数据到系统的其它部分比目前所有的 x86 处理器还快,也一并去除了 Pentium 3系统所遭受的瓶颈限制。不过,如果主存储器无法提供相对数据传输的话,这么快的处理器总线速度也是英雄无用武之地。因此,早期此处理器的芯片组850 就搭配了两条Rambus通道并使用昂贵的 RDRAM内存。这两个RDRAM通道能提供与Pentium 4系统总线(3,200MB/s)相同的数据频宽,这样的搭配将是理论上最完美的结合─提供处理器、系统与主存储器间最高的数据传输率,这也是最明显的优势之一。不过系统的整体系统的成本将会因为使用较昂贵的 RDRAM 而提高。
- 高速执行缓存
为了增加8KB的数据缓存,P4包含了一个执行跟踪缓存,可存储12K的微指令以帮助程序执行。这些指令不在主程序循环中执行,不被存储,从而大大提高了系统性能。
- 快速执行引擎
算术逻辑单元(ALU)以双倍的时钟速度运行,这让类似于加、减、逻辑与、逻辑或等基本运算的执行只用了1/2时钟。例如,1.5GHz的快速执行引擎其实是以3GHz在运算。
- 高级动态执行
高级动态执行是控制CPU执行顺序的动态单元。P4可以发出126条动态指令,使流水线完成48次载入和24次存储。与前一代的PⅢ处理器相比,它能够增加33%的预处理速度,还可以在缓存中存储更多的历史信息从而快速取出。
- 改进的浮点数运算和多媒体单元
P4的128位运算动态增加了运算单元,使得浮点数运算和多媒体表现都得到了较大的改进。
- 网络数据流单指令多数据扩展2(SSE2)
通过增加的144条新指令,SSE2具有更强多媒体增强指令和数据流单指令。这些特性包括一个128位单指令多数据整数运算和128位单指令多数据双精度浮点指令,这些指令减少了原有的指令执行数量,大大增加了执行速度。使得用户的视频、音频、图象处理、加密、财政、工程和科学应用都极大增强。SSE2可以提高多媒体的执行效率,特别是DVD/MP3/MPEG4的回放,可以最大效果地体现P4新指令集的威力。
总结:在理论上,Pentium 4是完美无缺,可是实际状况却远非英特尔想象的那么简单。第一代423针脚Pentium 4可以说是英特尔近几年内的最大失败。
首先是P4耗电惊人,所以P4系统使用的主板被设计为电源的12V电压(ATX12),通过一个4脚的插座和3.3V、5V一起供给主板,另外还在20针电源接口的旁边另加了一个6针的辅助电源接口。
最致命的硬伤还是Willamette核心属于Pentium 4最早期的产品,因此它的发热量很大、频率提升困难,只从1.5GHz到1.8GHz。而且它的二级缓存只有256KB,超深的处理流水线使得总体性能并不理想,特别是对于超频用户来说,这类产品难以让人感到满意。
因此英特尔很快就开发出了Northwood核心的产品,以满足消费者的需求。Northwood核心的Pentium 4采用0.13微米工艺制造,相比Willamette内核的处理器,其主频有了很大飞跃,二级缓存也从256K翻番到512KB。
Northwood核心Pentium 4的第二个核心,因此核心面积减小了60%,可搭配512KB或2MB二级缓存,外频400MHz、533MHz或800MHz,支持SSE2指令集,集成5500万个晶体管,核心面积131平方毫米,使用铜来连接晶体管。
Prescott核心是Pentium 4的第三个核心,生产工艺进一步升级为90纳米,可搭配512KB、1MB、2MB二级缓存,外频533MHz或800MHz,增加了SSE3指令集支持,激活曾1.25亿个晶体管,核心面积112平方毫米,使用铜来连接晶体管。
Pentium 4 506正面外观
而Prescott核心的Pentium 4采用了令人咋舌的31级流水线设计,配备16KB的一级数据缓存和多达1MB的二级缓存。
前景广阔 双核心奔腾D上市
奔腾D805 CPU-Z截图
2005年第二季度,基于“Smithfield”双核心的英特尔Pentium 8XX处理器发布,而2006年英特尔又推出了新一代“presler”双核心9XX处理器。此时英特尔Pentium核心已经发展到了颠峰。
Pentium 8XX处理器采用90纳米工艺生产,支持800MHz前端总线和EM64T技术,配备2MB二级缓存(每个核心1MB),并沿用目前奔腾4的LGA 775封装。不过,奔腾D 8系列并不支持超线程技术,只能用两个核心实现两个进程。
据英特尔透露,奔腾D 8XX使用的“Smithfield”双核心架构实际就是两个LGA 775奔腾4使用的Presscott 1MB(指二级缓存容量)核心的整合,这使得它总的核心面积扩大到了206平方毫米,集成的晶体管数量也高达2.3亿个,由于双核心4线程(每个核心都通过超线程技术支持两个线程)的设计比更高频率单核心的设计性能更好,因此奔腾D 8XX的时钟频率设定都比目前单核心奔腾4低,这种做法也可以尽量降低能耗。