一块小小的处理器中却蕴含着万千气象,包罗了众多业界尖端技术,可以毫不夸张地说处理器是人类在硅晶圆上创造的最宏伟的建筑,人类的聪明才智也在这块方寸之地上得到了集中体现。处理器所引发的巨变是数不胜数的,太空探索、基因破译、核力发电、制导导弹以及建筑设计等各个领域,都有它伟岸的身影。没有它,数字时代就会成为空中楼阁;没有它,人类就无法超越一个又一个数学极限;没有它,微观和虚拟世界就不会展现在我们眼前。
我们不只是好奇,我们对处理器更多的是怀有一种难以言表的敬意。那么这样一块小小的硅晶元是靠什么制胜的呢?什么是其兴盛不衰的法宝?未来新的突破又将去往何方?接下来文中将为大家一一分享。
1822年,瑞典化学家白则里用金属钾还原四氟化硅,得到了单质硅,至此人类又结识了一位新的化学元素,但此时人们无论如何也想不到,正是这一发现为开辟人类数字时代奠定下坚实的基础。硅的化学符号是Si,原子序数为14,属于元素周期表上IVA族的类金属元素。它具备来源丰富、成本低廉、提炼难度小、纯度高、可塑性好以及可用来充当半导体材料等特点,正是凭借这些先天性的优势,硅成为处理器理想的材料,也成为摩尔定律驱使下的“魔方”,不断为人类带来一个又一个的惊喜。
自1971年第一款实用型处理器问世以来,已经过了数十年的发展,现在处理器无论是在规格参数、制造技术还是在扩展功能方面均获得了巨大突破。不过总的来说,仍可大致分为九个方面:
1)主频,即处理器核心使用时钟频率,简单说就是处理器工作频率。一般说来,一个时钟周期完成的指令数是固定的,所以一般来说主频越高,处理器的速度也就越快。不过由于处理器核心架构的不同,同频率下的性能表现也会不尽相同,这主要是与缓存命中率有直接关系。外频就是系统总线的工作频率,而倍频则是指处理器外频与主频相差的倍数,公式为:主频=外频×倍频。
2)L1高速缓存,通常称为一级高速缓存。处理器内置的一级高速缓存可以在很大程度上提高处理器的运行效率。L1级高速缓存的容量和结构对处理器的性能影响非常大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在处理器核心面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。采用回写(WriteBack)结构的高速缓存可以对读和写操作均有可提供缓存,而采用写通(Write-through)结构的高速缓存仅对读操作有效。在486以上的计算机中基本采用了回写式高速缓存结构。在目前流行的处理器中,775针英特尔处理器采用16KB L1级数据缓存和12KB L1级追踪缓存,而AMD Sempron和Athlon 64处理器的L1级高速缓存达到了128KB。
3)L2高速缓存,通常称为二级高速缓存,第一个采用L2级高速缓存的是Pentium Pro处理器,它的L2高速缓存和处理器运行在相同频率下,成本昂贵,市场生命很短,所以其后Pentium II的L2高速缓存改采成本较为低廉的高速动态RAM,运行在相当于处理器频率的一半以下,不过之后的Celeron又开始采用全速缓存,目前无论是英特尔和AMD均采用全速L2级缓存。除速度以外,L2高速缓存容量也会影响处理器的性能,原则是越大越好,现在桌面用处理器容量最大已到4MB,而以后更会发展出8MB、16MB、甚至32MB。
4)系统总线速度,也可以称为内存总线速度,一般等同于处理器外频。系统总线的速度对整个系统性能来说很重要,早先时候由于内存速度的发展远远滞后于处理器的发展速度,为了缓解内存带来的瓶颈,所以出现了二级缓存来协调两者之间的差异,而内存总线速度就是指处理器和内存之间的数据交换速率。
5)流水线技术和超标量。流水线(Pipeline)是英特尔首次在486芯片中引入,流水线的工作方式就象工业生产上的装配流水线。在处理器中由5到6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5到6步后再由这些电路单元分别执行,这样就能实现在一个处理器时钟周期完成一条指令,因此提高了处理器的运算速度。超流水线是指某款处理器内部的流水线通常超过5到6步以上,例如Presccot核心奔腾4的流水线就长达31级。将流水线设计的级数越多,供给核心处理的指令数才会更多,因而才能使处理器工作在更高的主频上。需要说明的是,流水线并不是越长越好,如果指令预取命中率低的话,反而会得不偿失。超标量是指在一个时钟周期内处理器可以执行一条以上的指令。这在486或者以前的处理器上是很难想象的,只有奔腾级以上处理器才具有这种超标量结构。现代的处理器已经全面采用RISC技术,因此超标量技术也得到普及。
6)协处理器,通常也称为数学协处理器。在486以前的处理器里面,是没有内置协处理器的。由于协处理器主要的功能就是负责浮点运算,因此386、286、8088等微型处理器的浮点运算能力都相当差。自从486以后,处理器开始内置协处理器,而且协处理器的功能也不再局限于增强浮点运算。现在处理器的浮点单元(协处理器)往往对多媒体指令进行了优化。比如英特尔的MMX、SSE、SSE2、SSE3技术等,MMX即为“多媒体扩展指令集”的缩写。MMX是英特尔公司在1996年为增强Pentium处理器在音像、图形和通信应用方面的应用而采取的新技术。新增加的57条MMX指令把处理多媒体的能力提高了60%左右,足见协处理器的重要性。现在的处理器已经普遍内置了这些多媒体指令集,例如目前英特尔处理器还内置了SSE3和EM64T指令集,而AMD方面则内置了增强型的3DNow!和X86-64指令集。
7)工作电压,指的是处理器正常工作所需的电压。早期处理器(386、486)由于工艺落后,它们的工作电压一般为5V(奔腾是3.5V/3.3V/2.8V等),随着处理器的制造工艺的提高以及人们对能耗的较高要求,处理器的工作电压呈现出逐步下调的趋势,即使是目前英特尔的双核心Pentium D处理器的实际工作电压也不过1.35V,而AMD双核心Athlon 64 X2处理器的实际工作电压同样不超过1.5V。
8)乱序执行和分枝预测。乱序执行是指处理器允许将多条指令不按程序规定顺序发送而是分开发送给各相应电路单元处理的技术。分枝是指程序运行时需要改变的节点,分枝有无条件分枝和有条件分枝,其中无条件分枝只需要处理器按指令顺序执行,而条件分枝则必须根据处理结果再决定程序运行方向是否改变,这提高了数据处理的灵活性。所谓“分枝预测”技术也就是为了完成程序对条件分枝的处理。
9)制造工艺。制造工艺虽然不会直接影响处理器的性能,但它可以极大地影响处理器的集成度和工作频率。制造工艺越精细,处理器可以达到的频率越高,集成的晶体管也就越多。第一代奔腾处理器的制造工艺是0.35微米,最高达到266Mhz的频率;奔腾II和最早的赛扬是0.25微米,频率最高达到450Mhz;铜矿核心的奔腾Ⅲ制造工艺缩小到了0.18微米,最高频率达到1.13Ghz;最新的Presler核心Pentium D 955处理器制造工艺更是达到0.065微米,频率也达到3.46Ghz,晶体管数量更是达到了惊人的3.76亿。
处理器正是凭借这九大法宝,为人类创造无数的辉煌。然而随着技术的进一步提高,核心的多少也成为衡量性能的一个重要指标,目前Pentium D和Athlon 64 X2处理器便是双核家庭中的重要成员。由于频率提升会带来功耗及发热量的提升,核心架构研发成本又非常高昂,利用多核并行处理数据成为未来的发展趁势,2007年Intel和AMD就将在四核心处理器战场上一较高低。或许有一天我们会只剩下对核心概念的理解,而无须再关注晶体管的数量,因为到那时晶体管已是一个非常庞大的群体了。
结语:
尽管处理器将来会朝多核心的方向发展,但制约处理器性能的九大法宝仍将发挥作用,同时用户也仍然希望会有更低功耗以及更高性能的产品出现。处理芯片行业的两大巨头——Intel和AMD目前正展开激烈的价格战,这无疑进一步加快了处理器的普及速度,我们也真心希望双核乃至多核处理器可以早日普及,为我们的生活带来更多的精彩。