在对Core i7超频之前,我们得明确我们超频的最终目的,那就是为了提升性能。而我们看到在i7内部,一共存在或者有相联系的一共有以下的几个频率:
BCLK:Base Clock,也有叫Bus Clock的。用最通俗的讲法就是外频。如果找一个最贴近的概念,这个频率和AMD K8、K10平台的外频很相似。尽管它不直接决定处理器的速度,但以下所有频率都是在外频基础上乘以倍频得到的,一旦改变外频就是牵一发动全身,所以它也是超频的关键。
与Core 2平台的外频不同,这里通过BCLK外频不会得到一个固定4倍的FSB,也不是以分数分频的方式产生内存频率,它不需要很高。Core 2平台动辄400、500外频的时代一去不复返了。BCLK外频通过乘以四个倍频产生Core、Uncore、QPI、内存四个关键频率。
Core Clock:内核时钟,也就是我们常说的主频,这个频率是我们最为重视的一个频率,BCLK*内核倍频=Core Clock。倍频一般是锁死的,这时超主频就必须拉高BCLK。不过也有两个例外。
例外之一是通过开启Turbo Mode,处理器可以自动地提高倍频。例外之二是属于至尊版的i7 965的倍频没有锁,因而用户可以通过超倍频提高Core Clock。
Uncore Clock:一般缩写为UCLK。Uncore时钟,由BCLK乘以Uncore倍频得到。Uncore就是Nehalem CPU里除了四个内核以外的部分,包括了共享L3、内存控制器、QPI等。这个概念类似K10 CPU里的北桥,CPU-Z界面里干脆管它叫NB Clock。Uncore频率决定着QPI控制器、L3、内存控制器的工作频率,看上去也非常重要,稍后我们会做一个测试来说明这一点。
UCLK既不是内存频率也不是QPI频率,但它和内存频率存在一个很强的关联性就是,UCLK不能低于内存等效频率的2倍(或者说内存频率的4倍)。举个例子,i7-920/940的UCLK默认是2133MHz,所以内存频率最高只能到DDR3-1066(533MHz),这也就是其内存规格限制所在。
一部分主板在BIOS里强制UCLK不低于内存等效频率的2倍,另一部分主板BIOS虽然提供了更低的UCLK选项,但UCLK低于内存等效频率2倍时根本不亮机。
QPI Clock:QPI频率是BCLK乘以QPI倍频得到的。和当初我们在AMD K8上见到的HyperTransport(HT)频率一样,由于内存控制器的集成,它的频率大大超出了我们的需要,所以在超频时如果会碰到瓶颈,我们直接降低它的倍频即可,不用担心会降低什么性能。
QPI频率一般以QPI Data Rate的形式写出,每个时钟周期上下沿各传输一次数据,因而Data Rate是QPI总线工作频率的2倍。CPU-Z显示的是QPI的总线工作频率,单位写作Hz而不是T/s,注意区分。比如i7-965外频133MHz、QPI Data Rate为6.4GT/s,那么它的QPI频率是3200MHz,QPI倍频是24x;BIOS里选择QPI Data Rate为4.8GT/s的话,QPI倍频就是18x。
Memory Clock:内存频率也是在BCLK上直接乘以一个倍频得出的,而内存性能直接受此频率影响。BCLK=133MHz时,DDR2-1333、1066、800意味着内存倍频为5、4、3。前面已经提到,内存等效频率不得大于UCLK的一半。
这张CPU-Z截图显示了一颗超到4320MHz的i7-965至尊版的各种频率。
外频(Bus Speed)超到了180。内核倍频(Multiplier)是24x,内核时钟(Core Clock)为180*24=4320MHz。
UCLK(NB Clock)为3600MHz,反推出UCLK倍频是20x,与i7-965的默认值相同。
内存工作频率(DRAM Frequency)为900MHz,也就是说内存工作在DDR3-1800下。我们可以看到内存已经跑在了UCLK所限制的上限。CPU-Z显示的分频关系是FSB:DRAM=2:10,就是内存倍频为5x,或者内存等效频率是外频的10倍。
QPI工作频率3960MHz,比i7-965默认的3200MHz提高了24%,除以180外频我们反推出QPI倍频为22,低于默认的24倍频。在BIOS里我们是将QPI Data Rate从默认的6.4GT/s调整为5.86GT/s来做到这一点的,读者可以自行推算。
我们用一张表来总结三款Core i7处理器各个关键频率、倍频以及它们的可调范围。部分数据为目前的传闻,仅供超频玩家参考。
Core i7 920 | Core i7 940 | Core i7 Extreme Edition 965 | |
默认BCLK | 133 MHz | 133 MHz | 133 MHz |
内核倍频 | 20x 锁定 | 22x 锁定 | 24x 可调 |
默认Core Clock | 133*20=2666MHz | 133*22=2933MHz | 133*24=3200MHz |
Uncore倍频 | 16x 可调 | 16x 可调 | 20x 可调 |
默认UCLK | 133*16=2133MHz | 133*16=2133MHz | 133*20=2666MHz |
QPI倍频 | 18x 可调 | 18x 可调 | 24x 可调18x/22x/24x |
默认QPI频率 (Data Rate) |
133*18=2400MHz (4.8GT/s) |
133*18=2400MHz (4.8GT/s) |
133*24=3200MHz (6.4GT/s) |
默认内存倍频上限 | 4x | 4x | 5x |
默认内存频率 | 533MHz (DDR3 1066) |
533MHz (DDR3 1066) |
667MHz (DDR3 1333) |
关于Uncore倍频、QPI倍频和内存倍频的说明:UCLK、内存的倍频在i7-965至尊版上都是可以向上调节的,i7-940/920的ES版上是锁定的。i7-940/920零售正式版的UCLK/内存/QPI倍频都未锁定,这在我们手上的i7-920零售样品上得到了验证。
下面我们来看UCLK的频率对于L3/内存频率的影响,在此之前,我们把CPU、内存、QPI的等所有频率都固定了,仅仅对Uncore这一频率做调整。注意的是,Everest的测试不能反应L3频率以及延迟的真实值,只能在对比测试有对比意义。
测试平台固定在技嘉EX58 Extreme主板上,使用i7-965,调低了QPI以及Uncore倍频以保证各种频率下稳定,三次测试仅选择了不同的Uncore倍频,具体如下表:
点击图片查看大图
在这个小测试里我们一共使用了Everest Cache&Memory Benchmark、WinRAR、Super PI,我们看到了,除了Super PI的测试属于误差之外,有很多测试成绩有很大的差异,我们把差异整理成柱状图:
内存带宽测试中由于内存频率很低,实测带宽不高。尽管如此,Uncore频率仍然对带宽成绩产生了很强的瓶颈效应,随着UCLK线性下降,带宽也跟着线性下降,写入带宽几乎和UCLK成正比。
EVEREST测试中三级缓存的带宽与UCLK关系并不线性,从2.77G降到1.85G时三项测试成绩都有下降。
内存访问延时随Uncore频率降低而明显增加,与Uncore频率的倒数基本为线性关系。EVEREST测试给出的L3延时结果似乎都是错误的,无参考价值。
WinRAR内建的Benchmark对内存带宽十分敏感,因此正像我们在内存带宽测试中看到的一样,成绩与UCLK基本呈线性关系。
总的来看,Uncore频率对访问内存和缓存的性能都有非常大的影响,是影响性能的关键因素。