五大创新之Intel Smart Memory Access
Intel Core微架构同时也改良了存储器传取性能,每颗核心均拥有3个独立Prefetchers(2 Data and & 1 Instruction),及2个L2 Prefetchers,能同时地侦出Multiple Streaming及Strided Acess Patterns,让核心需要的资料提早准备放在L1中,两组L2 Prefetchers则会分析L2 Cache资料并保留有日后需要的资料在L2 Cache之中。Core微架构的L1 Cache设计放弃使用上代Netburst的Trace Cache设计,因为Trace Cache的最大优点在于较长的Pipeline Stage微架构,而Core只拥有14 Stages因此它改用Banias架构的8-Way 32KB Instruction Cache + 32KB Data Cache设计,虽然容量比AMD K8的 64K Instruction Cache + 64KB Data Cache少一半,但由于AMD的L1 Cache只是2-Way设计,因此Intel的L1 Cache命中率相比K8有较轻微的优势。L2 Cache方面拥有特大的16-Way 256Bit 4MB容量,但Latechy却下降至和AMD K8相当的12-14ns之间,相比AMD K8只有16-Way 128Bit 1MB(部份型号只有512KB),Intel Core微架构在改良Cache系统后拥有绝对优势。
但如果对比系统内存存取表现,AMD K8却因内建内存控制器而比Intel Core微架构优胜,但由于Core微架构的采用上短Pipeline Stage架构及频率相对Netburst微架构低,加上高容量的L2 Cache并内建Shared Router Bus减少FSB使用,因此系统内存控取的表现差距已不像与上代Netburst微架构产品那么严重,而为了进一步拉近与K8架构上的内存性能距离,Intel在Core微架构中加入全新的内存读取技术称为Memory Disambiguation。
Memory Disambiguation是一个十分聪明的设计,通过Out of Order过程把内存读取次序作出分析。在传统的微架构里,内存读取是按流程顺序而被执行,如图上例子Load 4是独立的Data X读取执行,也必需要等待其他Store 1、Load 2及Store 3工作完毕,即使Load 4的Data X和前面的资料存取动作并无关系,因为处理器并不会得到前面的动作是否会改变Data X的数值,所以不能重新排序并分析Load 4能否提前执行。
在Intel Core微架构中通过智能的分析机制,能预知Load 4的Data X是完全独立,并可让它提前执行。正因如此Memory Disambigutaion能减少处理器的等候时间减少闲置,同时减低内存读取的延迟值,而且它可以侦出冲突并重新读取正确的资料及重新执行指令,保证运作结果不会出现严重,但在正常情况下Memory Disambirutation出错的机会率很低。
- 第1页:扬眉吐气!新一代PC性能换代至酷至睿
- 第2页:Netburst下马!酷睿2危急处力拨狂澜
- 第3页:五大重要创新!Intel Core微架构解析(1)
- 第4页:让处理器更Smart!Intel Core架构解析(2)
- 第5页:没内存控制器照样强,Core微架构解析(3)
- 第6页:更强更智能!Intel Core微架构解析(4)
- 第7页:界线模糊化!Intel新一代处理器命名解析
- 第8页:Core 2 Duo/Core 2 Extreme价格/规格剖析
- 第9页:AMD性能没了优势,724让价格更公道、实在
- 第10页:好马配好鞍——Intel发布全新系列芯片组支持Core
- 第11页:好马配好鞍——主流取向:全新96x芯片组介绍(1)
- 第12页:好马配好鞍——主流取向:全新96x芯片组介绍(2)
- 第13页:好马配好鞍——低端取向:全新946系列芯片组介绍
- 第14页:扣肉虽香,Conroe与芯片兼容性问题非常关键
- 第15页:狂超破2.8GHz!E6300/E6400超频潜力巨大
- 第16页:Intel Core 2 Extreme X6800领跑未来新纪录
- 第17页:测试平台与说明
- 第18页:性能测试——整机性能:SYSMARK 2004
- 第19页:性能测试——综合性能:WorldBench 5
- 第20页:性能测试——商业性能:Winstone 2004
- 第21页:性能测试——专业3D渲染性能:Cinbench 9.5/3Dsmax 7.0
- 第22页:性能测试——音/视频压缩性能:DivX/WME9/H.264/iTunes
- 第23页:性能测试——游戏性能:HL 2/Quake 4/Battlefield2
- 第24页:性能测试——游戏性能:Ris Of Legends/F.E.A.R.
- 第25页:性能测试——缓存性能:4MB VS 2MB二级缓存
- 第26页:性能测试——FSB 性能:1333MHz VS 1066MHz前端总线
- 第27页:江山易主!新一代的性能王者诞生