在本页阅读全文(共7页)
● SSE4.2指令集 大幅优化文本处理
英特尔SSE4指令集最早出现在45纳米处理器上,首颗发布的Core 2 Extreme QX9650配备了SSE4指令集的第一版,即SSE4.1,凭借着这一指令集,45纳米酷睿2处理器的多媒体性能相对于65纳米产品提升了70%,而在Nehalem Core i7上,我们将迎来SSE4指令集的第二版,即SSE4.2。
Nehalem在SSE4.1 47条指令集的基础上加入了SSE4.2指令集
我们知道,SSE 4.1版本的指令集增加了47条指令,主要针对向量绘图运算、3D游戏加速、视频编码加速及协同处理的加速。英特尔方面指出,在应用SSE4指令集后,45纳米Penryn核心额外提供了2个不同的32位向量整数乘法运算支持,并且在此基础上还引入了8位无符号最小值和最大值以及16位、32位有符号和无符号的运算,能够有效地改善编译器编译效率,同时提高向量化整数和单精度运算地能力。另外,SSE4.1还改良了插入、提取、寻找、离散、跨步负载及存储等动作,保证了向量运算地专一化。
经过我们的测试,SSE4.1指令集的处理器比不具备此指令集的同档次处理器的视频编码效能提高了70%,在游戏中也有很明显的性能提升。而SSE4.2指令集则将重点放在了文本处理上。据英特尔透露,Nehalem的SSE4.2指令集中的7条指令用途各不相同,有面向CRC-32和POP Counts的,也有特别针对XML的流式指令。帕特·基辛格表示,SSE4.2指令集可以将256条指令和并在一起执行让类似XML的工作性能提升3倍!
本文导航