51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 2507|回复: 0
打印 上一主题 下一主题

酷睿I7处理器如何?

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2013-5-23 13:37:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我们常用的电脑看到CPU一般有I3、I5、I7,那么什么是酷睿i7处理器,i7处理器怎么样?酷睿i7是一款45nm的四核处理器,处理器拥有8MB三级缓存,支持三通道 DDR3内存。处理器采用LGA 1366针脚设计,支持第二代超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多。基于全新Nehalem架构的新一代桌面处理器将沿用“Core”(酷睿)名称,命名为“Intel Core i7”系列,至尊版的名称是“Intel Core i7 Extreme”系列。

对比以前的处理器,i7处理器怎么样?
1、更新制程。制造工艺的改进理论上可以带来功耗的降低,使得产品的默认时钟频率可以更高,直接提升性能。同时如果在更新制造工艺的同时对微架构进行细微的调整,那么产品的性能也会得到提升。

2、更新微架构。从奔腾4时代的NetBurst切换到Core架构后的Intel,一举击败了曾经风光一时的K8架构,帮助Intel重新登上性能王宝座。Core i7虽然商标名称仍然为酷睿,但产品的架构已经从Core更新为Nehalem,并且仍然采用高-K材料设计的45纳米制程打造,因此在性能上的表现值得期待。
LGA 775散热器全废Nehalem针脚有变化
        自Intel“9”系列主板芯片组开始,CPU针脚被移植到了主板上,改为触点式封装的LGA 775处理器可以非常有效地避免在运输过程中出现损伤。Core架构发布以后,这种封装方式被延续下来,而所有酷睿2处理器也采用LGA 775阵脚,与上一代的奔腾4、奔腾D接口完全兼容。但到了Nehalem架构虽然也延续了触点式封装,但却将产品的针脚更改为LGA 1366和LGA 1160(不久前有传言又改为LGA 1156),其中LGA 1366处理器面积由原来的37.5mm*37.5mm提升为42.5mm*45mm。
        代号为Bloomfield的四核心Core i7处理器全部产品会采用LGA 1366封装,针对主流市场的桌面级四核心处理器Lynnfield以及Cleaksfield将会采用LGA 1160(也可能是LGA 1156),而未来整合GPU功能的代号为Havendale的桌面双核产品则将在更晚时候发布,同样采用LGA 1160封装,不过接口定义可能与Lynnfield有些不同,因此可能相关主板不会兼容。
        采用LGA 1366和LGA 1160(LGA 1156)接口后,主板的孔距直接提升为80mm和75mm,因此LGA 775平台的散热器无法兼容最新平台,虽然这种设计为主板及散热器厂商带来了一些麻烦,但通过接口的差异化设计,Intel将顶级玩家与主流用户直接分离出来,一定程度上有助于后续服务的针对性进行。
为何只有133外频? QPI总线替代FSB
由于采用了全新的微架构设计,Core i7的规格相比以前有了大幅度改变。其首批上市的型号中最高端的Extreme 965主频达到3.2GHz,与上代产品QX9770持平,但却采用了133MHz*24这种低外频、高倍频的设计,与QX9770 400MHz*8的方式完全不同。我们知道,依赖于FSB总线传输,Intel 奔腾4、酷睿2 处理器都非常依赖处理器外频,为何这次的旗舰级产品外频却只有133MHz呢?
        因为Nehalem架构采用了全新的QPI总线。随着处理器核心数量的增多,继续公用一条FSB总线显然已经力不从心,为了改变FSB的瓶颈,Intel Nehalem架构采用了类似于Hyper-Transport总线的全新数据传输总线Quick Path Interconnect,让其与内存直接交换数据。QPI总线的连接方式更加灵活,它可以将处理器的每颗核心分割为独立的小块,每个核心之间也可以通过QPI总线进行连接,根据市场定位,QPI总线的条数会进行调整。目前桌面级CPU的QPI总线为1条,但服务器级别的Nehalem处理器则会配备2条甚至4条QPI连接,因此QPI总线的引入让Intel在服务器领域的竞争力大大加强。

        与竞争对手相比,Intel桌面级处理器的QPI总线频率最高可达6.4GT/s,即使是定位非旗舰的Core i7 920和940,也具备4.8GT/s频率。QPI每个方向的的位宽可以为5、10、20bit,因此每个方向的QPI连接宽度可提供12-16GB/s带宽,这样一来一条QPI连接的带宽可以达到24-32GB/s。
        第一批Nehalem处理器使用了20bit的连接位宽,提供了大约25.6GB/s的数据传输能力,从理论上超越了竞争对手所采用的HyperTransport 3.0。QPI总线的引入也使得Intel可以更加保守地设定处理器外频,将巨大的超频空间留给玩家,因为一旦采用高倍频设置,即便是小幅度的外频提升也会让CPU的时钟频率得到飞跃!
CPU直接控制内存峰值带宽32GB/s
讲到QPI总线就不得不谈谈Nehalem处理器的内存控制器。内存控制器(integrated memory controller)简称IMC,由于Core i7通过QPI直接与内存交换数据,因此CPU内部就必须集成一个控制内存的部门。首批上市的Core i7内存控制器支持3通道DDR3内存规格,彻底抛弃DDR2。其三通道内存默认运行在DDR3-1066,也可以很容易地运行在DDR3-1333,以达到32GB/s的峰值带宽。通过内存控制器设计,Nehalem处理器达到了酷睿2处理器的4倍内存带宽,使得每个核心可以支持最大10个未解决的数据缓存命中失败和总共16个命中失败,比酷睿2的单核心8个总共14个提高了不少。

         内存控制器和QPI总线的结合工作,令数据延迟大大降低,直接的表现就是我们在运行大型软件或大型3D游戏时的数据加载时间大大减少,这对无法忍耐长时间数据加载的玩家确实是一个利好消息。
        另外,值得一提的是,虽然Core i7处理器是集成3通道DDR3内存控制器,但并不表示我们必须搭配3条内存或6条内存来组建3通道系统才可以发挥其威力,采用2条内存测试,结果表明在装载2条内存的情况下Core i7可以开启双通道模式,虽然与3通道相比在内存带宽上存在一定差距。
        值得一提的是目前的32bit操作系统对4GB内存的支持并不到位,而在2GB内存配备已经成为主流的情况下,Intel将3通道的规格引入也确实符合了现实。采用3条1GB内存组成的3通道内存系统将恰到好处地为整套平台带来内存效能上的提升。
8MB L3 Cache引入Core i7缓存架构面目全非
Nehalem处理器的缓存架构相对于之前的奔腾4、酷睿2产品,也有了较大的变化。随着45纳米制程的引入,酷睿2处理器的最大L2缓存已经达到12MB,类似于FSB,继续无休止地提升L2缓存并不一定能带来明显的效能改善,因此在Core i7上,我们看到了一个全新的缓存架构。

        从Core i7的缓存架构示意图可以看出,它选用了共享L3缓存的方式来暂存数据。桌面级四核心处理器的产品动用了8MB L3缓存。4个核心除了共享8MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存,另外还为每颗核心配备了与Core架构极为类似的64KB L1缓存。
        这里必须说一下缓存延迟问题。45纳米酷睿2处理器的L2缓存延迟周期为15,而Intel工程师表示Nehalem架构的L3缓存可以达到30-40周期,不过每颗核心独立拥有的通用L2缓存周期只有12,因此L3带来的高延迟问题一定程度上由L2进行了弥补。另一方面,4颗核心共享L3缓存,在数据命中失败后可直接重新从内存寻找数据,而不是在缓存中重新进行侦测。Intel称Nehalem上的L3缓存为Smart Cache,想必也是因为这些原因。
SSE4.2指令集加入办公性能大幅提升
45纳米加入了SSE4.1指令集,令处理器的多媒体处理能力得到最大70%的提升。在Nehalem架构的Core i7处理器中,SSE4.2指令集被引入,加入了STTNI(字符串文本新指令)和ATA(面向应用的加速器)两大优化指令。

STTNI主要针对XML进行文档和数据处理进行优化,使这一方面的应用性能达到上一代产品的3.8倍。ATA则主要增加CRC32计算校验码,另一方面让POPCNT用来计算一个16/32/64位整数里面中多少个为1的位。
        目前Intel C++ Compiler 10.x和Microsoft Visual Studio 2008 VC++均已经实现了对于SSE4.2的支持。具备SSE4.2指令集的Nehalem Core i7处理器在办公应用中的性能将得到大幅度提升。
重新启用超线程恐怖8线程设计
Nehalem架构还重新启用了曾经在NetBurst上应用过的超线程技术,不过已经更名为同步多线程技术(Simultaneous Multi-Threading,SMT)。我们知道,NetBurst架构上的超线程技术局限于FSB和内存传输数据带宽,实际带来的性能提升可能并不明显,因此后来的酷睿2处理器直接抛弃了超线程技术。但这次Nehalem架构将QPI和集成内存控制器引入后直接带来惊人的带宽,重新启动同步多线程技术毫无疑问不用再担心传输带宽所产生的瓶颈。
Nehalem架构所采用的同步多线程技术基于2路设计,即每颗核心可以同时执行2个线程。在多任务情况下可以有效提升性能,采用这种模拟的逻辑运算核心绝对比直接增加一颗物理运算核心成本低。Intel表示SMT技术可以在能耗增加不明显的情况下提升20-30%性能。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

本版积分规则

关闭

站长推荐上一条 /1 下一条

小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

GMT+8, 2024-11-22 15:42 , Processed in 0.069133 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2024 Comsenz Inc.

快速回复 返回顶部 返回列表