当前位置:首页 > 装机升级 > CPU > 新闻
高性能低功耗 英特尔Haswell处理器解析
  • 2013-5-2 17:43:58
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:熊乐
  • 作者:
【电脑报在线】英特尔每年新平台的发布对于IT业界都是一件大事。按照英特尔的Tick-Tock战略,即将在第二季度发布的Haswell处理器,将基于22nm制程,升级为全新的架构。

        英特尔每年新平台的发布对于IT业界都是一件大事。按照英特尔的Tick-Tock战略,即将在第二季度发布的Haswell处理器,将基于22nm制程,升级为全新的架构。当然作为英特尔的重点产品,Haswell还要承担起更多的责任,不仅要在桌面平台延续在PC平台上的统治地位,甚至在SoC领域也要一展拳脚。Haswell有望成为历史上对英特尔更具开创性的一款处理器。


 
        新指令集带来更高性能

        虽然处理器架构进行了更新,但是Haswell处理器性能的提升非常有限,最重要的改进是引入了全新的指令集,提升了处理器运行的效率。其中一个是针对多线程应用的TSX扩展指令,再一个就是现有AVX指令的进阶版AVX 2.0。它们对Haswell性能的提升至关重要,如果没有这两个指令集,Haswell相对于Ivy Bridge还真没什么重要升级可言。


        在AMD和英特尔的共同推动下,单核处理器已经被淘汰,双核CPU已经是最基本的配置,四核、六核甚至是八核处理器也不是什么新鲜玩意了。但是在日常应用中,这些八核处理器性能表现却不总是比双核要好,这除了软件对于多核的优化不够之外,CPU自身也存在着一定的限制。

        传统操作中一个线程访问了某部分内存数据之后就会通过一个锁定操作来保证数据的统一性。这个过程又分出粗粒度锁定以及细粒度锁定,而这两种操作是互斥。粗粒度线程锁定比较简单,很容易实现,但只能单线处理,效率不高。而细粒度线程锁定则可以实现自由度更高的数据同步,每个线程都可以操作不同纵列的数据,效率更高但容易出错。所以程序员往往钟爱粗粒度线程锁定,这就是日常应用中多线程处理器的表现并不好的原因所在。

        英特尔在服务器处理器中引入了“Transactional Memory(事务内存)”来解决这样问题,但桌面CPU在这方面一直是个缺失。现在Haswell引入了TSX扩展指令,设计目的就是评估软硬件状况并为程序员提供无错的细粒度线程锁定,特别是在复杂的多线程应用中让多核处理器有着更好的处理效率。不过回到现实中这一技术还需要系统在内存管理和线程调度上做相应的优化,具体性能提升只能拭目以待。


        AVX 2.0指令集同样是Haswell一大重要的改进亮点。AVX 2.0是AVX指令集的升级版,后者仅支持256bit浮点指令集,但AVX 2.0中整数数据也扩展到256bit SIMD阵列,这可以极大提升处理器在图像及视频处理中的处理效率。AVX 2.0指令让每核心每时钟周期的单精度、双精度浮点均翻一番,可执行双FMA操作,这极大地提升了浮点峰值速度——能够同时执行8条内部指令,实现4倍整数运算,这对于高性能计算、专业图形处理以及脸部追踪等方面的应用都有极大的益处。
  除此之外,英特尔还改进了Haswell的分支预测技术,如增加了分支单元,这让处理器更可以更快地提前看一下哪些指令可能会在近期执行。如果处理器知道哪些指令会先执行,只开启处理器中需要的那些部分元件,那么分配处理器资源的效率有望大大提高。
 
        显示性能再次翻倍
        相对于处理器部分的小幅改进,Haswell处理器的GPU部分却是大幅革新,虽然Haswell处理器仍然采用上代 Sandy Bridge处理器的GPU,性能再次猛增。在Haswell处理器中,英特尔放弃了Sandy Bridge和Ivy Bridge中对于核心显卡的命名,HDX000,而是采用了全新的核芯显卡命名方式:GT1、GT2 和GT3。
 
图说:从结构图就可以看出,GT3面积大了不少,性能自然也有迅猛的提升
  其中GT1定位最低,只有6个EU单元,24个ALU单元,1个曲面细分单元,与目前的HD 2500显卡基本相同。GT2核心的EU单元提高到20个,80个ALU单元,2个曲面细分单元,比IVB HD 4000的16个EU单元相比多了四分之一。GT3核心的EU单元则大幅升至40个,是GT2的两倍。虽然GT3还不知道具体性能数据,但是这么大规模的硬件提升完全可以超越了入门级显卡的水平,甚至具备叫板中端显卡的能力。需要说明的是,英特尔在Haswell图形核心的执行单元做入到共同的模块化单元,英特尔称之为“共用切片”(slice common)。这块共用切片还包含许多其他的关键部件,用于处理实时图形,比如光栅引擎和高速缓存,这种设计的好处就是可以提高处理的效率及简单内核设计。
  除了在核心性能上的飞越外,Haswell视频引擎还引入了基于硬件的SVC(可扩展视频编码)解码器(可用于视频点播和多方会议视频等)、Motion JPEG硬件解码器、MPEG2硬件编码器,并通过SDK继续提升编码质量。同时Haswell核显在显示性能和分辨率方面也做了前所未有的改进,如加入对4K分辨率支持,可提供DIsplayPort 1.2及菊花链式显示器连接,最多提支持三路同步1080P显示。

        处理器“睡”得更好“醒”得更快

        为了节约用电,Haswell采用了全新的电源管理功能。处理器核心拥有“活动状态”和“睡眠状态”两个状态:在低负载时关闭供给处理器中大部分元件的电源,在需要时又及时打开。不过关闭很容易,在打开时会不会像Windows系统的睡眠模式那样,有明显的延迟呢?

        这些年来,英特尔稳步缩短了唤醒睡眠中处理器所用的时间。最新的Ivy Bridge处理器只需要几秒钟时间,就能从深度睡眠状态唤醒过来。不过,几秒钟离“即时开机”仍有一点距离。针对这个问题,Haswell引入了一项“SOix活动闲置状态”模式,这是一种功耗极低的活动状态,耗电量比Ivy Bridge少20倍。PC系统本身认为它醒着,但处理器仍然基本上处于睡眠状态。

        这一技术意味着唤醒时间最长也只有几百毫秒。从用户的角度来看,最长半秒的唤醒时间远胜过唤醒目前的处理器所需要的好几秒。Haswell在运行时,几乎总是处在这个“即时恢复”状态。这项技术有点类似于Atom凌动处理器电源管理。

        当然,除了让处理器“醒”得更快外,英特尔还要让Haswell“睡”得更好——加入了更多的“睡眠”模式,如Haswell增加了S3/4休眠状态、新的C状态(C7/C8/C9/C10),可实现更精细的电源管理。比如C7状态下时,CPU核心是处于关闭状态,而显示输出部门处于开启状态等。值得注意的是,Haswell在加强电源管理的优化,有超过20项的改进,最结成果是使得Haswell最低可以做到8W。

        Haswell将一统各平台

        作为22nm制程“Tock”进程之作,Haswell将在6月台北国际电脑展上正式与我们见面。全新的 Haswell 处理器将延续着 Ivy Bridge Core 3000 系列处理器的命名方式,以 Core 4000 系列命名。

        最先到来的Haswell桌面处理器有 Core i7-4770K、Core i7-4770、Core i5-4670K、Core i5-4670 以及 Core i5-4570 等几款标准电压版处理器,TDP 从 Ivy Bridge 的 77W 提升到 84W(nominal TDP),但频率与 Turbo Boost 部分将会与 Ivy Bridge 保持一致。

        低电压版本则有 35W 的 Core i7-4765T、Core i5-4570T;45W 的 Core i7-4770T、Core i5-4670T;65W 的 Core i7-4770S、Core i5-4670S、Core i5-4570S、Core i5-4430S 等三个版本。而入门的 Pentium 系列与市场主流的 Core i3 处理器要等到第三季才会现身。

        需要说明的是,桌面版Haswell处理器将改用新Socket H3插槽,即1150针脚。看来大家又得换主板了!至于针对笔记本及超极本平台的移动版Haswell具体情况,英特尔暂未透露,但可以肯定的是移动版Haswell将使用Socket G3插槽,947针脚。

  当然, Haswell也不仅仅是一次架构升级,英特尔还需要用实现“三位(PC、超极本、手持终端)一体”的大战略:性能不断提升的图形核心要抵御AMD APU的进攻,低功耗、高续航特性要支撑起第三代超极本,但真正值得重视或者称得上革命性进化的应该是Haswell的SOC封装变化。英特尔在此前公布的芯片组路线图显示将从14nm工艺节点启用Multi-Chip Package多芯片封装,形成CPU+南桥+北桥的三位一体方案,其中Haswell的各种封装就有一个使用MCP方案。这意味着目前PC、移动、手持终端最终实现三端同芯,将让英特尔更容易构建一个生态圈以在移动设备领域追赶ARM。 
本文出自2013-04-29出版的《电脑报》2013年第16期 E.硬件DIY
(网站编辑:黄海)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交