当前位置:首页 > 智能手机 > Android手机 > 评测
那些让手游火起来的“芯”
  • 2013-7-1 14:31:44
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:薛昱
  • 作者:
【电脑报在线】从苹果发布iPhone的那一刻开始,我们的工作、沟通和娱乐发生了戏剧性的改变。而一向在嵌入式系统默默无闻的ARM也因此一夜成名。同时,手游作为移动互联时代掌中娱乐的重心,对硬件性能的要求也越来越高。

  从苹果发布iPhone的那一刻开始,我们的工作、沟通和娱乐发生了戏剧性的改变。而一向在嵌入式系统默默无闻的ARM也因此一夜成名。同时,手游作为移动互联时代掌中娱乐的重心,对硬件性能的要求也越来越高。这种市场的需求促使ARM处理器的性能得到爆发性的提升,从早期的1GHz单核/双核心、到现在流行的四核心甚至是“4+4”八核心,只用了不到4年的时间。所以和PC电脑一样,智能手机在手游的刺激下,也开始走上了“核军备竞赛”的道路,以解决智能系统、大型3D游戏程序等日益增长的性能需求。


ARM处理器核心发展简表

时间

核心架构

代表产品

单核

2010年

Cortex A8

瑞芯微RK2918;

思卡尔i.MAX515;

德州仪器OMAP 3系列;

三星Hummingbird

(S5PC100及S5PC110);

高通Snapdragon S2;

双核

2011年

Cortex A9

高通高通Snapdragon S3

NVIDIA Tegra2;

三星Exynos 4210;

德州仪器OMAP 4系列;

四核

2012年
2013年

Cortex A7

Cortex A9

Cortex A15

高通高通Snapdragon S4;

NVIDIA Tegra3;

德州仪器OMAP 5系列;

三星Exynos 5 Octa;

NVIDIA Tegra4;


手游“核”战争 

    还记得PC上第一款让我们觉得处理器核心数量很重要的游戏《GTA4》么?当时用低端4核处理器的运行速度都要快过高端双核处理器。到现在,没有哪款PC游戏不为多核心进行优化了,多核心的处理器让游戏体验变得更好,游戏开发者也可以有更多发挥的空间。而在移动平台上,手机和平板电脑所采用的ARM处理器,其实也在走着PC当年的路,越来越多的核心和更高的频率,让手游的发展空间也变得很大,目前不少手游的品质已经不输游戏主机了。

    在去年4月,ARM 发布了Cortex-A15 MP4四核处理器,在性能方面又有了大的提升。  Cortex A15 MP4最高可配置4MB共享二级缓存,核心频率最高可达2.5GHz,性能已经超过早期Pentium M迅驰。另外Cortex-A15 MP4最大的改进在于支持硬件虚拟化和大物理地址扩展,内存最高可扩展至1TB,甚至可以满足高性能服务器的需求。

    同时,针对Cortex-A15面临的能耗增长问题,ARM还提供了一个新省电思路——big.LITTLE 架构。所谓的 big.Little 技术,是由高效能的Cortex-A15 以及低功耗的Cortex-A7 组成。big.LITTLE就像一个混合动力系统,在低负载时将系统交由 Cortex-A7 架构负责,等到有高运算需求时瞬间切换到高性能的 Cortex-A15 架构。可以说big.Little,将是ARM未来继续贯彻省电高效能原则的武器。那么可以想象,将来的手持设备,在玩游戏的时候,会启用Cortex-A15核心,而平时上网和一般应用时,则只启用Cortex-A7核心,这样性能与续航都兼顾到了。

    如此强大的处理器,自然又为手游的发展大大地加了一把油,NVIDIA代号为“Wayne”的Tegra 4四核处理器,就采用了ARM Cortex-A15内核,目前采用Tegra4的游戏掌机Shield马上就要上市,而采用Karit 400架构(基于Cortex-A15架构改进而来)的高通骁龙800,也已经面市,本文见报时应该已经有相应产品发布。

 

GPU大战:让手游画面更炫

  移动手持平台上无穷无尽的处理器大战,同时也带来了嵌入式GPU的大战。在以往的PC平台上,独立显卡赋予了3D游戏画面新的定义,让我们从二维色块世界进入了绚丽的三维世界,现在手机与平板电脑所使用的GPU,同样也在飞速地发展,让手游以更快的速度追赶着PC与主机游戏。


手游,GPU成长的催化剂

   近几年来,手机游戏正在逐渐侵蚀着掌上游戏机的市场份额,当然这种“侵略”是有实力为基础的。

    目前在手机上看到的已经不再是当年简单的贪吃蛇,各种各样庞大、精美的手机游戏已经走进我们的生活,甚至一些电脑上出色的网游《魔兽世界》也有了手机终端中的山寨版,画面堪比PC上的DX9级别。而且不少最新的手机都能通过HDMI或WiFi连接高清电视,这让手机和平板甚至可以是类似Xbox360、PS3等游戏机一般的存在。

    当然,手游效果“PC化”发展背后,对系统提出了更高的处理要求。此前,为了降低游戏对系统的要求,手游设计时大多采用数据分包的切入设计方式。打个比方,用户要运行某一款游戏,那么在点击游戏图标的那一刻开始,游戏程序就会将向CPU发送一个整体指令需求包,该需求在CPU那里被分解为数个小型指令,然后CPU再向屏幕、GPU、音频等相关处理单元派分这些小型指令,此时CPU基本已经完成了它的工作,剩下的就是各个处理单元进行指令需求的处理。而这些处理过程基本是不间断的,一直到用户退出该游戏。

    不过,面对效果越来越优秀的手机游戏,在这种工作方式下的CPU已经越来越难满足。这时手机的图形处理性能也逐渐被重视,手机、平板电脑如同PC发展一样不得不引了一个专业助手——GPU。虽然CPU和GPU都是具有高速运算能力的芯片,但CPU更像“通才”——指令运算+数值运算,GPU更像“专才”——图形计算,不同类型的运算决定了它们的工作效率。

    在多核架构成为主流的今天,多媒体应用的并行机制十分显著,例如图像处理、音频/视频转码以及文件压缩等等。这些应用可以利用对称多重处理以及CPU+GPU结合,配备性能更强的图形处理核心无疑对用户体验提供更加立竿见影的效果。

    由于移动游戏发展迅猛,开发者正将受欢迎的PC和游戏机游戏引擎移植到移动手持设备上,移动游戏现在可以具备先进的游戏特性,例如实时物理效果以及实时纹理生成。在这种趋势下专业的GPU能够为智能终端实现更高的性能,提供更高的图像质量,让玩家也能够获得更加逼真的游戏体验。如苹果的iPhone5就使用了三核的PowerVR SGX 543MP3 GPU,三星的平板电脑Galaxy Note 10.1则使用了最高支持四核的Mail T400MP。除了苹果和三星,其他厂商也将在自己的下一代智能设备中升级GPU。


ARM平台四大主流GPU

  目前市面上比较知名的手持设备GPU图形芯片有PowerVR的SGX系列、高通的Adreno系列、ARM自家的Mali图形处理单元和nVIDIA的Gefore ULV系列。


Imagination PowerVR SGX系列

  对于广大公众来说,Imagination公司的名字或许并不响亮,但包括Intel、三星、德州仪器等公司都获得了Imagination公司的授权,他们制造的手机、超便携系统处理器或SoC片上系统芯片上,都搭载了由Imagination开发的PowerVR图形核心技术。

    PowerVR在20世纪90年代曾是3dfx Voodoo的主要竞争对手,在后来的市场竞争中,这两个品牌都从PC市场消失了,但PowerVR转入了移动GPU领域。虽然PowerVR在桌面平台上难以和NVIDIA与AMD竞争,但在转向超便携、超低功耗平台后PowerVR却有着不错的表现,诸如OpenGL 2.0、OpenGL VG 1.0以及DirectX 9.0L等诸多规格都做到了完美支持。目前市场是常见的主要有PowerVR SGX530/535/540/543/544等几个型号,均属于第五代PowerVR产品,采用统一架构,支持DX9,SM3.0,OpenGL 2.0,依然采用TBR渲染模式,支持H264解码。PowerVR SGX最多可拥有16个图形核心,每个Core拥有4个渲染管线,总共拥有64个USSE2图形管线,可以根据不同的市场定位配备不同的管线配置。

  POWERVRSGX544则是这个系列最顶级型号,三角形输出输出率达到88M/s,像素填充达到1250 M/s,单核的三角输出率要比双核SGX543MP2还要高。举例而言,即便是SGX543 MP4,运行频率仅为200MHz,但是每秒可生成1.33亿个多边形,像素填充率则可达每秒40亿像素(4GPixel/s),已经达了入门级台式显卡的水准。同时,为了满足越来越高的移动终端的图形处理要求,Imagination 要在今年推出了代号Rogue的 PowerVR 6系列. Imagination宣称PowerVR 6系列架构将会带给行动装置媲美桌上型GPU的效能,却仅有mW等级的功耗。根据意法爱立信此前公布的Nova A9600 SoC规格数据,它搭载的PowerVR 6 GPU每秒钟可生成3.5亿个“真实多边形”,性能是PowerVR SGX 543的三倍,预计我们最快能够在今年年底看到搭载PowerVR 6核心的产品。

 

高通Adreno系列

    在手机移动GPU领域,高通公司的Adreno系列图形产品也是个不可或缺的角色。Adreno,是高通在2009年初收购了AMD包括图形芯片技术在内的掌上设备资产的基础上,推出的一个全新GPU品牌体系。Adreno GPU至今已经发布了几款产品,包括:Adreno 130、Adreno 200、Adreno 205、Adreno 220、Adreno 225,主要应用在Snapdragon系列芯片组上。

  如采用双核架构的三代Snapdragon主要配备性能最的Adreno 220,三角形输出率、像素填充率分别提升到:88M/s、532M/s,性能比上一代Adreno 205提升达50%以上。性能的提升,Adreno 220 GPU可以带来多种优秀的图形技术,包括先进的物理粒子和顶点蒙皮、全屏着色处理效果、动态全屏照明Alpha混合、实时仿真贴图、3D动画纹理,以及动态阴影、贴图、反射等着色器。高通曾做过这么一个演示:一个内置Snapdragon MSM8660双核处理器的移动开发平台可以将《沙漠之风》游戏画面通过HDMI输出到了一个55英寸的高清液晶显示屏,这充分展示Adreno 220的处理能力。而第四代Snapdragon的图形核心就是配备性能更高的Adreno 225---比如其在200MHz下浮点运算能力可以达到12.8GFLOPS。这是高通2系列GPU的最后一款产品,而性能更高的Adreno320已经出现---拥有200M/s三角形输出、3200M/s像素填充的水准,如小米2、Nexus 4就是配备这款GPU。


NVIDIA ULP GeForce系列

  NVIDIA是PC平台上主要的图形芯片供应商,不过与高通一样,它们也不出售和授权自家的移动终端GPU,NVIDIA的GPU主要应用在自家的Tegra移动芯片上。如Tegra2采用就是自家的ULP GeForce架构,包含8个CUDA处理器,支持OpenGL ES2.0以及可编程等特性,1080p的高清视频编码与解码更是它的长项,性能极其强大。而最新四核心Tegra4则配备了性能更强的GPU。相比Tegra 3,Tegra 4的GPU核心除了支持支持3D技术外,顶点处理引擎/着色引擎数量从12个提升到72个,图形性能空前强大。


ARM Mali系列

    Mali系列是ARM推出的GPU,因为是ARM的亲儿子,故支持它的设备也不少,当然最鼎鼎大名的是三星的猎户座Exynos系列。它们使用的Mali-400MP4系列GPU,性能非常强悍,而且Mali-400 开始导入多核设计的概念,将一定数量的管线定义成一颗完整 GPU “核”,透过管理机制可让多个 GPU 视需求进行休眠甚至彻底关闭,曾经一度领跑Android设备。但是随着Adreno320等“新强者”的出现,Mali400MP4也终于走下神坛。当时三星的Galaxy S II刚面试时,很多用户抱怨Mali400MP4的兼容性很差,大部分大型游戏都玩不了。但是随着三星设备的强势发展,现在的游戏厂商甚至专门针对Mali400 MP4优化,只有它才可以“特效全开”,这也说明有时候数据表现不是最重要的,更重要的是有专属优化。

    ARM在推出Mali4系列之后就推出更高级Mali6系列产品,结构上发上了很大改变,在性能上也有很大提升。T600系列采用了这色器内核架构和三管道体系,更容易实现多核---设计上支持至 8核架构,在未来随着制程演进,实际上 16 核甚至更多核 GPU 架构也是可能被实现的,这比其他架构GPU更有优势。而且加入名叫Transaction Elimination(免覆写)的机制,对于相同画面做自动检查,透过侦测连续祯当中相同的区块省去该区块重复写出的动作,不仅可减少 GPU 负担,也可减少传输数据量以及功耗。值得一提的是,自T600系列发布发,ARM就一直重重点优化T600系列产品,例如它最新发布的T624\T628\T678就比T604在同等裸片面积性能提升50%!性能的提升源自对架构的增强,例如这三款系列GPU可在同样的内核面积下提供更高的时钟频率、更高的IPC(每时钟周期指令数)、更高的能效,每个型号的性能都可以提升50%。另外这三款GPU在支持OpenGL ES 3.0版准同时也首次支持ASTC(适应性可扩展纹理压缩):这是一种由ARM开发、Khronos Group已将其纳入OpenGL ES规范的纹理压缩技术,能在系统级别提高效率,并改进纹理质量和弹性。值得注意的是,同时在设计T600系列时,ARM已经考虑到了与未来64位处理器的兼容问题,T624\T628\T678可支持64位双精度,能与ARM最新的A50系列64位处理器紧密关联。如谷歌Nexus 10平板电脑所采用的三星Exynos 5250双核处理器,就集成了Mali T604四核GPU。

 

内存带宽,GPU的“芯”结

  当然,相对于桌面GPU,移动GPU的级别只能算个小孩子。虽然小孩子在某些场合也能比成人更有优势(比如功耗小),但在力量上还是有先天的差别,主要表现在理论性能和带宽上。与桌面GPU动辄256bit甚至384bit的位宽、1.2-1.5GHz的高频显存相比,手持设备通常搭配的RAM是低功耗、窄带宽的 LPDDR、LPDDR2 等特殊内存——普遍使用的是双32bit位宽、LPDDR2-800或1066的内存系统,总带宽普遍在10GB/s以内,而Tegra 3为了降耗使用的还是单通道内存模式,要和CPU共享仅6.4GB/s的内存带宽。

    没有高带宽就没有大容量纹理数据,也就不会有高画质。在内存带宽有限的限制下,移动GPU厂商关心的头等大事就是如何在尽可能小的带宽需求下提升GPU性能及画质,其中常采用的一个方法就是纹理压缩技术。但与桌面级平台图形接口早已经标准化了不同,整个ARM平台没有如同X86平台的DirectX这种统一的标准,各个GPU厂商的纹理压缩标准格式不一样。如PowerVR SGX系列的专用纹理压缩格式是PVRTC,而高通Adreno系列专用的是ATITC,NVIDIA专用的为DXTC(S3TC),Mali 400则支持ETC 1格式,各自的压缩比例与算法各有不同,所以难以跨平台使用。对于经常在手机上玩大型3D游戏的朋友来说,下载对应自己手机的数据包可以说是一件很让人抓狂的事了,而且各种兼容问题还得用第三方“3D神器”APP来解决,这也是手机GPU大混战的结果,各家支持的材质标准不一样,游戏制作者也很头痛。

    另外,虽然目前ARM移动图形处理器都支持OpenGL ES图形标准,但是与DirectX不同的是,openGL是个开源性标准,尽管有自带的ETC 1纹理压缩格式,但是它并没有像DirectX那样对纹理压缩有着明确的限制,也允许其它纹理压缩格式的出现。OpenGL ES 2.0下 的 ETC1 纹理压缩仅支持 4bit 格式,虽然可以将场景有效率的进行压缩,但由于压缩比过大,被压缩的纹理材质不免影响画面质量,这时候手游开发者通常会在部分需要高画质的地方,把材质改回不压缩状态,但这就只好牺牲带宽。由于内存带宽有限,且带宽使用越凶也越耗电,故开发者只有在画面质量与耗电间取舍,找到一个平衡点。

    还好OpenGL ES 3.0 开始支持ASTC 纹理压缩格式,可最佳调适压缩比,单一像素可以压缩至小于 1bit 到 8bit 。例如,看不出画质影响的部份用1bit到4bit来压,需要高画质的区块则用8bit,除了能减少纹理材质的传输大小外,也能让游戏开发人员开发起来更容易,一个ASTC压缩格式用到底,用不着在某些地方为了画质就得改为不压缩,这也让手持设备的高质量游戏得以全面减少纹理材质上的带宽耗损,维持游戏的画面质量又可减少带宽。

     除了采用纹理压缩技术外,移动GPU解决内存带宽不足的还有一种方法,那就是使用不同的渲染方式,主要有IMR、TBR及TBDR等。

    IMR(Immediate Mode Rendering)就如字面意思一样——提交的每个渲染要求都会立即开始,这是一种简单而又粗暴的思路,优点缺点都非常明显,如果不用为性能担忧,这种方式会很省事,但是IMR的渲染实行的是无差别对待,那些遮蔽处理的部分依然会被渲染处理器,这也导致无意义的读写操作更多,浪费了大量性能和带宽。

    IMR傻大粗的做法不可取,那就来一个聪明点的方式——TBR(Tile Based Rendering,贴图渲染),它将需要渲染的画面分成一个个的区块(tile),每个区块的坐标通过中间缓冲器以列表形式保存在系统内存中。这种渲染方式的好处就是相对IMR减少了不必要的渲染任务,缺点就是遮蔽碎片依然会少量存在,而且需要中间缓冲器。

  TBR虽然比IMR聪明多了,不过还是存在不少缺陷,因此TBDR(Tile Based Deferred Rendering,贴图延迟渲染)闪亮登场,它跟TBR原理相似,但是使用的是延迟渲染(Deferred Rendering),合并了完美像素,通过HSR(Hidden Surface Removal,隐藏面消除)等进一步减少了不需要渲染的过程,降低了带宽需求。实际上这些改变和PC上的渲染有些相似。其他几家厂商用的都是TBR技术,TBDR主要是Imagination在使用,这也是他们最大的筹码之一。在微软的DX11.1升级中也有提到支持TBDR,因为Windows 8系统还专门为平板和触控优化,对TBDR这种移动平台常用的技术加以优化也是必然的。

    通过这些渲染技术,手持设备的GPU在一定程度上缓解了内存带宽不足对手游性能的影响,在游戏画面与运行效率之间寻得了一个平衡点。


GPU发展到最后必将走进云端

    就在ARM处理器核战告一个段落时,ARM平台GPU之战的高潮才刚刚到来。但手机GPU还会拼多久?可能未来规格越来越高,性能越来越强,结果会是什么样?最后既便是8核、16核GPU也HOLD不住飙升的功耗与发热,除非电池技术有了革命性的进步,才会让这样的硬件大战继续延长。

    毫无疑问,对于手游来说,已经到了需要作出改变的时刻。云游戏的出现,恰恰代表新的变革思路。云游戏,就是将游戏过程中涉及的绝大部分计算任务,包括AI、物理效果、图像和声音等,都交由服务器端运行,并将渲染完毕后的游戏画面压缩后通过网络传送给用户。在客户端,用户的游戏设备不需要任何高端处理器和显卡,只需要基本的视频解压能及网络通讯质量能够满足数据传输需求即可就可以了,这无疑会将手机、平板等智能终端从目前GPU核战中解脱出来!到最后GPU不再是手游用户最关注的点——在未来,用户可能会关心某款手机是否有虚拟现实显示功能,但他们不会去在意它是用什么GPU来实现的!

 
本文出自2013-07-01出版的《电脑报》2013年第25期 D.智能手机
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交