關鍵零組件 2013-10-02

淺談智慧型手機應用處理器的效能

由於智慧型手機的應用越來越多，加上Android 4.0作業系統版本以後需耗用較大的系統資源，目前智慧型手機的應用處理器(Application Processor， AP)已經邁向多核心的ARM架構。各家業者功能強大的應用處理器持續推陳出新，競爭激烈，就像軍備大賽一樣展現各項進化規格，如何選擇讓人傷透腦筋? 雖然目前坊間有各式各樣的手機效能測試軟體可供參考(如安兔兔、Quadrant、Smartphone Benchmarks..) ，不過各家軟體對於效能要素的權重不一，評量結果莫衷一是。雖然多數的評測結果仍有可參考之處，但在手機測試軟體評價獲得高分的智慧型手機在實際體驗上並沒有太特殊之處，甚至比較差〭以下針對智慧型手機CPU效能的問題, 提出個人拙見:

CPU

圖片來源: 網路

1. 智慧手機應用處理器是一種SOC晶片，必須整合與優化各項處理單元才能提升效能

目前智慧型手機應用處理器都是Soc 晶片 (System on a Chip, 系統級單晶片)，乃整合各種計算能力，包含多媒體編解碼、3D、音效、介面連接、DSP等處理單元，然後再連接到嵌入式RISC核心(一般都是ARM核心)，形成一個完整的應用處理器架構。CPU只佔應用處理器的一部分，若要提升應用處理器的效能，不能光提升CPU的效能，, 必須將相關搭配的處理單元的效能也同步提升，才能發揮綜效。

CPU1

2. 處理核心架構、製程工藝、GPU、L2二級緩存、作業系統的優化與手機的DRAM是影響應用處理器效能最重要的因素

測試應用處理器效能常根據DMPIS數據(同一秒內系統的處理能力的參數，DMPIS = ARM架構效能 X常規主頻的高低X核心數)，所以一般人都會以CPU核心數(單/雙/四核/八核)﹑常規主頻 ( 600~800Mhz / 1~2.5Ghz )的高低及ARM架構(A5/A7/A8/A9/A15/A53/A57/A72..)來斷定CPU或應用處理器的效能〭其實，真正影響應用處理器效能重要關鍵因素是應用處理核心架構、製程工藝、GPU、L2二級緩存、作業系統的優化與手機的DRAM〭說明如下:

CPU2

A. ARM架構、多核心、總線帶寬:

a. ARM架構:

ARM Cortex A系列, A15 DMIPS效能(3500-3300)>A9(2500) > A8(2000) >A7(1900) > A5 (1200)。

PS: 另有說法是A7 With 28nm 1.2G hz是A8 45nm 1 Ghz 1.5倍

b. 多核心:

除Cortex A8只能支援單核外，其他都可以支援多核心，A15甚至可以支援到八核心〭。是故，多核心處理器的效能高低要看是採用哪種架構的多核心，A15+A15 > A9+A9，這也是高通S4系列>S3系列效能的原因〭高效能也代表高耗能，為取得效能、省電、成本間的平衡，聯發科與高通將於年底/明年Q1推出的四核心的MTK6583將採四核心A7架構及MSM8225Q將採A5四核心架構〭加上 ARM已開發big.LITTLE與虛擬化技術，可做到高效能CPU與低效能CPU混搭分工合作〭。是故，未來多核心CPU效能不能光以核心數多寡來斷定〭

c.總線帶寬:

智慧型手機的應用處理器既然是SOC晶片，各處理單元間必須互聯才有辦法發揮綜效。總線帶寬是指在固定的的時間可傳輸的數據數量，帶寬越大，則代表傳輸能力也越強。總帶寬(GB/S)=總線寬度(bits)X工作頻率(Mhz)。總線寬度一般有32/64/128/256 Bits，工作頻率則為200/300/400 Mhz。總線帶寬基本上與ARM架構有關，一般應用處理器的總線寬度為64bit、200MHz，總帶寬1.6GB/S，就已經夠用了。不過德州儀器OMAP 4430 A 9架構的雙核處理器則能夠達到128bit，200MHz，總帶寬為3.2GB/S。三星 Exynos 4210處理器能夠達到256bit，200MHz，總帶寬可達6.4GB/S。一般認為總帶寬越大越好，不過CPU互聯結構佔用不少處理器空間，只要配合處理器性能提供足夠帶寬即可。

B. 製程工藝、常規主頻的高低、處理器核心協助作戰能力

a. 製程工藝:

製程工藝是在生產CPU過程中，要進行加工各種電路和電子元件，製造導線連接各個元器件。通常其生產的精度以nm奈米表示，精度越高，生產工藝越先進。在同樣的材料中可以製造更多的電子晶體，連接線也越細，提高CPU的集成度。換言之，製程工藝越先進，可以降低功耗並在同樣面積中集成更多晶體，代表處理器的性能將會越優異。智慧型手機的製程工藝已由過去的95nm、65nm、45nm、40nm、32nm到最新的28nm製程工藝。20nm、16nm、14nm，也正在發展中。製程工藝與架構是同步在發展的，先進的ARM架構，通常就會搭配更先進的製程工藝。製程工藝與架構是同步在發展的，越先進的ARM架構，通常就會搭配更先進的製程工藝。

b. 常規主頻的高低:

常規主頻一般會被認為與處理器性能有關，以為頻率越高代表性能越強。不過，CPU的主頻是CPU內核工作的時鐘頻率（CPU Clock Speed），代表CPU內數字脈衝信號震蕩的速度，與CPU實際的運算能力並沒有直接關係。常規主頻的高低一般與製程工藝有關，製程工藝越先進。常規主頻就會越高，處理器效能也會越高。雖然常規主頻不代表CPU的速度，但提高主頻對於提高CPU運算速度卻有幫助。CPU在高主頻運作會比在低主頻運作快，所以提高主頻將是提高CPU運算速度的先決條件之一。

c. 協同作戰能力:同步多核(SMP)與異步多核(ASMP):

主頻高低無法代表處理器效能的主因乃是同步多核與異步多核技術的爭議。同步CPU(SMP)是指各個CPU內核必須以相同頻率相同電壓時工作或同時休息，不能輪流工作，二級緩存共享。CPU性能得到最大發揮，但同時也帶來更高的功耗，三星/蘋果處理器屬於SMP。異步CPU(ASMP)，各個CPU內核能夠同時以相同或不同頻率電壓處理不同任務，二級緩存共享，可以降低功耗，高通處理器屬於ASMP，. 一般認為異步多核會造成高主頻但低能的現象，異步多核效能=1-10%*核心數。舉例來說，高通1.5GHZ異步雙核處理器的效能就只有同步雙核處理器的1-10%*2=80%=1.5GHz*0.8=1.2Ghz。不過針對此點，高通陣營認為高通是採用在一個CPU滿載情況下再啟用另一個CPU，目前手機大多數都是待機狀態或執行性能要求較低的任務而且大多數應用在開發的時候其實都是單線程的，也就是說本質上大多數應用只能分配給一個CPU內核處理。所以，異步多處理對處理器效能降低影響有限。

C.GPU( 圖型處理器):

GPU( Graphic Processing Unit)圖型處理器，是一個專門的圖形的核心處理器。由於智能手機的快速發展，很多大型的應用程序(如3D遊戲)讓手機的CPU變得不堪負荷，Mobile GPU就扮演類似電腦顯卡的角色，分擔繁重圖形處理工作，讓CPU 可以專心處理純指令。手機GPU不僅負責所有圖形顯示功能(2D/3D處理) ，還負責視訊播放，視訊錄製及照相的輔助處理。

目前比較知名的GPU主要由四家公司執行設計，分別為高通公司的Adreno系列、Imagination Technologies公司的PowerVR SGX系列，同時還包括來自NVIDIA Tegra 芯片組中的Geforce圖形核心及ARM所開發的Mali系列。各家Mobile GPU業者持續推出功能更強大的GPU，目前各業者推出的旗艦GPU效能評比如下:

Apple非常重視GPU能力，在其應用處理器裡塞了2-4顆(核心)的GPU，自然效能非常強大。因Android應用處理器無法塞下如此多核的GPU，以目前坊間推出的單獨GPU性能來看, Adreno 320應該是最強的。

D.L2二級緩存:

二級緩存是介於一級緩存和內存之間的存儲器，主要用來協調一級緩存於內存之間的速率差。 二級緩存在在CPU核心不變化的情況下，增加二級緩存容量能使CPU性能大幅度提高。目前頂級手機L2緩存大都是1066MB。

E.手機DRAM容量

RAM（random access memory）隨機存取記憶體, 容量大小會影響遊戲載入速度和運行流暢度，加上Android 4.0以上作業系統本身就耗用340MB的RAM，若採用過去512MB的RAM往往容易發生RAM不足而造成手機運作緩慢或甚至當機問題.若是選購Android 4.0以上作業系統智慧型手機，RAM容量至少要768MB以上，越大越好.

F. 作業系統優化:

iPhone手機雖然硬體的規格相較其他Android旗艦手機並不突出，但運行卻是非常流暢. 主因就是iOS系統重視用戶體驗與應用，軟硬體間的優化程度最好, 所以把硬體的性能發揮到最好. 反觀Android作業系統採開放系統，牛鬼蛇神混雜，無法統一規範,導致軟硬體間無法及時同步提升，常造成手機卡卡的，逼使等不及的用戶熱愛刷機了!

3. 各品牌頂級應用處理器效能評比: A6 VS 8064 VS 4412 VS Trgra 3

目前坊間已經上市智慧型手機所使用的應用處理器最頂級的就是Qualcomm APQ8064、Apple A6、nVIDIA Trgra 3及Samsung Exynos 4412, 其中除Apple A6是雙核心外, 其餘三款都是四核心處理器。

根據前文提到有關影響應用處理器效能的要素將這四款頂級處理器攤開比較，就不難判斷出Qualcomm APQ8064一定可以在各項手機效能測試軟體打敗其他處理器。為抗衡APQ8064，,SAMSUNG與nVIDIA近期都宣布推出四核心升級版1.6Ghz的Exynos 4412 及nVIDIA Trgra 3 A P37, 就不難判斷出Qualcomm APQ8064一定可以在各項手機效能測試軟體打敗其他處理器。為抗衡APQ8064, SAMSUNG與nVIDIA近期都宣布推出四核心升級版1.6Ghz的Exynos 4412 及nVIDIA Trgra 3 A P37。純就規格來看, 採用同步多核處理(SMP) 的1.6Ghz Exynos 4412 是比較有機會與採用異步多核處理(ASMP)的APQ8064抗衡。 nVIDIA Trgra 3 A P37 雖然調升了常規主頻頻率，不過整體架構及其他處理單元還是差太多，加上Trgra 3 Die Size(晶圓面積)只有80mm光是散熱問題就令人頭大，所以要等Trgra 4才有機會跟大家比拼。純就規格來看，採用同步多核處理(SMP) 的1.6Ghz Exynos 4412 是比較有機會與採用異步多核處理(ASMP)的APQ8064抗衡. nVIDIA Trgra 3 A P37 雖然調升了常規主頻頻率, 不過整體架構及其他處理單元還是差太多，加上Trgra 3 Die Size(晶圓面積)只有80mm光是散熱問題就令人頭大，所以要等Trgra 4才有機會跟大家比拼。

目前採用Qualcomm APQ8064的智慧型手機是小米機二代、LG Optimus G及即將發表上市的Asus Padfone2。雖然Qualcomm發表APQ8064時提供各家手機評測結果非常亮眼，但已上市小米機二代及LG Optimus G在實際體驗上卻不是如此亮眼了。處理器的性能無庸置疑，但APQ8064在Qualcomm的產品規劃屬於S4 Pro系列，主要用於需要較強運算能力及處理較大解析螢幕的平板電腦上。把原本設在使用在高階平版電腦的處理器放在智慧型手機上，除了具備行銷話題外，根本就是一種規格浪費(Over Spec)的做法。若是軟硬體間校調與優化沒做好，反而會畫虎不成反類犬啊!

雖然Apple iPhone6使用的雙核A6處理器在規格上與其他三款Android頂級四核處理器無法比拼，不過根據以實際體驗為主的手機測試軟體評測， iPhone6卻大勝其他三款處理器。雖然目前大家對於A6的核心到底是Cortex A9或A15或是基於ARMv7 ISA指令集而設計出來的新架構(有人猜測試運用ARM big-LITTLE技術)仍有爭議，但A6是雙核心處理器是無庸置疑的。換言之，智慧型手機效能的發揮，不只是像軍備大賽中展現最新穎強化的武器就好，做好軟硬體的優化及站在用戶體驗與應用來設計才是正途。

4. 由Apple處理器發展論智慧型應用處理器正確發展方向

智慧型手機需求全球引爆, Apple iPhone絕對是居功厥偉. 目前智慧型手機陣營中, 只有Apple是作業系統、應用處理器與手機設計全包的廠商. 在Android陣營來看, 除Samsung包辦應用處理器與手機設計(華為勉強也算是)外, 基本Android 陣營的作業系統(Google主導)、應用處理器(高通、聯發科…)及手機硬體設計基本上是各做各的, 所以Android智慧型手機軟硬體優化問題一直是一個很大問題。是故, 要探討智慧型應用處理器正確的發展方向,應該要好好研究Apple歷代應用處理器的進化過程。iPhone、iPhone3及iPhone 3G S的處理器過於老舊就不探討, 以下針對A4(iPhone4)、 A5(iPhone5) 、A5r(iPad2)、A5X(New iPad)及A6(iPhone6)的進化過程做探討:

由iPhone歷代處理器規格進化過程來看, 可以發現規格的提升主要在製程工藝(45nm/32nm)、GPU效能( 1/2/3 )、CPU架構與核心數提升(A8單核/A9雙核/A?雙核)及L2內存緩存( 256M B/ 512M B/ 1G B)及手機DRAM( 512MB/1GB).

因iPhone A4、A5、A6處理中間, APPLE也開發了供平版電腦使用的處理器A5R2(iPad2)與A5X(iPad2). 若用時間序列順序, 可以看到Apple針對智慧型手機與平版電腦產品本身特性在處理器規格的取捨有所調整. 其中, iPad2 A5R2使用32nm的製程工藝到了New iPad A5居然改回45nm, 也讓A5X的CPU Die Size（晶圓面積)大幅增加; 內存寬帶由A5X 128bits又改回64bits ; GPU核心數也由A5X四個改回A6的三個. 內存寬帶與GPU核心數降低, 可以解讀為Apple因應產品類別 (平版電腦/智慧型手機) 需求不同，調整合適規格, 這對於一昧在智慧型手機處理器規格追高的廠商或許可以借鏡.

製程工藝與晶圓面積(Die Size):

為增加CPU效能與降低成本, A6處理器採用32nm製程工藝, 雖然應多增加的一顆GPU導致晶圓面積大於A5R2, 但相較於A5, 晶圓面積由122.2mm2降低到95mm, 提升了處理器效能也兼顧縮小體積因應手機輕薄化的需求. Apple New iPad 使用A5X處理器製程工藝由32nm又改回45nm, 加上將GPU核心數由2個增加到4個以提升圖形處理能力及增加帶寬由64bits增加到128bits增加各處理單元的協同作戰能力, 導致Die Size晶圓體積由原本A5R2的69mm2大幅增加到163mm2, 令人不解. 由於晶圓體積變大會增加晶圓成本, 唯一可以合理解釋此現象的理由是當時Samsung 32nm產能或良率不足? 亦或是改用45nm可以降低的成本可以大於使用先進32nm所必須增加晶圓面積的成本考量? 這個問題恐怕要等10月底iPad Mini上市後解析採用的CPU才能有進一步的理解與釐清.

對於多數廠商而言, 應用處理器的設計, 除了追求性能外, 攻耗與成本對於研發工程師而言總是難以取捨的難題. 以目前已知的各品牌處理器Die Size來看, 　nVIDIA通常是不惜犧牲效能遷就成本降低Die Size; TI很平庸所以拼不過別人準備退出; 三星則追求效能為主, 這由其4210不惜採用256bIts帶寬設計就可驗證. 高通雖然處理器Die Size最大, 但這與其應用處理器整合基頻晶片(BaseBand)有關. 高通是所有處理器業者率先採用28nm先進製程的, 所以可以歸類在注重效能與成本平衡的代表. 今年以黑馬之姿崛起的聯發科, 拜台積電就在附近優勢, 也率先採用28nm先進製程並採用高效能的Cortex A9架構. 28nm因良率較差且產能有限與32nm製程工藝各有優劣所以各擁山頭.放眼未來, 中高階智慧型手機處理器將以四核心為主, 更先進的製程工藝將有可能被運用. 不過, 由Apple仍只採類似Cortex A9雙核的架構來看, 除非智慧型手機還有更進一步的運用必須持續進化使用更強大效能的處理器, 否則基於省電與降低成本考量, 處理器廠商將會改採較低功耗低成本的A7或A5架構的多核心組合或是運用ARM big-little與虛擬化技術改採大小效能處理器分工合作的多核心組合.

DRAM/L2二級緩存/GPU:

在CPU已達到一定水準效能前提下, APPLE以用戶體驗的角度告訴我們, RAM>GPU> CPU。

Apple不但提升DRAM與L2二級緩存容量, 也在存取速度上不斷提升.

Apple增加GPU核心數, 以應付用戶不斷增加的視訊與圖形使用的需求, 這是Android廠商很難去匹敵的優勢.

4.結論:

頭文字D 動漫有段情節, 劇中藤原拓海的AE86引擎掛掉後改裝性能更強的4AG-E AE101高轉速引擎. 雖然4AG-E AE101引擎屬於怪獸級的高速引擎, 但缺乏高轉速表及駕馭經驗不足下, 藤原拓海剛開始的成績不進反退。後來經過裝上萬轉高轉速表與父親文太指導下, 藤原拓海裝上新引擎的AE86性能才被真正解放, 成為山路下坡競賽之王。

手機品牌廠商願意不計成本花錢, 也可輕易裝上怪獸級的應用處理器, 讓產品在手機測試軟體跑分名列前茅. 但對於用戶而言, 實際體驗最重要, 若無法優化軟硬體間的隔閡, 仍是很難獲得用戶的青睞的。