不得不說,手機(jī)產(chǎn)業(yè)從幾年前的電子奢侈品已經(jīng)完全轉(zhuǎn)變?yōu)殡娮酉M品。而曾經(jīng)的黑箱交易也變得越來越透明。透明不僅僅局限于手機(jī)硬件利潤的下降,更體現(xiàn)在時下市場的理性。記得幾年前屏大、高主頻CPU就是高價手機(jī)的代名詞,而隨著消費者越來越理性,手機(jī)產(chǎn)業(yè)鏈的各個硬件產(chǎn)業(yè)也紛紛走上正軌。例如屏幕向著窄邊框發(fā)展、電池向著高能量密度/快速充電方向發(fā)展、拍照朝著高低光靈敏度發(fā)展等等.而作為智能手機(jī)硬件最重要的一環(huán),CPU未來的發(fā)展方向是什么?對于這個問題大家眾說紛紜。
但必須要說的是,之前拼最高主頻、最高性能那條老路在16年已經(jīng)行不通了。從高通、三星、海思等最新產(chǎn)品上我們也可以看出在未來的一段時間內(nèi)主流CPU廠商已經(jīng)朝著比拼單位性能方向發(fā)展。舉個簡單的例子:如何提升單位主頻下的運算性能、如何能在超低功耗下提升性能是體現(xiàn)各大廠商研發(fā)實力的關(guān)鍵。今天我們就來總結(jié)下各大廠商為了能夠提升單位性能在哪些方面做出了努力。
全面升級架構(gòu)
提升CPU性能的最主要的方法就是更新架構(gòu)。近年來ARM高性能架構(gòu)從Cortex-A8/A9到Cortex-A15/A17,再到去年紅極一時的Cortex-A57,而今年包括高通、海思都升級至Cortex-A72架構(gòu)。對于性能方面,ARM官方宣稱A72架構(gòu)核心性能達(dá)到A15架構(gòu)的3.5倍(數(shù)據(jù)基于16nm FinFET工藝A72對28nm傳統(tǒng)工藝A15),之前A57相比A15架構(gòu)性能提升1.9倍(數(shù)據(jù)基于20nm傳統(tǒng)工藝A57對28nm傳統(tǒng)工藝A15),所以大致可以看出同頻率同工藝的A72核心性能相比A57架構(gòu)性能應(yīng)該有大致25%到35%左右的提升。
A72架構(gòu)除了CPU性能提升、功耗下降之外,還有兩大其他特性。其中就有Corelink CCI-500的加入。Corelink CCI-500最大的變化就是增加了一個“探聽過濾器”(Snoop Filter),從而使探聽控制不再局限于單個簇內(nèi)部的CPU之間,可以擴(kuò)展到整個處理器的所有核心。之前這一特性僅在高通驍龍805及其后續(xù)旗艦SoC芯片中有所體現(xiàn)(高通不采用ARM公版的CCI,而采用自主研發(fā)CCI)。總體而言,CCI-500的加入能夠提升30%的內(nèi)存性能,讓很多需要大內(nèi)存吞吐的場景例如4K視頻等場景體驗更好,也能夠進(jìn)一步解放多核心性能。由此我們也可以看出A72是現(xiàn)有高性能架構(gòu)中單位主頻性能最強(qiáng)的架構(gòu),這一點毋庸置疑。同時相比于A57來說,單位主頻下功耗也有大幅度下降,這不僅得益于A72架構(gòu)的分支預(yù)測運算能力提升,更重要的是FinFET工藝的加入。
采用全新工藝制程
如果說15年三星Exynos7420系列是FinFET工藝嶄露頭角的話,那么16年就是FinFET工藝大放異彩挑大梁的一年。FinFET工藝誕生于上世紀(jì)90年代,當(dāng)時美國政府認(rèn)為有必要進(jìn)行25nm以下工藝制程的研究。因當(dāng)進(jìn)入25nm以下會出現(xiàn)傳統(tǒng)工藝柵欄無法有效控制漏電率的問題,此時美籍華人胡正明提出了FinFET技術(shù)和FD-SOI技術(shù)來解決漏電率的問題。其中FinFET工藝則是通過改造刪欄形態(tài)來控制漏電。其實芯片的總功耗P=Pswitch(電路聯(lián)通時功耗)+Pshort(刪開關(guān)的功耗)+Pleak(漏電功耗)。
之所以高通驍龍810會出現(xiàn)運行過程中降頻甚至關(guān)閉核心的問題,很大程度上就是因為漏電功耗居高不下,導(dǎo)致整體功耗過高。甚至整機(jī)功耗超過4W也是時有發(fā)生的事。所以有很多人認(rèn)為驍龍810降頻是為了降溫,其實根本的問題是20nm傳統(tǒng)工藝無法已經(jīng)無法控制A57架構(gòu)漏電所帶來的超高功耗。所以在新一代的SOC芯片中,高通也采用了FinFET工藝。想要了解更多關(guān)于FinFET的故事,大家可以點擊上方麒麟團(tuán)隊為胡正明教授拍攝的宣傳片。(PS.胡正明教授也在很長一段時間內(nèi)任職臺積電CTO)。總體而言,ARM官方宣稱基于16nm FinFET工藝的A72核心相比28nm A15下降75%,相比20nm A57也有50%的下降。并且采用big.liTTLE大小核架構(gòu)會更加省電。這一切的功勞很大程度上都得益于FinFET工藝的成熟。
協(xié)處理器性能迅速提升
超低功耗下性能提升也是目前各大CPU廠商重點攻堅的對象。其實手機(jī)CPU和PC處理器相同,從誕生之日起就對于不同使用場景進(jìn)行針對性的調(diào)節(jié)。例如以全球首款1GHz主頻商用智能手機(jī)CPU——高通MSM8250為例。雖然其最高主頻為1GHz,但也針對不同使用場景進(jìn)行了最低192MHz的設(shè)定。但手機(jī)處理器由于其工作原理的限制,不能做到類似“無級變速”的最小單位為1MHz的動態(tài)調(diào)節(jié),所以在使用過程中會出現(xiàn)使用最低主頻運行仍然性能過剩的情況。為了解決這一問題,協(xié)處理孕育而生。而ARM在去年發(fā)布了最新的針對物聯(lián)網(wǎng)、智能家居的嵌入式架構(gòu)Cortex-M7則是目前最炙手可熱的協(xié)處理器架構(gòu)。
相比于Cortex-M3架構(gòu),最新的Cortex-M7性能提升4倍。在40nm LP工藝與400MHz主頻下,Cortex-M7處理器能夠達(dá)到2000 Coremarks的性能,基本比肩了Cortex-A架構(gòu)的性能。具備FPU和Cache,最重要的一點能夠?qū)⒋龣C(jī)功耗從之前的90mA下降至6.5mA。舉個簡單的例子,一塊1080P屏幕最低亮度待機(jī)時功耗基本在90mA左右。而6.5mA的待機(jī)功耗可供3500mAh電池運行500小時。同時高性能的Cortex-M7也充當(dāng)了Sensor Hub的功能,能夠?qū)崟r的處理各個傳感器的信息,再舉個例子:6.5mA功耗能將你一天的路線圖在不知不覺當(dāng)中記錄下來,能夠監(jiān)測你步行的速度等等,為智能健康提供了更多更精準(zhǔn)的數(shù)據(jù)。
自主架構(gòu)的研發(fā)
自研架構(gòu)相比于公版ARM授權(quán)架構(gòu)(例如我們常說的Cortex-A53/A57等)有個不形象卻通俗易懂的比喻——“站在巨人的肩膀上”。大體來說就是Qualcomm獲得ARM公版授權(quán)后在已經(jīng)較為成熟的公版設(shè)計上在做修改,例如公版設(shè)計上三行代碼解決一個問題,Qualcomm精簡為一行, 當(dāng)然更重要的是加入一些全新的特性例如更新的內(nèi)存控制機(jī)制等等,最終得到一個更高效率的自研架構(gòu)。這也是Qualcomm一直以來有別于其他家廠商的差異化競爭力之一。Qualcomm之所以能夠霸占旗艦手機(jī)市場大部分份額多年,其自研架構(gòu)的戰(zhàn)略也起了很重要的作用。
以采用自主架構(gòu)的驍龍820為例子,此次采用Kryo架構(gòu)的驍龍820采用四核心設(shè)計,時鐘頻率達(dá)到2.2GHz,但有一點值得我們注意,相比于APQ8064、驍龍800、驍龍801不同,此次驍龍820采用了2*2.2GHz+2*1.5GHz的不同時鐘頻率的四顆核心設(shè)計。同時,之前驍龍800采用了4aSMP,也就是四個異步對稱式核心,每科核心均能夠單獨控制,每顆核心的頻率也不存在差異。而此次驍龍820采用兩簇核心管控2aSMP,也就是2+2的異步對稱式核心,換句話說2顆1.5GHz核心是同步同頻的,而兩顆2.2GHz也是同步同頻的,但在這兩簇核心組之間采用了異步對稱式的設(shè)計。講到這里大家可能認(rèn)為驍龍820也采用了類似big.liTTLE的設(shè)計,但通過Qualcomm官方的講解其實并不是這樣,兩簇核心組僅是時鐘頻率上有所差異,但仍采用相同的Kryo架構(gòu)。關(guān)于自研架構(gòu)我們上面已經(jīng)簡單的解釋一下Kryo架構(gòu),順便提一句多渠道信息表明,包括三星、LG在內(nèi)的多家廠商也開始走自研芯片的道路。