Apple新聞

蘋果 A13 Bionic 處理器深入分析:已經屌打所有市面上最強安卓手機

今年,知名硬件網站anandtech發布了對蘋果iPhone 11系列和蘋果A13處理器深入解讀。在晶片環節,他們通過對蘋果這顆A13處理器器深入分析。並得出一個結論:與所有的安卓系列處理器晶片相比,蘋果A13擁有最佳的性能表現。

蘋果 A13 Bionic 處理器深入分析:已經屌打所有市面上最強安卓手機

 

下面我們來摘取一下文章中的一些亮點:

首先在製造工藝方面,根據anandtech的分析,蘋果A13使用的是N7節點的性能調整型工藝,而不是基於EUV生產的N7 +節點。他們進一步指出,他們這邊還沒披露這顆處理器的具體尺寸,但從TechInsights的數據顯示,蘋果新處理器晶片的尺寸為98.48mm²,比去年的A12大18.3%。

而在內核性能方面, anandtech表示,A13同樣採用“2+4”的設計,其大型性能內核的時鐘速度與前一代相比,大約提高了6%,使其達到2666MHz左右。但根據去年的經年,當時A12大內核的時鐘頻率約為2500MHz,但在性能計數器測得的準確數字似乎是2514MHz。同樣,A13的大核心時鐘應比其估計的2666MHz時鐘高幾個MHz。

小型效率內核的時鐘頻率提高了8.8 – 12.3%,使其最高頻率達到了約1728MHz。這是一個很好的提升,但是重要的是,當有更多的小核處於活動狀態時,它們現在不會降低時鐘頻率。

anandtech進一步指出,這一代的大型內核稱為“Lightning”,是去年Vortex微體系結構的直接後繼產品。在他們看來,新的內核在核心設計方面,至少在通常的執行單元方面,與去年的核心之間沒有太大差異。微體系結構的核心仍然是7寬(wide)的解碼前端,與非常寬的執行後端配對,該後端具有6個ALU和3個FP /矢量流水線。

因為Lightning和Vortex兩者在很大程度上相似,所以anandtech認為Apple尚未對執行後端進行任何實質性更改,但值得注意的是其複雜的整數管道,在這上面確實看到了改進。在這裡,兩個乘法器單元可以減少一個週期的延遲,從4個週期減少到3個週期。整數吞吐量也得到了很大的提升,因為吞吐量現在已經加倍,並且延遲/最小周期數從8個減少到8個, 7個週期。

在緩存方面,蘋果似乎保留了A12的Vortex內核中的緩存結構。這意味著我們具有8路關聯的128KB L1指令和數據緩存。數據高速緩存保持非常快的速度,並具有3個週期的加載使用延遲。內核之間共享的L2高速緩存繼續保持8MB的大小,但是Apple已將延遲從16個週期減少到14個週期。

在發表會時候,我們記得蘋果介紹晶片的時候提到,CPU內核的一個重大變化是Apple將“機器學習加速器”集成到微體系結構中。從本質上講,它們似乎是矩陣乘法單元,並帶有類似DSP的指令,Apple將其性能提高到了1太字節操作(TOP)吞吐量,聲稱比常規矢量流水線提高了6倍。根據anandtech的分析,該AMX指令集似乎是在CPU內核上運行的ARM ISA的超集。

關於這意味著什麼一直有很多困惑,因為直到現在還不廣為人知,允許Arm體系結構的被許可人使用自定義指令擴展其ISA。我們無法從Apple或Arm那裡得到任何確認,但是,很明顯的一件事是Apple並未向開發人員公開公開這些新指令,並且它們也未包含在Apple的公共編譯器中。

我們確實知道,Apple內部確實有可用的編譯器,並且Acclerate.framework之類的庫似乎能夠利用AMX。

Arm最近透露了將定制指令提供給供應商以實施和集成到Arm內核中的證據,這顯然足以證明體系結構被許可人可以自由地做自己想做的事情–蘋果選擇隱藏AMX指令至少可以解決對可能的ISA的擔憂軟件方面的碎片化。

 

CPU內核:重大升級

蘋果公司的小型效率內核非常有趣,因為與Arm的典型小型內核(例如Cortex-A55)相比,它們並沒有那麼小。去年,A12中的Tempest效率核心基於一個3幅亂序的微體系結構,該體系結構具有兩個主要執行管道,與L / S單元一起工作,我們假設這是一個專用的單元。

今年的Thunder微體系結構似乎對效率CPU內核進行了重大更改,因為我們看到了新內核的執行功能的實質性升級。就整數ALU而言,我們似乎仍在查看兩個單元,但是Apple已將能夠進行標誌設置操作的單元數量從1倍增加到2倍。MUL吞吐量在每個週期保持1條指令,而除法單元也是貌似不變。

從新的A13 Thunder內核的性能來看,我們看到新的微體系結構已大大提高了IPC、SPECint的增益從403.gcc的19%提高到400.perlbench的38%,而浮點性能在非內存綁定的SPECfp工作負載中,性能也同樣提高了34-38%

在其他方面,我們看到一些性能下降,這是因為Apple更改了內存子系統的DVFS策略,導致效率核心無法觸發某些內存控制器的更高頻率性能狀態。這導致我們看到一些奇怪的結果,例如470.lbm。

新內核的電源效率也明顯更高。當然,其中一些改進將歸因於系統內存運行速度不快,但考慮到內核仍可在SPEC套件中提供10%到23%的平均性能,仍然給人留下深刻的印象,即能耗降低了25 %平均而言,也指向主要的效率提升。

面對Lightning核心(除AMX之外)相對保守的變化,新的Thunder核心對於A13來說似乎是徹底的巨大變化,並且與Apple過去的效率核心微體系結構存在重大分歧。在與諸如Snapdragon 855的Cortex-A55實施方案進行對抗時,新的Thunder內核表現出2.5-3倍的性能領先優勢,而能耗卻不到一半

 

SPEC2006性能:台式機水平

鑑於我們沒有看到大型Lightning CPU內核的微體系結構有太多重大變化,因此我們不會期望其較之A12,性能會有特別大的提高。但是,由於內存子系統和核心前端的改進,時鐘頻率增加了6%,而IPC卻提高了幾個百分點,因此可以,而且確實會帶來大約20%的性能提升,這與實際情況是一致的。蘋果在做廣告。

我暫時仍要回到SPEC2006,因為我還沒有時間移植和測試2017年的移動設備。

在SPECint2006中,性能的改進相對平均地分佈。平均而言,我們看到性能提高了17%。最大的收益來自受延遲限制的471.omnetpp和403.gcc,這給緩存帶來了更大的壓力。這些測試分別增加了25%和24%,這是非常顯著的。

儘管性能數據非常簡單明了,而且沒有任何令人驚訝的地方,但另一方面,功率和效率數據卻極其出乎意料。在幾乎所有的SPECint2006測試中,Apple都採用了A13 SoC並提高了峰值功耗。因此,在許多情況下,我們比A12高出近1W。在這裡,在性能達到峰值時,功率增加似乎大於性能增加,這就是為什麼在幾乎所有工作負載中,A13的效率都低於A12的原因。

總體而言,就性能而言,A13和Lightning內核非常快。在移動領域,實際上沒有競爭,因為A13的性能幾乎是次佳的非Apple SoC的兩倍。在浮點套件中,兩者的差異要小一些,但同樣,我們至少要再等待2-3年,才能期待任何適當的競爭,而且Apple也不會停滯不前。

去年,我注意到A12與最好的台式機CPU內核相比差強人意。今年,A13至少在SPECint2006上與AMD和Intel所能提供的最佳匹配。在SPECfp2006中,A13仍落後約15%。

令人震驚的功率數字的一種可能解釋是,對於A13,蘋果公司在新的Lightning核心的峰值頻率處處於頻率/電壓曲線的遠端。在上圖中,我們估算了去年A12的功率曲線–在這裡,我們可以看到Apple非常保守,其電壓直到最後幾百MHz。對於A13而言,蘋果在隨後的頻率狀態下可能更激進。

關於這種假設的好消息是,平均而言,在日常工作量中,A13應該在效率更高的運行點上運行。蘋果公司的營銷材料將A13的速度提高了20%,同時還指出其耗電量比A12少30%,不幸的是,這種說法具有欺騙性(或至少不清楚)。儘管我們懷疑很多人會把它解釋為意味著A13速度提高了20%,而同時使用的功率卻減少了30%,但這實際上是其中之一。實際上,這意味著在相當於A12峰值性能的性能點上,A13的能耗將減少30%。考慮到蘋果功率曲線的陡峭性,我可以輕易地想像出這是準確的。

 

系統和ML性能

在研究了新A13的CPU性能之後,是時候看看它在某些系統級測試中的性能了。不幸的是,仍然缺少針對iOS的適當的系統測試,這尤其令人沮喪,尤其是涉及PCMark之類的測試時,它們可以更準確地表示應用程序用例。取而代之的是,我們必須退回到基於瀏覽器的基準測試。瀏覽器性能仍然是設備性能的一個重要方面,因為它仍然是主要工作負載之一,它在顯示性能延遲(例如響應時間)等性能特徵時,給CPU帶來了很大壓力。

與往常一樣,以下基準測試不僅表示硬件功能,還表示手機的軟件優化。在我們的測試中,iOS13再次將基於瀏覽器的基準性能提高了約10%。我們已經進行了更新,並以iOS13上的新分數更新了上一代iPhone的性能數據,以對新iPhone 11進行正確的Apple-Apple比較。

在Speedometer 2.0中,我們看到新的基於A13的手機與上一代iPhone XS和A12相比,性能提高了19-20%。這一增長與蘋果的性能要求保持一致。今年的增長比我們去年使用A12看到的要小,因為去年得分的主要提升似乎是升級到128KB L1I緩存。

與A12相比,A13在達到大型Lightning內核的最大時鐘速度所需的時間方面並沒有太大變化,而CPU內核在超過100ms的時間內達到了峰值。

真正改變的是工作負載駐留在較小的Thunder效率內核上的時間。在A13上,小核心的爬坡速度比在A12上要快得多。調度程序行為以及工作負載從小型內核遷移到大型內核時,也都發生了重大變化。現在,在A13上,這種情況大約在30毫秒後發生,而在A12上,這可能需要54毫秒。由於小型內核不再能夠獨自請求更高的內存控制器性能狀態,因此在工作負載要求更高的情況下,現在應該盡快遷移到大型內核。

A13的Lightning內核以910MHz左右的基本頻率啟動,這比A12及其1180MHz的基本頻率低了一點。這意味著Apple已將A13中大型內核的動態範圍擴展到了更高的性能以及更低,更有效的頻率。

 

機器學習推理性能

蘋果還聲稱已經提高了A13中神經處理器IP模塊的性能。要使用此單元,您必須使用CoreML框架。不幸的是,到目前為止,我們還沒有一個自定義工具來測試它,因此我們不得不依靠一種罕見的外部應用程序為它提供基準,那就是魯大師的AIMark。

像網絡瀏覽器的工作負載一樣,iOS13也為過去的設備帶來了性能改進,因此我們重新運行了iPhone X和XS評分,以便與新iPhone 11進行適當比較。

iPhone 11和新款A13的改進取決於型號和工作負載。對於InceptionV3和ResNet34等經典模型,我們發現推理率提高了23-29%。MobileNet-SSD的增長幅度有限,僅為17%,而DeepLabV3的增長幅度則為48%。

通常,運行機器學習基準測試的問題是它貫穿抽象層(在本例中為CoreML)運行。我們無法保證NPU與CPU和GPU上實際運行了多少模型,因為根據設備的ML驅動程序,它們之間可能會有很大差異。

不過,這裡的A13和iPhone 11很有競爭力,並且為這一代人提供了良好的迭代性能。

總體而言,iPhone 11s的性能非常出色,因為我們已經一次又一次地期望蘋果公司。話雖如此,我不能說我在日常使用中與iPhone XS的區別太大。因此,儘管A13提供了一流的性能,但對於來自去年A12設備的用戶而言,它可能不會非常引人注目。老式設備將帶來更大的影響。否則,憑藉如此強大的功能,我覺得用戶體驗將從加速應用程序和系統動畫的選項中受益匪淺,或者甚至完全關閉它們以真正感受到硬件的順暢性。

 

GPU性能和功耗

我們詳細介紹了A13的CPU,GPU也是不可忽視的一部分。蘋果今年在對這個單元的性能表現更為保守,該公司承諾,在與A12相同的性能下,GPU性能提高20%或功率降低40%。

除了晶片組和GPU的原始性能外,遊戲的重要意義在於實際設備的熱特性以及如何消散和維持SoC的高熱量。對於A12,我確實批評蘋果,因為它在允許手機開始使用3D工作負載的峰值功率方面表現得非常激進。這導致電話在降低速度之前並不能真正保持這些性能水平超過2-3分鐘。

今年,蘋果公司已經宣布,他們已經提高了設備的SoC冷卻能力,能夠更好地將熱量從SoC散佈到手機主體,從而使晶片保持更高的性能狀態。

從3DMark中的物理測試開始,實際上,在GPU工作負載期間受功率限制時,這實際上更多地是CPU工作負載。在這種情況下,與去年的iPhone相比,iPhone 11在峰值性能方面的表現要好一些,但是它們並不能完全保持與A12 iPhone相同的持續性能。

切換到對GPU施加最大壓力的圖形工作負載,我們現在在這裡看到分數和排名的重大變化。首先,與去年的A12設備相比,新的iPhone 11s和A13現在顯示出顯著的性能提升。我注意到,當我們分析該晶片時,蘋果在3DMark方面表現異常差強人意,並且看來蘋果能夠解決這一代的任何瓶頸,性能提高了38%。實際上,我已經回過頭來,迅速對iOS13上的iPhone XS進行了測試,與我們在此圖中看到的相比,確實看到了20%的性能提升。

新的iPhone得分不及某些Snapdragon 855(+)設備,但這是因為Apple不允許iPhone的發熱量幾乎與其他某些設備一樣高。我無法在任何新iPhone上測量高於41°C的場景。

通過測量功耗,我們再次看到A13設備的峰值功率極激進,超過6.2W。有趣的是,即使在這種耗電的峰值性能狀態下,A13的效率也比A12高,並且比競爭對手的效率高得多。

通過一系列的測試,anandteh指出,去年,A13的GPU性能是同類產品中最佳。他們表示,去年A12在GPU方面進行了令人印象深刻的改進,這是蘋果第一次在性能和效率方面能夠非常明顯地領先於高通。

首先,A13的峰值性能確實提高了約20%!但是這不是人們應該最關注的指標。與去年的iPhone相比,蘋果的持續性能得分提高更為顯著,達到50%~60%,看起來,蘋果聲稱改善了SoC散熱性能的說法非常好。

最重要的是,蘋果在A13上的新型GPU微體系結構令人印象深刻。鑑於流程節點的發展微不足道,我沒想到該公司能夠推動如此大的性能和功率效率提升,我們需要從競爭對手中看到一些重大的模式轉變,以使它們能夠趕上下一代設備。

 

延伸閱讀:

 

本文來源:由半導體行業觀察(ID:icbank)翻譯自「anandtech」,作者:Andrei Frumusanu。

▼ 如果覺得本篇教學不錯,歡迎加入瘋先生粉絲團追最新教學技巧 ▼