欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

雷鋒網消息,上周我們對全新iPhone XS和A12處理器進行了深入分析,不過主要部分集中在CPU的大核心集群以及GPU集群兩方面,對A12的低功耗小核心集群和NPU集群并沒有過多描述,本文便來繼續探究這兩部分。

代號“Tempes(暴風)”:兇猛的小核心

從A10這一代開始,蘋果在SoC中引入了代號為“Twister(龍卷風)”的低功耗小核心集群,而后是A11為“Mistral(干冷的北風)”,而此次的A12則為“Tempest(暴風)”。不過多年來小核心經歷三代更迭,我們卻從來沒有分析過這些架構,對它們始終有一種神秘感。

從某種意義上說,高性能的核心架構無論怎樣壓低功耗,也無法媲美天生的低功耗小核心架構,即使時鐘門控設計完美,也無法避免核心中存在的靜態泄漏。使用更小的CPU核心有助于緩解靜態泄漏,以及提高動態泄漏功率效率。

Tempest核心是一個亂序三發射的架構,這意味著它與Arm big.LITTLE體系下的小核心基本無關,因為Cortex A53和Cortex A55等均為更簡單的順序執行架構。Tempest核心的執行單元也相對較少,只有兩個簡單ALU算數邏輯單元,其中一個可執行整數和浮點乘法,另一個則能夠執行浮點加法。除了兩條主要管道外,只有一個專用的組合裝載/存儲端口。

有趣的是,Tempest核心基本上與蘋果此前A6處理器的Swift核心是相同的,蘋果很有可能是將老的高性能架構精簡并修改為64位后作為低功耗小核心使用。如果Tempest核心確實是Swift核心派生的,那么在上面描述的三個執行單元之外,還應該有一個用于整數和浮點分區的專用端口,這樣在指令被饋送時才不會阻塞主流水線。

Tempest核心頻率最高可達1587MHz,有32KB L1緩存以及2MB L2緩存。除了L2容量較大之外,Tempest核心與A11的Mistral核心并沒有其他明顯差異。不過不幸的是,當A11的小核心集群上只有一個線程處于活動狀態時,Mistral核心的頻率可以提升到1694MHz,高于Tempest核心,很難直接比較二者的能耗比。

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

與大核心Vortex非常相似,A12的Tempest核心的最大改進體現在對內存敏感的測試項中。,而輸給A11的Mistral核心主要是由于頻率劣勢。總體而言,除了內存改進之外,Tempest核心在性能上與Mistral核心非常相似,這也為我們對比二者的能耗比提供了便利。

但不幸的是,Tempest核心相比Mistral核心的能耗比提升并不如大核心一樣巨大,縱觀SPECint2006測試,Tempest核心的能耗比提升了35%,考慮到Mistral核心的頻率更高,實際同頻下的能耗比提升還要低于35%。而在浮點基準測試中,Tempest核心的能耗比平均只提高了17%。

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

如果將A11和A12的小核心與大核心以及來自Arm的競爭對手放在一起對比,其實并沒有太大的驚喜。與蘋果的大核心相比,小核心的性能大概只有三分之一到四分之一,但它們消耗的能量卻足有大核心的一半。

雷鋒網 (公眾號:雷鋒網) 注:小核心的功耗只有大核心的七分之一到八分之一,但因為性能較低,執行相同任務所用的時間更長,因此實際消耗的能量為大核心的一半

不過令人驚訝的是, 在SPEC的整數工作負載中,A12的Tempest核心和A11的Mistral核心性能甚至相當于2.1GHz頻率下的Cortex A73,但Mistral核心的功耗卻僅有Cortex A73的41%(A11和麒麟970同為臺積電10nm) 。不過在浮點工作負載中,小核心由于沒有專用的浮點執行單元而失去了性能上的競爭力,但它們仍能提供很高的能效。

從測試來看,蘋果的小核心要比Arm的小核心性能要高得多,從私下里積累的Cortex A55測試成績來看, Tempest核心的性能大概是Cortex A55的將近3倍 。Arm小核心的性能在實際使用中很容易成為短板,這意味著 我們未來可能會看到更多像麒麟980這樣的的“大-中-小”三集群SoC ,而Arm也應該思考一下小核心是否還應該繼續使用性能低下的順序執行架構

NPU神經網絡推理性能測試

A12另一個重大而神秘的進化是自主研發的全新NPU,雷鋒網在上篇文章中曾經提到,NPU在A12芯片上占據了較大的面積,幾乎相當于兩顆Vortex大核心。

幸運的是,魯大師的AImark支持iOS,使用Apple的CoreML框架來加速與Android相同的推理模型,可以直接對比蘋果和安卓陣營處理器的神經網絡推理性能。

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

從結果來看,雖然蘋果公布的理論性能(A11:0.6TOps,A12:5 TOps)在這個測試中并未得到很好的驗證,但提升依然達到了4~6.5倍。測試中還發現,擁有NPU的A11成績并沒有比A10高出許多,這可能是由于A11的NPU從未通過API公開展示,因此在測試中只能使用GPU來執行CoreML。

華為P20 Pro的麒麟970比A12落后大約2.5倍,恰好與各自宣稱的NPU理論性能比例相同(2TOP和5TOP)。而華為表示,麒麟980的全新雙核NPU比麒麟970的NPU快2.2倍,每分鐘可實現4500次推斷,由此看來麒麟980的AI性能應該能夠追平A12。

高通驍龍845的表現也很好,在不同特性的測試中與麒麟970互有勝負。由于AJmark目前還不支持NNAPI,只能使用SNPE框架進行推理加速,因此Pixel 2和Note9不得不使用CPU來進行運算,測試結果很差。

功耗方面,A12的NPU滿載功耗約為5.5瓦,且整個測試期間的功耗有很大起伏。這一功耗水平意味著蘋果希望擁有最高的突發處理性能。使用GPU加速AI處理的A11和10功耗在2.3瓦到5瓦范圍內,具體取決于推理模型。

via: Anandtech

蘋果A12處理器補充分析:超兇小核心性能看齊Cortex A73,NPU性能暴漲6倍

隨意打賞

蘋果a10處理器蘋果a12處理器蘋果a12仿生蘋果a12芯片四核心處理器a12處理器蘋果a12
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 天天射网站 | 国产在线观看91精品不卡 | 奇米第四色在线 | 国模私拍视频在线 | 中文字幕在线国产 | 精品一精品国产一级毛片 | 日本在线毛片视频免费看 | 中国一级毛片免费观看 | 国产精品伦理久久久久久 | 亚洲视频免费在线播放 | 免费观看91视频 | 奇米四色在线视频 | 久久99精品久久久久久h | 国产偷视频 | 一本一本久久a久久精品综合麻豆 | 国产成人亚洲综合网站不卡 | 国产 高清 在线 | 国产亚洲欧美久久久久 | 亚洲四虎永久在线播放 | 激情视频日本 | 欧美一级成人一区二区三区 | 乱色专区 | 四虎永久在线观看免费网站网址 | 激情五月婷婷久久 | 色域综合| 99热免费精品 | 色综合色综合色综合色综合网 | 国内视频精品 | 国产精品国产亚洲精品看不卡 | 小视频国产 | 久久久精品视频免费观看 | 国产亚洲精品成人a在线 | 99热在线观看精品 | 日韩欧美 在线播放 | 中文字幕美日韩在线高清 | 夜色私人影院永久地址入口 | 曰本一区 | 婷婷亚洲综合一区二区 | 免费国产黄线在线观看视频 | 日韩精品中文字幕视频一区 | 日日碰夜夜操 |