華為用麒麟970,打開手機新世界大門?
華為這家企業(yè),你不服不行。
昨天晚上, 從德國傳來好消息,風(fēng)傳已久華為自家全新一代手機Soc處理器——麒麟(Kirin)970芯片正式發(fā)布。更重要的是,它同時還是第一款帶有AI的手機芯片。
而搭載麒麟970的全新旗艦手機Mate10系列,將在今年10月16號在德國慕尼黑正式發(fā)布。
究竟麒麟970強在哪里?華為憑借麒麟970又能打開怎樣一個手機 新世界 ?且聽 雷鋒網(wǎng) 為你解釋一番。
作為本次麒麟970的最大看點,NPU最受到大家關(guān)注。
NPU實際上是“Neural-network Processing Unit”的簡寫,翻譯過來就是“神經(jīng)網(wǎng)絡(luò)處理器單元”。 我們現(xiàn)在耳熟能詳?shù)母鞣N人工智能能力,大部分都是依靠對人類大腦的部分模擬實現(xiàn)的,即神經(jīng)網(wǎng)絡(luò)運算。
寒武紀(jì)板卡
根據(jù)雷鋒網(wǎng)了解,這顆NPU并非華為獨立打造,技術(shù)方面主要由國內(nèi)AI芯片創(chuàng)業(yè)公司寒武紀(jì)負(fù)責(zé)。 后者去年已經(jīng)發(fā)布了第一款深度學(xué)習(xí)專用處理器“寒武紀(jì)1A”,同時還為其配套了專用的指令集系統(tǒng)。就在兩個星期之前,寒武紀(jì)還完成了A輪融資,總金額達到1億美元,融資方包括國投創(chuàng)業(yè)、 阿里巴巴 、聯(lián)想等一批知名巨頭和VC。
所以NPU是專門為了人工智能而生,根據(jù)官方現(xiàn)場PPT, 這顆NPU的性能將達到1.92T FP16(半精度浮點運算)。 相比之下,經(jīng)常拿來作為神經(jīng)網(wǎng)絡(luò)研究的NVIDIA GTX1080,F(xiàn)P32的處理能力為8.87T。由此換算,GTX1080的FP16能力大約為17.74T。
換句話說,NPU的性能約等于1/9個GTX1080。
因為專用,NPU在性能強大的同時,還擁有極佳的功耗表現(xiàn)。華為官方也給出了4個比例: NPU的性能6.25倍于CPU、4倍于GPU;NPU的效能50倍于CPU、6.25倍于GPU。
華為還給出了一個實際的應(yīng)用場景表現(xiàn),在用NPU識別1000張圖片的過程中,NPU的整體功耗只在0.3-0.7W之間浮動,實際的電池消耗僅為0.19%(4000mAh電池)。換句話說: 如果電量充足,NPU完全可以利用一塊電池實現(xiàn)50W張照片的識別。
NPU在專用場景中的性能表現(xiàn)可見一斑,但專用處理器并不只是靠硬件就能運作, 華為此次也同時發(fā)布了自己的開放AI平臺 ,專門搭建具體應(yīng)用到CPU、GPU、NPU等硬件處理器之間的“橋梁”,這也是NPU能夠發(fā)揮性能的前提條件。
從發(fā)布會上的信息來看,這套AI平臺主要有兩層:第一層由Google自家的API Android NN(Neural Network,神經(jīng)網(wǎng)絡(luò))、華為的Kirin AI API組成。第二層則是Kirin AI Heterogeneous Resource Management(麒麟混合資源管理)和其他Runtime方案組成。
從整體布局上來看,華為并不想單純依靠于Google官方的工具,而是希望通過向開發(fā)者開放,進而徹底將華為的硬件能力釋放出來。
華為在發(fā)布會上也稍微展示了一下這套架構(gòu)的威力, 在2000張圖片識別的基準(zhǔn)測試中,麒麟970取得了2005的分?jǐn)?shù),相比之下依靠CPU的三星S8只有95分,而在GPU調(diào)用方面比較出色的iphone也只不過487分。
在發(fā)布會之上,華為也宣布了相對應(yīng)的AI生態(tài)舉措。主要包括開發(fā)網(wǎng)站、麒麟AI開發(fā)套件、應(yīng)用市場三塊。 利用華為全線資源扶持這個生態(tài)的趨勢,顯而易見。
2. 麒麟970詳細(xì)介紹
說完NPU,我們再回頭來整體看看麒麟970,先放一張規(guī)格:
-
制程:TSMC(臺積電)10nm;
-
CPU:4個A73 2.4GHz + 4個A53 1.8GHz;
-
GPU:Mali G72MP12(12核);
-
NPU(新增AI處理器):1.92T FP16 OPS;
-
Image DSP(圖像專用處理器):512bit SIMD;
-
Modem(基帶):1.2Gbps@LTE Cat18;
-
內(nèi)存:LPDDR 4X;
-
存儲:UFS 2.1
-
....
我們先從制程看起,麒麟970選擇了全新的TSMC 10nm工藝。在這一點上,970看齊去年年底的驍龍835,后者選擇了三星的10納米工藝。
因為新制程的關(guān)系,麒麟970相比上一代960將會有20%的功耗降低,同時在封裝尺寸上還將縮小40%。但實際上, 970再次刷新了麒麟系列芯片中晶體管數(shù)量的記錄——55億個晶體管,遠超上一代麒麟960的40億個。相比之下,驍龍835只有30億,蘋果iphone7系列使用的A10處理器也不過33億個。
但實際上,這次970的CPU部分是“不思進取”的。 8個核心的組成方式(4個A73+4個A53)、8個核心對應(yīng)的運行頻率,實際上與麒麟960完全一致。
真正的改變主要集中在GPU和NPU上。 GPU采用了全新的Mali G72MP12。這也是手機首次用上12核GPU。 而就其組成Mali G72圖形處理器單元來說,相對于上一代麒麟960的G71圖形處理器單元來說,并沒有大幅度的性能提升。所以按此估算, 麒麟970的圖形處理性能大約會接近960的1.5倍。
在拍照方面,麒麟970采用了兩個ISP,在拍照這一應(yīng)用場景中取得了很大進展:更快的反應(yīng)速度、更快的對焦速度、運動拍攝幀率更大、暗光場景下的拍攝能力更強。
最后是網(wǎng)絡(luò),華為在麒麟970之上,再次擴寬了4G基帶頻率范圍,同時還支持最先進的4.5G LTE技術(shù)。在極限條件下,整體帶寬最高能達到1.2Gbps。
看到這里,或許還有很多人并不理解:麒麟970是更強了,但為什么說它正在打開手機新時代的大門?
這一點我們要倒回手機這個應(yīng)用場景本身去看,在去年的WWDC16之上,蘋果就為iOS 10中的“照片”提供了一個功能:照片應(yīng)用會自動根據(jù)地點、主題等將照片歸納分組,除此之外,它也能將內(nèi)部的一些相關(guān)資源組合,生成一些“回憶合集”。這種東西在原來都是不可想象的。
很明顯, 如何利用人工智能釋放出更多功能、更多能力,已經(jīng)成為手機發(fā)展的下一個戰(zhàn)場。
就拿去年紅極一時的Prisma來說,這款能夠?qū)⒏鞣N照片變成“名畫風(fēng)格”的應(yīng)用一開始它選擇的是將照片上傳到服務(wù)器處理,但隨著用戶的數(shù)量不斷增加,處理速度也變得越來越慢。直到去年年底Prisma開始在iPhone上面開始調(diào)用本地GPU來處理,往往能夠在2s內(nèi)完成處理,同時還不受網(wǎng)絡(luò)好壞的影響。這樣的新體驗是“革命性”的。
正如余承東在發(fā)布會上列舉的那樣,我們不遠的將來或許能夠?qū)崟r使用計算機視覺分析街道、能夠在低功耗的前提下使用AR、翻譯之類的應(yīng)用也將變得更加準(zhǔn)確。
對于為手機端添加AI能力的持續(xù)影響,華為其實也做了思考。除了上面提到的這種革命性改變之外,隱私問題同樣重要。之前我們經(jīng)常將數(shù)據(jù)上傳到云端去處理。上傳到云端的數(shù)據(jù)是否會泄露?是否會被違法使用?完全依賴云端或者本地的數(shù)據(jù)其實都不可行。
完美的解決方案應(yīng)該是把隱私的數(shù)據(jù)本地處理,不隱私的數(shù)據(jù)云端處理,進而兼顧隱私和能力,讓用戶能夠最大程度獲得人工智能帶來的改變。
功耗同樣重要,在體積有限、電池技術(shù)短期無大突破的前提下,造“電老虎”并沒有實際意義,因為專業(yè)軟件底層、調(diào)用、硬件的配合,手機對于處理人工智能需求也會變得高效。進而確保了手機能夠持續(xù)輸出革命性的體驗。
將這些趨勢組合起來,其實可以很容易得到解決方案,但這件事之前實際上幾乎只有蘋果在做。
一方面是因為蘋果自己采用了相對封閉的生態(tài),在技術(shù)實現(xiàn)上相對適應(yīng)性強一些。第二個是全新技術(shù)加入,同樣需要大量資金和人力的投入,“富可敵國”的蘋果自然不缺那些。最后是借助外力,只有整個生態(tài)完善了,才可能持續(xù)不斷地為消費者創(chuàng)造新體驗。
這件事,按照對位來說,本來應(yīng)該由Google完成,但Google本身的純軟件定位和現(xiàn)有的手機硬件市場,注定依賴Google并不靠譜。自己做,幾乎是唯一靠譜,但又需要大量勇氣的方法。
就已經(jīng)在手機核心模塊中初步打造出AI能力的華為來說,已經(jīng)邁出了最重要的前幾步,如何在此基礎(chǔ)上繼續(xù)培育生態(tài)、開發(fā)更多全新的手機功能,為消費者帶來全新體驗,這依舊是個很大的挑戰(zhàn)。
挑戰(zhàn)歸挑戰(zhàn),還是得給華為的勇氣和遠見點個贊。