研發(fā)神經(jīng)網(wǎng)絡(luò)處理器NPU及解決方案,Kneron要做人工智能時代的NVIDIA
過去這些年,伴隨著 3D 技術(shù)興起,專用于 3D 圖形運算加速的 GPU 崛起,并誕生了 NVIDIA 和 ATI (現(xiàn) AMD) 兩大巨頭。近幾年人工智能興起,對高效運行神經(jīng)網(wǎng)絡(luò)算法的處理器需求日益增加。為此 Google 研發(fā)了專用于深度學(xué)習(xí)的 TPU,中星微發(fā)布了國內(nèi)首款 NPU “星光智能一號”等。來自美國的 Kneron,也希望用針對神經(jīng)網(wǎng)絡(luò)計算加速的處理器 NPU,成為人工智能時代的 NVIDIA。
關(guān)于 NPU(Neural Processing Unit),目前還沒有準(zhǔn)確定義,通常是指專門針對神經(jīng)網(wǎng)絡(luò)的計算進(jìn)行加速的處理器,可以低功耗高效能地處理并行運算。3D 時代誕生了 GPU 針對通用 3D 做加速,AI 時代或許也需要針對神經(jīng)網(wǎng)絡(luò)加速的 NPU。目前的 GPU 也具備高效并行計算能力,但 NPU 在神經(jīng)網(wǎng)絡(luò)計算方面的性能和功耗又要優(yōu)于 GPU。
通過提供 NPU 及配套的軟件解決方案,Kneron 給自己定位的是未來的 Google+NVIDIA。Kneron 的 NPU 支持運行各種神經(jīng)網(wǎng)絡(luò),如 Caffe、TensorFlow 等。處理器本身體積很小,小到可以嵌入手機(jī),但創(chuàng)始人劉峻誠博士告訴 36 氪,Kneron 的處理器性能很強(qiáng)。以運行目標(biāo)識別算法為例,Kneron 的 NPU 性能是英特爾 Xeon E5 CPU 的 8 倍、英偉達(dá) M40 GPU 的 2 倍左右,而功耗,分別是兩者的 1/1000 和 1/2000 左右。
除了芯片,Kneron 自己也做智能算法的研究,可以把面向特定功能、訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型寫入芯片提供給客戶。Kneron 還可以提供服務(wù)器端的 NPU,并組建云 + 端協(xié)同的整套 NPU 解決方案。劉峻誠博士介紹,Kneron 已經(jīng)簽訂了一些大客戶包括:國內(nèi)著名互聯(lián)網(wǎng)巨頭、臺灣著名代工廠、國內(nèi)著名手機(jī)和通信系統(tǒng)供應(yīng)商、國內(nèi)頂尖大學(xué)旗下芯片公司等。
要研發(fā) NPU,顯然需要團(tuán)隊此前有相當(dāng)?shù)姆e累。Kneron 創(chuàng)始人劉峻誠是 UC Berkeley、UC LA 和 UC SD 博士,曾參與 NASA JPT、IARPA、Bell Labs 的研發(fā)項目,也曾在三星研發(fā)中心和高通任職。聯(lián)合創(chuàng)始人還包括 Intel 圣地亞哥藍(lán)牙部分前負(fù)責(zé)人、中興手機(jī)前 VP、甲骨文前副董事總經(jīng)理與技術(shù)總監(jiān)。團(tuán)隊其它成員畢業(yè)于 MIT、Cornell、Purdue、清華、臺灣大學(xué)等,曾在 Google、微軟、Broadcom、Bell Labs、IBM 等機(jī)構(gòu)任職。
Kneron 剛剛成立半年,團(tuán)隊目前人數(shù)不到 20 人,此前曾獲得數(shù)百位美元的天使輪投資。雖然 NPU 屬于技術(shù)門檻相當(dāng)高的領(lǐng)域,但畢竟 Google、高通、NVIDIA、IBM 等都在朝這一領(lǐng)域加大投入,時間對于 Kneron 顯得十分重要。