揚言「吊打」英偉達的AI芯片公司,快被現(xiàn)實打趴了
作者 | 包永剛
編輯 | 王亞峰
與三四年前國內(nèi)云端AI芯片公司們在發(fā)布會的PPT上超越英偉達的豪言壯志形成鮮明對比,如今這些公司在現(xiàn)實里到處碰壁,許多連北都找不著。
“剛過完年,我們把芯片送到客戶那里測試時,才發(fā)現(xiàn)我們的軟件根本沒辦法滿足客戶應用場景的需求,因為有些功能設計的時候就沒考慮到,我們當場就傻眼了。”
這還是擁有AI芯片的公司才能感受到的痛楚,產(chǎn)品還沒出來的公司,在2022年的資本寒冬里,奮力融資。
“ 我只能用腥風血雨來形容搶融資的可怕。 ”目睹AI芯片公司間爭搶融資的從業(yè)者露西說,“為了能夠拿到融資,有些初創(chuàng)公司寫抹黑競爭對手的盡調(diào)報告,再單獨發(fā)給投資人阻礙競爭對手融資。”
當然,為了拿到融資,還有AI芯片公司講起了GPU的新故事。
“不懂的人不會投了, 真正懂的人只會投真能落地的AI芯片公司。 ”這幾乎是業(yè)界的共識。
但云端AI芯片公司們落地的時候,才真切體會到設 計出芯片只拿到了“入場券” ,才真切體會到軟件有多難做。
現(xiàn)實讓云端AI芯片創(chuàng)業(yè)者們更加心知肚明的是,不要說超越英偉達,賣出一張AI加速卡才是最現(xiàn)實的目標。
這就留下了一個值得深思的問題,如果AI芯片的參與者們和投資人們都只是想賺快錢,那狂歡結(jié)束能給國內(nèi)半導體產(chǎn)業(yè)留下什么?
資本寒冬里,為搶融資不擇手段
對于單款芯片開發(fā)成本就高達數(shù)億元,每年員工的薪資支出高達上億元的大芯片創(chuàng)業(yè)公司,大量融資成為了活下去的關鍵。“ 擁有更多融資,就有更大熬死競爭對手的機會, 最終就能活下來。”數(shù)位投資界和芯片業(yè)界的人都對雷峰網(wǎng)說。
融資能力成為了一家大芯片創(chuàng)業(yè)公司掌舵人重要的能力,在2022年的資本寒冬里,就更加考驗大芯片公司的創(chuàng)始人們。
“市場上的資金是有限的,為了能夠獲得融資,除了拼實力,有的公司也耍起了手段。”露西有些憤慨,“為了阻礙競爭對手融資,一家芯片公司找競爭對手公司的離職員工挖黑料,找第三方機構(gòu)出一份盡調(diào)報告一對一發(fā)給投資人,投資人收到盡調(diào)報告后質(zhì)疑其可信度,找撰寫報告的機構(gòu)確認,機構(gòu)支支吾吾回復說是實習生寫的,這種手段有些拙劣。”
這家為了搶融資的GPGPU(通用圖形處理器,屬于AI芯片的一類)初創(chuàng)公司不擇手段其實也容易理解,畢竟作為為數(shù)不多還沒正式發(fā)布產(chǎn)品的公司,處境尷尬,為了拿到參賽入場券,只能先拿融資,特別是在投資人愈加謹慎和理性的2022年。
“還好當時創(chuàng)始人‘騙’了我們,如果當時創(chuàng)始人特別理智的給我們分析投資大芯片創(chuàng)業(yè)的風險,我們也不敢投大芯片。現(xiàn)在我們也‘上船’了,就大家一起劃船。” 一位回過味的AI芯片投資人在2022年變得更加謹慎。
這與幾年前的情況大不相同。
“在AI大熱的2016年前后,AI芯片公司創(chuàng)始人甚至連完整的商業(yè)計劃書都沒有就能獲得幾億融資。后來,AI芯片公司的創(chuàng)始人靠著在PPT上超越英偉達也能獲得融資。但到了如今,投資人不僅要看產(chǎn)品,還要看芯片的MLPerf Benchmark(一套用于測量和提高機器學習軟硬件性能的通用基準),更實際的投資人直接看芯片落地的訂單的發(fā)票。”AI芯片從業(yè)者張偉(化名)看得很清楚。
“陪AI芯片初創(chuàng)公司真正跑出來難度太大了,即便我們天使輪就投資了一家非常有潛力的AI芯片公司,他們的產(chǎn)品也在落地過程中,但是 高估值沒有足夠的支撐,對我來說是一個很大的壓力,我們在考慮退出。 ”投資了多個早期項目的投資人王軍(化名)表達了自己真實的想法。
關于AI芯片公司的估值,放棄投資AI芯片初創(chuàng)公司的投資人Blake說,“ 給AI芯片公司估值沒有一個很好的錨 ,提高或者降低50%都可以,這對投資人而言算不上好機會。”
為什么資本還是涌入了AI云端芯片領域? “一個是賽道邏輯,看到英偉達生意好、市值高就投資。另一個是一級市場投資人抱團。還有就是很多投資人并不專業(yè),特別是跨領域的投資人和機構(gòu)。”Blake認為。
實際上,不止是沒有產(chǎn)品的公司在搶融資,有產(chǎn)品但資金緊張的AI芯片公司也參與了“搶融資”。
起個大早,趕了個晚集的「早鳥」
說來有趣,有產(chǎn)品但還要搶融資的公司A此前面臨過一次融資危機,公司的兩次動蕩為這家公司的前景蒙上一層陰影。另一家起個大早的AI芯片初創(chuàng)公司B早早準備好產(chǎn)品,卻被困在了軟件里,先發(fā)優(yōu)勢消耗殆盡。
兩家起了大早趕了晚集的AI芯片公司,一個從公司經(jīng)營的維度,另一個從產(chǎn)品的維度,展現(xiàn)了大芯片創(chuàng)業(yè)的巨大挑戰(zhàn)。
兩次動蕩,前途未卜
A公司成立很早,2018年就發(fā)布了首款產(chǎn)品,占據(jù)了先發(fā)優(yōu)勢,但這家公司的前員工向雷峰網(wǎng)透露,在公司發(fā)布首款產(chǎn)品的一年多之后,融資一直處于B輪,融資進度跟不上研發(fā)需求, 于是開始縮減業(yè)務、欠薪、裁員,連CEO也被“裁”了。
A公司的前員工透露,“那次的大變動,公司只保留了芯片團隊,公司管理層和業(yè)務大洗牌。不過融資也只是公司動蕩的其中一個因素,實際是各種因素的共同作用。”
業(yè)界的說法是,這家公司的CEO和聯(lián)合創(chuàng)始人在技術路線上理念不合,聯(lián)合創(chuàng)始人和投資人一起讓CEO出局。
創(chuàng)始人被踢出局的戲碼算不上新鮮,但不幸的是公司的關鍵人物變動似乎成了這家公司的“劫”。
A公司在第一次動蕩之后重整旗鼓,發(fā)布了新產(chǎn)品,迎來新的掌舵人,正當一切都重回正軌之時,再次遭遇動蕩。
“A公司新任CEO氣焰有些囂張,聲稱某公司的項目勢在必得, 2022年能落地2億的項目。 ”多位AI芯片業(yè)界人士都向雷峰網(wǎng) (公眾號:雷峰網(wǎng)) 提及。
但這位經(jīng)驗豐富的CEO還沒實際創(chuàng)造2億的營收就遭遇了調(diào)查。
“ 一時間,香餑餑CEO好像成了燙手山芋 ,不說2億,不知道A公司今年能不能實現(xiàn)幾千萬的營收?”這成了同行會關注的話題。
每代產(chǎn)品不同樣,沒有高質(zhì)量落地項目
A公司因為人的因素沒能占盡先機之時,B公司被局限在了創(chuàng)始團隊的認知里。
“軟件做的真的太差,客戶沒辦法用起來,自然難落地。”幾位B公司前員工以及業(yè)內(nèi)同行都如此評價。
軟件沒做起來,是因為硬件設計也有問題。
“ B公司的芯片迭代到了第三代,但每一代芯片架構(gòu)思路都在變,甚至首席架構(gòu)師都不同, 設計出的硬件微架構(gòu)也有很大的不同,硬件架構(gòu)沒有延續(xù)性,就算軟件的工程師再努力,軟件也難以復用,每一代產(chǎn)品軟件就像是從零開始。”了解B公司的馬超(化名)說:“另一方面,B公司沒有能真正掌控整個軟件棧的技術大牛。”
一位B公司的前員工透露, 公司沒有業(yè)界頂尖的大牛, 軟件團隊的人背景雖然都還不錯,但就背景差不多造成了相互看不上,怎么可能做出好產(chǎn)品。當然,公司請過一個業(yè)內(nèi)某技術領域的高手,但面對AI芯片這么大一攤子軟件,估計也很難把控,待了一個多月兩個月就離開了。
對于這種情況,幾位業(yè)界人士有一些共識,這家公司的創(chuàng)始人確實是有深厚積累的芯片專家,但畢竟不是芯片架構(gòu)方面的專家,有局限性也很正常。但這家公司的創(chuàng)始團隊中沒有軟件的大牛,外部招來的人即便能力再強,也很難被“接納”,在核心管理團隊中沒有話語權(quán),也很難發(fā)揮合力做出好產(chǎn)品。
沒有高效、好用的軟件,也是 B公司的投資人雖然購買了少量芯片測試,但沒能通過灰度測試,進入大規(guī)模采購環(huán)節(jié)的關鍵原因。 當然,B公司也拿到了政府項目,訂單金額不小,但實際能不能產(chǎn)生真實利潤都存疑,算不上高質(zhì)量、可復制的落地項目。
其實,目前國內(nèi)AI云端芯片公司大部分創(chuàng)始團隊都是有深厚的芯片從業(yè)背景,在對軟件的理解和重要性的認知上有明顯的局限。
一位國內(nèi)AI芯片公司軟件的負責人直言:“CEO和CTO都聽不懂我的工作。 一些國內(nèi)AI公司創(chuàng)始人對軟件的認知,相比領先的國際大公司,我認為有十幾年的差距。 ”
那么,AI芯片的軟件到底難在哪?
被AI軟件棧困擾的AI芯片公司負責人陳俊(化名)指出,一方面, AI芯片的軟件是從零開始,具有天然的復雜性 ,與CPU不同,各家的AI芯片計算架構(gòu)和指令都不同,從編譯器到庫再到框架的適配,都不像CPU一樣有開源可以復用的東西。
另一方面, AI的軟件生態(tài)實際上就是英偉達生態(tài) ,但英偉達的軟件生態(tài),尤其是CUDA相關的核心部分都是閉源、封閉的,想要將自家的軟件與英偉達的生態(tài)兼容的難度可想而知,想要短期內(nèi)自己建立一個新的AI生態(tài),無異于癡人說夢。
最后, 云端AI推理應用的多變性 。目前AI的算法和模型仍然在快速發(fā)展和迭代,好不容易實現(xiàn)了圖像分類ResNet 50模型的優(yōu)化,新的語言模型BERT模型又開始流行,自然語言處理模型又開始越變越大,BERT的各種變形枝繁葉茂,這也增加了AI芯片軟件的開發(fā)難度。
尤其是編譯器相關的開發(fā)難度,以及針對不同模型不依賴手工優(yōu)化,僅通過編譯器完成自動化性能優(yōu)化的模型泛化能力,這個能力的缺失幾乎成了大多數(shù)AI芯片停留在“送測”而不能獲取訂單的核心原因。
這些是所有英偉達的挑戰(zhàn)者面對的技術難題,同時還有人才的挑戰(zhàn)。
馬超和大多數(shù)AI芯片的從業(yè)者有相同的觀點,“要打造一個完整易用的AI軟件棧,必須要有一個不僅熟悉驅(qū)動、固件等基礎軟件,既能夠從上向下看,也要能從下往上看,對整個AI軟件生態(tài)有全面認識,有足夠經(jīng)驗和能力的軟件大牛。”
“ AI芯片火起來之前,在國內(nèi)做編譯器是個非常冷門的職業(yè)。 ”陳俊說:“編譯器是AI芯片軟件棧中重要的部分,國內(nèi)芯片相關軟件人才非常匱乏。”
手握入場券,敗倒在客戶「變態(tài)」的模型里
AI芯片創(chuàng)業(yè)公司軟件棧的問題并非無解, 已經(jīng)在百度落地的昆侖芯,以及在字節(jié)跳動落地的希姆計算, 是國內(nèi)為數(shù)不多被商業(yè)市場檢驗通過的AI芯片公司,摸索出了一條具備可復制性的商業(yè)化道路。
熟悉希姆計算的王雷(化名)說,“軟件都是和場景相關的,想要把軟件做好,只能接近客戶,深入業(yè)務。 不僅要和客戶負責系統(tǒng)的人談,還要和運維、業(yè)務場景、算法的人深入溝通, 否則很難把軟件做好。”
“想把軟件做好哪有捷徑可以走,國內(nèi)AI芯片公司都在一個起跑線上,也都有互聯(lián)網(wǎng)大廠的投資人,希姆計算能稍微跑的快一點,還是負責市場落地的人天天泡在客戶辦公室和工廠里磨出來的,但即便這樣,也不能保證未來的成功。”王雷認為。
但AI芯片公司也不是輕輕松松就能獲得與客戶深入溝通的機會。一般的情況是,有需求的公司(比如BAT和移動運營商)會公開招標,AI芯片公司尋求合作,經(jīng)過初步篩選之后,符合需求的AI芯片公司可以送測產(chǎn)品,在現(xiàn)場運行客戶給的AI模型。
“ 很多公司連編譯那一關都過不去。 ”王雷說,“即便能編譯,不少公司 聲稱算力是英偉達同級別產(chǎn)品的2倍,實際還不到其性能的1/4。 ”
張偉表示,“主要還是因為編譯器做的不夠好,通常都是依據(jù)芯片存算特征針對特定的模型手動做了優(yōu)化, 不具備泛化能力 。所以在遇到客戶特別‘變態(tài)’模型的時候,就會遇到困難,就算手動編譯通過,性能也會受限。比如一般情況下,96*96尺寸的圖片,可以順利編譯,吞吐性能還不錯,但客戶會根據(jù)自身業(yè)務需要對輸入的圖片尺寸進行調(diào)整,比如調(diào)整到1280*720,那性能就會受到大幅度影響,甚至編譯不通過。更有甚者,模型結(jié)構(gòu)都會發(fā)生諸如基礎算子和邏輯的變化,那編譯器的泛化能力是很難支撐直接跑起來的。”
這就是AI芯片編譯器的另一個難點所在,由于客戶的AI模型與其業(yè)務密切相關,涉及商業(yè)機密,因此并不會直接把模型給芯片公司,AI芯片公司很難提前做有針對性的優(yōu)化。
但即便進展更快一點,昆侖芯也需要更多時間完善其軟件棧。張偉了解的情況是,昆侖芯的AI芯片在搜索場景對比英偉達的產(chǎn)品有一倍多的性能優(yōu)勢,但在其它場景優(yōu)勢很小甚至沒有優(yōu)勢。
“有聽到昆侖芯的客戶反饋離開了昆侖芯的人幫忙調(diào)試,芯片還是很難用起來。”陳俊說,“ 軟件還是不夠好用,所有AI芯片公司都還需要時間去打磨,這需要一個過程。 ”
這對所有云端AI芯片公司而言都是一個需要花非常多時間和精力的工作,在落地的過程中可能需要為客戶開發(fā)數(shù)百項特性,這是在設計硬件和開發(fā)軟件棧之初都無法完全明確的需求,甚至都意識不到用戶會有哪些應用場景和需求。
今年交卷,2024年開始淘汰
云端AI芯片公司們的落地競賽已經(jīng)開啟。馬超認為, AI芯片公司今年下半年是給投資人和市場交答卷的時候了,今年如果還不能上量落地 ,可能今年底明年初就會有公司開始收縮。
陳俊認為, 云端推理AI芯片的格局明年會更加明朗。
王雷則認為,即便是融資幾十億的AI芯片公司,按照千人規(guī)模,人均百萬的薪資計算,融資最多能撐到 2024年,那時候就能看到真正裸泳的人。
想要在AI市場的競爭中不被淘汰,產(chǎn)品和選擇一樣重要。AI云端芯片公司們優(yōu)先把目光投向了采購規(guī)模在億美元級別頭部互聯(lián)網(wǎng)公司以及政府的項目。
張偉說:“政府的項目看起來需求很大,但實際比預想的需求小很多。”
“政府的項目看起來金額很大,芯片公司自己要承擔的成本也很高,實際上利潤不高。更重要的是, 政府的AI項目不具備延續(xù)性和可復制性。 ”張超表示,“寒武紀近幾年每年都有政府項目簽單,如今的市值也不到300億,這足以說明資本的態(tài)度。”
“那些一個項目沒落地,估值快趕上寒武紀的公司,未來怎么持續(xù)發(fā)展?”多位AI芯片圈人士都質(zhì)疑。
因此,當下檢驗一家云端AI芯片公司,無論是采用DSA(領域?qū)S眉軜?gòu))還是GPGPU架構(gòu), 能在互聯(lián)網(wǎng)公司落地才是有硬實力的體現(xiàn)。
互聯(lián)網(wǎng)公司對于AI芯片有嚴苛的性能和穩(wěn)定性要求,能夠在互聯(lián)網(wǎng)公司的場景中落地,不僅證明了產(chǎn)品的可用性,也說明了其AI芯片落地的可復制性。
但也要看到,BAT的增長在放緩,AI算法的迭代速度也在變慢,AI芯片的前途雖然光明,但道路依舊曲折,特別是還有英偉達這個難以超越的領導者。
英偉達耗費十多年打造了以CUDA為基礎的AI生態(tài),有大量的合作伙伴共同優(yōu)化軟件和適配最新算法,有業(yè)內(nèi)頂尖的硬件團隊不斷迭代產(chǎn)品,客戶也早已習慣英偉達的軟件平臺。“我們怎么可能用幾年時間就趕超別人十幾年的成功?夢都不敢這么做。”這是一位AI芯片創(chuàng)業(yè)公司CEO的心聲。
“差距和難度確實存在, 但許多人都只是為了賺快錢, 先把公司做大,不好好打磨產(chǎn)品,趕著商業(yè)化,然后盡快上市變現(xiàn),最后能留給中國半導體產(chǎn)業(yè)什么?”這是從業(yè)者留下的還沒有答案的問題。
云端AI芯片公司確實存在挑戰(zhàn),但相信一定會有跑出來的公司,如果想和作者更深度討論AI芯片的話題,可以添加 作者微信BENSONEIT(注明來意) ,下一篇文章我們將講一講AI安防芯片的話題,歡迎從業(yè)者與作者討論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見 轉(zhuǎn)載須知 。