煒燁智算VP孟健雄:推理算力需求12個(gè)月內(nèi)或反超訓(xùn)練,只等爆款應(yīng)用落地
作者 | 趙之齊
編輯 | 胡敏
“5-10年內(nèi),算力行業(yè)可能從當(dāng)前的動(dòng)態(tài)平衡,逐步轉(zhuǎn)向長(zhǎng)期的賣(mài)方市場(chǎng)。”
當(dāng)基模創(chuàng)業(yè)公司放緩訓(xùn)練腳步、數(shù)據(jù)中心退租現(xiàn)象頻發(fā),外界紛紛唱衰智算市場(chǎng),商湯旗下負(fù)責(zé)智算業(yè)務(wù)的子公司煒燁智算的商務(wù)副總裁孟健雄,卻有此信心。
這份信心,源于他在智算領(lǐng)域的經(jīng)驗(yàn)與積累。2022年,孟健雄就加入算力領(lǐng)域知名公司、彼時(shí)算力板塊的“領(lǐng)頭羊”英博數(shù)科團(tuán)隊(duì),與團(tuán)隊(duì)共同打造了當(dāng)時(shí)中國(guó)最大的單體成建制高性能GPU集群。當(dāng)時(shí),他們把英偉達(dá)DGX A100 SuperPOD集群引入中國(guó)落地,后來(lái)也成為英偉達(dá)在中國(guó)唯一的AI創(chuàng)新賦能中心。“可以說(shuō),我們是智算行業(yè)的拓荒者”,他如此定位這段經(jīng)歷。
而后,孟健雄和核心團(tuán)隊(duì)離開(kāi)英博數(shù)科,創(chuàng)立煒燁智算。公司聚焦智算中心全生命周期管理,業(yè)務(wù)覆蓋從前期規(guī)劃、基礎(chǔ)設(shè)施建設(shè)、供應(yīng)鏈整合,到后期運(yùn)維運(yùn)營(yíng)及資本退出的完整鏈路,定位為新質(zhì)生產(chǎn)力資產(chǎn)管理平臺(tái)。
與此同時(shí),商湯科技在AI全鏈路技術(shù)領(lǐng)域的深厚積累,尤其是其大裝置平臺(tái)軟件的核心能力,吸引了團(tuán)隊(duì)的關(guān)注。雙方達(dá)成合作, 煒燁智算引入商湯科技的天使輪投資,此后正式成為商湯科技智算業(yè)務(wù)板塊的核心載體,對(duì)接頭部KA客戶(hù),成為商湯智算業(yè)務(wù)布局中的 “特種部隊(duì)”。
也因此,在大家普遍感受到智算市場(chǎng)的消納降溫、利潤(rùn)下滑時(shí),處于大廠陣營(yíng)內(nèi)的煒燁智算,仍能保持相對(duì)可觀的毛利率水平。
不過(guò),孟健雄也看到了行業(yè)的消納痛點(diǎn)。在他看來(lái),此前算力需求很多源于基礎(chǔ)大模型的訓(xùn)練,但當(dāng)前的核心瓶頸是LLM(大語(yǔ)言模型)撞到了數(shù)據(jù)的天花板,基模訓(xùn)練短期內(nèi)難以提供算力增量;可是,新的潛在消納動(dòng)能也已在醞釀:后續(xù)多模態(tài)對(duì)顯存和算力的需求很大,一旦能突破訓(xùn)練數(shù)據(jù)匱乏的困境,將引發(fā)遠(yuǎn)超 “2022-2023年全球算力荒” 的需求爆發(fā)。
在尚未走出消納困局的此刻,行業(yè)內(nèi)卷仍在加劇。孟健雄直接地點(diǎn)出國(guó)內(nèi)GPU市場(chǎng)的成本困境: “國(guó)內(nèi)市場(chǎng)是用全球最高的價(jià)格買(mǎi)GPU,再用全球最低的價(jià)格把它們租出去。”
他觀察到,比起物理屬性,GPU此刻更像是一種金融資產(chǎn),其價(jià)格是被Scaling Law這個(gè)宏大敘事?lián)纹饋?lái)的, 當(dāng)下GPU的價(jià)格其實(shí)是人們對(duì)AI未來(lái)發(fā)展的凈現(xiàn)值的預(yù)測(cè) 。盡管一系列政策以及GPU服務(wù)器二手市場(chǎng)也已逐漸興起,為改善這種“高買(mǎi)低賣(mài)”的情況提供了可能,但具體效果還需要時(shí)間進(jìn)行檢驗(yàn)。
然而,在智算行業(yè)面對(duì)消納滯漲的同時(shí),算力相關(guān)廠商卻在二級(jí)市場(chǎng)迎來(lái)暖春——近來(lái),協(xié)創(chuàng)數(shù)據(jù)、云天勵(lì)飛、銳捷網(wǎng)絡(luò)等多支算力概念股迎來(lái)大漲。孟健雄也指出,英偉達(dá)過(guò)去十幾年最大的技術(shù)突破發(fā)生在2012-2022年里, 市值上升10倍卻發(fā)生在最近30個(gè)月里 。對(duì)金融屬性非常敏感的他,認(rèn)為未來(lái)第三方AIDC廠商,除了和大客戶(hù)捆綁、定制化成長(zhǎng)外,也要借助金融工具謀求出路,才能在大廠、運(yùn)營(yíng)商稱(chēng)霸的算力市場(chǎng)里有一席之地。
在“AI一天、人間一年”的當(dāng)下,孟健雄對(duì)算力行業(yè)的未來(lái)有何預(yù)判?推理算力需求什么時(shí)候會(huì)迎來(lái)爆發(fā)?未來(lái)端側(cè)與數(shù)據(jù)中心之間會(huì)呈現(xiàn)出什么形態(tài)?第三方AIDC廠商的出路又在哪里?以下是雷峰網(wǎng)與孟健雄的對(duì)話。為了方便理解,對(duì)話內(nèi)容經(jīng)編輯。
Agent算力需求何時(shí)爆發(fā)?樂(lè)觀估計(jì)6-12個(gè)月內(nèi)
雷峰網(wǎng):在DeepSeek出圈后,許多基模創(chuàng)業(yè)公司似乎也放慢了訓(xùn)練的腳步,數(shù)據(jù)中心退租現(xiàn)象明顯,這是否意味著未來(lái)數(shù)據(jù)中心市場(chǎng)需求會(huì)下降?在你看來(lái),訓(xùn)練帶來(lái)的算力需求未來(lái)增長(zhǎng)潛力預(yù)計(jì)如何?
孟健雄: 我認(rèn)為, 未來(lái)人們對(duì)算力的需求會(huì)有機(jī)會(huì)變成“無(wú)底洞” 。
為什么這么說(shuō)?一方面,現(xiàn)在LLM撞到數(shù)據(jù)的天花板了, 基模的訓(xùn)練在短期內(nèi)提供不了什么算力需求增量 ;但在改善推理性能方面, 后訓(xùn)練部分還會(huì)帶來(lái)一段時(shí)間的算力需求 。
但另一方面,多模態(tài)對(duì)顯存和算力的需求比LLM更大,只是多模態(tài)領(lǐng)域還沒(méi)有遇到一個(gè)Transformer之于LLM那樣的加速器,尤其是具身智能方向,現(xiàn)在可以說(shuō)是有算法、有算力但沒(méi)數(shù)據(jù), 一旦解決訓(xùn)練數(shù)據(jù)的匱乏,對(duì)算力的需求會(huì)比2022年底到2023年那段時(shí)間的“全球算力荒”更甚 。
雷峰網(wǎng):除了訓(xùn)練這一核心需求外,當(dāng)下AI推理的需求也持續(xù)攀升,目前已經(jīng)帶來(lái)哪些具體的改變?
孟健雄: 推理算力占比的暴漲,一是讓大模型本身by token API的生產(chǎn)力已經(jīng)廣泛商業(yè)化了,并且,Agent、DeepResearch這種極度吃推理算力的模型產(chǎn)品形態(tài),也找到了PMF,有用戶(hù)喜歡、也能收費(fèi),后面用量的繼續(xù)加速爬坡是個(gè)確定的事情。
雷峰網(wǎng):推理端用量加速爬坡,預(yù)計(jì)什么時(shí)候占比會(huì)比訓(xùn)練端更大?
孟健雄: 這主要取決于爆款應(yīng)用什么時(shí)候出來(lái) 。目前看起來(lái),Agent是最有希望的方向,最接近消費(fèi)、對(duì)算力消耗也很大, 行業(yè)里比較樂(lè)觀的估計(jì)是6-12個(gè)月內(nèi) 。大廠們前段時(shí)間以來(lái)已經(jīng)開(kāi)始增加推理算力配置,其實(shí)也是對(duì)這種預(yù)估的一種驗(yàn)證。
回顧起來(lái)距離我們最近的一場(chǎng)推理算力需求的爆發(fā)是挖礦,挖礦的盡頭是專(zhuān)用集成電路ASIC,現(xiàn)在AI應(yīng)用還沒(méi)有在這一方向上大量占領(lǐng)市場(chǎng),只是因?yàn)橥评硇枨蟮奶卣鬟€沒(méi)收斂。
雷峰網(wǎng):有說(shuō)法說(shuō),未來(lái)邊緣端數(shù)據(jù)會(huì)占整個(gè)社會(huì)總量數(shù)據(jù)的80%,在你看來(lái),邊緣計(jì)算的崛起是否會(huì)影響智算中心發(fā)展的可持續(xù)性?
孟健雄: 很好的問(wèn)題。中長(zhǎng)期來(lái)看,邊緣數(shù)據(jù)的采集效率及采集量、和邊緣推理計(jì)算的算力總量,注定會(huì)有一個(gè)爆發(fā)期,但這對(duì)中心化的數(shù)據(jù)中心來(lái)說(shuō),其實(shí)是 synergy(協(xié)同發(fā)展)關(guān)系 ,而不是零和關(guān)系。
雷峰網(wǎng):怎么理解兩者間的協(xié)同?
孟健雄: 拿具身智能舉例,每臺(tái)機(jī)器人、每輛電動(dòng)車(chē)、每架無(wú)人機(jī),都在不停采集多模態(tài)數(shù)據(jù)、在端側(cè)進(jìn)行實(shí)時(shí)計(jì)算,但如果工作在端側(cè)就結(jié)束了, 那端側(cè)就依舊是孤島 。
這些端側(cè)個(gè)體采集到的數(shù)據(jù)和反饋,海量、多樣、且結(jié)構(gòu)化,只有集中到中心化的數(shù)據(jù)中心或智算中心分析和訓(xùn)練計(jì)算,才能發(fā)揮價(jià)值。并且,也只有這些中心化的場(chǎng)所,能更低成本高效率地完成這種量級(jí)工作。
所以,一句話總結(jié), 端側(cè)的發(fā)展實(shí)際上會(huì)為數(shù)據(jù)中心帶來(lái)需求的增量 ,而不是反過(guò)來(lái)影響其發(fā)展。
雷峰網(wǎng):最終兩者間會(huì)呈現(xiàn)出什么樣的狀態(tài),行業(yè)又應(yīng)該對(duì)此做些什么準(zhǔn)備?
孟健雄: 大家常聽(tīng)到的觀點(diǎn)是:日后邊緣計(jì)算與中心化計(jì)算的協(xié)同模式,是“邊緣計(jì)算+分布式數(shù)據(jù)中心”,但我們認(rèn)為,最終整個(gè)計(jì)算業(yè)態(tài), 還是會(huì)收斂到“少數(shù)超大型中心化數(shù)據(jù)中心+與之高速互聯(lián)的邊緣節(jié)點(diǎn)”模式。
數(shù)據(jù)上說(shuō),小型邊緣節(jié)點(diǎn)PUE(能源使用效率)是2.0左右,遠(yuǎn)高于集約化數(shù)據(jù)中心的PUE 1.2-1.5,所以只有“超大型中心化+互聯(lián)邊緣”這種架構(gòu),才能使得整個(gè)體系的成本最低、效率最高。在這種趨勢(shì)下, 能源與通信成本就是底層競(jìng)爭(zhēng)力 ,從這個(gè)角度講,我非常看好中國(guó)。
雷峰網(wǎng):那整體來(lái)說(shuō),除了推理算力占比的提升,未來(lái)AIDC行業(yè)還會(huì)面臨什么新的挑戰(zhàn),AIDC廠商需要如何應(yīng)對(duì)?
孟健雄: 可以從幾類(lèi)不同的主體來(lái)看。對(duì)于大廠來(lái)說(shuō),平臺(tái)化的商務(wù)模式韌性很高,主要還是滿足整體市場(chǎng)內(nèi)的共性需求,捆綁自身能力銷(xiāo)售。運(yùn)營(yíng)商這類(lèi)主體,相對(duì)以追求資產(chǎn)價(jià)值為主,商務(wù)能力較強(qiáng)但創(chuàng)新能力存在一定提升空間。
而對(duì)于第三方AIDC廠商,盡頭是跟大客戶(hù)捆綁、定制化成長(zhǎng),也能因此最終走上自己獨(dú)特的技術(shù)路線, 這個(gè)類(lèi)別也會(huì)是金融工具使用最為頻繁的 ——因?yàn)榇髲S、運(yùn)營(yíng)商自身的資金成本低,或者本身自有資金就很豐富,所以其它AIDC廠商可能就要借助資金杠桿上突破創(chuàng)新,才能與前兩者對(duì)齊。
但總的來(lái)說(shuō),接下來(lái)的算力市場(chǎng),最底層共性還是要提升經(jīng)營(yíng)效率、算力效率和能源效率,等達(dá)到效率優(yōu)化的邊際以后,資本熱點(diǎn)其實(shí)也就向生態(tài)上層轉(zhuǎn)移了。到時(shí)候, 焦點(diǎn)會(huì)更多集中在數(shù)據(jù)、算法上的突破,和這些突破帶來(lái)的應(yīng)用層的價(jià)值,這一層最有想象空間。
雷峰網(wǎng):在未來(lái)資本市場(chǎng)焦點(diǎn)發(fā)生轉(zhuǎn)移前,當(dāng)下資本市場(chǎng)的關(guān)注焦點(diǎn),主要還放在什么層面?
孟健雄: 先從最簡(jiǎn)單的說(shuō),根據(jù)我們觀察,如果是純算力建設(shè)的項(xiàng)目,性質(zhì)更傾向于類(lèi)債項(xiàng)目,就是風(fēng)險(xiǎn)和收益上與傳統(tǒng)債券有相似性的投資項(xiàng)目或資產(chǎn)。這部分投資者 主要是看硬件軟件的先進(jìn)性和財(cái)務(wù)表現(xiàn),包括最重要的項(xiàng)目財(cái)務(wù)健康度和投資回報(bào)周期等 。2023年、2024年一部分以市值管理為目的的投資者,也是用這個(gè)邏輯。
基于長(zhǎng)期主義的投資者,考量角度就比較復(fù)雜了。算力是AI應(yīng)用的基礎(chǔ),中長(zhǎng)期主義投資者會(huì)更關(guān)注未來(lái)上層的價(jià)值產(chǎn)出, 智算項(xiàng)目的規(guī)模、算力效率、技術(shù)架構(gòu)乃至整個(gè)智算平臺(tái)生態(tài)的價(jià)值都是考量因素 ,屬于更偏向成長(zhǎng)型權(quán)益類(lèi)投資。
雷峰網(wǎng):那現(xiàn)在的算力市場(chǎng),大家對(duì)智算項(xiàng)目的期待和考量,整體會(huì)比以前更理性了嗎?
孟健雄: 是的,踩過(guò)很多市場(chǎng)亂象的坑后, 現(xiàn)在大家會(huì)更關(guān)注項(xiàng)目穿透到最后是誰(shuí) 。不過(guò)市場(chǎng)上仍有時(shí)間差的,部分投資者還是2023年、2024年的思想狀態(tài),這跟大家入場(chǎng)時(shí)間點(diǎn)不同有很大關(guān)系。
“5-10年內(nèi),算力行業(yè)可能轉(zhuǎn)向賣(mài)方市場(chǎng)”
雷峰網(wǎng):你在2022年左右就加入英博數(shù)科團(tuán)隊(duì),可以說(shuō)是很早一批踩過(guò)算力市場(chǎng)坑的人,在你看來(lái),現(xiàn)在這些亂象問(wèn)題背后的癥結(jié)是什么?
孟健雄: 現(xiàn)在的市場(chǎng)亂象,比如包銷(xiāo)、消納協(xié)議違約等,是因?yàn)榇蠹摇安贿@么做就算不過(guò)來(lái)賬”,但說(shuō)到底就是 成本太高、售價(jià)太低 。
先說(shuō)成本問(wèn)題。其實(shí) GPU的價(jià)格是被Scaling Law這個(gè)宏大敘事?lián)纹饋?lái)的 ,英偉達(dá)這家公司在過(guò)去十幾年最大的技術(shù)突破發(fā)生在2012-2022年里,但 市值上升10倍卻發(fā)生在最近30個(gè)月里,所以當(dāng)下GPU的價(jià)格,其實(shí)是人們對(duì)AI未來(lái)發(fā)展的凈現(xiàn)值的預(yù)測(cè) ,這種定價(jià)思維偏離了成本考量的定價(jià)邏輯,把GPU物理產(chǎn)品變成了一種金融屬性的資產(chǎn)。
接下來(lái)是算力售價(jià)問(wèn)題。 國(guó)內(nèi)市場(chǎng)是用全球最高的價(jià)格買(mǎi)GPU、再用全球最低的價(jià)格把它們租出去 。中國(guó)的算力供需市場(chǎng)除了電力成本比美國(guó)低,其它都比美國(guó)高,所以你看,美國(guó)人在喊智算的盡頭是能源,我們?cè)诎l(fā)展國(guó)產(chǎn)可控自主。
雷峰網(wǎng):怎么理解GPU變成一種金融屬性的資產(chǎn)呢?
孟健雄: 舉個(gè)例子,你買(mǎi)一臺(tái)用來(lái)做土建工程挖溝的挖掘機(jī),你就會(huì)關(guān)注這機(jī)器貴不貴、扛不扛風(fēng)吹日曬;但如果你買(mǎi)的是可以挖金礦的挖掘機(jī),是不是就不會(huì)對(duì)它的價(jià)格太敏感了?而且大家都想挖金礦,就算你不買(mǎi),也有別人買(mǎi),價(jià)格自然就高上去了。
雷峰網(wǎng):所以說(shuō),因?yàn)镚PU是AI這類(lèi)“高收益項(xiàng)目” 的基礎(chǔ),它的價(jià)格就不再只是由硬件成本決定,而是像金融資產(chǎn)一樣,價(jià)格會(huì)隨收益預(yù)期和稀缺性而波動(dòng)。
孟健雄: 是的。正好借此說(shuō)回剛才提到的兩個(gè)問(wèn)題癥結(jié),成本高這塊我們解決不了,產(chǎn)業(yè)鏈不在我們手里,所以能讓大家發(fā)揮點(diǎn)主觀能動(dòng)性的,就是售價(jià)這一塊——這也是更根本的地方。
投資方怕售價(jià)低、本兒收不回來(lái),就會(huì)要求建設(shè)方運(yùn)營(yíng)方包銷(xiāo)兜底。而在售價(jià)低的情況下,運(yùn)營(yíng)方或消納方要想兌現(xiàn)協(xié)議,只能從各個(gè)方面努力爭(zhēng)取降低消納壓力, 最直觀的就是能源補(bǔ)貼和算力券等方法 。如果這些方法也爭(zhēng)取不到,違約退租就是消納方最后的止損方法。
雷峰網(wǎng):智算中心售價(jià)低,卻反而可能導(dǎo)致違約退租的情況出現(xiàn),如何理解這種看似矛盾的市場(chǎng)狀態(tài)呢?
孟健雄: 現(xiàn)在的GPU租賃市場(chǎng)上,我們常聽(tīng)到兩種相互矛盾的聲音:一種是“算力設(shè)備閑置、價(jià)格內(nèi)卷”,一種是“客戶(hù)在市場(chǎng)上找不到合適的算力、大廠們都忙著在全國(guó)收算力”,這兩種情況都真實(shí)存在。
但“設(shè)備閑置、價(jià)格內(nèi)卷”更具體點(diǎn)講,是“ 零散、異構(gòu)的算力匹配不到合適的客戶(hù),而被迫閑置 ”。這有兩種可能,一是集群性能達(dá)不到專(zhuān)業(yè)客戶(hù)的要求;二是好不容易找到了要求一般的客戶(hù)、但用不了幾個(gè)月他們訓(xùn)練工作就結(jié)束了,與此同時(shí),新的用戶(hù)還沒(méi)找到,這些智算中心因?yàn)樵诳諜n期就被迫降價(jià)傾銷(xiāo)。
而與之對(duì)應(yīng)的“算力稀缺”情況,則是客戶(hù)們需要穩(wěn)定存儲(chǔ)、網(wǎng)絡(luò)和平臺(tái)軟件配套齊全的成建制集群。 能達(dá)到這種水平的目前基本只有大廠 ,但大廠們自己也要用,高質(zhì)量資源售罄的情況下,想找到合格可用的算力也很難。
雷峰網(wǎng):性能和技術(shù)門(mén)檻,確實(shí)也是行業(yè)內(nèi)反復(fù)提到的導(dǎo)致現(xiàn)在算力“結(jié)構(gòu)性過(guò)剩”的一個(gè)關(guān)鍵核心。但在你看來(lái)大家成建制集群跟不上大廠的原因是什么,真的是自身研發(fā)能力不夠嗎?
孟健雄: 導(dǎo)致各地智算中心追不上大廠水平的原因, 本質(zhì)還是在于這些項(xiàng)目是資本驅(qū)動(dòng)的 。
資本更看中他們懂的那部分:不動(dòng)產(chǎn)、大機(jī)電、GPU等這些 資產(chǎn)管理 的東西,但智算中心能收多少租金,最終靠的是交付質(zhì)量。從資產(chǎn)到算力交付,中間隔著巨大的技術(shù)水平鴻溝。但現(xiàn)在市場(chǎng)上沒(méi)有那么多大廠供資本選擇,所以很多資本退而求其次,以最低配置跑步入場(chǎng)。
并且,一個(gè)智算項(xiàng)目同時(shí)還可能需要滿足太多其它目標(biāo),最終就形成了設(shè)備閑置、價(jià)格內(nèi)卷的現(xiàn)象。
雷峰網(wǎng):現(xiàn)在也已經(jīng)有一系列政策對(duì)這種現(xiàn)象進(jìn)行干預(yù),在你看來(lái),這種情況有在好轉(zhuǎn)嗎?
孟健雄: 長(zhǎng)期看好,但可能短期內(nèi)不會(huì)改善。雖然國(guó)家出臺(tái)了相應(yīng)窗口文件,但其影響還需要一段時(shí)間來(lái)沉淀出結(jié)果。民間也有逐漸興起GPU服務(wù)器二手市場(chǎng),也能對(duì)這種情況有改善,但具體改善多少,有待時(shí)間驗(yàn)證。
雷峰網(wǎng) (公眾號(hào):雷峰網(wǎng)) :結(jié)構(gòu)性過(guò)剩畢竟也是一種“過(guò)剩”,這意味著現(xiàn)在智算市場(chǎng)可能對(duì)大多數(shù)廠商來(lái)說(shuō),已經(jīng)飽和了嗎?
孟健雄: 市場(chǎng)是有周期性的。具身智能(包括自動(dòng)駕駛)的iPhone時(shí)刻已經(jīng)到來(lái),關(guān)鍵在于核心技術(shù)突破在什么時(shí)候發(fā)生,比如AI生成多模態(tài)訓(xùn)練數(shù)據(jù)的能力、電機(jī)和電池的革新。小周期應(yīng)該是從當(dāng)前供大于求,向供需平衡、直至供小于求發(fā)展。
雷峰網(wǎng):這個(gè)周期預(yù)計(jì)會(huì)多久?
孟健雄: 我認(rèn)為未來(lái)5-10年內(nèi),算力市場(chǎng)會(huì)呈現(xiàn)出一個(gè)向長(zhǎng)期賣(mài)方市場(chǎng)變化的趨勢(shì)。
煒燁與商湯“聯(lián)姻”背后:獲取技術(shù)與KA客戶(hù)資源的雙贏
雷峰網(wǎng):目前算力市場(chǎng)很多廠商是在貼著成本價(jià)去做,那么成立至今只有一年多的煒燁智算,利潤(rùn)如何?
孟健雄: 煒燁智算作為商湯科技智算業(yè)務(wù)板塊的載體,處于智算大廠陣營(yíng),天然有些技術(shù)優(yōu)勢(shì)和規(guī)模成本優(yōu)勢(shì),這部分溢價(jià)讓煒燁智算的毛利率水平能保持在行業(yè)高位。
歷史上,百團(tuán)大戰(zhàn)最后就剩下美團(tuán)和餓了么,百模大戰(zhàn)迅速就只剩下頭部幾個(gè)基模,未來(lái)智算行業(yè)大概率也只會(huì)聚焦于經(jīng)營(yíng)效率最優(yōu)化的頭部玩家,發(fā)展慢就會(huì)被動(dòng)下牌桌,這是客觀發(fā)展規(guī)律。
雷峰網(wǎng):但現(xiàn)在智算領(lǐng)域仍有許多創(chuàng)業(yè)公司存在。
孟健雄: 創(chuàng)業(yè)公司要發(fā)展獨(dú)特性,或說(shuō)細(xì)分市場(chǎng) ,如果沒(méi)有差異化,就會(huì)敗給效率更高的平臺(tái)。大廠為了追求平臺(tái)效率最高,會(huì)優(yōu)先滿足客戶(hù)的共性需求,犧牲定制化。跟大廠競(jìng)爭(zhēng)的事情交給運(yùn)營(yíng)商去做。
雷峰網(wǎng):你們強(qiáng)調(diào)自己在做的是“智算中心的全生命周期管理”,這是否是你們的差異化?要做到這一點(diǎn),主要困難會(huì)在哪里?
孟健雄: 現(xiàn)在市面上許多玩家都只負(fù)責(zé)數(shù)據(jù)中心建設(shè)其中某個(gè)環(huán)節(jié),但我們是從規(guī)劃、建設(shè)、供應(yīng)鏈、運(yùn)維運(yùn)營(yíng)到資本退出,整個(gè)穿透。
我們團(tuán)隊(duì)從2022年底開(kāi)始沉淀供應(yīng)鏈、技術(shù)、項(xiàng)目建設(shè)與運(yùn)營(yíng)相關(guān)的資源,做這件事的主要難點(diǎn)就在于每個(gè)層級(jí)就都要有積累,不能為了一個(gè)項(xiàng)目臨時(shí)攢局。
雷峰網(wǎng):你們吸引到投資者,主要就是你們選擇的這條路線嗎?
孟健雄: 還有我們的背景。煒燁智算創(chuàng)始團(tuán)隊(duì)在2022年,將英偉達(dá)DGX A100 SuperPOD集群引入中國(guó)落地的團(tuán)隊(duì),做成了當(dāng)時(shí)中國(guó)最大的單體成建制高性能GPU集群,是第一個(gè)做成這件事的人。后來(lái)我們成為英偉達(dá)在中國(guó)唯一的AI創(chuàng)新賦能中心,最早開(kāi)始經(jīng)營(yíng)英偉達(dá)生態(tài)建設(shè),我們認(rèn)為自己是智算行業(yè)早期的拓荒者。
商湯科技也是看中了我們的背景,在煒燁智算團(tuán)隊(duì)獨(dú)立創(chuàng)業(yè)后投資了我們,并把智算業(yè)務(wù)交給煒燁來(lái)做。
雷峰網(wǎng):團(tuán)隊(duì)出來(lái)創(chuàng)業(yè)時(shí),市場(chǎng)上投煒燁智算的人多嗎?為什么選擇了商湯呢?
孟健雄: 當(dāng)時(shí)我們還挺搶手的,也和其他資方包括大廠談過(guò),但最后選擇了商湯,是因?yàn)樯虦欠浅<夹g(shù)驅(qū)動(dòng)的公司,他們的技術(shù)加上煒燁智算自己的經(jīng)驗(yàn)和商業(yè)化能力,是一個(gè)很好的合作契機(jī),能讓商湯的技術(shù)能力在市場(chǎng)中得到最大化的回報(bào)。
雷峰網(wǎng):具體來(lái)說(shuō),商湯什么方面的技術(shù)對(duì)你們非常重要?
孟健雄: 商湯在AI上的全鏈路技術(shù)全棧都有,但最貼近煒燁業(yè)務(wù)的是商湯大裝置的平臺(tái)軟件能力。
目前市面上經(jīng)歷過(guò)長(zhǎng)期生產(chǎn)環(huán)境檢驗(yàn)、支持異構(gòu)混訓(xùn)的這種真正能打的GPU云服務(wù)平臺(tái)不多, 商湯可以說(shuō)是國(guó)內(nèi)最早一批做異構(gòu)的企業(yè) ,從成立的第一天就開(kāi)始。
異構(gòu)混推本來(lái)就很難,混訓(xùn)對(duì)技術(shù)要求更高,因?yàn)榛煊?xùn)后如果效率拉低就沒(méi)有生產(chǎn)意義了。 早先商湯沒(méi)有那么多卡的時(shí)候,就只能“被迫”混訓(xùn) 。在人工智能還沒(méi)現(xiàn)在這么火的時(shí)候,他們已經(jīng)開(kāi)始做積累。
雷峰網(wǎng):那商湯投資了煒燁智算后,是否會(huì)給煒燁提供客戶(hù)入口,相當(dāng)于會(huì)幫助解決消納?
孟健雄: 商湯自身的算力剛需很大,確實(shí)在必要時(shí)可以提供消納方面的支持。不過(guò)更準(zhǔn)確說(shuō),是煒燁為商湯提供更多樣化的客戶(hù)入口,尤其是頂級(jí)AI客戶(hù)和頭部行業(yè)客戶(hù)。
雷峰網(wǎng):不過(guò)你們和商湯自身大裝置團(tuán)隊(duì)之間的客源如何區(qū)分呢?
孟健雄: 商湯的大裝置平臺(tái)商務(wù)團(tuán)隊(duì)人多,集團(tuán)化作戰(zhàn)效率很高, 煒燁相比起來(lái)團(tuán)隊(duì)規(guī)模小,但打的都是top級(jí)KA客戶(hù) ,單個(gè)客戶(hù)ARPU值(每用戶(hù)平均收入)極高,形象一點(diǎn)說(shuō)是“特種部隊(duì)”。
雷峰網(wǎng):那么現(xiàn)在煒燁智算在算力上的布局情況和主要業(yè)務(wù)方向如何?整體出租率如何?
孟健雄: 目前實(shí)控算力2.3萬(wàn)P,年底可達(dá)近 2.6萬(wàn)P,主要集中在商湯自營(yíng)臨港機(jī)房及各地納管智算中心 。現(xiàn)在主要是圍繞國(guó)央企需求,選擇與合適的地方政府合作整體智算項(xiàng)目。
我們的算力部署,主要在經(jīng)濟(jì)相對(duì)發(fā)達(dá)、基礎(chǔ)設(shè)施完善的區(qū)域,出租率穩(wěn)定在接近滿租的狀態(tài)。
雷峰網(wǎng):那接下來(lái)發(fā)展策略是什么樣的?
孟健雄: 我們?cè)跒椴认乱粋€(gè)引爆點(diǎn)做準(zhǔn)備。目前來(lái)說(shuō) ,煒燁的策略已經(jīng)從硬件層向軟件和商務(wù)模式方向進(jìn)化 ,例如利用商湯大裝置平臺(tái)軟件的技術(shù)優(yōu)勢(shì),實(shí)現(xiàn)訓(xùn)練by token計(jì)費(fèi)的方法,在算力銷(xiāo)售環(huán)節(jié)探索引入合規(guī)金融衍生品,相關(guān)嘗試正在合規(guī)推進(jìn)中。
專(zhuān)題介紹
2023 年來(lái),智算產(chǎn)業(yè)迎來(lái)爆發(fā)式增長(zhǎng)。但兩年過(guò)去,國(guó)內(nèi)智算企業(yè)的生存狀態(tài)如何?在技術(shù)突破與場(chǎng)景落地中做了哪些新探索、又面臨什么新挑戰(zhàn)?智算行業(yè)的未來(lái)還有什么想象空間?本專(zhuān)題與一眾智算領(lǐng)域的先鋒從業(yè)者對(duì)話,回顧近年智算行業(yè)在技術(shù)與商業(yè)上的拓展實(shí)踐歷程,并展望未來(lái)發(fā)展方向。即便身處行業(yè)氣候更迭之際,從業(yè)者們憑借智慧與韌性、懷揣對(duì)智算未來(lái)的堅(jiān)信,開(kāi)辟多樣化發(fā)展路徑。對(duì)此專(zhuān)題感興趣的從業(yè)者,歡迎添加微信 Ericazhao23 共同參與討論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn) 轉(zhuǎn)載須知 。