爭搶垂直大模型機遇,創業公司們拼了
來源:獵云精選(ID:lieyunjingxuan),作者:盛佳瑩
時代的大幕已然拉開,燦若繁星。
“盡管在泡沫期,貼上大模型標簽的公司都很貴,沖上十幾億甚至數十億估值,但這依然是出手的窗口期。”常年看AI賽道的天堂硅谷高級合伙人王偉興奮地說道,他堅信,將大模型的思想和技術武裝到牙齒,必然會建立起一個全新的商業帝國。
由ChatGPT掀起的這一波大模型浪潮中, 百度、阿里等大廠相繼下場,王慧文、王小川、李開復等大佬也紛紛入場,而創業公司在這波浪潮里的最大機會在哪里?
大多數人都并不看好創業公司入局通用大模型,遠望資本創始合伙人程浩就曾公開表示,大廠肯定比創業公司有流量、有錢,而重要的是大廠的核心優勢是自帶場景,不論是百度的問答和搜索,還是騰訊的微信、阿里的天貓精靈和釘釘,都具備成熟的落地場景。
既然通用大模型機會鮮少,不少創業公司瞄準了垂直大模型。
如今,通用大模型數據來源于公開互聯網場景,但互聯網數據并不等同于全世界的數據,尤其在垂直賽道,依然有很多私有數據。
而深耕垂直領域的創業公司已經積累大量數據和know-how,具備核心優勢,而大廠的基因并不在垂直領域。范特科技CTO郭長柱表示,大模型對于大廠而言在通用和垂直領域之間是魚和熊掌不可兼得,“做通用大模型的大廠,它要的是生態,讓眾多的企業接入它的大模型,以它的大模型作為底座去賦能百業,這個時候它自己也下場踢球就和它的身份不符,所以它們一般不會輕易這樣做。”
如果在互聯網時代,每個行業都值得用互聯網重做一次,那么在大模型時代,每個行業依然如此,甚至此前在互聯網時代依然保守的賽道,極有可能被大模型重塑。
這讓投資人足夠興奮,在奇績創壇2022年11月舉辦的秋季路演日中,陸奇投了55個項目,其中有16個是“預訓練大模型”方向,而彼時ChatGPT還未發布。
而到今年,前四個月國內AI領域就已經完成融資243起。面對越來越熱的風口,創業公司們都拿出渾身解數,捕捉這輪機遇。
01 垂直大模型:變革的生產力
在ChatGPT爆火前,大模型已經默默發展了數年,極驗AI實驗室負責人曹佳豪坦言,多模態大模型的核心技術本質并沒有發生大的改變。但是在訓練規模大到一個量級以后確實出現了一些感受上是質變的效果。最終大模型能否走到通用人工智能,還是一個未知數。
三維家CEO蔡志森也表示,大模型是AI從量變到了質變的階段性里程碑,最大價值在于通過千億數據訓練,其生成的內容超出想象,驗證了這條路徑是正確的。
可以說,這波熱浪更多得益于ChatGPT商業和營銷方面的成功,而不是技術迭代。
但不可否認的是,大模型會改變很多垂直行業的業務和商業模式。
對于驗證碼這個行業而言,垂直大模型可以幫助驗證碼廠商管理圖集,也可以誕生新的驗證形式,甚至基于文生圖和圖生圖模式,可以與客戶共創圖集,增強交互體驗。
但對于這樣一個需要人機對抗的領域,大模型也極有可能被用于驗證識別,為黑產所用,這也更推動極驗在垂直大模型領域進行投入,從防御角度而言,只有了解黑產的工作模式,才能精準研發破解手段。
從目前的情況而言,極驗已小規模上線一批由垂直大模型自動生成的圖集,用于驗證碼圖形,極驗發現,雖然大模型對防御黑產程度有限,但卻可以縮小對抗領域,進而優化對抗資源,從被動防御轉變為主動防御。
而像金融行業而言,過去長尾算法數據收集難、標注時間長、數據不均衡導致落地效果差,即便一些擁有算法自訓練平臺的AI基礎設施供應商,像范特科技,其長尾算法的落地難度依然大且周期長。
郭長柱告訴獵云網,主要是因為其中包含了大量的人工工作。而如今結合CV大模型的能力之后,對于常見物體的檢測和分割可以實現全自動訓練,對于特殊物品也可以借助CV大模型把人工作業降到最低。
“不僅工作量降低了,工作難度也降低了。” 郭長柱表示:“原來做分割時需要沿著物體邊緣仔細描邊,現在只需要點一下就能自動分割,這樣我們把系統私有化部署到客戶那里,打通內部網絡的云邊兩端,客戶自己坐在辦公室里就可以對模型進行升級和維護,而我們專注做基礎算法和底層平臺能力建設,這樣實際上分工也產生了變化。”
這意味著,垂直大模型將作為基礎能力對外標準輸出,端到端的解決用戶需求。目前,范特科技已完成語言類大模型、視覺大模型以及多模態大模型的技術預研,將于近期推出相關產品進行落地。
而像家居和電商內容這樣的行業,垂直大模型可以賦能全流程。
聚焦電商內容解決方案的極睿科技創始人武彬告訴獵云網,在電商內容生成全領域,從拍攝-場景圖-種草-直播切片-短視頻,過去的AI解決方案只能賦能部分流程,而垂直大模型可以全流程自動生成,這可以極大地降本增效。
專注家居行業的三維家CEO蔡志森也表示,不論在設計場景、營銷場景還是制造場景,垂直大模型可以生產3D矢量化的內容,做到“所想即所見”、 “所見即所得”,甚至在生產制造端,垂直大模型將取代規則驅動,生產自動化提效,優化人員結構和人機交互模式。
目前三維家已構建起室內空間大模型、定制家居大模型等垂類模型,應用于戶型識別、智能樣板間、智能柜體、智能硬裝、智能水電、智能家居布置等多種設計環節。
基于室內空間大模型通過可配置的AI知識圖譜和大規模神經網絡,深度學習海量家居家裝方案,可以自動完成智能設計。
而基于真實柜體數據的定制家居大模型,則可根據尺寸輸入、對話文本生成參數化的定制衣柜、櫥柜設計,生產合理的柜體方案,可直接對接生產,將大大縮減復雜易出錯的柜體設計時間。
對于各行各業來說,垂直大模型是一種全新的生產力,底層能力的突破不僅可以降本增效,長期來看必然帶來上層應用的躍遷和變革。
如蔡志森所說,一方面,在當前中國的智能化浪潮下,產業側數字化革新本就有廣闊的市場需求;另一方面,在toB生態下,基于垂直大模型的應用實踐也有利于形成數據飛輪與場景飛輪。
天堂硅谷高級合伙人王偉也表示,大模型最大的價值在于建立新的商業模式和新的經營思想,重新改造商業組織的每一個環節。
這也是為什么創業公司紛紛擁抱大模型的原因。
02 創業公司垂直大模型第一仗:控本增效
雖然大模型“很香”,但眾所周知,過去大模型的一次性投入成本極高。此前,有市場消息稱GPT3單次訓練的成本為400萬美元,因此,不少聲音認為訓練大模型門檻至少在數千萬元。
但在垂直行業,盲目追求“大”規模沒有意義,OpenCSG創始人& CEO陳冉將大模型比作一塊“玉”,“如何用好大模型能力,也就是說雕琢這塊玉更為重要。”
郭長柱也提到,大模型的標準并不能以參數規模一概而論,核心在于其是否具備“涌現”能力,即其準確率是否達到突然躍升的階段。“在垂直領域,同樣的效果,通用大模型要千億甚至萬億參數,垂直大模型百億數據也可以達到。”
參數規模的指數級下降,疊加這段時間涌現的眾多開源模型和蒸餾法等變革性技術,過去千萬級的訓練大模型“門票”已降至百萬級。
但這對于創業公司們而言,這仍然是一筆不大不小的開支,控制成本和提升效率成為各家公司在百模大戰中的第一仗。
極驗在優化投入產出比方面,采取彈性計算環境,以按量計算完成前期零碎的探索任務。在明確方向后,再轉化為周期性訓練。
極睿科技則聯合清華大學人工智能研究院,由學術團隊提供算力支持,優化投入產出比。
而三維家則打造了一套多服務器、多GPU并行的計算網絡,優化算力調配和運行機制,同時,三維家作為英偉達的高級初創會員,得到高效利用GPU的技術支持,這也加速了三維家垂直大模型的迭代速度。
范特科技在成本和生成效率方面,一方面,通過在現有的產品中整合大模型能力,大幅提升了內部創新效率;另一方面,通過自研的推理引擎優化技術和并行計算技術最大限度的提升大模型推理速度和硬件利用效率,通過自研業務流編排引擎解決最后一公里的業務流自定義問題,完成基于大模型的端到端的解決問題完整閉環。
事實上,控制成本不僅僅是為了控制投入,小苗朗程合伙人俞佳偉坦言,對于用戶側而言,成本太高也難以被接受,尤其是在算力低、功耗低的終端場景。
03 垂直大模型:數據和know-how為王
訓練大模型的成本下降,對于創業公司而言,只是拿到了入場券。對于垂直大模型而言,核心和關鍵離不開算力、算法和數據。
在一定程度上,錢可以解決算力和算法,但卻很難買到數據,尤其是在垂直領域,很多都是私有數據,能買到的數據意義并不大。
這對一直深耕在垂直行業的公司而言,是天然的優勢。
蔡志森告訴獵云網,依托其在線的3D設計軟件和3D制造軟件,三維家已經具備2800萬+覆蓋全國小區的戶型數據、8100萬+軟硬裝、家具家電、材質飾品素材庫、16.3億+風格種類多樣的設計方案庫,此外,還擁有數千萬參數數據的真實定制柜體數據集。
與此同時,用戶不斷使用,這些數據集仍按照三維家定義的方向在自動實時生成。
和三維家一樣,深耕電商內容領域的極睿科技每年都在產生數百萬乃至數千萬的電商內容數據。
除了數據壁壘,定位清晰的應用場景、掌握垂直大模型落地的全流程也是核心競爭力,這對了解行業know-how提出了極高的要求。
實際上,大模型提供的是基礎能力,具體業務則是專有能力的組合。
在郭長柱看來,目前基于大模型的模型即服務(MaaS)是一種創新的模式,即把大模型作為基礎能力對外標準輸出,端到端的解決用戶需求。但直接使用大模型端到端的解決問題相對較少,尤其是在CV領域,更多的是在基礎能力之上針對垂直領域做定制。
“比如使用大模型自動標注訓練垂直領域小模型,使用大模型更加general的特征做VQA、檢測、分割和識別等二次開發。除此之外,部分業務可能涉及多項大模型能力的組合,甚至需要語言和視覺特征對齊的多模態能力。這就要求我們在實際的業務中必須支持多種大模型的自定義業務流,實現大模型的自由組合和業務的深度定制。”
OpenCSG也從實踐中積累了大量大模型落地通用行業的實踐,包括垂直行業語料產生,大模型微調,業務結合等方面。
王偉也表示,投資大模型他看好在核心行業有海量行業數據,懂行業know-how的企業。
俞佳偉則看好有實際落地場景的企業,尤其是需求強、專業性強的場景,例如醫療、金融、法律等行業。
在陳冉看來,大模型具備了推演、舉一反三的能力,在一定程度上,具備類似人類的腦神經,可以替代不少人類的工作。“過去最大的創業成本是人,而利用好大模型,重塑工作流,可以極大降低創業成本,這對創業公司來說是極大的利好。”
王偉也持相同觀點:“將大模型的思想和技術武裝到牙齒,必然會建立起一個全新的商業帝國。”
時代的大幕已然拉開,燦若繁星。
