歷史轉折中的百度
?
大風始于青萍之末,命運的偶然和必然經常會縱橫交織在一起。
2019 年,是整個人工智能歷史上,最為晦暗的一年。繼 2016 年 AlphaGo 打敗李世石,2017 年 Tansformer 架構橫空出世使得技術大規模爆發,2018 年的 創業 熱潮之后。2019 年,資本退潮、技術瓶頸期、場景難落地,開啟了人工智能史上的 " 亂紀元 "。
沒有人知道通用人工智能何時到來,就像三體人不知道太陽會在何時升起。
那一年,大批 AI 公司陷入裁員風波、資金鏈斷裂、產品難產,能堅持至今的,所剩寥寥。
但也正是在 2019 年,AI 新的希望開始孕育:OpenAI 在 7 月接受了微軟的 投資 并與其深度合作,如今讓世人震驚的 GPT-3 正是從那一年開始研發;國內最早樹立 AI 戰略的百度,從年初就開始進行了一次長達半年的人事調整,如今看來,重新排兵布陣,似乎是開啟了長達 4 年的堅守期。
2019 年,王海峰晉升為集團 CTO,繼續擔任 AI 技術平臺體系(AIG)和基礎技術體系(TG)總負責人,兩者是百度最重要的技術底座;沈抖晉升為高級副總裁,全面負責移動生態事業群,隨后在 2022 年又調任至百度智能云,成為百度第二增長曲線的開拓者;而在 2019 年引進的一批新生力量中,何俊杰是唯一一名 80 后百度副總裁,先是負責投資并購和戰略投資,后又被重用,負責沈抖空缺出來的移動生態事業群,實權更加在握。
時間來到了 2023 年,Transformer 的能力在這一年終于由 OpenAI 打破了天花板,進階到一個新的層次,技術的突破讓 OpenAI 一舉成為全世界最受矚目的公司。微軟蓋過了谷歌的 科技 光輝。
在過去四年里,百度的核心業務形成了由沈抖領軍智能云,何俊杰負責移動生態,王海峰壓陣技術的三角結構,百度也終于結束了靜默期,開始轉守為攻,動作不斷。
" 重新把每個應用都做一遍 ",是經歷了半年蓄力后的第一次亮劍,如今的百度像一顆行星,即將遇到巨大的 " 技術引力場 ",而徹底改變軌道。
大模型涌現前夜
2017 年,谷歌在一篇名為《Attention Is All You Need》的論文中,提出了 Transformer 架構,以替代傳統的 RNN 和 CNN 循環模型,論文中展示了 Transformer 的訓練準確性高于之前所有模型,訓練時間明顯低于之前的模型,在訓練集內容較少時訓練效果也很好。
這之后,Transformer 架構迅速被接受并應用在了 NLP 和 CV 領域,尤其在 NLP 領域,注意力機制讓機器能夠更準確地理解語義并生成,以及減少信息重復。
作為最早一批發現并跟進 Transformer 技術路線的公司,百度已經在 NLP 領域研究超過十年之久,并已經組成了一支由王海峰、吳甜、吳華等頂尖專家組建起來的精悍的 NLP 隊伍。
彼時,NLP 團隊成立的第一個重要任務,是打造百度翻譯。王海峰將深度學習和神經網絡大膽應用在翻譯中,加強機器對上下文的理解,形成更流暢的譯文。這一勇敢嘗試也讓百度翻譯成為第一個支持 200 多種語種的翻譯系統,甚至比 Google 還早了一年零 3 個月。
這也是大模型四大核心能力 " 理解、生成、邏輯、記憶 " 中,理解能力的雛形。
但王海峰覺得,NLP 還不夠。他專門跑到李彥宏辦公室去做匯報,提出了下個 " 登陸的諾曼底 " ——語音識別。他的理由是,語音識別技術馬上要到產業化的臨界點,一旦突破很快就會大規模商用。
李彥宏憑借著自己對技術的判斷,決定再次支持王海峰,陸續建立了與 NLP 部門平行的 " 語音識別部門 "、" 圖像識別部門 " 和 " 知識圖譜部門 "。
王海峰的一通操作讓很多百度的同學不解," 這些技術和百度現在的產品也沒關系啊,一股腦創建這么多部門,是攢著過年么?"
彼時的王海峰,正是看到了搜索數據對于大模型形成邏輯有著非常強大的支撐。? " 百度有世界上最大的搜索引擎,搜索引擎不僅信息時效性很強,也有很高的準確率,可以構建最全的知識圖譜 ",王海峰曾在公開采訪中解釋道。
在打造文心一言之前,百度沉淀了擁有超過 50 億實體、550 億事實的多元異構超大規模的知識圖譜,能夠通過語言、聽覺、視覺等獲得對世界的統一認知。其在 2021 年發布的知識增強大模型—— ERNIE ( 文心 ) 3.0,正是文心一言的前身,該項目由吳甜主要負責。
又是 2019 年,百度文心 1.0 發布,在 4 年時間里迭代了 3 個版本。2022 年 11 月,吳甜在公開峰會中同時公布了文心已經累計的 11 個行業大模型,涵蓋電力、燃氣、 金融 、航天等領域,產業生態初步形成。
這些,都為百度搶先發布文心一言做了伏筆和鋪墊。3 月 16 日,文心一言發布之后,百度再次回到鎂光燈下,但比肯定更多的,是質疑。
" 市場需求這么旺盛情況下,誰先做出來還是意義非常大的 ",李彥宏曾在采訪里講到,即便產品并未完全成熟,但仍然要發布的原因:" 文心一言發布之后,無數的人,過去不怎么聯系或者行業跟我隔得很遠的人都在問,我們怎么能跟百度合作,怎么盡早試用 "。
從技術的角度,大模型更是 " 越用越靈 " 的高速迭代。 ?" 內測的時候,員工問,文心一言怎么藏頭詩寫不好?我說等等吧,明后天估計就能學會了,結果第二天果然就能用了,大模型的進步也是一個不斷學習的過程 ",王海峰笑道。
在半年時間里,文心一言從 3.0 到 3.5,再到 4.0 版本進行了三次迭代,據王海峰在會上介紹,文心一言用戶規模已經達到 4500 萬,開發者 5.4 萬、場景 4300 個、應用 825 個、插件超過 500 個。
在 NLP 澆的水,施的肥,終于在 2023 年迎來了豐收,也正如李彥宏所講,技術發展的路徑,是 " 一生二、二生三、三生萬物 " 的過程。
大模型背后的內功
通用人工智能爆發之后,云計算的關注度和企業重視程度到了頂峰,也隨即來到了 "iPhone 時刻 "。
大模型的出現,產生了巨大的算力缺口,云計算既為大模型提供云算力支撐,又是大模型落地企業的最佳著落點,無論是百度還是任何一家擁有大模型的企業,當大模型面世,下一步的重點便是推向市場,讓企業用起來。
對于百度而言,這樣的重擔,落在了沈抖肩上。
在百度的六大事業群負責人中,除了 CTO 王海峰,沈抖是唯一一個高級副總裁。雖然同為技術出身,但和王海峰的 " 工程師 " 角色不同,沈抖從加入百度開始,就一直在負責關鍵業務的增長。
加入百度的 10 年里,沈抖先后整合了廣告投放系統,提高了系統變現能力;將搜索和 feed 信息流進行結合;整合了由搜索升級后的移動生態事業群,補齊了百度移動生態的版圖。
如果說,王海峰打造了一把尖刀,那沈抖則是能利用這把尖刀,開拓疆土的先鋒官,用李彥宏的話說是 " 敢打硬仗、能打勝仗 "。
2022 年 5 月,沈抖輪崗為百度智能云(ACG)事業群總裁。于百度而言,最開始并沒有全力押注云計算,但也正是隨著人工智能技術的不斷發展,讓百度意識到了云計算短板后,開始暗自發力,默默培養第二增長曲線。
由于沒有先發優勢,百度云過去 10 年的目標都十分明確,不和 " 老炮 " 們比拼 IaaS 層的規模化,而是通過 PaaS+SaaS 與智能化能力的結合,打出差異化,并以小搏大地切入企業數字化。
2023 百度世界大會上中,沈抖再次提出 " 云智一體 " 戰略:" 人工智能與云計算的深度結合是企業快速落地 AI 原生應用的關鍵。目前,百度集團所有應用和服務全部基于‘云智一體’技術架構運行在百度智能云上 "。
據光錐智能觀察,云智一體戰略的核心在于,一方面,以百度智能云為依托,可以快速為企業提供整套的大模型服務;另一方面,大模型也推動著企業數字化的門檻變得更低。
在接手 ACG 后的 5 個月里,沈抖針對企業在大模型時代的核心需求,迅速整合出了 " 大模型服務超級工廠 " ——文心千帆,并按需求將用戶分為五大類用戶。
首先,針對算力資源所產生的需求缺口, ?千帆平臺提供各類異構算力。比如在耗費最多訓練環節,通過分布式并行訓練和微秒級互聯能力,千帆平臺可以實現萬卡集群訓練加速比達到 95%,有效訓練時間占比達到 96%,大幅降低客戶算力和時間成本。
其次在模型層面, ?對于希望直接調用已有大模型的客戶,企業可快速調用包括文心一言在內的多個大模型,同時千帆平臺提供中文增強、性能增強、上下文增強等工具。據沈抖透露,目前千帆平臺已經服務超過 1 萬 7 千家客戶。
針對有二次開發需求的客戶, ?千帆平臺為大模型提供再訓練、微調、評估和部署等全生命周期工具鏈,業界最多的 41 個高質量行業數據集,并針對自身業務場景快速優化。
大會現場還進行了如何基于檢索增強生成(RAG,Retrieval Augmented Generation)框架,為三一重工快速開發知識問答應用的實操演示:只需在千帆 AI 原生應用工作臺中選擇預置的 RAG 框架,進行相應的參數配置等工作,就可以快速實現三一重工官網智能客服應用的開發與上線。
沈抖表示,搭建這樣一個 " 小助手 ",即使需要處理幾千篇萬字長文檔,成本也只需幾百塊錢;而之后用戶每次咨詢,成本僅需幾分錢。
一直以來,大型工業、制造業、農業都是數字化的深水區,核心原因就在于產業的復雜性導致了數字化的門檻高,難以落地。
但通過大模型,既降低了使用門檻,也降低了使用成本。不需要打造任何新系統,也不需要人工參與,是技術組件的一個更高級的應用方式,? 二者結合,也轉起了云智一體的飛輪,逐步蓄力。
大模型的創新挑戰
過去已成定局,未來卻可以改變。
所有擁有了大模型的廠商,都發現了應用層的機會。微軟在 3 月份就開始動刀包括 Bing、Office、Windows 系統在內的全線產品,阿里張勇講道:" 要用大模型把所有產品重做一遍 ",然而這句話,說起來簡單,做起來卻是大模型時代最大的創新挑戰。
AI 如何重構應用?這不僅要業務能力,更需要想象力,面對一個新的 AI 時代,百度也將指揮棒交到了年輕人手里。
2022 年 5 月之后,接替沈抖作為 MEG 事業群負責人的,是百度人才梯隊建設計劃中引入的 80 后副總裁——何俊杰。如果說沈抖是 " 硬戰派 ",那何俊杰就是名副其實的 " 少壯派 "。正如任正非所說,要 " 讓聽到炮聲的人指揮戰斗 "。
重構應用,是不破不立,對比來看,百度對自己,確實 " 下手特別狠 "。
百度世界大會,圍繞 " 生態 ",何俊杰交出了 " 移動生態 "、" 內容生態 " 和 " 商業 生態 " 的答卷。
其中,移動生態涵蓋了 " 新搜索 "、" 新文庫 "、文心一言 APP、百度電商 " 慧播星 " 等 AI 原生應用;內容生態層面,通過百度 APP"AI 編輯器 " 等一系列應用為創作者生態賦能;商業生態層面,推出 AI Native 營銷 平臺 " 輕舸 "。此外,何俊杰還公布了文心一言插件生態—— " 靈境矩陣 ",現已全面開放。
百度所定義的新搜索,正是延續了 2010 年李彥宏提出的框計算的邏輯。 ?具備極致滿足、推薦激發和多輪交互三個特點。即用戶搜索問題時," 不再給你一堆鏈接 ",而是通過對內容的理解,生成文字、圖片、動態圖表等多模態答案;推薦激發則可以實時推薦用戶關心的問題;在針對復雜需求時,多輪交互可以通過提示、調整等方式,滿足用戶個性化的搜索需求。
需求到匹配的過程,也稱之為 " 端到端 " 搜索,但這會打破百度曾經賴以生存的競價排名模式,廣告收入也是一直以來百度最大的現金牛,自己革自己的命并不簡單,百度后面還有一場硬仗要打。
AIGC 的能力讓一部分百度老應用有了新的活力,比如百度文檔從內容檢索工具升級為了內容生產工具、百度編輯器成為了內容生成工具;另一部分也探索了新的場景,比如百度輕舸通過 AIGC 一站式生成營銷內容并智能投放,結合數字人生成平臺 " 慧播星 " 幫助商家擴大營銷范圍和場景。
同時,隨著大模型應用的逐步落地,百度也意識到憑借一己之力終究有限,無限的是合縱而連橫。
這正是靈境矩陣的價值所在,這一平臺大大降低了大模型插件開發的成本,讓有創意、有想法的普通人,也能成為插件開發者。李彥宏表示,插件是一種特殊的 AI 原生應用,也是門檻最低,最容易上手的 AI 原生應用。
插件的特點在于 " 萬能接口 ",既可以連接搜索、小程序、內容平臺也可以連接任何入口,這樣 " 即插即用 " 的使用方式,能讓開發者、創作者快速加入到生態中。
何俊杰透露,上線一個月,靈境矩陣已經收到 2.7 萬個開發者注冊申請,覆蓋了 20 多個垂直領域,其中包括企業、機構和個人開發者。
一位百度內部人士告訴光錐智能:" 應用層的大模型插件以靈境為主要平臺,會放在文心一言和百度 App 中。千帆更偏底層調用,靈境更偏上層,甚至未來有可能在應用插件層面會替代千帆 "。
結語
2016 年,李彥宏曾說,百度離破產只有 30 天。" 恐龍腳上踩到一個瓢,幾個小時以后他的腦子才能反應過來。所以不管恐龍長到多大,都會滅絕 "。
百度不想做恐龍,在意識層面,總是想著十步以外。
幸運的是,百度等到了新時代,度過了最艱難的時刻;不幸的是,在這個新時代的開端,任何費勁心力的搶跑,都會在漫長的競爭下顯得微不足道。
但拿到了新的船票,至少是一個新的開始。
來源:光錐智能