為人工智能賦予機器人軀體的“登月計劃”項目,倒在具身智能熱潮之前
仿生人會夢見電子羊嗎?或許答案就在現(xiàn)代機器人的世界里。
Google X 前任副總裁、Everyday Robots 前任 CEO Hans Peter Brondmo 說,在 Everyday Robots,機器人整晚都在做夢,它們在模擬世界里學(xué)習(xí),一覺“醒來”就能掌握新技能。
Everyday Robots 有一個充滿未來感的實驗室,機器人專家Peter Pastor在這里配置了七個工業(yè) Kuka 機器人手臂,被形象地稱為“Arm-Farm(手臂農(nóng)場)”。
這些機械臂晝夜不停地工作,像抓娃娃機一樣移動到垃圾箱上方的隨機位置,再伸手抓取垃圾箱里的海綿、樂高積木、小黃鴨或塑料香蕉等物品。垃圾箱上方的攝像頭能夠捕捉到物品和機械臂的每一個動作,幫助系統(tǒng)判斷抓取是否成功。
通過反復(fù)訓(xùn)練,機器人的成功率從最初的 7% 成功增長到 70% 以上。
這個結(jié)果令人振奮,但它仍然不夠。幾個月才能學(xué)會抓起一只小黃鴨的速度再過幾百年也無法讓機器人學(xué)會在現(xiàn)實世界里執(zhí)行任務(wù)。
因此,Everyday Robots 開發(fā)了一個云端模擬器,創(chuàng)建了超過 2.4 億個機器人實例,內(nèi)置的真實世界物理模型能夠模擬物體的重量和摩擦力。
成千上萬的虛擬機器人通過模擬攝像頭和模擬機械臂同時執(zhí)行任務(wù),經(jīng)歷數(shù)百萬次失敗,最后才會把表現(xiàn)優(yōu)異的算法應(yīng)用到真實的物理機器人上,在現(xiàn)實世界中進行訓(xùn)練。
Everyday Robots 在機器人學(xué)習(xí)領(lǐng)域的成就令人矚目。“端到端學(xué)習(xí)”和“混合方法”的爭論從未停止,而 Everyday Robots 在兩個方面都取得了顯著進展。
2023年,OpenAI 推出了 ChatGPT,這也讓 Everyday Robots 意識到了數(shù)據(jù)的重要性,制定了下一個目標:讓數(shù)百萬機器人在現(xiàn)實世界中執(zhí)行任務(wù),收集足夠的數(shù)據(jù)訓(xùn)練最終模型,使機器人能夠超出狹窄訓(xùn)練定義任務(wù)范圍的復(fù)雜任務(wù)。
讓機器人從撿東西到能夠游走在谷歌大樓里做擦桌子、垃圾分類等雜務(wù),Everyday Robots 花了七年的時間,并確信自己正在引領(lǐng)一個屬于機器人的未來紀元。
Hans Peter Brondmo 每周都會和母親通電話,他的母親每次都會問同一個問題,“機器人什么時候來?”而他總是回答,“媽媽,還要過一段時間。”
遺憾的是,Hans Peter Brondmo 的母親在 2021 年過世,沒能等到機器人的到來,這也仿佛預(yù)示了 Everyday Robots 的結(jié)局。
就在 ChatGPT 推出短短兩個月后,谷歌就突然宣布關(guān)閉 Everyday Robots,只有少數(shù)機器人項目和成員被轉(zhuǎn)移到 DeepMind 繼續(xù)研究。
Hans Peter Brondmo 也從 Everyday Robots 離職,轉(zhuǎn)向攝影領(lǐng)域,似乎有些心灰意冷。
十年前,谷歌掀起了機器人收購狂潮,波士頓動力等公司曾被一一收購。
然而十年后的今天,波士頓動力多次易主,谷歌機器人的輝煌也隨著 Everyday Robots 的關(guān)停、諸多研究人員的流失陷入了低谷。
科研的伊甸園
在谷歌籌備上市的招股書中,有一封兩位創(chuàng)始人堅持附上的公開信,信的開頭是這樣的:
谷歌不是一家傳統(tǒng)的公司。我們也不打算變成一家這樣的公司。
兩位創(chuàng)始人擔(dān)心上市會損害谷歌的獨立性和客觀性,或許會因為市場的短期需求放棄長期利益。為了保證管理層決策的獨立性,谷歌創(chuàng)造了一種"雙重投票權(quán)"的結(jié)構(gòu):管理層 B 類股的投票權(quán)是公眾擁有的 A 類股的 10 倍。
在公開信的最后,他們強調(diào):
不要作惡。我們堅信,作為一個為世界做好事的公司,從長遠來看,我們會得到更好的回饋——即使我們放棄一些短期收益。
這封公開信后來被人們稱為“不作惡宣言”。
Google X 正是基于這一價值觀創(chuàng)立,旨在開發(fā)和推出能改善數(shù)百萬甚至數(shù)十億人生活的技術(shù)。這家實驗室創(chuàng)立的所有項目都被統(tǒng)稱為“登月計劃(Moonshot)”, 象征著和登月計劃一樣,瞄準一個看起來不可能的目標而努力。
和主流的職場規(guī)則不一樣的是,Google X 不需要員工在做決策或提案前做好詳細的計劃,首席執(zhí)行官 Astro Teller 非常歡迎員工們提出各種具有創(chuàng)新性的、甚至瘋狂的想法。
Astro Teller 就曾經(jīng)提出要在植物車(一種可以在農(nóng)田中滾動采集植物數(shù)據(jù)的技術(shù))上安裝喇叭,向植物播放激勵演講的想法。他并不在意其他人異樣的眼光,在他看來想法的價值不在于成果有多好,而在于是否具備創(chuàng)新性,能否打破常規(guī)思維。
他說,“如果團隊花時間探索和測試像這樣的愚蠢想法,可以幫助‘打破’他們的思維束縛,并取得原本可能不會取得的成果。”
當(dāng)然,即使是 Google X 也必須考慮到現(xiàn)實因素。這里幾乎每周都會有一次評審會,聚在一起討論并否決掉成員們提出的過于瘋狂的想法。大約九成的項目會因為太難或太貴而止步于提議。
一旦通過,Google X 給予的支持也是令人難以想象的。
Astro Teller 曾要求谷歌給他的項目提供 3000 萬美元,而對方直接給了他 1 億 5000 萬。時任谷歌 CEO 的 Eric Schmidt 說,“如果我給你 3000 萬美元,下個月你還會來要 3000 萬。”
在 Google X,項目失敗的頻率比其他實驗室要高出不少。但Google X 并不像傳統(tǒng)公司那樣將失敗項目視為恥辱,一旦失敗就關(guān)閉整個項目并裁掉相關(guān)團隊。
Astro Teller 設(shè)立了項目失敗獎金,鼓勵大家放開手腳去做一些冒險的嘗試,安慰那些盡力了但沒能成功的員工。
Google X 還在員工的建議下舉辦了分享會,員工可以分享失敗項目的經(jīng)驗和生活里的變故。
追求創(chuàng)新,鼓勵冒險,擁抱失敗。在這種氛圍下,Google X 打造了一個純粹的科研伊甸園。
谷歌一直在探索 AI 與機器人技術(shù)的結(jié)合,目標是創(chuàng)造能執(zhí)行復(fù)雜任務(wù)的機器人。Google X 的通用學(xué)習(xí)機器人項目 Everyday Robots ,正是這一愿景的產(chǎn)物。
Everyday Robots 的研究進展非常順利,團隊開發(fā)出了能夠在模擬環(huán)境中進行訓(xùn)練的AI模型,將表現(xiàn)優(yōu)異的結(jié)果轉(zhuǎn)移到實際的機器人硬件上進行進一步測試和優(yōu)化。
雖然現(xiàn)實世界的復(fù)雜性和不可預(yù)測性導(dǎo)致機器人在模擬與現(xiàn)實之間的表現(xiàn)存在顯著差距,但這并未阻礙 Everyday Robots 的研究步伐。
這些機器人逐漸具備了在實際環(huán)境中完成整理辦公桌這類簡單任務(wù)的能力,也代表著機器人能夠在 AI 幫助下有效識別人類及其周圍的物體。很快,這些機器人就被賦予了更多職責(zé),忙碌于谷歌大樓中,處理各種日常雜務(wù),成為了真正的“特殊員工”。
不止是雜務(wù),Everyday Robots 把機器人的應(yīng)用拓展到了藝術(shù)方面。
曾是專業(yè)舞蹈演員的斯坦福博士 Catie Cuan 與工程師們合作,開發(fā)了一種能夠根據(jù)編舞者偏好訓(xùn)練機器人的算法。她在閑暇時間與這些機器人共舞,探索舞蹈與技術(shù)的全新融合。
來自荷蘭的 Tom Engbersen 對此很感興趣,他和 Catie Cuan 一起為機器人的每個關(guān)節(jié)設(shè)計了不同的音效。打開音樂模式后,機器人的每次移動都會創(chuàng)作出獨特的管弦樂曲。
Hans Peter Brondmo 和他的母親一直相信,這些機器人很快就會進入普通人的日常生活。但他的母親沒能等到這一天,而現(xiàn)實的殘酷也不止于此。
理想和現(xiàn)實的沖突
商業(yè)黑洞?
根據(jù)咨詢公司 Evercore 的估算,谷歌在 Google X 上投入了 6.5 億美元的研發(fā)預(yù)算,卻造成了 9 億美元的虧損。
硅谷的創(chuàng)業(yè)者和學(xué)術(shù)界也經(jīng)常批評 “燒錢”的 Google X,怎么吃掉了這么多的資源,卻遲遲沒有交出一款真正的“現(xiàn)象級”產(chǎn)品?
說到底,Google X 更像是一個理想主義者的創(chuàng)新樂園,而不是一個合格的商業(yè)實驗室。
像知名的 Google Glass 明明實現(xiàn)了技術(shù)上里程碑式的突破,最終卻因為高昂的成本和市場冷淡的回應(yīng)市無法商業(yè)化而宣告失敗。
Google Glass 于 2013 年 4 月正式發(fā)布,最初版本 Explorer Edition 售價高達 1500 美元,將近一萬人民幣。Google Glass 的科技含金量自然不用多說,但很可惜主流市場對此并不買賬。
一方面,Google Glass 便捷的拍攝功能涉及隱私問題,引起了很大的隱私爭議。
另一方面,社會對這項新奇的高科技眼鏡接受程度出乎意料的低。根據(jù)移動應(yīng)用公司 Bite Interactive 的調(diào)查, 38% 的受訪者表示不會佩戴谷歌眼鏡,即使價格在他們預(yù)算范圍內(nèi)。另有 45% 的人擔(dān)心佩戴谷歌眼鏡會導(dǎo)致社交尷尬或令人不快。
沃頓商學(xué)院法律研究和商業(yè)倫理學(xué)教授 Kevin Werbach 也指出,“Google Glass 可能要花好幾年才能降價到讓普通人接受的水平,社會接受這類產(chǎn)品則可能需要更長的時間。”
Google Glass 只是 Google X 失利項目的冰山一角。還有互聯(lián)網(wǎng)氣球 Loon、模塊化手機 Project Ara 和能源風(fēng)箏 Makani等項目,都因為技術(shù)過于復(fù)雜或成本高昂等因素?zé)o法走向市場。
創(chuàng)新有時候像一場賭局,谷歌的賭注很大,但并非每次都能押對。
2015年,谷歌成立了 Alphabet 作為谷歌的母公司。同時把原本自主運營的 Google X、DeepMind、Waymo 等部門都脫離出來,放在了 Alphabet 名下作為子公司運營。
Alphabet 的目的是幫助谷歌專注于利潤豐厚的核心業(yè)務(wù),而不被“燒錢”的創(chuàng)新項目拖后腿。
2023 年 1 月 20 日, Alphabet 沒能頂住經(jīng)濟寒冬,宣布將裁員約 12,000 人,占其員工總數(shù)的 6%。 Everyday Robots 正是因預(yù)算削減而解散的少數(shù)項目之一 ,成為了這場創(chuàng)新與利益博弈中的犧牲品。
大公司的通病
根據(jù) Alphabet 2023 年的財報,廣告業(yè)務(wù)占谷歌總收入的 80% 左右,云計算服務(wù)貢獻了總收入的 10% ,剩下 10% 來自于硬件和其他業(yè)務(wù)。
谷歌在廣告業(yè)的霸主地位保證了源源不斷的巨大收入,也反映了其對廣告業(yè)務(wù)的嚴重依賴。即使是新的盈利增長點云計算服務(wù),也是一直保持虧損狀態(tài),直到 2023 年才終于實現(xiàn)首次盈利。
而市場上盈利項目單一,高度依賴某一特定業(yè)務(wù)收入的失敗案例真的有很多。
最出名的案例就是諾基亞,曾經(jīng)全球最大的手機制造商,在功能手機市場上沒有對手,但因沒有及時轉(zhuǎn)型智能手機,市場份額快速流失,最終在2013年被微軟收購,退出了主流手機市場。
另一個經(jīng)典案例是雅虎,曾經(jīng)也是依靠門戶網(wǎng)站和搜索引擎成為互聯(lián)網(wǎng)巨頭,廣告業(yè)務(wù)也是其主要收入來源,在谷歌的攻勢下節(jié)節(jié)敗退,已經(jīng)在 2017 年被 Verizon 收購并重組為 Oath。
過去雅虎怎么沒落的還歷歷在目,現(xiàn)在還有可能要走上雅虎的老路,谷歌也很著急,不然也不會在自家機器人勢頭正好的時候叫停研究,轉(zhuǎn)頭跟著 OpenAI 開始做大語言模型。
谷歌出現(xiàn)了一個奇特的現(xiàn)象。一方面各類創(chuàng)新項目層出不窮,只有業(yè)界想不到?jīng)]有谷歌做不到;一方面谷歌在廣告以外的領(lǐng)域都沒有能站住山頭的王牌項目,總是屈居人后。
盈利開源的難題緊緊卡住了谷歌的脖子,然而禍不單行,谷歌開始留不住人了。
谷歌廣告與商業(yè)化的副總裁 Sheryl Sandberg 離職去了 Meta,云業(yè)務(wù)的副總裁 Thomas Kurian 離開去了 Oracle,YouTube 首席執(zhí)行官 Susan Wojcicki 也結(jié)束了在谷歌 25 年的工作生涯。
曾經(jīng)參與谷歌機器人登月項目的員工們,不少去了其他公司:嚴夢媛去了OpenAI,Eric Jang選擇了創(chuàng)業(yè)公司1X,Deepmind RT-1、RT-2、RT-X等項目發(fā)起人之一Yao Lu,現(xiàn)在是Nvidia的主任研究員......
谷歌的一位高級運維工程師在博客上寫了一封辭職報告,回顧了自己在谷歌九年的心路歷程:
最開始,谷歌吸引她的是技術(shù),而不斷升職的后她卻因為公司內(nèi)部臃腫的機構(gòu)、繁瑣無意義的會議和重復(fù)性工作、邊緣化、創(chuàng)新受挫等問題感覺壓力越來越大,最終選擇離開谷歌。
這也揭示了一個更大的問題:公司的擴展必然會帶來復(fù)雜的層級結(jié)構(gòu)和低下的決策效率,想依靠雙重投票權(quán)擺脫這一問題的谷歌,最終還是患上了大公司臃腫僵硬的通病。
Everyday Robots 的一名前員工在采訪中表示, 公司很難確定公司的使命。團隊無法決定他們的目標是高級研究項目還是商業(yè)上可行的產(chǎn)品。
曾經(jīng)發(fā)展目標明確的谷歌,如今帶著模糊的使命在創(chuàng)新的路口迷失了方向。
谷歌的創(chuàng)新迷途
問題在哪?
回首2010 年,谷歌創(chuàng)始人 Larry Page 和 Sergey Brin 決定成立一個新的部門來研究“登月計劃”:
聽起來遙遠、聽起來科幻的技術(shù),有朝一日可能會讓世界變得更美好。
Google X 就是這個大膽的實驗,也確實孵化出了很多聽著就很科幻的“黑科技”。
比如大名鼎鼎的 Google Glass,戴上后能直接在眼前放出一塊虛擬屏幕,可以通過手勢、語音等方式對這塊虛擬屏幕進行操縱,還配備了骨傳導(dǎo)等功能。
再比如針對碳排放問題的 280 Earth 項目,大氣中的二氧化碳含量過高那就直接把二氧化碳吸走,吸走的二氧化碳還能用來生產(chǎn)淡水,中間的廢熱還能用來給下一階段供電。
谷歌成立 Google X 就是想把所有風(fēng)險最高、短期回報最低的創(chuàng)新項目都塞到一個地方去解決,以“外腦”的形式運營。
早在上市之初,谷歌的兩位創(chuàng)始人就擔(dān)心未來股東們要求的短期利益會和科研需要的長期投資產(chǎn)生劇烈沖突,導(dǎo)致谷歌喪失初心放棄長期項目,不再創(chuàng)新只賺快錢。
為了避免這種情況,才有了特殊的 Google X,既是“外腦”也是初心。
谷歌曾經(jīng)有過一個“20% 創(chuàng)新時間”政策,指的是員工可以每周拿出一天的工作時間去做本職工作以外的項目。這個創(chuàng)新的管理規(guī)定催生了Gmail、AdSense、谷歌新聞和 GTalk 等優(yōu)秀產(chǎn)品。
但這項政策已經(jīng)被廢止,并且早在 2013 年就被內(nèi)部員工視為“名存實亡”。
當(dāng)時的員工如果想要享受這一福利就必須提出申請,而通過審批的難度越來越高,內(nèi)部還有員工效率測試系統(tǒng)用來判斷員工是否百分百投入本職工作。
其實,“20% 創(chuàng)新時間”的取消也是谷歌規(guī)模擴大后追求高效、規(guī)范的必然結(jié)果,不過谷歌并沒有放棄對創(chuàng)新的追求。某種意義上來說,Google X 正是這個政策的替身,承擔(dān)了創(chuàng)新的使命。
但從近幾年的表現(xiàn)來看,谷歌不僅沒能保住之前的創(chuàng)新氛圍,還走向了新的創(chuàng)新陷阱。
谷歌前 CEO Eric Schmidt不久前在斯坦福演講的時候放飛自我,表示“谷歌會在 AI 競賽中輸給OpenAI 等初創(chuàng)企業(yè),是因為谷歌的遠程辦公政策導(dǎo)致員工不夠努力。”
這正是谷歌陷入創(chuàng)新陷阱的一個縮影。高層不愿意再放寬工作時間,想通過縮緊管理政策來倒逼員工全身心放在工作上,并期待這樣就能提升工作效率,讓員工生產(chǎn)出源源不斷的創(chuàng)新產(chǎn)品。
Google X 的設(shè)計廚房
但歷史告訴我們,一個企業(yè)最有創(chuàng)新活力的時候就是初創(chuàng)期,只有這個時候企業(yè)才是真正以創(chuàng)新為導(dǎo)向的;一旦企業(yè)規(guī)模擴大,就不得不面對創(chuàng)新和賺錢的核心業(yè)務(wù)之間的取舍難題。
歷史也告訴我們,歷史總是驚人的相似,人類總要重復(fù)同樣的錯誤。
諾基亞、雅虎、黑莓都因過于保守不夠創(chuàng)新錯失了轉(zhuǎn)型的機會,被殘酷的市場拋棄。但谷歌仍然懷有“變革沒有那么快到來”的僥幸心理,再加上短期的財務(wù)壓力,逐漸在創(chuàng)新中落于人后。
具身智能熱潮已來,谷歌還有機會嗎?
CB Insights 的數(shù)據(jù)顯示,2022 年全球機器人行業(yè)的投資總額達到 89 億美元,比 2021 年增長了 44%。其中,像 Agility Robotics、Boston Dynamics 這樣的具身智能創(chuàng)業(yè)公司均獲得了大規(guī)模融資,預(yù)計到 2025 年全球機器人市場規(guī)模將突破 400 億美元。
這兩年,具身智能發(fā)展可以說突飛猛進,各大公司和科研團隊都取得了不小的突破。
英偉達就是領(lǐng)軍者之一。比如今年在 GTC 開發(fā)者大會上推出的 GR00T 項目,之前被評為“2023年英偉達十大項目”之一的 Eureka。除了機器人全棧平臺,英偉達還宣布了一項針對人形機器人開發(fā)者的加速計劃,意在進一步推動具身智能的快速發(fā)展。
不僅是英偉達,OpenAI 投資的 1X 公司也不甘落后,推出了全新的人形機器人 NEO,并發(fā)布了他們自己的世界模型。
斯坦福大學(xué)的李飛飛團隊也針對家務(wù)機器人做了重大更新,提出了全新的 ReKep 技術(shù)。與此同時,李飛飛創(chuàng)辦的 World Labs 公司宣布,計劃構(gòu)建一個讓 AI 能夠在 3D 世界中感知、生成和互動的“大世界模型”。
斯坦福大學(xué)具身智能領(lǐng)域的另一個頂梁柱 Chelsea Finn 團隊和 DeepMind 合作了 ALOHA 項目,在今年年初推出了 Mobile ALOHA 炒菜機器人。最近,他們又推出了升級版 ALOHA 2 機器人,能夠執(zhí)行更多精細動作。此外,Chelsea Finn 團隊還提出了雙向解碼 BID 新型算法。
然而,并非所有公司都能在具身智能的浪潮中幸存。
Everyday Robots 的一位員工曾在采訪中說,“公司對實用且價格合適的機器人做了過早的承諾卻無法兌現(xiàn),我希望 Everyday Robots 不會犯同樣的錯誤。”
曾經(jīng)堅守“登月計劃”準則的 Everyday Robots 還是倒在了具身智能的熱潮前,但在谷歌,它的使命并未就此終結(jié)。
曾經(jīng)在 Arm-Farm “抓娃娃”的機械臂,如今在 DeepMind 的新項目中大展身手。機械臂和人類選手打得有來有回,成為首個在乒乓球比賽中達到人類業(yè)余選手水平的學(xué)習(xí)型機器人智能體。
谷歌在這場具身智能浪潮中依然有勝算,但前提是需要做出足夠驚艷、與其他對手拉開差距的產(chǎn)品。
當(dāng)你勝利的時候,無論你說什么,都是對的。
入關(guān)學(xué)有一句名言,“入關(guān)之后,自有大儒為我辯經(jīng)。”只要實力夠強,自然有人替你辯解為你站隊。其實谷歌并沒有輸在管理政策上,只是敗在了創(chuàng)新的勇氣上。
創(chuàng)新需要的是野蠻生長而不是限定好的框架,戴著鐐銬跳舞必然無法實現(xiàn)質(zhì)的突破。
最開始在車庫里鼓搗搜索引擎的年輕人,能夠僅憑一腔熱血向互聯(lián)網(wǎng)巨頭發(fā)起沖擊。如果谷歌不想錯過這一波具身智能浪潮,那就應(yīng)該反思一下畏手畏腳的現(xiàn)狀,重拾顛覆自我的勇氣,迎接來自后起之秀的挑戰(zhàn)。 雷峰網(wǎng)雷峰網(wǎng) (公眾號:雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見 轉(zhuǎn)載須知 。