欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

“具身智能機器人”如何改變世界?

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

隨著人工智能技術的飛速發展,具身智能 (Embodied Artificial Intelligence,簡稱EAI) 作為AI領域的一個重要分支,正逐漸從實驗室走向商業應用。EAI系統通過與環境的物理交互,賦予機器人物理實體感知、學習和動態交互的能力。這一領域的進步不僅對科技發展具有重要意義,也對社會經濟結構產生深遠影響。在2023年的半導體大會上,英偉達創始人兼CEO黃仁勛便表示,人工智能的下一個浪潮是具身智能。2024年云棲大會上,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘表示,生成式AI最大的想象力不在手機屏幕,而是改變物理世界。


本文中,劉少山博士為我們帶來他對這一前沿科技領域的獨到見解。作者闡述了具身智能的三個核心原則,并對EAI系統的商業價值進行了深入分析。他指出,盡管EAI系統在學術和實踐上已取得顯著進展,但在商業化的道路上仍面臨多重挑戰,包括軟件系統的復雜性、缺乏適合的計算機體系結構,以及數據運用的不足等。本篇文章不僅是其對具身智能領域的深刻洞察,也是對未來技術發展趨勢的前瞻性思考。


以下為演講內容:


人工智能是否能“取代”人?這個問題的答案我們還不知道。但我們這些做人文研究、政策研究的學者,是需要做好人工智能可能會取代人的準備,因為這個時刻一旦到來,世界將變得超乎我們的想象。我是做具身機器人研究的,所以我就講講在實體世界中具身機器人將會如何改變世界。


AI改變未來的三種可能


我的演講主題是“具身智能機器人技術探索與研究”,大家可能對這個詞比較陌生,希望通過簡單的講解,能讓大家理解什么是“具身智能”。


在開始之前,我先提出的三個比較“激進”的想法,是對未來的一些可能發生事件的設想。


首先,AI代幣是否會變成貨幣? 什么是AI代幣呢?它不是比特幣,我們今天用的大模型的底層計價單位是Token——比如你用OpenAI,它是看你用了多少Token。當全社會所有的底層功能都是AI驅動的時候,全社會的計價單位都會變成AI Token。那么,它是否有等同貨幣的作用?這是我的第一個比較激進的思考。


第二,“計算效率”即“經濟效率”。 芯片的作用是把能源轉化為算力,芯片做得越好,就越能有效地把能源轉化為算力。而軟件的作用是把算力轉為智能。兩者結合,最終就是把能源跟智能連起來。所以賦能人工智能分兩步,先用很強的芯片把能源轉化為算力,再用很強的軟件把算力轉成智能。如果以后AI代幣成為貨幣,那它的“錨”就是能源,因為追根溯源就是多少能源產生多少算力,多少算力產生多少智能。


第三,控制基礎模型的公司或可壟斷經濟。 壟斷的關鍵在于誰是發幣者。今天發幣的機構還是央行,但假如未來有一個名為“OpenAI”的公司成為發幣機構——在各行各業都大規模依賴大模型的時候,最終控制經濟的可能是公司——我們怎么防止此類事情的發生?可能學人文、學政策的同學需要考慮這件事情。


具身智能的發展史


最近“具身智能” (Embodied Artificial Intelligence,簡稱EAI) 這個詞在中文媒體出現的頻率極高。到底“具身智能”是什么?我們需要先回顧EAI的發展歷史。


1991年,麻省理工教授羅德尼·布魯克斯 (Rodney Brooks,“現代機器人之父”) 在1991年發表的研究論文《沒有表征的智能》 (Intelligence without representation) 中提出了一種對“智能的根本性”的重新思考。


布魯克斯反對傳統的認為智能必須基于復雜算法或內部數據模型 (即“表征”) 的觀點。他認為, 智能行為可以直接從自主機器與其環境的簡單物理交互中產生,而這種交互不依賴于預先設定的復雜算法。 他提出一個“行為主義智能” (Behavior-based AI) 的概念,認為只有從與環境的直接物理交互中得到的智能才是智能。該概念強調通過與環境的直接物理交互來生成行為,而不是通過內部世界模型——這種方法的核心在于,智能系統不應該首先處理抽象的內部世界表征,而是應該能夠直接響應外部環境刺激。這一理念對后續的機器人研究產生了深遠影響,尤其是在自主移動機器人和實時處理系統的設計方面。


1999年,在羅爾夫·普費弗 (Rolf Pfeifer) 和克里斯蒂安·謝爾 (Christian Scheier) 合著的《理解智能》 (Understanding Intelligence) 一書中,他們提出了一種全新的智能理解方式。這種方式突破了傳統認為智能僅僅源自大腦或算法的局限,進一步擴展了對什么叫作“環境中獲取智能”的觀念。


這本書的核心理論是智能是行為主體的整個身體結構和功能的綜合體現,他們強調了身體對智能形成的根本影響,也就是“身體化智能” (Embodied intelligence) 或“身體化認知” (Embodied cognition) ——這也是第一次人們正式將“具身智能”作為一個核心詞提出。這本書的核心觀點是什么呢?智能行為是通過身體與環境的直接相互作用產生的,而不僅僅是大腦內部的計算過程。這種觀點與傳統的以大腦或計算為中心的智能理解形成了鮮明對比。簡單地說, 智能的行為是通過身體和環境的互動產生的,而不是通過“想”產生的。


2005年,琳達·史密斯 (Linda Smith,行為學家) 提出“具身假說” (Embodiment Hypothesis) ,從認知科學的角度對智能的理解提出了新的視角——我們的思維、感知能力以及其他各種能力的發展,都是人們通過身體與環境的持續互動而逐漸形成的。這種觀點強調, 身體不僅是感知世界的工具,更是影響和塑造認知結構的主體。 她觀察到嬰兒的成長是通過跟環境的互動學到東西,這些行為展示了身體在認知過程中的積極作用。琳達·史密斯的工作擴展了我們對認知科學的理解,將傳統關注點從大腦的內部機制轉移到了身體與環境的動態交互上;也讓科學界逐步形成一個共識,具身智能才是真正的智能。


具身智能的三個原則


上面這些基礎研究,為我們提供了重要的指導思想。EAI,就是將人工智能融入機器人等物理實體,賦予它們感知、學習和與環境動態交互的能力。在此基礎上,我總結出了三個原則。


第一,具身智能系統不能依賴預定義的復雜邏輯來管理特定場景。 這一原則強調,EAI系統應當能夠靈活應對多變的環境,而不是僅僅執行固定的、預設的程序。這要求系統能夠在沒有詳盡預設條件的情況下,通過實時的感知和處理,對環境做出反應。也就是說,EAI不能依賴預先“寫死”的邏輯來處理復雜的場景。例如,很多自動駕駛公司,每一個新的場景都用新的代碼去填,最后越填越復雜,最終證明它不是可伸縮 (scalable) 的方法。再例如,一個自動導航的機器人,在未知的環境中,應當能夠根據當前的障礙物和地形,實時規劃出最佳的行進路線,而不是單純依賴預先編程好的路徑。


第二,具身智能系統必須包含進化學習機制,使其能夠不斷適應運行環境。 進化學習機制允許EAI系統從經驗中學習,并隨著時間的推移優化其性能。也就是說,除了不要將程序“寫死”,還要有一個學習的方法,有一個機制來從環境中提取智能。這類學習機制通常涉及一些機器學習算法,這些算法可以使系統根據其與環境的互動進行自我調整。例如,一個清潔機器人在不斷清潔的過程中,會學習哪些區域更容易積累污垢,從而在未來的清潔過程中調整其清掃路線,提高清潔效率。


第三,環境在塑造物理行為和認知結構方面起著關鍵作用。 環境特別重要,環境決定能夠學習多少東西。環境不僅僅是EAI系統操作的舞臺,更是影響和塑造該系統行為和認知發展的關鍵因素——環境的每一個組成部分,從物理結構到社會互動,都可能對EAI系統的發展產生深遠影響。因此,理解和利用這種環境影響,可以顯著提高系統的適應性和智能性。例如,一個適用于戶外救援的機器人,需要能夠識別不同的自然環境特征 (如河流、泥濘地面等) ,并根據這些特征調整其救援策略,以確保操作的安全性和有效性。


這三個原則共同構成了一個強大的框架,指導我們設計出更為智能、自主和適應性強的EAI系統。通過不斷地學習和適應,這些系統有望在各種復雜和動態的環境中發揮關鍵作用。


EAI系統的商業價值


一個行業要商業化,需要所有的點都具備,將點連成線,才能成功實現商業化。今天的EAI系統達到可以商業化的地步了嗎?我們先回到三原則來看,目前EAI系統究竟發展到了什么程度。


從原則一來看,現階段已經基本完成。 很多人說具身智能就是“大模型+機器人”,而“大模型+機器人”完成的就是原則一對應的場景。


從原則二來看,至少在學術層面上已經成立。 2017年Nature communication上面發布了一篇文章,講述了“深度進化強化學習”的框架 (Deep Evolutionary Reinforcement Learning,DERL) 。在文章中,研究團隊制備出一種深度學習“游樂場”——DERL計算系統,并首次對“鮑德溫效應”進行了驗證,即在模擬進化實驗中,這種深度學習系統可以快速地篩選出學習效率更高的形態。該系統可以在復雜的環境下學習極具挑戰的運動和操作任務,以進化出不同的代理形態。


從原則三來看,現在已經基本可以滿足。 Facebook已經發布了一個叫Habitat的虛擬現實開發環境。英偉達也放出它的自動駕駛的模型。目前,我們已經能夠理解和利用環境影響,去顯著提高系統的適應性和智能性。


可以說,這三個原則在學術和實踐上已經被滿足了,下一步就是怎么將其商業化。


說到商業化,又要回到宏觀政策。 誰能做?這是核心的問題,因為這取決于供應鏈在哪里。 于是,我們把具身智能機器人拆解,去了解所有不同模塊在全世界的占比是多少?驚奇地發現,中國占比是38%,位居世界第一。傳統上認為做精密儀器很強的日本,占比只有12%。歐盟更是逐年在跌,今年是23%。而美國是26%。在中國占比的38%里面,大灣區占到中國的55%。


中國為何會有如此高的占比?過去20年,中國政府在新能源智能車投入了幾萬億的資本。盡管這些資本投下去之后,仍有一些公司倒閉,但這并不是一個浪費。這些資本在背后孵化了一條很完整的智能供應鏈,比如,激光雷達現已成為一個很普世的傳感器。 具身智能和新能源智能車在供應鏈的重合度有80%左右,所以這些供應鏈外溢到了具身智能。 在大模型這一塊,平安有平安大模型,騰訊有騰訊大模型,只要解決好數據怎么獲取的問題,這一塊就不需要太過擔心。


我們再看看粵港澳大灣區在具身智能關鍵零部件的份額占比。我們發現, 芯片在粵港澳大灣區現在還是一個空白——幾乎每一項零部件的占比都很高,但是作為AI底座芯片的占比基本為零。 這是一個很大的缺失,怎么把大模型有效地運行在一個相對便宜、可商業化的芯片上,我們目前缺失這一環節。


我們正經歷著兩個時代,一個是PC時代,一個是Mobile Computing——PC時代的后一個時代。從宏觀經濟的觀察角度來看,去年PC芯片的市場規模大約在550億美金,但PC所賦能的生態市場規模大約在9000億美金,這里差距在20倍左右。同樣,Mobile chip市場規模大約在350億美金,但是Mobile市場大約在8000億美金的規模,是25倍的關系。因此,我們得出一個結論, 把芯片做好了,至少可以賦能20到25倍于它自身的市場。 當它的生態市場足夠大,又有足夠的資源投入的時候,商業價值就像滾雪球一樣越滾越大,這是我們的立論。


此外,我們還可以從另一個視角來進一步驗證這個立論。大概20年前我還是學生的時候,人們都還在用諾基亞手機——這是一款很老的機型,它能發短信、打電話,還能玩“貪吃蛇”的游戲。20年前的手機市場幾乎可以算是飽和市場,因為其達到了人手一臺的程度。但是,當年手機市場規模是100億美金,今天我們的手機市場規模是8000億美金。


那么,諾基亞時代的手機跟現在的手機有什么差別?差別在于現在的手機多了很多APP,這是一種完全不同的生態模式,而這種生態將市場擴容了近80倍。盡管今天我們看到機器人都很“笨”,可能只能完成一個功能,比如掃地機器人。但它就像我們當年的功能手機,只能操作最基礎的功能。因此,我們預測, 機器人具身智能的市場會有相似的趨勢。如果最后機器人生態要商業化大發展,那么未來它不能是功能機,應該是一個智能機的形態。 從算力的角度來看,功能機90%的算力在打電話,而智能機90%的算力在APP,這是其本質的區別。


未來的設想與挑戰


那么,我們想在具身智能的發展層面做些什么呢?今天我們研究了各種機器人的設計,基本是三個功能——感知、定位、規劃。這些功能運用了多少算力呢?大概在95%。也就是說,今天大多數機器人95%的算力都用在了基礎功能上,沒有額外算力去完成其他功能。 我們希望的是,盡可能做到將20%的算力用于基礎工作,預留出80%的算力給智能和應用層面。如 果能達到這樣的程度,就可以迎來一個大發展的周期,可以研發各種有趣的應用。 比如,在智能車上可以有很多娛樂系統,可以看AR、VR,有機器人在家里幫你做家務,有自動醫療車幫你看病,這是我們對機器人最終生態的一個設想。


但是在這個生態來臨之前,我們遇到了三重挑戰。


第一,機器人所需的軟件系統遠復雜于過去任何軟件系統。 現在大模型在與用戶交互的過程中,就已經損耗很多的算力。如果在機器人身上,比如手臂如何移動,如何開發智能化地圖,這些算法都十分復雜。這樣的情況帶來了怎樣的直接影響?我們如果去看近年來兩類上市公司的報表,一類是谷歌、微軟,一類是自動駕駛公司,關注其每年的營收放在研發上的比例,會發現自動駕駛公司85%~90%的營收放在研發上,員工個人能為公司創造的價值基本上是0。再看谷歌和微軟,他們大概20%的營收放在研發,但是員工人均能為公司帶來幾百萬美金的收入,這是其成功的原因。谷歌和微軟的可擴展性 (scalability) 是隨著他的數據和算力而變化,不是隨著人;但是自動駕駛是隨著人變化的,有多少人就有多少能力,就有多少代碼,所以這個軟件棧 (soft stack) 是很難商業化的。


因此,我們得出結論,想解決軟件系統過于復雜的問題,必須先解決一個問題,那就是 如何 把軟件棧簡化,讓scalability隨著投入的算力和數據變化,而不是隨著投入的人而變化


第二個挑戰是目前沒有一個適合的計算機體系結構給具身智能用。 因為具身智能很復雜,它的軟件棧就很復雜,它的計算就更復雜。簡單地說,就是我們需要經過很多輪的優化。所以目前我們設計的目標是20%放在基礎算力,80%留給上層的應用。


第三個挑戰是我們現在對數據的運用并不充分。 互聯網數據值多少錢?今天如果你去問扎克伯格,他的答案會是:一個互聯網用戶的價值是600美金。目前互聯網世界大概有50億的用戶,所以大概是3萬億的市場價格。那么,如果放在一個機器人上,要投入多少錢來提取數據?大概是1000美金。再推測一下,當機器人達到最終態的時候,這個世界會有多少機器人?馬斯克推測大概會有100億臺機器人。如果我們將兩者相乘,可以預測,未來達到飽和態的時候,它將是一個10萬億美金的市場。


但今天最大的問題是我們沒有很好的數據收集方法。 比如,OpenAI用的是互聯網的數據,它的收集是天然的,互聯網公司都可以收集。但是由于機器人公司目前并無恰當的數據收集方法,導致很多廠商把數據扔掉,完全用不起來。因此,怎樣設計一個數據收集的計劃,對未來智能的衍生將起到重要作用。


(本文內容由劉少山在前海國際事務研究院主辦的“人工智能與智能機器人對社會發展與經濟影響”主題研討會上的發言整理和擴充而成。)

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 99热免费 | 国产精品 第二页 | 国产系列在线观看 | 久久久影院 | 亚洲国产精品看片在线观看 | 国产精品福利视频主播真会玩 | 色综合五月激情综合色一区 | 一级特级欧美a毛片免费 | 欧美成人一区二区三区不卡视频 | 色婷婷av777 色婷婷国产 | 五月婷视频 | 欧美一级午夜免费视频你懂的 | 99精品欧美一区二区三区美图 | 尹人久久 | 不卡不卡| 免费高清在线影片一区 | 爱操综合 | 久草在线视频在线 | 成人亚欧网站在线观看 | 色偷偷成人网免费视频男人的天堂 | 天天干狠狠干 | 国产综合色在线视频区 | 国产精品一区二区不卡 | 国产国产人免费人成成免视频 | 日日日夜夜操 | 久久久这里只有精品加勒比 | 日本香蕉视频 | 久久亚洲影院 | 国产欧美精品一区二区三区四区 | 色综合久久中文色婷婷 | 在线观看一级毛片 | 中文字幕亚洲综合久久菠萝蜜 | 国产91在线精品福利 | 欧美人zoxxxx另类 | 综合色在线| 精品亚洲欧美中文字幕在线看 | 国产夜夜操| 奇米影视第四色888 奇米影视第四色首页 | 91资源| 久久国产精品999 | 欧美日韩成人午夜免费 |