欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

AI 能造世界了?谷歌 DeepMind 的 Genie 3 分秒生成《死亡擱淺》

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

不再是一花一世界,而是「一話一世界」。

如果說過去幾年,生成式 AI 的突破讓我們學會了和算法對話,能讓它幫我們寫文章、畫插畫、甚至剪視頻,那么 DeepMind 在這個今天拋出的 Genie 3,又讓生成式 AI 走進了另一個維度。

8 月 5 日,DeepMind 在 官網公布了 Genie 3,一款被稱作「通用世界模型」的新模型

打開 Genie 3,輸入一句 prompt「在一個暴風雨中的中世紀村莊漫步」,幾秒鐘后,Genie 3 就可以生成一片可以探索、可實時交互的 3D 場景,在濕漉漉的村莊,石板路上反射著雷電的光芒,你可以控制視角,在村莊里自由漫步,你走近一間小屋推開門,能看到爐火在風中搖曳的光影變化。

更神奇的是,當你離開小屋再返回,爐火還在,墻上的涂鴉也沒變,此時你在指令框中輸入「雨過天晴,屋外有一名騎士騎馬而來。」幾秒鐘后,你就能再次推門而出,迎接騎士的光臨。

這一刻,你宛若小小世界的造物主,這就是 Genie 3 所呈現的「通用世界模型」的生成能力。而 Genie 3 的強大能力,讓谷歌在激烈的 AI 競爭中,又扳回了一分。

01

指尖創造世界

Genie 3 的前身是 2024 年底發布的 Genie 2,那時的模型雖然能生成簡單的 3D 環境,但場景只能維持 10 到 20 秒,細節粗糙且經不起考驗,視角稍一轉頭,樹木可能漂浮,角色可能憑空消失,物體位置會隨機變化。

短短七個月,Genie 3 實現了驚人飛躍。

從 360p 分辨率躍升到了 720p 分辨率、24 幀每秒的畫面輸出, Genie 3 還可以維持連續數分鐘的模擬 ,而不是十幾秒的動畫片段。

更關鍵的是,Genie 3 不是像游戲引擎那樣靠硬編碼物理,而是通過模型預測,保持場景邏輯和物理一致性。簡單來說,場景里的樹葉會自然晃動而不是亂飛,角色的陰影隨位置移動,物體在碰撞后也會給出符合物理規律的反饋。

通過詳細地指令,就可以生成宛若《死亡擱淺》一般的場景|圖源:DeepMind

過去,不論是 Sora 這樣的文本轉視頻模型,還是早期的 Genie 系列,都難以解決「世界一致性」的難題。

而 Genie 3 則引入了新的視覺記憶機制,讓每一幀都參考前一幀的狀態,并持續維護整個環境的布局。這意味著,走過的路不會在你回頭時憑空消失,樹木、巖石、建筑會穩定地保持在原地,仿佛真的存在于一個連續的空間。

簡單說,就是模型學會了「記住」自己剛才畫過什么。于是,你不再看到那種突兀的跳變,而是看到了連續、可持續幾分鐘的世界。

AI 能造世界了?谷歌 DeepMind 的 Genie 3 分秒生成《死亡擱淺》

Genie 3 已經能記住生成的物體|圖片來源:Genie 3

DeepMind 在博客中直言,這類世界模型是通用智能的基石,因為真正的智能不僅需要理解世界,還要能在世界中做決策、采取行動,而這一切只能在穩定的、邏輯一致的環境里發生。

這也是為什么 DeepMind 把它稱為「世界模型」而非單純的「視頻生成器」。

AI 能造世界了?谷歌 DeepMind 的 Genie 3 分秒生成《死亡擱淺》

生成場景符合物理規律|圖片來源:Genie 3

傳統的生成視頻模型,比如 Sora,可以把一段文本描述轉換成 30 秒的視頻,但本質上仍然是「一段封閉的片段」。你不能改變片段中的世界,更無法與它交互。

而 Genie 3 則在交互性上跨出了一大步。它不僅能生成一個連續世界,還能在你探索的過程中動態調整場景,同時保證邏輯不崩壞。這既是 Genie 3 的 Promptable World Events,簡單理解就是「文字即指令,世界實時響應」。

比如,當你輸入「水面出現一輛摩托艇」,Genie 3 不會重新生成一個全新的畫面,而是空降一臺摩托艇滑過河道,在兩側和身后濺起逼真的水花。

這種即時可塑性,意味著用戶不僅是觀眾,還是導演。

AI 能造世界了?谷歌 DeepMind 的 Genie 3 分秒生成《死亡擱淺》

同一場景,無限可能|圖片來源:Genie 3

據 DeepMind 透露,Genie 3 在訓練時使用了大量游戲引擎生成的數據集,以及視頻預測任務,以此讓模型具備「因果感」和「持久性」。更通俗地說,Genie 3 學會了兩件事:世界是連續的,動作會帶來后果。

另一個細節是,Genie 3 支持視角的自由移動,并能動態重繪不同視角的內容。這聽起來容易,但在生成模型里極其困難,需要模型具備強大的 3D 推理能力。這也是為什么 DeepMind 在博客里強調,Genie 3 的目標不僅是視頻,而是「基于世界的交互式生成」。

所以 Genie 3 不是「生圖」、「生視頻」,而是生成一段可探索、可編輯的虛擬現實,這就產生了無限的應用場景。

02

顛覆創意行業

只看官方的 demo 演示,都能想象出許多 Genie 3 可應用的場景,特別是在創意行業。

從最初的文字界面,到 2D,再到如今的 3D 和 VR,電子游戲一直是人類探索虛擬空間的先鋒。在 Genie 3 的演示中,這一趨勢被推向了一個全新高度:只需一句話,就能即時生成一個可探索、可交互的 3D 場景,這對游戲開發行業意味著什么?

在傳統開發流程中,3D 場景的構建是游戲制作中最昂貴、最耗時的環節之一。尤其對于獨立開發者,這往往成為他們不得不妥協的原因,很多人退而求其次,選擇 2D 像素風、手繪、低多邊形等形式,以降低開發成本。

但 Genie 3 徹底打破了這一限制。以往需要數周甚至數月去建模、貼圖、調光,如今只要寫下幾句話,就能搭建一個動態可交互的場景。

是不是非常有「面包房模擬器」游戲畫風即視感|圖片來源:Genie 3

大型工作室或許仍會用虛幻引擎或自研引擎構建極致畫質的 AAA 世界,但對于資源有限的開發者而言,Genie 3 恰好填補了那道「成本鴻溝」:它不取代專業引擎,卻極大降低了場景設計的門檻,一家有創意但沒技術的小團隊,可以像拼樂高一樣,用文本拼湊出一整張開放世界地圖。

影視行業同樣如此,導演和美術可以在開拍前實時預覽場景風格,調整光影、添加角色,甚至讓演員直接在虛擬空間中走位,實現「沉浸式分鏡頭」。

教育行業的想象空間更大,課本中描繪的歷史古跡、地理現象,都可能通過 Genie 3 生成一個可交互、可探索的場景。

藝術也產生了新的表達,想象一下我們能「光顧」《魔戒》中的都林之門,也能「進入」拉斐爾所繪的《雅典學院》。

或許當每個人都能有「構建虛擬空間」的能力時,扎克伯格心心念念的元宇宙也能得以實現了。

而 DeepMind 更大的野心,還在對物理 Agent 的訓練上。

03

AI 的「認知訓練場」

DeepMind 在博客中直言,世界模型的意義在于, 它能為智能體提供一個「認知訓練場」,讓 Agent 在虛擬世界中學習因果關系、空間感知和行動規劃,而不是直接在真實世界中試錯

舉個例子,如果你要訓練一臺倉儲機器人,過去的做法是搭建昂貴的物理場景,或依賴傳統游戲引擎模擬。但這些方法都存在局限:前者成本高,后者缺乏多樣性。

但在 Genie 3 里,你有一個可以無限生成、即時修改、邏輯連貫的世界,機器人可以在里面練習避障、搬運、協作,甚至模擬極端情況,比如訓練自動駕駛汽車應對行人突然沖出馬路的情況,這類場景在現實中極難復現,但在 Genie 3 中單靠文本就能創建。

這也是 DeepMind 所說的:Genie 3 有可能將 AI Agent 推到極限,它將迫使 Agents 從自己的經驗中學習,類似于人類在現實世界中學習的方式。

不過 Genie 3 并非萬能,它仍在技術上有明顯限制。

比如目前場景分辨率只有 720p,幀率 24fps,雖然對 AI 生成來說已經不易,但距離 4K 高幀率的游戲畫面標準還有差距;其次,Genie 3 生成的場景持久性仍然有限,盡管官方表示能達數分鐘,但放出來的演示都控制在了 1 分鐘以內。

而場景中的文字渲染仍然糟糕,你很難在它生成的路牌上看到清晰字體,物理一致性也還不夠完美,在出現大批量生物、模擬雪崩等細節測試中,仍會露出「AI 異常」的破綻。

詭異地鹿群|圖片來源:Genie 3

開放性也是未知數。DeepMind 表示,Genie 3 目前只在研究和合作項目中使用,尚未面向公眾開放 API,更沒有像 Imagen 或 Gemini 那樣的在線體驗入口。

然而回到更大的圖景,Genie 3 不是孤立的巧思,而是 AI 技術遷移方向的一次標志性轉折。

從李飛飛所創建的 World Labs、英偉達推出的 Cosmos 世界基礎模型到現在 DeepMind 放出的 Genie 3,反映了一條清晰的 AI 空間智能技術的發展路徑:從 2D 到 3D、再到空間可探索、最終場景物理一致、時空連貫、交互有變化和因果。

ChatGPT 讓我們意識到語言可以是操作系統,Sora 讓我們看到視頻可以是創作界面,而 Genie 3 則進一步,把文字變成「可操作」的空間。

最終,無論是游戲、影視、教育、科研,構建虛擬世界將變成一種即時表達方式:

一行文字,一段描述,一話一世界。

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 91视频青青草 | 国产综合精品久久久久成人影 | 99爱在线视频这里只有精品 | 久青草国产手机视频免费观看 | 精品国产国产综合精品 | 五月婷婷综合色 | 国产中文欧美 | 波多野结衣一区二区三区四区 | 天天操网站 | 久久riav| 亚洲国产精品成人久久 | 老司机午夜免费影院 | 免费色视频网站 | 久操视频网| 亚洲成综合 | 奇米在线 | 美女黄频视频大全免费高清 | 不卡一区在线观看 | 一区二区三区美女视频 | 黄色wwwwww| 四虎中文 | 欧美另类亚洲一区二区 | 成年女人午夜毛片免费看 | 亚洲精品成人久久 | 亚洲欧洲日本在线观看 | 99国产精品欧美久久久久久影院 | 亚洲福利影院 | 国产大尺度视频 | 午夜黄色影院 | 在线精品国产 | 天天操天天操天天操 | 久久国产热这里只有精品8 久久国产三级 | 久久国产精品只做精品 | 精品久久久久国产 | 四虎永久网站 | 奇米在线观看视频 | 国产精品亚洲综合色区韩国 | 亚洲精品1区 | 久久国内精品自在自线观看 | 青春草国产成人精品久久 | 韩国日本三级在线观看 |