欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

為何DeepMind、Facebook都愛上了《星際爭(zhēng)霸》?

我是創(chuàng)始人李巖:很抱歉!給自己產(chǎn)品做個(gè)廣告,點(diǎn)擊進(jìn)來看看。  
為何DeepMind、Facebook都愛上了《星際爭(zhēng)霸》?

上周AI圈有很多大事,但只有一件事同時(shí)引起了兩家AI巨頭的興趣,那就是《星際爭(zhēng)霸》。

8月7日,Facebook的AI團(tuán)隊(duì)發(fā)布了史上最大的《星際爭(zhēng)霸:母巢之戰(zhàn)》游戲數(shù)據(jù)集。緊接著8月10日,DeepMind就和暴雪聯(lián)合發(fā)布了《星際爭(zhēng)霸2》的游戲數(shù)據(jù)集與AI訓(xùn)練平臺(tái)SC2LE。

為什么DeepMind、Facebook、阿里等AI巨頭先后迷上了對(duì)《星際爭(zhēng)霸》的研究?為什么他們做的不是制造一個(gè)人工智能去打敗人類選手,而是不約而同走上了開源數(shù)據(jù)、發(fā)布研究工具的這條路?

此外,相信關(guān)注AI的各位都注意到了,眾多媒體和專家們都認(rèn)為《星際爭(zhēng)霸》的研究可以引導(dǎo)AI走向通用智能之路。但大部分解釋都知其然不知其所以然,到底《星際爭(zhēng)霸》跟通用智能之間是怎樣的邏輯關(guān)系?

本文嘗試回答以上這些問題——到底《星際爭(zhēng)霸》是如何讓AI巨頭們集體為之著迷的?

為何DeepMind、Facebook都愛上了《星際爭(zhēng)霸》?

在開始詳細(xì)分析之前,我們必須要重申這樣一個(gè)常識(shí):頂級(jí)AI專家們并不是游戲宅(至少工作時(shí)不是),AI會(huì)打游戲這事本身對(duì)他們來說并沒有任何價(jià)值。就像AI在圍棋上的建樹也絕不是為了顯擺AI好厲害,或者意圖羞辱亞洲國家傳統(tǒng)文化(沒錯(cuò),微博上有人就是這么認(rèn)為的)。

AlphaGo之所以選擇圍棋,是因?yàn)檫@項(xiàng)智力運(yùn)動(dòng)具有無法被暴力窮舉的特質(zhì),可以檢驗(yàn)AI的非運(yùn)算能力。比如我們看到最終版的AlphaGo已經(jīng)展現(xiàn)出了布局能力、對(duì)抽象形勢(shì)的判斷力,甚至具體行為中的創(chuàng)造力——這都是傳統(tǒng)計(jì)算機(jī)絕不會(huì)具備的能力。

對(duì)于AI研究者來說,游戲只是方法,絕非目標(biāo)。AI公司的目標(biāo)只有兩個(gè):一是做出更好的AI,二是用它賣錢。但游戲在訓(xùn)練AI上有天然的實(shí)驗(yàn)室屬性:用數(shù)據(jù)支撐、成敗標(biāo)準(zhǔn)清晰、大量的人類訓(xùn)練數(shù)據(jù)可用。

有了這點(diǎn)共識(shí),我們就可以開始破解AI巨頭對(duì)《星際爭(zhēng)霸》的圖謀。但第一步我們要先明白AI公司對(duì)《星際爭(zhēng)霸》究竟做了什么,做這些事的目的又何在?

DeepMind和Facebook都對(duì)《星際爭(zhēng)霸》做了什么?

首先我們來分別看一下Facebook和DeepMind這次很有“打擂臺(tái)”意味的動(dòng)作中,到底都發(fā)布了什么。

按時(shí)間順序,首先是Facebook。簡(jiǎn)單來說,F(xiàn)acebook這次發(fā)布的是達(dá)到365GB,包含6萬多條內(nèi)容的《母巢之戰(zhàn)》游戲數(shù)據(jù)集。當(dāng)然這些數(shù)據(jù)不是給人看的,而是專門為了機(jī)器學(xué)習(xí)任務(wù)訓(xùn)練使用的數(shù)據(jù)。

尤其值得注意的是,F(xiàn)acebook在發(fā)布的論文中特意強(qiáng)調(diào)了這些數(shù)據(jù)的通用性。它們可以適配不同的算法、不同的平臺(tái),可以說是提供了相對(duì)標(biāo)準(zhǔn)化的機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)。

而到了DeepMind這里,事情就有一點(diǎn)復(fù)雜了。他們的對(duì)象不是《母巢之戰(zhàn)》,而是更加高級(jí)的《星際爭(zhēng)霸2》。DeepMind這次發(fā)布的是被稱為SC2LE(星際爭(zhēng)霸2學(xué)習(xí)環(huán)境)的整合式AI訓(xùn)練工具包。

為何DeepMind、Facebook都愛上了《星際爭(zhēng)霸》?

在這個(gè)大禮包里包含四樣?xùn)|西,還有一篇專門討論《星際爭(zhēng)霸2》機(jī)器學(xué)習(xí)環(huán)境的論文。

首先,DeepMind也給出了游戲數(shù)據(jù)集,包含6萬5千場(chǎng)暴雪官方回收的匿名游戲數(shù)據(jù)。未來還會(huì)持續(xù)增加。

其次,發(fā)布了由暴雪研發(fā)的《星際爭(zhēng)霸2》機(jī)器學(xué)習(xí)編程入口,方便研究人員和開發(fā)者將自己的智能體接入游戲進(jìn)行研究。

此外,DeepMind還開源了自己研發(fā)的PySC2工具包,讓研究者更方便地訓(xùn)練自己的智能體。

最后,大禮包里還包括一系列從《星際爭(zhēng)霸2》里抽象出來的增強(qiáng)學(xué)習(xí)迷你游戲。這些迷你游戲可以讓研究者更方便的測(cè)試特定場(chǎng)景下的智能體效果。

這樣看來,DeepMind和暴雪的科學(xué)家更加貼心一些,不僅送上了主食,還附帶了各種餐具和甜點(diǎn),還有食品說明書。

但無論DeepMind還是Facebook,目標(biāo)都只有一個(gè):提供盡可能方便舒適的研究環(huán)境,吸引更多研發(fā)者加入《星際爭(zhēng)霸》的前沿AI訓(xùn)練中來。

這樣做的基本動(dòng)機(jī),在于《星際爭(zhēng)霸》這類游戲的動(dòng)作和情景近乎是無窮的,一家公司的人力無從進(jìn)行面面俱到的深入開發(fā)與實(shí)驗(yàn)。所以開源和共享數(shù)據(jù),幫助更多研究者跳過基礎(chǔ)步驟直接研究前沿的、具體的動(dòng)作算法和多任務(wù)協(xié)調(diào)方案,才是AI公司目前真正的重心。

這種動(dòng)作思路來源于即時(shí)戰(zhàn)略游戲的特殊性。這里我們就可以開始解答另一個(gè)問題了:為什么一定是《星際爭(zhēng)霸》?

為什么一定是《星際爭(zhēng)霸》?

訓(xùn)練深度學(xué)習(xí)等AI系統(tǒng),被使用最多的有三種游戲:迷你游戲、沙盒游戲和即時(shí)戰(zhàn)略游戲。但這三種當(dāng)中,迷你游戲和沙盒游戲AI扮演的都是單一智能體。只有即時(shí)戰(zhàn)略游戲提供了獨(dú)一無二的訓(xùn)練特征:復(fù)雜與協(xié)作。

剛剛OpenAI的AI打敗了DOTA2頂級(jí)選手,馬斯克激動(dòng)地連發(fā)推特慶祝(順便沒忘了提AI威脅論),但很多其他AI巨頭的科學(xué)家卻相當(dāng)不屑,這是為什么?

原因在于1V1模式的DOTA2里AI僅適用一個(gè)智能體,目標(biāo)比較單一,1對(duì)1遭遇戰(zhàn)也談不上不完全信息博弈。拼手速和反應(yīng)人類是肯定比不上AI的,OpenAI的這款A(yù)I價(jià)值更多在于用系統(tǒng)自主學(xué)習(xí)電競(jìng)的規(guī)則。

為何DeepMind、Facebook都愛上了《星際爭(zhēng)霸》?

而大型即時(shí)戰(zhàn)略游戲則有著完全不同的環(huán)境:

1、復(fù)雜多變的環(huán)境,考驗(yàn)智能體對(duì)大量環(huán)境信息空間、時(shí)間和數(shù)據(jù)變化的理解能力。

2、眾多獨(dú)立單位的配合。人類選手稱之為“微操”的技術(shù),就是考驗(yàn)混戰(zhàn)下對(duì)多個(gè)單位、建筑、編隊(duì)的協(xié)同運(yùn)作能力,這對(duì)AI是核心考驗(yàn)。

3、不完全信息博弈。這類游戲開局時(shí)由戰(zhàn)爭(zhēng)迷霧,無法觀察對(duì)手動(dòng)向。需要智能體進(jìn)行布局和長(zhǎng)遠(yuǎn)判斷。

這些特征讓即時(shí)戰(zhàn)略游戲成為已知AI實(shí)驗(yàn)環(huán)境中最復(fù)雜的其中之一,要知道AI的目標(biāo)不是可以贏,而是一定贏。

至于為什么一定是《星際爭(zhēng)霸》,或許也可以歸納出幾個(gè)原因:

首先,暴雪有開源打造AI的意愿,《星際爭(zhēng)霸》本身的素材和接口也都非常流暢。整個(gè)游戲數(shù)據(jù)化的成本很低。

其次,相比于拼效果和畫面的即時(shí)戰(zhàn)略游戲,《星際爭(zhēng)霸》的競(jìng)技屬性更強(qiáng)。其動(dòng)作眾多、元素復(fù)雜,像圍棋一樣具有難以被暴力計(jì)算拆解的基本特質(zhì)。

同時(shí),因?yàn)楦?jìng)技屬性強(qiáng)烈、競(jìng)技?xì)v史悠久,《星際爭(zhēng)霸》的戰(zhàn)術(shù)、戰(zhàn)略討論非常豐富,每一個(gè)子動(dòng)作的價(jià)值基本都有判斷依據(jù),這是機(jī)器學(xué)習(xí)系統(tǒng)的先決條件之一。

這三點(diǎn)之外,其實(shí)還有個(gè)最重要的原因:《星際爭(zhēng)霸》是對(duì)戰(zhàn)量最大的即時(shí)戰(zhàn)略游戲,同時(shí)戰(zhàn)網(wǎng)等平臺(tái)建設(shè)非常完整——換言之,就是留給AI的訓(xùn)練數(shù)據(jù)夠多。

AI巨頭的真實(shí)目的

寧愿采取開源眾包的模式,也要攻克《星際爭(zhēng)霸》這種超復(fù)雜的訓(xùn)練環(huán)境,AI巨頭們難道是吃飽撐的嗎?他們到底想要從中獲得什么呢?

按照DeepMind把《星際爭(zhēng)霸2》拆解成系列小游戲的原理逆推。我們可以知道AI公司希望的是破解一個(gè)又一個(gè)細(xì)節(jié)動(dòng)作后,把這些集合在一起組成大的智能體集合。而這個(gè)集合將匯集的不僅僅是無數(shù)解決方案,更是這些方案背后普遍蘊(yùn)藏的通用能力。

如果與圍棋進(jìn)行參照,我們可以從《星際爭(zhēng)霸》作為訓(xùn)練環(huán)境中推測(cè)出至少四種圍棋無法給予的能力:

1、機(jī)器記憶力。區(qū)別于棋類游戲,即時(shí)戰(zhàn)略游戲中過去的信息可能被完全抹殺,比如剛才造的兵都死了……但這些信息卻將左右接下來的故事。這就需要AI具有記憶力,和對(duì)記憶進(jìn)行運(yùn)用,給出反制措施。根據(jù)記憶的快速調(diào)整,將是一種全新且商業(yè)價(jià)值極強(qiáng)的AI能力。

2、弱信息環(huán)境下的長(zhǎng)期規(guī)劃能力:就像上文所說,《星際爭(zhēng)霸》這種游戲開局是完全信息封閉的。開局時(shí)做的事可能跟戰(zhàn)爭(zhēng)的結(jié)果完全無關(guān),但卻具有貨真價(jià)實(shí)的因果關(guān)系。這類人類獨(dú)有的長(zhǎng)期規(guī)劃和調(diào)整規(guī)劃能力,對(duì)應(yīng)的是機(jī)器的預(yù)測(cè)和判斷能力。

3、多智能體協(xié)作能力。通過與人類近似的鍵盤鼠標(biāo),一個(gè)智能體如何在終端指揮大量智能體協(xié)作,絕對(duì)是個(gè)迷人的話題。甚至戰(zhàn)略性犧牲、設(shè)置誘餌和集中火力,對(duì)照的可能是未來AI在現(xiàn)實(shí)社會(huì)中的中樞作用。

4、動(dòng)作連貫性:打游戲的都知道,取勝的關(guān)鍵是打出“節(jié)奏”。所謂節(jié)奏,來自玩家每一個(gè)指令之間如何銜接,是否具備連貫性。對(duì)于AI來說也是如此,一個(gè)細(xì)節(jié)上超越人類智慧并不難,但如何把每一個(gè)動(dòng)作銜接起來,整體取得價(jià)值最大化,就是AI向前發(fā)展的關(guān)鍵了。

這四個(gè)方向,最精彩的部分在于都對(duì)應(yīng)著現(xiàn)實(shí)中人的能力——不僅是人類認(rèn)知和解釋世界的智能,更是記憶、協(xié)作、堅(jiān)持這種人類反作用于物理世界的“動(dòng)能”。

至此,或許我們就可以理解為什么《星際爭(zhēng)霸》被稱為通用智能的關(guān)鍵了。因?yàn)樗A(yù)示著AI將在更加混亂和真實(shí)的環(huán)境里,學(xué)得更加類似人類心智的可能性。

它不僅是實(shí)驗(yàn)環(huán)境向真實(shí)環(huán)境的過渡,長(zhǎng)遠(yuǎn)來看,這類游戲被AI完全攻克,甚至可能成為智能體向類人智能體過渡的關(guān)鍵。

即使不說那么宏大的命題,類似智能體也可能成為AI代替股票分析員、代替廣告策劃、代替律師,這類巨大商業(yè)變革的基石——至少這類智能游戲,恐怕不比與頂級(jí)玩家打《星際爭(zhēng)霸》困難。

AI公司對(duì)《星際爭(zhēng)霸》的愛戀,至此就很可以被理解了。



本文被轉(zhuǎn)載1次

首發(fā)媒體 加速會(huì) | 轉(zhuǎn)發(fā)媒體

隨意打賞

deepmind人工智能谷歌deepmind星際爭(zhēng)霸重制版星際爭(zhēng)霸2星際爭(zhēng)霸
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 欧美精品亚洲精品日韩专 | 免费黄色小视频在线观看 | 有码中文字幕在线观看 | 欧洲亚洲精品 | 亚洲欧美亚洲 | 夜夜夜夜操| 精品国产不卡一区二区三区 | 日本xoxoxo在线播放 | 国产精品欧美日韩精品 | 操的好爽视频 | 五月天婷婷久久 | 久久精品国产视频 | 日日操夜夜操视频 | 毛片网站视频 | 99久久精品免费看国产麻豆 | 涩涩色中文综合亚洲 | 91手机在线视频 | 亚洲图片在线观看 | 亚洲精品欧美日韩 | 综合国产 | 国内精品亚洲 | 刺激videoschina偷拍 | 不卡久久 | 国产一级毛片国语普通话对白 | 99精品国产三级在线观看 | 日本三级中文字幕 | 人人揉人人爽五月天视频 | 国产精品激情综合久久 | 亚洲精品国产综合久久一线 | 国产真实强j视频在线观看 国产真实偷乱视频在线观看 | 免费国产97久久青草 | 奇米线在人线免费视频 | 久久一本精品久久精品66 | 一本久久道 | 精品久久久日韩精品成人 | 久久中文字幕久久久久91 | 琪琪色在线视频 | 欧洲色网| 伊人狼人久久 | 欧美在线激情视频 | 国产精品久久久久久久久久免费 |