OpenAI的人工智能進(jìn)軍DOTA2:影魔solo輕松擊敗頂級(jí)選手天才少年Dendi和Sumail!
雷鋒網(wǎng) (公眾號(hào):雷鋒網(wǎng)) AI 科技評(píng)論按:在攻克了圍棋以后,人工智能研究者們似乎不約而同地把電子競(jìng)技游戲作為了下一個(gè)練兵場(chǎng)。這兩天 DeepMind 剛剛聯(lián)合暴雪發(fā)布了一系列星際2的開(kāi)發(fā)工具包,便于自己和全球的研究者們開(kāi)發(fā)玩星際2的AI ,OpenAI 更是已經(jīng)取得了一些成果,借著DOTA2國(guó)際邀請(qǐng)賽 TI7 的機(jī)會(huì),在西雅圖鑰匙館正賽現(xiàn)場(chǎng)邀請(qǐng)了職業(yè)選手 Dendi 與自己的人工智能一決高下。
賽況慘烈!
Dendi 是世界知名DOTA2職業(yè)選手、solo高手,不僅自己的玩法靈動(dòng)多變,經(jīng)常出現(xiàn)神級(jí)的操作,還曾帶領(lǐng) Navi 戰(zhàn)隊(duì)拿下 TI1冠軍和TI2、TI3亞軍。
然而這一切在 OpenAI 的 AI 面前都顯得無(wú)力。三局兩勝的比賽,在影魔中路對(duì)solo、不允許使用瓶子和魂戒、死兩次或者丟一塔為負(fù)的規(guī)則下,第一局 Dendi 在線上沒(méi)有占到什么便宜,然后不小心被拿了一血,回到線上以后找機(jī)會(huì)和 AI 在兵線上近身對(duì)拼,結(jié)果同歸于盡,死亡達(dá)到兩次輸?shù)舻谝痪帧?/p>
OpenAI 的 CTO Greg Brockman 和開(kāi)發(fā)工程師 Jakub Pachocki 就在 Dendi 身后觀戰(zhàn),輸?shù)舻谝痪忠院篑R上與 Dendi 握手致意,然后在進(jìn)入第二局之前,三個(gè)人一同接受了短暫的主持人現(xiàn)場(chǎng)采訪。
第二局則結(jié)束的更快,由于 Dendi 沒(méi)有擋好小兵,一露頭就一直被 AI 壓制,接著2級(jí)時(shí)被 AI 進(jìn)塔強(qiáng)殺,直接打出GG認(rèn)輸。(完整視頻見(jiàn)文末)
現(xiàn)場(chǎng)采訪
主持人在兩局比賽之間和結(jié)束后采訪了 Dendi、Greg?Brockman 和 Jakub Pachocki 三人。這個(gè) AI 的10人開(kāi)發(fā)團(tuán)隊(duì)也來(lái)到了現(xiàn)場(chǎng)觀戰(zhàn)。
開(kāi)發(fā)工程師 Jakub Pachocki 簡(jiǎn)單介紹了 AI 的訓(xùn)練過(guò)程:“這個(gè)AI跟以往的游戲AI不一樣, 它完全是通過(guò)自己跟自己對(duì)局學(xué)習(xí)的。我們沒(méi)有給它設(shè)計(jì)任何策略、沒(méi)有從人類高手的對(duì)局中學(xué)習(xí),從一開(kāi)始就是自己和自己對(duì)局。雖然玩出來(lái)的結(jié)果基本是隨機(jī)的,但是每次都能提高那么一點(diǎn)點(diǎn),慢慢慢慢就達(dá)到了專業(yè)級(jí)水平。 ”
這個(gè)過(guò)程中的表現(xiàn)挺有意思的,根據(jù) Jakub介紹,“它剛開(kāi)始會(huì)在地圖上亂跑,不知道怎么回事就死在塔下了,那么很快學(xué)會(huì)了這樣不行以后,就待在家里不出來(lái)。接下來(lái)會(huì)站在地圖里一動(dòng)不動(dòng)只是看著,然后會(huì)攻擊一下小兵、推進(jìn)一下兵線之類的,甚至有時(shí)候還能補(bǔ)到兵。”“訓(xùn)練過(guò)程中其實(shí)沒(méi)有突然的大突破,就是一點(diǎn)點(diǎn)、一點(diǎn)點(diǎn)地升級(jí)。基本的學(xué)會(huì)以后就也逐漸學(xué)會(huì)騙對(duì)手的操作了。”
OpenAI CTO Greg?Brockman的講解更加令人驚訝:“這個(gè)AI從零開(kāi)始,連續(xù)訓(xùn)練了2個(gè)星期的時(shí)間。 訓(xùn)練了一個(gè)小時(shí)以后就已經(jīng)可以打過(guò)內(nèi)置的AI了 ,2周以后就達(dá)到了今天我們看到的水平。”“我們構(gòu)建的是一個(gè)通用學(xué)習(xí)系統(tǒng),在很多方面仍然受到限制,但是它已經(jīng)能夠打敗最強(qiáng)的人類DOTA玩家了。在構(gòu)建更加通用的系統(tǒng)的過(guò)程中,這就是重要的一步,以后它們能夠?qū)W會(huì)真實(shí)世界中復(fù)雜、混亂的重要任務(wù),比如外科手術(shù)。我們OpenAI的目標(biāo)就是確保這樣強(qiáng)大的系統(tǒng)能夠?yàn)槿祟愖龀鲐暙I(xiàn)。”
而且他還表示:“ 我們計(jì)劃的下一步是5v5的比賽,明年的TI上就可以讓大家看到! ”這話說(shuō)完以后現(xiàn)場(chǎng)觀眾一片歡呼。
主持人讓 Dendi 評(píng)價(jià) AI 的表現(xiàn),他的評(píng)價(jià)是:“你的任何操作失誤都會(huì)被AI抓住,毫不猶豫,很厲害!”比賽開(kāi)始前,看到上臺(tái)的對(duì)手是一臺(tái)電腦的時(shí)候 Dendi 還是一臉詫異的“你在逗我”的表情,在賽后已經(jīng)變成了不甘心:“從來(lái)沒(méi)有想過(guò)會(huì)被AI打敗。”“感覺(jué)它有點(diǎn)像人類,也有點(diǎn)不像。”
游戲表現(xiàn)
如果你覺(jué)得 Dendi 輸給 AI 是因?yàn)樗挠澳娴目赡軟](méi)有屠夫那么好的話,更多職業(yè)選手也在早些時(shí)候“體驗(yàn)”了這個(gè) AI,而且全都“意外”地輸了;EG 戰(zhàn)隊(duì)的 Arteezy 表示自己從 replay 中有所收獲,Sumail 直接輸了個(gè)0:10。
具體到操作上,人類玩家需要有意識(shí)做出的卡兵、壓制、拉仇恨、運(yùn)補(bǔ)給等等動(dòng)作在 AI 身上一應(yīng)俱全,第一局里 Dendi 驚呼 AI 的影魔身上有個(gè)芒果,第二局里 AI 的這個(gè)卡兵則直接讓全場(chǎng)沸騰了。
下面的假動(dòng)作和站在兵線上吃藥秀走位也顯示出了頂級(jí)的水平(上方為AI)。
達(dá)成這樣的表現(xiàn)可一點(diǎn)也不容易。AlphaGo 的比賽中大家都見(jiàn)識(shí)到了圍棋的復(fù)雜多變,但每一步只要在某個(gè)位置落子就好;DOTA比賽中的操作則要復(fù)雜得多,在基于血量、藍(lán)量、裝備、消耗品、buff等方面判斷自己的狀態(tài)以后,如何移動(dòng)、面向的方向、技能釋放地點(diǎn)、真動(dòng)作還是假動(dòng)作都需要考量。OpenAI 也放出了下面這個(gè)視頻逐項(xiàng)講解了 AI 學(xué)到的操作技能。
5v5比賽的野心
在搞定了影魔 solo 比賽以后,OpenAI 的下一步打算是讓 AI 玩起 5v5 的比賽,并在明年的 TI8 上和職業(yè)戰(zhàn)隊(duì)過(guò)招。不過(guò)也已經(jīng)有DOTA2玩家在欽佩 solo AI 之后表達(dá)了對(duì) 5v5 AI 的擔(dān)心,畢竟在 solo 的基礎(chǔ)之上,多人團(tuán)隊(duì)比賽中還有 BAN/PICK、分路、接技能、吸引火力、大后期、買(mǎi)活、強(qiáng)拆等等策略性極強(qiáng)、對(duì)團(tuán)隊(duì)配合要求極高的因素。每屆 TI 中都有職業(yè)玩家做出精彩的配合令觀者拍案叫絕,AI 能否具有這樣的創(chuàng)造力(“靈性”)也讓人捏了把汗。
不過(guò),該來(lái)的總是要來(lái)的,職業(yè)選手們已經(jīng)表示希望經(jīng)常和 solo 中這樣厲害的 AI 過(guò)招了。雷鋒網(wǎng) AI 科技評(píng)論也會(huì)密切關(guān)注 OpenAI 的 DOTA2 AI 動(dòng)向,祝 Open AI 好運(yùn)、為中國(guó) DOTA 加油。
Dendi 與 AI 影魔 solo 完整視頻如下:
雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。
相關(guān)文章:
DeepMind和暴雪聯(lián)手發(fā)布開(kāi)發(fā)工具和replay數(shù)據(jù)集,讓更多AI研究者玩上星際2
。