10:1!DeepMind AI大勝星際2職業玩家
(原標題:DeepMind AI Challenges Pro StarCraft II Players, Wins Almost Every Match 任務描述: )
網易科技訊1月25日消息,據外媒報道,谷歌旗下子公司DeepMind的人工智能(AI)因戰勝人類圍棋冠軍而備受贊譽,現在它又開始挑戰另一款游戲――《星際爭霸2》(StarCraft II)。僅僅18個月后,DeepMind就擁有了能夠打敗世界上最好職業玩家的AI,幾乎每場必勝。在去年的一場比賽中,它以10:1戰勝了兩位歐洲職業選手。
DeepMind稱其主導圍棋的AI為“AlphaGo”,而這款玩《星際爭霸》的機器人也有類似的綽號,被稱為AlphaStar,擁有相當于人類200多年的實踐經驗。在去年11月份的暴雪大會上,DeepMind表示,其機器學習平臺大約有半數時間能夠戰勝游戲中的“瘋狂”挑戰。從那以后,情況有了明顯改善。
AlphaStar是個卷積神經網絡。其開發隊伍從專業比賽回放開始,給了AlphaStar開始玩這款游戲的起點。通過與競爭模型進行密集對戰訓練,DeepMind能夠教會AlphaStar如何像最優秀的人類玩家那樣玩游戲。隨著時間的推移,他們將AlphaStar削減到五個最好的“代理”,這就是它用來對付世界上許多最熟練《星際爭霸2》玩家的力量。
比賽實際上是在去年12月份舉行的,所以今天的網絡直播主要是重播這些比賽。首先,AlphaStar與一名主要在《星際爭霸》中扮演“蟲族”的玩家TLO對戰。然而,他必須扮演“神族”,因為這是目前AlphaStar唯一受過訓練的種族。盡管TLO盡了最大努力,但AlphaStar還是以5比0的成績擊敗了他。接下來,另一個AlphaStar代理與一名經驗豐富的“神族”玩家MaNa對抗。盡管有些比賽打得難解難分,但AlphaStar最終仍以5比0獲勝。
AlphaStar在這些比賽中展示了令人印象深刻的單位微觀管理能力。它迅速地將受損的部隊調回后方,并將更強壯的部隊調往戰斗前線。AlphaStar還控制了戰斗的節奏,在適當的時候向前推進或后退,以給對方造成更大傷害,同時減少自身的損失。這不是因為AlphStar的每分鐘操作率(APM)爆表,與人類玩家相比,它甚至擁有更低的APM,但它正在做出更明智的選擇。
AlphaStar也有些似乎非常有趣的戰略怪癖。它經常派兵沖到斜坡上,這在《星際爭霸2》中是很危險的,因為在你進入之前看不到那里有什么。盡管如此,這種策略還是奏效了。AlphaStar還避開了一個久經考驗的策略,即用一堵墻擋住基地的坡道。這在星際爭霸中是眾所周知的手段,但是AI并不在意它,仍然設法保護它的基地。
直到最后一場直播比賽,人類挑戰者才發現其中有個AI存在缺陷。這個版本的AlphaStar致力于將幾乎整個軍團作為一個整體移動,目的是橫推MaNa的基地。然而,MaNa能在AlphaStar基地后方的幾個單位內反復騷擾。每次,AlphaStar都會調轉方向來應對威脅。這給了MaNa足夠的時間去建立更強大的力量并與AI戰斗。
當天比賽結束時,AlphaStar贏了10場比賽,只輸掉了一場。如果AlphaStar能從這些比賽中吸取教訓,那么它在未來的比賽中幾乎不可戰勝。(小小)