DeepMind發布《星際爭霸 II》深度學習環境
雷鋒網 (公眾號:雷鋒網) AI研習社【本期論文】
StarCraft II: A New Challenge for Reinforcement Learning
星際爭霸 II:增強學習的新挑戰
上個月,DeepMind和暴雪終于開源了《星際爭霸II 》的機器學習平臺。本文介紹了基于星際爭霸II游戲的強化學習環境SC2LE(《星際爭霸II 》學習環境)。
論文描述《星際爭霸II 》行動和獎勵規范,并提供一個開源的Python界面,用于與游戲引擎進行通信。暴雪提供游戲輸入輸出的API,DeepMind又做了層基于Python的封裝。
除了主要的游戲地圖,他們提供了一套專注于《星際爭霸II 》游戲不同元素的迷你游戲。對于主要的游戲地圖,還提供了一個伴隨專業玩家的游戲重播數據數據集。從該數據訓練的神經網絡的初始基線結果,預測游戲結果和玩家行為。
文中使用了被稱為Blizzard分數的一個中間分數,這個分數包含了一個對當前資源、等級以及單位和建筑的加權和,如果玩家贏得戰斗而且管理好資源,這個分數就會單調增加,失敗的時候,這個分數就會減少。此外,系統還使用了一系列的特征層為AI編碼相關信息,比如地形高度、相機位置、屏幕中單位的血量以及各種其他信息。
最后,提出了應用于《星際爭霸II 》的規范深強化學習的初始基線結果。DeepMind之后也會發布上百萬幀的選手游戲記錄,這對模擬環境研究也會有很大的幫助。
??觀看論文解讀大概需要??6??分鐘
學霸們還請自行閱讀論文以獲得更多細節
論文原址: ?https://arxiv.org/abs/1708.04782
Github:? https://github.com/Blizzard/s2client?
雷鋒網AI研習社出品系列短視頻《 2 分鐘論文 》,帶大家用碎片時間閱覽前沿技術,了解 AI 領域的最新研究成果。歡迎關注雷鋒網雷鋒字幕組專欄,獲得更多AI知識~感謝志愿者對本期內容作出貢獻。
。
