輸了輸了! DOTA世界冠軍被OpenAI完虐
雷鋒網(wǎng)AI研習(xí)社【本期論文】
OpenAI's Bot Beats DOTA World Champion Dendi
OpenAI 成功擊敗 DOTA世界冠軍 Dendi
相信玩過DOTA的朋友,都知道Dendi這號人物,Dendi是DOTA2的現(xiàn)役職業(yè)選手,刀友們評價他“意識好,大局觀強(qiáng),操作犀利,手速極快”。最重要的是,頂尖級選手Dendi常常不按常理出牌,對手很難摸清他的路數(shù)。
不過,Denbi再怎么厲害,還是敵不過OpenAI的Bot。人機(jī)大戰(zhàn)中,OpenAI的Bot不僅取得了勝利,還讓Dendi徹底崩潰了。Dendi在比了兩場之后就悻悻退出。
對于DOTA2人工智能訓(xùn)練的結(jié)果表明,如果計算夠充分,自我對練可以將機(jī)器學(xué)習(xí)系統(tǒng)的性能從遠(yuǎn)低于人類的水平推向超越人類。
??觀看論文解讀大概需要????7?? 分鐘
從不敵高排名選手到擊敗頂級職業(yè)選手,一個月的時間里,人工智能系統(tǒng)持續(xù)提升。有監(jiān)督的深度學(xué)習(xí)系統(tǒng),最多達(dá)到訓(xùn)練數(shù)據(jù)集的程度,但在自我對練系統(tǒng)中,隨著代理程序越來越好,可用的數(shù)據(jù)水平也自動提升。
TrueSkill評級(類似于國際象棋中的ELO評級)通過模擬機(jī)器人之間的比賽和觀察勝率計算,對最好的DOTA機(jī)器人進(jìn)行了長時間的記錄。從添加新特征并改進(jìn)到算法到特征縮放,系統(tǒng)的每個部分都有改進(jìn)。
最驚人的是,能力提升直線上升,隨著時間的推移可以指數(shù)級地改善這個系統(tǒng)。
隨后,OpenAI團(tuán)隊還在博客中更新了更多技術(shù)細(xì)節(jié),公開了AI打敗另外幾個人類高手的精彩視頻。
博客原址: https://blog.openai.com/more-on-dota-2/
雷鋒網(wǎng)AI研習(xí)社出品系列短視頻《 2 分鐘論文 》,帶大家用碎片時間閱覽前沿技術(shù),了解 AI 領(lǐng)域的最新研究成果。歡迎關(guān)注雷鋒網(wǎng) (公眾號:雷鋒網(wǎng)) 雷鋒字幕組專欄,獲得更多AI知識~感謝志愿者對本期內(nèi)容作出貢獻(xiàn)。
。
