人工智能擊敗世界頂級德州撲克玩家,贏下177萬美元
【AI世代編者按】卡內(nèi)基梅隆大學(xué)人工智能系統(tǒng)Libratus在長達(dá)20天的鏖戰(zhàn)中,打敗4名世界頂級德州撲克玩家,這標(biāo)志著人工智能技術(shù)又達(dá)到了一個新的高峰。
在國際象棋之后,機器人相繼在Jeopardy和圍棋游戲上打敗人類,人類唯一領(lǐng)先的,就是撲克了。
在一次長達(dá)20天的德州撲克大賽上,卡內(nèi)基梅隆大學(xué)開發(fā)的人工智能系統(tǒng)打敗了4名世界頂級的專業(yè)德?lián)渫婕?,贏得1,766,250美元籌碼。
這據(jù)稱是人類與機器不斷角力道路上的一個新里程碑,人工智能首次以大賭注策略擊敗了它的人類對手。
卡內(nèi)基梅隆大學(xué)的計算機教授圖奧馬斯·桑德霍姆(Tuomas Sandholm)稱,撲克是人類防守智能機器在游戲領(lǐng)域節(jié)節(jié)勝利的“最后一道防線”。機器打敗人類的首例,要追溯到20年前國際象棋大師加里·卡斯帕羅夫(Garry Kasparov)被 IBM 的超級電腦擊敗。
谷歌 ( 微博 )旗下的DeepMind,在英國贊助下開發(fā)出最頂尖的人工智能系統(tǒng),去年開發(fā)的一款程序贏了圍棋比賽,這被稱為是對思維延伸策略游戲的終極測試。
但是,撲克檢測的是不同的腦部區(qū)域,因為它涉及利用不完整信息做戰(zhàn)略決策,而這也更貼近現(xiàn)實世界。
“這也不僅僅是撲克。我們開發(fā)的算法…可以處理任何不完整信息的情況,并依此做出最好的策略,” 桑德霍姆先生說,他和博士生諾姆·布朗(Noam Brown)共同開發(fā)了這個系統(tǒng)。
這個技術(shù)可以應(yīng)用在各個領(lǐng)域與人類競爭,比如商業(yè)談判、軍事戰(zhàn)略和大型銀行使用的高頻交易系統(tǒng),他說。
這個叫做Libratus的人工智能系統(tǒng),每天10小時連續(xù)三周玩撲克中最有挑戰(zhàn)性的不限注德州撲克。它起初的表現(xiàn)讓人類覺得有希望最終獲勝。但是,系統(tǒng)逐漸補救了戰(zhàn)術(shù)中的漏洞,最終如桑德霍姆描述為“系統(tǒng)大舉獲勝,結(jié)果很顯著”。
“比賽到一半的時候,我們真的以為要贏了,”其中一位專業(yè)玩家丹尼爾· 麥考利(Daniel McAulay)說。“我們真的有機會打敗它?!?/p>
卡內(nèi)基梅隆大學(xué)團(tuán)隊每晚用超級電腦來分析白天的比賽,提高系統(tǒng)性能。系統(tǒng)檢測自身在每輪比賽中的弱點,每天補救三個最明顯的失誤,而不是試圖學(xué)習(xí)對手的制勝戰(zhàn)術(shù)。
這個方法最終使其出其不意用大賭注智勝它的對手,桑德霍姆稱之為系統(tǒng)相對人類“心理承受能力”的優(yōu)勢。
相對其它玩撲克的程序,Libratus最主要的提高在于電腦在接近游戲最后時的玩法。先前的系統(tǒng)從頭至尾使用單一戰(zhàn)術(shù),但是Libratus使用額外的反饋回路來實時回應(yīng)對桌的人類。
“我們用了所有能想到的辦法,它實在是太強大了,”另一位撲克玩家杰森·萊斯(Jason Les)說?!八刻斓某霈F(xiàn)都讓我們士氣低落,最后輸?shù)倪@么慘。我以為我們最后的籌碼會非常接近。”
桑德霍姆說,幾乎可以肯定要單獨成立一家新的創(chuàng)業(yè)公司,用Libratus背后的技術(shù)來開發(fā)商業(yè)用途。他已經(jīng)研究了27年的談判策略。他早先開發(fā)過的一款程序被2/3的美國器官移植中心使用來決定哪位病人可以得到新腎的移植。 (編譯/趙瑩)
推薦:人工智能洶涌而來,未來已變!關(guān)注“AI世代”微信號(tencentAI),關(guān)注未來。