德撲人機大賽落幕:Libratus戰勝人類頂級選手,贏了170萬美元
?
又一個游戲陷落了。
昨日,在20天的血肉鏖戰后,匹茲堡賭場里的圍觀者不再驚訝連連,因為早在賽程過半時,人們就已經認識到,人工智能機器人Libratus鐵定是要把四位世界頂級撲克選手殺得落荒而逃。眾所周知,無限注德州撲克是一種非常復雜的牌類游戲,需要掌握游戲理論,擁有下賭注的果敢之心。在過去的20年里,機器先后在跳棋、國際象棋、拼字游戲、《危險邊境》上戰勝人類選手,甚至是最古老的圍棋,其深藏的神秘內涵在人工智能面前也無處遁形。但是,在所謂“不完全信息”類游戲上(也就是說某些牌是被隱藏的),人工智能此前從未取得領先地位。無限注德州撲克就是這樣一種游戲,它不僅需要玩家的直覺,更需要運氣。
為了應對這一復雜的游戲,卡內基梅隆大學的教授Tuomas Sandholm和研究生Noam Brown設計了一款名為Libratus(拉丁語意為平衡)的人工智能機器人。在近兩年來,這對師生用相似的人工智能軟件挑戰了多位世界頂級人類選手,輸了一次又一次。然而這一次,他們贏了,而且不費吹灰之力。在20天的賽程中,Libratus戰勝了4位人類選手,雙方的籌碼差距達170萬美元。
在無限注德州撲克中,玩家們要爭取的不是每把都贏,而是盡可能多地贏錢,這就需要在數十手中掌握下賭策略。像Libratus這樣的機器高手,能夠模仿游戲所需的人類直覺。
參與比賽的人類選手表示,Libratus確實名副其實。它每個策略都會來一點,有時候放個空炮,有時候明明牌很好,卻偏偏下最低的賭注。
眼下,Sandholm對Libratus的運作模式還比較遮掩,不過他承諾,在適當的時間,他們會和大家公布相關細節。幾位人類選手稱,Libratus不僅每天都在變,每天學習他們的技巧,還能從自己玩過的牌局中吸取經驗。
有人可能會說,卡內基梅隆大學的研究人員在每輪游戲之間都會對軟件做出調整,這似乎有些不公平吧。不過,要知道,人類選手也同樣盡了自己最大的努力,運用了每一種戰術。
雖然4位選手都是一對一與Libratus對戰的,但每晚他們會互相交流游戲策略。“每天晚上我們都會花好幾小時討論。”McAuley說,“我們互相之間會練習,這也是為了整個人類的勝利。”
小程序搜索難?獵云網精品小推薦正式上線,你想要的都在這里: xiao.lieyunwang.com
267588