精品国产免费福利片,一级片手机在线观看,欧美日韩国产在线一区,久久精品综合一区二区三区

人工智能在多人桌德州撲克比賽中戰(zhàn)勝世界頂尖選手

來(lái)源:新華網(wǎng) 作者:周舟 發(fā)表時(shí)間:2019-07-16 16:50
新華網(wǎng)  作者:周舟  2019-07-16
新華社華盛頓7月11日電(記者周舟)美國(guó)卡內(nèi)基-梅隆大學(xué)11日宣布,該校和臉書(shū)公司合作開(kāi)發(fā)的人工智能Pluribus在六...

新華社華盛頓7月11日電(記者周舟)美國(guó)卡內(nèi)基-梅隆大學(xué)11日宣布,該校和臉書(shū)公司合作開(kāi)發(fā)的人工智能Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,成為機(jī)器在多人游戲中戰(zhàn)勝人類的一個(gè)里程碑。

美國(guó)《科學(xué)》雜志11日在線發(fā)表的相關(guān)論文顯示,Pluribus與13名德州撲克高手進(jìn)行了1萬(wàn)手不限注對(duì)局的六人桌比賽,每次比賽中由機(jī)器對(duì)5名人類選手,結(jié)果機(jī)器取得勝利。

在另外一種形式的六人桌比賽中,由5個(gè)Pluribus與1名人類選手對(duì)局,結(jié)果機(jī)器分別在5000手對(duì)局中先后擊敗了德州撲克世界冠軍達(dá)倫·伊萊亞斯和克里斯·弗格森。

在比賽中,Pluribus會(huì)讓自己變得難以預(yù)測(cè)。例如常規(guī)打法是在牌最好的時(shí)候押注,但這很快會(huì)被對(duì)手識(shí)破,因此它會(huì)“耍點(diǎn)心眼”,不按常理出牌。分析顯示,它會(huì)做出一些多數(shù)人類玩家都認(rèn)為不好的決策,這在客觀上也迷惑了對(duì)手。

研究人員指出,與讓機(jī)器下國(guó)際象棋和圍棋相比,德州撲克的挑戰(zhàn)更大。德州撲克比賽中每方都不知道對(duì)手的牌,對(duì)手還可能在押注時(shí)虛張聲勢(shì),因此決策只能基于不完全信息,這與真實(shí)世界中的問(wèn)題更接近。

卡內(nèi)基-梅隆大學(xué)教授圖奧馬斯·桑德霍爾姆說(shuō),此前人工智能在“戰(zhàn)略性推理”方面取得的成就僅限于二人游戲,此次在復(fù)雜游戲中戰(zhàn)勝5名人類選手,將為人工智能解決真實(shí)世界問(wèn)題提供新的可能性。

據(jù)介紹,在二人游戲中,機(jī)器的策略是實(shí)現(xiàn)博弈論中的“納什均衡”,即確保結(jié)果至少是平局,而只要對(duì)手犯錯(cuò)打破均衡,機(jī)器就能獲勝。但這一策略不適用于多人游戲,因此機(jī)器不能保平,必須不斷爭(zhēng)取先手才能最終獲勝。研究人員為此設(shè)計(jì)了一種新的“有限前瞻搜索”算法,讓機(jī)器能做出一個(gè)平衡的整體決策。

2017年,卡內(nèi)基-梅隆大學(xué)開(kāi)發(fā)的人工智能Libratus曾在12萬(wàn)手一對(duì)一不限注德州撲克比賽中分別戰(zhàn)勝4名人類選手。

編輯:
新聞排行榜
精彩推薦