Claudico软件与四位冠军Bjorn Li,Doug Polk,Dong Kim和Jason Les之间的扑克比赛于本周末结束,球员获胜。四人组甚至利用比赛的最后几天进一步扩大了他们的领先优势。

人工智能在过去几年中可能取得了显着进展,但扑克之路对它来说尚未完全开放。除了Limit Hold'em Heads Up,其项目Cepheus被证明“已解决”之外,在大多数情况下,最好的球员仍然在机器上保持着重要的“优势”。首先是在多路游戏中,仅靠数学无法确定最佳招数。2011年,参与IBM的Watson项目(旨在在Jeopardy游戏中与人类对抗)的一位科学家明确证实:“对于两个玩家参与的Hold'em限制下注,计算机非常擅长[...]但一旦增加了第三个玩家,就会陷入恐慌。三个玩家的策略变得相互依赖,既取决于统计考虑因素,也取决于心理因素”。
但即使在单挑游戏中,在No Limit Hold'em中寻求最佳策略仍然很困难:“无限注使算法复杂化”。 过去的两周实际上证实了这一点。在与匹兹堡的四位单挑冠军对抗的挑战中,Claudico似乎从未能够扭转局面。随着时间的推移和80,000手牌的进行,它与玩家之间的差距不断扩大。最终,比赛结束时,虚拟收益为732,713美元(对于20,000美元的买入和50/100的盲注)。
尽管如此,不同玩家的结果差异很大。Bjorn Li在很大程度上击败了Claudico(+ 529,033美元),Doug Polk未能跟上他同事的节奏(+ 213,671美元),而Dong Kim仅以微弱优势战胜了机器。至于Jason Les,他将是四人组中唯一未能超越该软件的成员(- 80,482美元)。那么,我们是否应该认为卡内基梅隆大学的孩子并没有被辜负,甚至欢迎他们的表现作为科学的真正进步?无论如何,Tuomas Sandholm教授在体验结束时发表的声明中采用了这种方法:
“即使四个玩家中有三个超过了Claudico,他们732,713美元的集体领先优势也不足以被认为具有真正的统计意义。换句话说,结果不允许做出任何明确的科学结论。总共在两周内下了1.7亿美元的赌注。因此,尽管玩家看起来领先,但比赛在统计上是平局。”
如果Jason Les承认Claudico相对于其前身Tartanian7取得了明显的进步,他的同伴Douglas Polk更喜欢强调该软件的一些持续存在的缺陷:“有些地方它表现得非常好,而另一些地方我根本不明白。它的一些下注非常不寻常。一个玩家通常会下注赌池的一半到四分之三。Claudico有时可能只下注10%,或者相反地下注赌池的1,000%。投入19,000美元赢得700美元,这并非玩家可以做的事情”。
毫无疑问,这些观察结果将使Claudico的开发人员能够完善他们的工作,因为到目前为止,这仅源于纯粹的算法方法,而没有借助任何人类经验。与此同时,这四名玩家将因其对科学事业的贡献而获得奖励,他们将获得由河流赌场和微软支付的10万美元的集体奖金。但是,不确定Jason Les是否能看到它的颜色,因为这笔象征性金额的分配计划是根据这四名男子的表现按比例分配的。
评论 0 条