本周末在匹兹堡开始的,软件Claudico与四位扑克冠军Doug Polk、Dong Kim、Bjorn Li和Jason Les之间的对决,目前对玩家有利。然而,差距并非最终结果,在Twitch上准直播的下一场比赛将非常精彩。

对于Tuomas Sandholm教授来说,扑克现在已经取代了国际象棋,成为人工智能进步的标准学科。这位科学家非常清楚他在说什么。去年7月,他的冠军Tartanian7在人工智能发展协会组织的年度比赛中轻松获胜。几年前,他所属的著名的卡内基梅隆大学已经因其对Deep Blue(加里·卡斯帕罗夫的刽子手)和Watson(Jeopardy之王)的贡献而闻名。
他的最新作品Claudico之所以得名,是因为它喜欢“跛行”(在拉丁语中,Claudico的意思是“跛行”)。据Sandholm称,它比大多数高水平扑克玩家更经常使用。Doug Polk、Dong Kim、Bjorn Li和Jason Les是否从周五开始就发现了这一点?这几乎是毫无疑问的。在过去的这三天里,这四位玩家总共与该软件进行了16500手牌的对决。到5月8日,他们将再进行63500手牌,届时我们将终于知道机器是否在像No Limit Hold'em Heads Up这样复杂的学科中与人类平起平坐。
与此同时,考虑到比赛的头几天,这个问题仍然存在。Doug Polk和他的团队确实以迅猛的势头开始了挑战,但Claudico此后缩小了差距:它现在只落后其四位对手166000美元,相当于八个筹码。更仔细地观察,结果在不同玩家之间有明显差异:虽然Doug Polk和Bjorn Li明显处于盈利状态(分别为145000美元和180000美元),但Dong Kim的收益停留在41000美元,而Jason Les目前遇到了严重困难(损失117000美元)。
那么方差呢?挑战的模式被设计成尽可能地减少它。首先,牌局样本(总共80000手牌)似乎足够高,可以给出一个趋势。然后,它们在时间上的分布旨在消除软件所享有的自然优势:除了5月3日给予玩家的休息日之外,每天的1500手牌分为两个不同的时段进行。最后,为了让运气尽可能少地发挥作用,发牌依赖于“重复”格式:玩家A面对机器时拿到与机器面对玩家B相同的牌,等等。所有这些都阻止了玩家之间的任何互动,因为其中两人在匹兹堡里弗斯赌场的主厅中比赛,另外两人在二楼比赛。
在挑战开始之前,Doug Polk表现出了一定的信心,预测了他的团队会获胜。他借此机会谈到了比赛的一些关键:“与我与其他玩家的对决相比,我的策略会发生很大变化。由于情况的需要,我将更多地依赖于对对手的观察和心理因素。我甚至认为这是一件好事,因为它迫使我专注于游戏本身,而不会陷入元游戏的讨论”。Sandholm教授对比赛的命运就像一枚硬币一样,表现得不那么乐观。这位研究人员还回忆说,他的软件完全是基于算法开发的,从未求助于玩家的专业知识,并且他的创作涵盖了比这场与单挑之王的比赛更多的东西。最终,Claudico使用的算法可能会在商业、医疗领域或网络安全方面找到应用。
评论 0 条