除非出现难以置信的局面逆转,否则机器在几天前于匹兹堡举办的No Limit Hold'em Heads Up比赛中不会战胜人类。在已经进行的80,000手牌中的55,000手牌之后,道格·波尔克和他的同伴们领先了590,000美元。

尘埃落定,结局已定,一切都结束了... 在54,900手牌中,Claudico从未表现出能够动摇其四位对手的迹象。 如今,这个软件已经亏损了589,633美元的虚拟资金(底注为20,000美元,盲注为50 / 100),如果想扭转局面,它将需要一个奇迹。 这是一个其非常理性主义的创造者无疑已经放弃的前景。
去年十月,当Tuomas Sandholm教授展示了他的Tartanian7项目(Claudico的创始人)的大致框架时,他对机器在与人类玩家对战中的能力仍然充满信心:“到目前为止,不可能知道最好的程序,也就是说,我们的程序是否会胜过最好的职业玩家。 我认为会是这样[...] 纳什均衡是不可战胜的。 但是,由于我们只是在接近它,所以我们的机器人理论上是可以被击败的。 即使我认为很难找到它的漏洞。”
道格拉斯·波尔克和他的团队似乎已经做到了。 但是,如果他们的统治地位毫无疑问,那么这需要进行几点值得相对化的评论。 首先,被选来对抗机器的四个人不是新手:他们都是世界上最好的单挑玩家。 其次,他们的集体成功掩盖了非常不同的结果:当道格·波尔克和Bjorn Li目前交出完美答卷(每人+320,000美元)时,董金稍微逊色一些(+137,000美元),而杰森·莱斯明显处于困境(-190,000美元)。
请记住,方差并不能解释这种差异。 比赛的模式实际上已经确定,目的是最大程度地减少其影响:首先是使用duplicate格式,该格式要求玩家A面对机器时获得与机器面对玩家B相同的牌,依此类推; 其次,当其中一个参与者全押时,则没有抽奖,然后根据各自的获胜概率按比例分配彩池。
即使在5月8日之前还有25,000多手牌要打,这场甚至在扑克圈之外广为传播的挑战赛的结论也因此变得势不可挡:与被Cepheus项目团队称为“已解决”的Limit Hold'em Heads Up不同,No Limit Hold'em Heads Up(更不用说更难被人工智能吸收的多方游戏了)仍然对卡内基梅隆大学的研究人员和整个科学界来说是一个重要的谜团。
Sandholm教授的方法论本身是否是罪魁祸首? 无论如何,这位科学家选择了纯粹的算法方法,从未使用过人类的经验:“所有当前的机器人都是在相同的基础上开发的。 您从一个抽象算法开始,该算法生成一个更小但战略上相似的博弈基础,然后可以使用一个均衡搜索算法,该算法导致纳什均衡或接近纳什均衡的结果,以用于更小的博弈。 NLHE Heads Up游戏本身对于纳什均衡而言过于复杂。 因此,我们解决了一个更简单的问题,然后使用了一个与原始游戏相匹配的算法”。
评论 0 条