谷歌DeepMind开发的软件战胜欧洲围棋冠军,引发了科学界和公众的兴奋、钦佩和好奇。从3月9日到15日,AlphaGo将再次与世界上最优秀的棋手之一一较高下。目标是,人工智能迈出巨大的一步。

在专业和大众媒体上广泛报道的樊麾输给AlphaGo的消息,被人工智能专家们视为一场真正的地震。当时所有人都一致认为,谷歌DeepMind团队取得的进步是惊人的。然而,如果没有下周计划的新一轮对决的结果,就不可能衡量这次成功的真正意义。
为什么?很简单,因为2015年10月以压倒性比分(正常比赛5-0,快棋3-2)输掉比赛的欧洲冠军,并没有进入世界顶级棋手的行列。樊麾确实是第一个输给计算机程序的围棋专家,但他的失败并不能真正说明目前人工智能和世界冠军之间的力量对比。为了更好地支持这一结论,专业杂志还提到了AlphaGo在比赛中开发的1202个CPU和176个GPU的强大算力。在这里或那里可以看到,这足以跻身世界前300名。
围棋,它是如何运作的?(米歇尔·谢瓦莱风格)
围棋在亚洲比在欧洲更受欢迎,它基于看似非常简单的规则:两个对手将黑白棋子放在一个格子棋盘的交点上,称为goban,并努力通过逐渐封锁对手的棋子并俘获它们来占据尽可能多的空间。然而,这些规则带来了很多组合的可能性:每回合250个,而国际象棋为例是35个。这种复杂性也参与了围棋游戏给计算机开发人员带来的挑战的难度。
AlphaGo的壮举也不容小觑:在没有人预料到的情况下,这款软件已经挥手扫除了人工智能专家们花费数十年精力攻克的障碍。它的前辈,HandTalk或Many Faces of Go,二十年前还难以与冠军匹敌,即使有25到29颗棋子的让子。这种劣势随着时间的推移被抹平,这要归功于蒙特卡洛算法的使用,计算机逐渐能够在越来越大的goban(格子棋盘的名称)上进行对弈。
谷歌DeepMind的这款产品是结合了先进的人工智能方法和包含数百万个神经元连接的网络的成果,它通过在传统的goban上取得胜利,并更胜一筹,甚至没有任何让子。然而,将于3月9日在首尔与它对决的人,和他的许多同行一样,仍然认为他将轻松获胜。
Piconzaz在论坛上的看法
樊麾和李世石之间仍然存在巨大的水平差距。分析了AlphaGo对阵樊麾的比赛的专业人士认为,人工智能还远远没有达到标准,并且犯了太多明显的错误,以至于没有机会获胜。
与此同时,使用蒙特卡洛树搜索方法的AI似乎倾向于不一定发挥其最佳水平,而仅仅是足够好地击败对手。因此,AI的真实水平可能不为人知。更不用说AlphaGo将受益于额外的六个月的训练,这可能会产生影响。
在十几天前接受美联社记者采访时,李世石预测比分将是4-1或5-0。是过度自信还是冷静的头脑?有一点是肯定的:这场比赛将在YouTube上全程直播,并将受到成千上万的好奇者和爱好者的密切关注。就像Deep Blue和加里·卡斯帕罗夫之间过去的其他比赛一样,它的赌注将远远超过承诺给获胜者的100万美元奖金(编者注:DeepMind团队计划在获胜时将其捐赠给慈善机构)。
在这方面,机器在沟通方面具有重量级的优势:如果获胜,它对人类的统治地位很可能会得到确认;相反,如果失败,比赛的结果无疑将被视为对当前力量对比的简单写照。如果说之前的国际象棋比赛有一个教训,那就是时间确实对机器有利。李世石本人对此也深有体会,他对3月9日的信心与他对中期形势的分析形成了鲜明对比:“一两年后,真的很难预测结果”。
扑克也是如此
Polaris, Cepheus, Claudico... 扑克也有其机械冠军。作为Tartanian7的直系后代,Claudico一年前与四位No Limit Hold'em Heads Up的国王对决:Doug Polk、Bjorn Li、Dong Kim和Jason Les。这场对决明显对牌手有利,但许多专家一致认为,力量对比可能会在几年内发生逆转。
在最近的世界扑克系列赛上,这场对决的主角之一Jason Les曾表示,当Claudico接受挑战时,他愿意进行复赛。虽然自那以后没有关于这场假设的第二轮比赛的任何信息,但Claudico仍在继续学习。它被称为Tartanian8,它的最新迭代就像它的祖父Tartanian7一样,刚刚在一年一度的计算机扑克爱好者盛会上占据了主导地位。从那里想象卡内基梅隆大学的宝贝再次在不久的将来与人类对决,无疑只有一步之遥。
评论 0 条