当前位置: 首页 > 科技观察

柯洁为什么说“我发脾气了”!8道题解读人机对战第一局

时间:2023-03-17 10:34:36 科技观察

经过四个多小时的对局,柯洁以四分之一的差距输给了AlphaGo。赛后,曾参加过AlphaGo培训的棋手范辉与围棋九段棋手常昊一起回顾了整个比赛过程。柯洁还接受了Deepmind创始人DemisHassabis和AlphaGo主程序师DavidSilver的媒体采访,畅谈了自己对这款游戏的感受。AlphaGo注重全局的发展。范辉提到,年初法师60局之后,很多玩家也在尝试用点三三局。而柯洁也模仿了这个开场。常昊在分析中表示,整盘棋给人印象最深的是开局不久后第24步白棋的大飞。这说明AlphaGo更注重中央力量的发展,更注重厚度和对局的发展。因为这一步在以后的棋局中效率会更高。AlphaGo的另一个令人印象深刻的特点是在开局后不久,在游戏的左上角。开盘前,黑棋(柯洁)看起来很厚,但随后白棋(AlphaGo)也变厚了。常昊道:“这算是退一步了,倒是留下了很多回味。”第24招是“大飞”,第54招是“破”。“这一步给我们带来了新的思路,下了之后,就会有新的思路,提供了一种思路的创新,大家可以一起研究,给围棋的下法带来更多的发展。”虽然被围成围棋的四个字看起来是没救了,但是AlphaGo还是会更多的利用这4个棋子,它会想利用棋盘上所有棋子的价值。柯洁:没脾气就输了他说,“太震撼了,这在人间法上是做不到的。”破碎之后,它脚下踏地,变得粗壮,一石打二。”杰米斯·哈萨比斯赛后表示,这是一场非常精彩的比赛,他非常尊重柯洁,他在这场战斗中的表现令人钦佩。他认为柯洁表现出了坚韧和精彩的力量,他也做出了自己的贡献。很多赛前的战前准备。”柯洁在战略和战术上都做了准备,比如点三三(这种策略),这是他从年初法师60场比赛中总结出来的。他有自己的攻略,几招都非常漂亮,第24手是全力一招。还有很多比赛要打。我很尊重柯洁,所以AlphaGo必须全力以赴对付你。”虽然比赛结果已经出炉,但外界对AlphaGo和柯洁的好奇并没有得到满足。在采访中,双方也回答了很多大家关心的问题。赛后柯洁为什么会笑?柯洁说是苦笑,不是很开心的笑。”我很早就知道我会输。AlphaGo的一举一动都是匀速的,一局结束,你就已经知道自己会输多少。对于自己的评价,柯洁表示,“AlphaGo下得很好,但我也尽力了。它下得很好,棋手可以学习和探索的地方很多,对围棋的概念带来了影响,并且改变了我们原来的围棋下法,没有不能下的棋,AlphaGo的思路也变了,我们可以大胆创新,发展自己的思维,自由下棋。今天,我也大胆开发了我的自己的想法。“柯洁也想用AlphaGo的策略对付它。”我的印象是AlphaGo会很贪地,比如点三三的方法,我今天也在用这个策略。但是“这个意图被AlphaGo打败了,完全合情合理,下得真好。”柯洁认为,AlphaGo的棋和去年相比完全是二人对弈。第一次和人类很亲近,现在却越来越像“神”。AlphaGo有弱点吗?柯洁认为,暂时还没有看出弱点。过去还是有弱点的,但是现在AlphaGo对棋的理解和判断已经远远超过我们了。如果你赢了,你只能找到一些错误。但与此同时,他说,“永远要对自己有信心。“哈萨比斯表示,继李世石之后再次参加比赛,他希望棋手能够找到AlphaGo的弱点,找到它在与自己对弈时不知道的破绽。”李世石在第4局就发现了这个差距,然后我们改进了系统。当然还会有新的领域,我们和AlphaGo都不知道,所以我们会参加比赛。”DavidSilver解释说,AlphaGo的做法是最大化自己获胜的概率,而不是势均力敌地赢得比赛。它会寻找一些确定的路线来实现风险较小的获胜机会。这也是一个权衡的问题。决定如何增加获胜的比例,当然还有其他一些目的,比如把胜利的步幅更大一些,如果只关注获胜,可能会降低风险,即使是小风险也会被关注到。对围棋的影响?Hassabis认为围棋是一个非常有趣的学科,具有很大的可能性。通过比赛,可以提高对围棋的理解。这是我们可以用来让伟大的棋手发现更多围棋奥秘的工具。AlphaGo是不是完全不依赖棋手的训练?DavidSilver解释说,AlphaGo从一开始就向人类学习。当它通过与自己比赛来学习时,它还必须与人类专家比赛,因为它只能通过与最好的球员比赛来提高。新版本是通过与自己对战来学习更多,实现自我搜索,减少对人类数据的依赖。DeepMind的目标是让它的规则超越围棋,应用到其他领域。打败围棋第一的柯洁后,AlphaGo会退役吗?哈萨比斯没有正面回应这个问题,只是表示将在本周晚些时候宣布下一步行动。就像最新版本在学术期刊上公布技术细节一样,他们以后会发布更多新版本的细节,会公开更多的技术细节,让其他团队和实验室做出自己的版本。技术细节?有多少TPU?单一视觉?本次比赛的AlphaGo是新版本,改进了新算法。主要进步是计算量减少十倍,自玩性更强。哈萨比斯说,比赛期间程序是在单机上运行的,不像去年是分布式的。这一次有更强大的算法,它们工作起来更简单、更好,而且速度更快。Hassabis表示,计算能力可以“在谷歌云中获得,使用TPU,十个处理单元,减少十倍的计算量”。简单来说,这次的AlphaGo是单机版。柯洁不再与人工智能相提并论?赛前,柯洁在微博发文称,本场比赛是第三场对阵人工智能。赛后,他再次确认了这个决定。“想了半天,AlphaGo进步太快了,每一步都是巨大的进步,以后会更好,人和它的差距不是靠自己的努力可以弥补的。我相信在技??术的力量上,未来是人工智能,对于围棋,我还是喜欢和人类对弈,因为机器和人类的差距会越来越大,人类获胜的概率会越来越小。这么玩太痛苦了,我赢不了。”他说以后不练机器了,这是最好的三盘棋。“我希望以后能和人下棋,把软件当老师,当学习对象。”他说自己对自己的表现有些不满意,觉得自己可以做得更好,但有时候无论怎么努力,都做不到。所以这一次,他希望能下一盘让自己满意的棋局,不留遗憾。“让AlphaGo的主机火起来就好了。”那么,如果人类棋手不想与AlphaGo对弈怎么办?哈萨比斯表示,从他们的角度来看,他们希望AlphaGo成为人类可以使用的围棋工具,所以会有架构知识的分享,让大家了解它。也希望它能走进寻常百姓家,在医学和科学上找到应用场景。