当前位置: 首页 > 科技观察

DeepMind用AI技术为国际象棋制定新规则

时间:2023-03-12 09:42:34 科技观察

此次,他们与前国际象棋世界冠军弗拉基米尔·克拉姆尼克(VladimirKramnik)合作,希望引导AI技术重新学习这一古老棋局的规则。最新变种。为了完善本已极度平衡的国际象棋规则体系,研究团队开始对这款千年棋盘进行调整,利用AI寻找最合理、最有趣的变化组合。AlphaZero是一种自适应学习系统,能够从头开始自学新规则并达到超人的游戏水平,科学家们测试了团队在克拉姆尼克的帮助下预先定义的九种国际象棋规则变体。对于每个变体,AlphaZero都与自己进行了数万场对局,分析了特定棋盘条件下所有可能的走法,并编写了新的策略和玩法。基于此,克拉姆尼克和研究人员继续评估如果采用这些变体,人类玩家将如何相互对战,并最终判断不同的规则集是否真的可以改进游戏。在过去的几个世纪里,国际象棋有了长足的发展,新的变化不断出现。这些变体要么是为了提高这项古老运动的认知门槛,要么是为这项运动引入新的复杂性。规则的调整无疑会对棋局策略、可玩性乃至棋局动态产生巨大的影响,而从历史的角度来看,过去只有足够多的人类棋手观察真实的棋局过程和结果,才能我们深刻理解规则带来的变化。实际影响。DeepMind研究人员表示,“根据这些规则变化训练AlphaZero模型,可以让我们快速模拟过去需要几十年才能完成的人类博弈过程,并回答每一个‘假设’问题:在相应的策略和战术成熟之后,各种象棋变种有什么样的发展潜力?”AlphaZero测试推出的规则包括:玩家可以吃掉自己的棋子,或者让棋子后退两步等,研究团队还提出了“禁止王车易位”的规则,相当于大大降低了出现的可能性两名球员之间的平局。AI系统以每秒一步的速度在各种变体上完成10,000场比赛,然后以每分钟一步的速度完成另外1,000场比赛。为了尽可能客观地研究规则变化对游戏质量的影响,科学家们还研究了其他一些因素。其中之一就是观摩平局,这是棋手们最激动人心的比赛。情绪低落的发生。总的来说,大部分变种确实增加了棋局的胜算,而“相持=胜利”的新规则进一步增加了对局的考量。研究人员还发现,时间控制也可以对游戏产生决定性影响:每秒走一步的游戏比每分钟走一步更不可能以平局告终。每秒走一步,平局的可能性将远低于每分钟走一步。结果还表明,在大多数游戏中,AlphaZero可以借助新规则主动采取前所未有的战术,而不是固守经典的棋局走法。研究人员指出,“这表明新规则确实产生了影响,也让游戏本身变得更加生动。”在对AlphaZero在新规则下的行为进行统计分析后,DeepMind团队还参考了Kramnik的意见,包括棋子出现的位置、棋子如何移动以及其他关于战术思维的主观问题都由规则变体来回答。前国际象棋世界冠军的参与和评论也有望让这些新规则引起传统国际象棋界的关注。俄罗斯国际象棋大师长期以来一直主张取消“城堡王”规则的变体,称它鼓励侵略并消除棋盘双方被动抵抗的动机。另一方面,克拉姆尼克还发现,“僵持=胜利”变体对国际象棋的整体影响较小。Chess.com首席棋手DannyRensch也通过视频评价了DeepMind的发现。但与克拉姆尼克不同的是,伦施认为“僵持=胜利”规则最有可能显着改变国际象棋的标准下棋方式。伦施解释说,“除非真正消除造成僵局的因素,否则国际象棋永远无法彻底摆脱这个问题。我坚信,僵局应该等于胜利。这不仅有助于初学者探索这个游戏的更多可能性,也将也对棋盘上的战斗方式有着决定性的影响。”最终,AlphaZero给出的意见只能作为参考,我们无法预测哪些国际象棋规则变体会真正被人们接受。找出答案的唯一方法是观察人类玩家如何采用、改变或丢弃不同的变体。但无论如何,如果这次尝试能够让更多的小伙伴重新打开尘封已久的棋盘,将是DeepMind研究团队最大的胜利。