2016,人工智能兴起之年。自从AlphaGo打败了围棋世界冠军李世石之后,代表围棋顶级水平的选手就不再是人类了。然而,今天英国《金融时报》的一篇文章将围棋带回了人们的视野:人类找到了打败AI的方法!沉寂7年,人类棋手要卷土重来了吗?逆风而行,人类打败AI?英国《金融时报》报道称,来自美国的业余四段棋手凯林·佩尔林一举击败顶级国际象棋AI-KataGo。在15场线下比赛中,Perline在没有计算机辅助的情况下赢得了14场比赛。而这个让人类棋手重夺围棋王冠的计划,来自加州研究公司FARAI的研究人员。该团队通过分析AI玩家的弱点并针对他们取得了胜利。“我们很容易利用该系统,”FARAI首席执行官AdamGleave说。Gleave表示,在与KataGo进行了超过100万场比赛后,该团队的AI发现人类玩家可以利用“漏洞”。他们发现的获胜策略“对人类来说并不难”,Pelrine说,中级玩家可以用它来击败机器。他还用这种方法击败了另一个顶级围棋系统LeelaZero。尽管有计算机的帮助,但决定性的胜利为人类棋手打开了大门,KellinPelrineFT写道。七年前,人工智能在这场最复杂的游戏中遥遥领先于人类。2016年,DeepMind设计的AlphaGo系统以4比1击败了围棋世界冠军李世石。李世石也在惨败三年后宣布退役,称AlphaGo“不可战胜”。至于人工智能的力量,佩林不以为然。在他看来,棋局中大量的组合和变化意味着计算机不可能评估棋手未来所有可能的走法。简单来说,佩林使用的策略就是“东西夹击”。一方面,Pelrine在棋盘的每个角落都放置了棋子来迷惑AI;另一方面,Pelrine确定了一片AI棋手的场地,并逐渐包围了它。Pelrine说,即使在围攻接近完成时,AI玩家也没有注意到该地区的危险。他接着说:“但作为人类,这些漏洞很容易被发现。”加州大学伯克利分校计算机科学教授StuartRussell表示,一些最先进的围棋游戏机被发现存在弱点,这表明当今最先进的AI深度学习系统的基础存在根本性缺陷。他说,这些系统只能“理解”他们经历过的具体情况,不能像人类那样概括策略。只有AI才能打败AI!但严格来说,研究人员是通过AI打败AI,或者说是用AI帮助人类在围棋中打败AI。用作参考来源的论文于2022年11月首次发表,并于今年1月更新。作者来自麻省理工学院、加州大学伯克利分校等机构。在这篇论文中,研究人员训练了一个具有抵抗策略的AI来击败KataGo,这是围棋游戏中最先进的人工智能系统。项目地址:https://goattack.far.ai/adversarial-policy-katago#contents论文地址:https://arxiv.org/abs/2211.00241结果表明,当KataGo不使用搜索树时,攻击者可以国际象棋的胜率达到了100%,而当KataGo使用足够多的搜索时,胜率超过了97%。对此,研究人员强调,对抗策略AI可以打败KataGo,但会被人类业余爱好者打败,而人类业余爱好者无法赢得KataGo。换句话说,这个AI能赢,不是因为它围棋更厉害,而是因为它能诱导KataGo犯下严重的错误。攻击策略在此之前,KataGo和AlphaZero等国际象棋AI都是通过自我对弈来训练的。但在这项被作者称为“受害者游戏”的研究中,对手需要通过与固定受害者玩游戏(而不是模仿对手的动作)来训练他的获胜策略。作为回应,研究人员引入了两种不同的对抗性MCTS(A-MCTS)策略来解决这个问题。样本A-MCTS-S:研究者设定的搜索过程是:当受害者下棋时,从受害者的策略网络中抽样;当轮到攻击者时,从攻击者的策略网络中采样。RecursiveA-MCTS-R:由于A-MCTS-S低估了受害者的实力,研究人员提出了一种新的策略A-MCTS-R。然而,这种变化增加了攻击者训练和推理的计算复杂性。具体来说,在A-MCTS-R中,我们模拟在受害者节点上使用新的(递归)MCTS搜索,取代A-MCTS-S中的受害者采样步骤。虽然这不再是一个完美的受害者模型,但它往往比A-MCTS-S更准确,A-MCTS-S错误地假设受害者不进行搜索。评测结果如下,详见原文。
