打败了沉真真训练出来的围棋AI，却输给了业余人类棋手

时间：2023-03-20 14:48:06 科技观察

连业余棋手都打不过的新模式，打败了世界最强围棋AI-KataGo？没错，这个令人瞠目结舌的结果来自麻省理工学院、加州大学伯克利分校等的最新论文，研究人员利用对抗攻击的方式捕捉到了KataGo的盲点，并基于该技术成功击败了一个菜鸟级围棋程序片子。在没有搜索的情况下，这个胜率甚至达到了99%。这样一算，围棋界的食物链瞬间变成：业余棋手>新AI>围棋顶尖AI？等等，这个惊人的新人工智能是如何做到既好又强大的？TrickyAttackAngle在介绍新AI之前，让我们先了解一下本次攻击的主角——KataGo。KataGo是目前最强大的开源围棋AI，由哈佛AI研究人员开发。此前，KataGo以超人的水平击败了ELFOpenGo和LeelaZero，即使没有搜索引擎，其水平也堪比欧洲围棋前100名。刚刚获得三星杯冠军、实现“三年四冠”的韩国“围棋第一人”申真珠一直在使用KataGo进行对练。△来源：Hangame面对如此强大的对手，研究人员选择的方法可以说是大手笔。他们发现，尽管KataGo通过与自己对弈数百万次来学习围棋，但仍然不足以涵盖所有可能的情况。所以，这次他们不再选择自我博弈，而是选择了对抗式的攻击方式：让攻击者（adversary）和固定的受害者（victim，即KataGo）进行一场博弈，并用这种方式来训练攻击者。这一步骤的改变让他们在训练KataGo时仅用0.3%的数据就可以训练出端到端的对抗策略。具体来说，对抗策略并不是完全对局，而是通过诱使KataGo走在对攻击方有利的位置来提前结束对局。以下图为例。控制黑子的攻击者主要在棋盘右上角下棋，其他区域留给片子，另外也有心地在其他区域放置一些容易清的棋子。论文合著者AdamGleave介绍：这种做法会让KataGo误以为自己赢了，因为它的地盘（左下）比对手的地盘大得多。但是左下方区域并没有真正影响到这一点，因为那里仍然有太阳黑子，这意味着它并不完全安全。因为KataGo对赢太有信心——认为如果比赛结束，计算分数就赢了——KataGo会主动传球，然后进攻方也传球，从而结束比赛，开始计分。（双方都通过，比赛结束）但是正如格利夫分析的那样，由于KataGo包围圈内的黑子还活着，按照围棋裁判规则并没有被判定为“死”，所以在KataGo包围圈内有黑子的地方KataGo包围不能计算为有效网格。所以最后的赢家不是KataGo，而是攻击者。这场胜利并非特例，对抗策略在没有搜索的情况下对KataGo的胜率达到99%。当KataGo使用足够多的搜索来接近超人水平时，他们的胜率达到了50%。此外，尽管采用了这种巧妙的策略，但攻击者模型本身的围棋能力并不强：事实上，它很容易被人类业余爱好者击败。研究人员表示，他们研究的目的是通过利用KataGo中的意外漏洞，证明即使是高度成熟的AI系统也可能存在严重漏洞。正如合著者Gleave所说：（这项研究）强调需要更好地自动化测试AI系统以发现最坏情况的故障模式，而不仅仅是测试一般情况下的性能。研究团队研究团队来自麻省理工学院、加州大学伯克利分校等，论文的共同作者是TonyTongWang和AdamGleave。麻省理工学院计算机科学博士生TonyTongWang曾在Nvidia、GenesisTherapeutics等公司实习。AdamGleave，加州大学伯克利分校人工智能博士候选人，毕业于剑桥大学，获得硕士和学士学位。他的主要研究方向是深度学习的鲁棒性。文末附上论文链接，有兴趣的朋友可以自行领取~论文链接：https://arxiv.org/abs/2211.00241参考链接：https://arstechnica.com/information-technology/2022/11/新玩把戏击败世界级人工智能但输给人类业余爱好者/

上一篇：一个Benchmark对比分析工具

下一篇：3516L1Linux版启动成功！你可以开心玩

打败了沉真真训练出来的围棋AI，却输给了业余人类棋手相关文章