当前位置: 首页 > 科技观察

打败了沉真真训练出来的围棋AI,却输给了业余人类棋手

时间:2023-03-20 14:48:06 科技观察

连业余棋手都打不过的新模式,打败了世界最强围棋AI-KataGo?没错,这个令人瞠目结舌的结果来自麻省理工学院、加州大学伯克利分校等的最新论文,研究人员利用对抗攻击的方式捕捉到了KataGo的盲点,并基于该技术成功击败了一个菜鸟级围棋程序片子。在没有搜索的情况下,这个胜率甚至达到了99%。这样一算,围棋界的食物链瞬间变成:业余棋手>新AI>围棋顶尖AI?等等,这个惊人的新人工智能是如何做到既好又强大的?TrickyAttackAngle在介绍新AI之前,让我们先了解一下本次攻击的主角——KataGo。KataGo是目前最强大的开源围棋AI,由哈佛AI研究人员开发。此前,KataGo以超人的水平击败了ELFOpenGo和LeelaZero,即使没有搜索引擎,其水平也堪比欧洲围棋前100名。刚刚获得三星杯冠军、实现“三年四冠”的韩国“围棋第一人”申真珠一直在使用KataGo进行对练。△来源:Hangame面对如此强大的对手,研究人员选择的方法可以说是大手笔。他们发现,尽管KataGo通过与自己对弈数百万次来学习围棋,但仍然不足以涵盖所有可能的情况。所以,这次他们不再选择自我博弈,而是选择了对抗式的攻击方式:让攻击者(adversary)和固定的受害者(victim,即KataGo)进行一场博弈,并用这种方式来训练攻击者。这一步骤的改变让他们在训练KataGo时仅用0.3%的数据就可以训练出端到端的对抗策略。具体来说,对抗策略并不是完全对局,而是通过诱使KataGo走在对攻击方有利的位置来提前结束对局。以下图为例。控制黑子的攻击者主要在棋盘右上角下棋,其他区域留给片子,另外也有心地在其他区域放置一些容易清的棋子。论文合著者AdamGleave介绍:这种做法会让KataGo误以为自己赢了,因为它的地盘(左下)比对手的地盘大得多。但是左下方区域并没有真正影响到这一点,因为那里仍然有太阳黑子,这意味着它并不完全安全。因为KataGo对赢太有信心——认为如果比赛结束,计算分数就赢了——KataGo会主动传球,然后进攻方也传球,从而结束比赛,开始计分。(双方都通过,比赛结束)但是正如格利夫分析的那样,由于KataGo包围圈内的黑子还活着,按照围棋裁判规则并没有被判定为“死”,所以在KataGo包围圈内有黑子的地方KataGo包围不能计算为有效网格。所以最后的赢家不是KataGo,而是攻击者。这场胜利并非特例,对抗策略在没有搜索的情况下对KataGo的胜率达到99%。当KataGo使用足够多的搜索来接近超人水平时,他们的胜率达到了50%。此外,尽管采用了这种巧妙的策略,但攻击者模型本身的围棋能力并不强:事实上,它很容易被人类业余爱好者击败。研究人员表示,他们研究的目的是通过利用KataGo中的意外漏洞,证明即使是高度成熟的AI系统也可能存在严重漏洞。正如合著者Gleave所说:(这项研究)强调需要更好地自动化测试AI系统以发现最坏情况的故障模式,而不仅仅是测试一般情况下的性能。研究团队研究团队来自麻省理工学院、加州大学伯克利分校等,论文的共同作者是TonyTongWang和AdamGleave。麻省理工学院计算机科学博士生TonyTongWang曾在Nvidia、GenesisTherapeutics等公司实习。AdamGleave,加州大学伯克利分校人工智能博士候选人,毕业于剑桥大学,获得硕士和学士学位。他的主要研究方向是深度学习的鲁棒性。文末附上论文链接,有兴趣的朋友可以自行领取~论文链接:https://arxiv.org/abs/2211.00241参考链接:https://arstechnica.com/information-technology/2022/11/新玩把戏击败世界级人工智能但输给人类业余爱好者/