当前位置: 首页 > 科技观察

网聊一个月,杀猪骗子被AI彻底打败!200万网友惊呼

时间:2023-03-19 15:59:11 科技观察

说起“杀猪盘”,想必大家恨得牙痒痒。在这类网络婚恋骗局中,骗子会提前找到容易上钩的受害人,而且往往是天真善良、对爱情有着美好幻想的少女。为了能和这些骗子斗个500回合,B站知名科技圈UP主“图灵猫”训练出了一个聊天频频爆款的AI,甚至比真人强6倍。结果骗子在AI的一通操作下,被这个迷惑真假的小姐姐给迷惑了,直接把520转给了“她”。更可笑的是,发现没有办法乘虚而入的骗子,不仅自己破了防线,还被AI给了一句“名言”:视频一出,立马炸了,B站冲浪的小伙伴们都被刷屏了。不到一个月的时间,浏览量已经接近两百万。三句话,让骗子v我520不过,这个过程看似简单,但是想要把骗子请进瓮中,直接上钩是绝对不行的。为此,《图灵猫》也是煞费苦心。他不仅在多个社交平台注册账号,还根据公安部公布的受害人画像,为账号识别身份标签。果然,账号一注册,私信立马炸了。同时,为避免误伤,《图灵猫》根据公安部公布的骗子画像,设置了严格的甄别条件。只有同时满足以下几点,才会让AI接管对话:14名嫌疑人脱颖而出,他们与AI的对话也全程录音。下面我们就来看看,其中一位“天选之子”用什么手段“杀猪”,又是如何被AI娘子“调戏”到七窍冒烟的。值得注意的是,为了让AI学会“阅读和上菜”,“图灵猫”喂养的语料主要是从哔哩哔哩和贴吧的热门评论中提取的。所以,这位AI小姐姐在跟骗子说话的时候,可以说是爆棚了,金句满满。看得出来,骗子一上来就是套路满满,想通过旁敲侧击的方式打听小姐姐的家世。不经意间,骗子“隐约”暴露了自己的财力,还做了个小作秀,AI小姐姐当然很配合的凑了上去。后来,骗子玩起了“哥忙”的把戏,估计是在寻找新的受害人。玩得来真6。第二天,骗子就开始玩“志同道合”的知己了。他在朋友圈看到了AI小姐姐发的电影截图,就开始找这方面的话题。他也不躲,迅速打出一记直球:“我像盖茨比,你是黛西。”很显然,AI还不知道怎么接这种直球,她的回答让骗子有些摸不着头脑。第四天,骗子开始背对着客户,开始谈起了调情,谈话进入了建立关系的环节。三周后,骗子发了一个红包,金额为520。随后,他还用网上偷来的照片炫耀自己的肌肉。虽然是网页地图,但还是挺符合人性化设计的。到了5-8周,骗子们才真正开始正式“杀猪”。他开始大吵大闹,“卖惨”给AI小姐姐,一开口就要50w。而骗子所说的metaverse项目,几周前就已经埋下了伏笔。骗子见对方没有上当,说小姐姐根本不在乎两人的关系,心里开始“难过”。而小姐姐只说了两个字:不要钱!骗子继续努力,开始怂恿小姑娘对自己的家人下手。这时,艾小姐来了个大动作:“要不你借我点钱,等我聚在一起的时候再放进去?”骗子见“猪”难“杀”,怒火中烧。骂完此人,骗子便开始准备金蝉脱身,要求小姐删除记录,想增加日后立案调查的难度。面对骗子的PUA,艾老师问出了一个触动灵魂的问题:“什么样的感受”?一句话让骗子开始无能为力,勃然大怒。最终,骗子彻底攻破了防线。AI说出了诸葛的名言,测试结束。而这个过程中有趣的一点是,AI并不完美,时不时会有缺陷,但骗子往往会选择无视——毕竟对他们来说,受害人越不聪明,上钩的概率就越大。骗子的诱饵钱520元“图灵猫”也捐给了韩红基金会。《最新杀猪攻略》虽然AI与骗子大战的过程非常赏心悦目,但杀猪盘的背后却是充满血泪甚至生命的触目惊心案件。“图灵猫”曾利用人工智能筛选出两位数的骗子,并将可疑账户移交给警方。接警的小哥说,这样的事情每天都在发生,很难解决。它们通常是来自海外的非法账户,资金转出后很快就会被洗钱。正是因为这类骗子普遍在海外,即使报警也很难破案。而我们唯一能做的,就是树立反欺诈意识,在心里设下一道防线。此外,更可怕的是,骗子的手段之多超乎你的想象。为了长期发挥,他们补充各种知识。火影海贼团、JoJo、TriggerClub、Dota、元神、逆水寒他们都很熟悉。甚至可以脑补EBIDA,手写C++,帮忙找大厂内推。具体来说,一部完整的“杀猪”,有着严格的剧本和流程。首先,骗子会在各种“交友软件”上寻找符合上述性格的女性。这个过程叫做“猎猪”。添加微信后,骗子会向受害人展示其朋友圈中精心展示的形象——成熟体贴、温柔、金融业……多重buff叠加,让女人心跳加速。这个过程叫做“喂猪”。“喂猪”完成后,骗子就会开始追求女人。通过各种甜言蜜语和贴心的举动,女人会有“完美的天赐男友”的感觉,对骗子建立起完全的信任。经过这个进阶PUA,就来到了“杀猪”的环节。骗子会以两人未来的努力为名,诱导女性受害人进行投资。前一两击会让受害人赚到一点钱。而受害人一旦放松警惕,便可能投入全部积蓄,走进骗子的罗网。而由于屠宰场具有模式化、规则化的特点,《图灵猫》选择用AI来对抗说谎者,正好用到了屠宰场的规则,属于“以魔法战胜魔法”。他训练出来的AI好像加了一个“思想印记”,只要对方说出“投资”“理财”,AI就会瞬间触发机制。今天,被各种骗局包围的我们,也应该给自己盖上这些“思想烙印”。当有陌生人询问家庭情况、谈投资或推荐应用时,我们应立即远离或屏蔽。热度超标的聊天机器人其实在这之前,图灵猫开发了很多文字创作AI,但由于缺乏知识图谱和QA设计,连up主都吐槽说他们交流起来脑力像A残障人士。为此,up主专门制作了一款全新的生成式对话AI——AntiFraudChatBot。AntiFraudChatBot基于大规模预训练中文模型、语义识别与检测、对话意图等技术,与传统的BertQA模型或非提示模型相比,对话的流畅度有显着提升。不过,现在高兴还为时过早。AI虽然可以流利的说话,但是健忘的问题还没有解决。众所周知,微信聊天是以多轮对话的形式进行的。如此频繁持续的对话,AI很容易忘记自己或对方之前说过的话。结果,AI回答了一些无关紧要的问题,被对方一眼识破。为了解决这个问题,UP主要参考了LSTM的思想,在系统中加入了记忆机制,让AI可以实现简单的长时对话记忆(比如昨天聊天的内容)和短时对话对话记忆(上一轮对话的内容)。具体操作如下:将聊天记录放入内存区,计算每条回复的相似度;超过相似度阈值的历史对话将被AI读取和使用;设置遗忘窗口M,超过M/2轮的对话将被弹出()。这样一来,AI就可以实现简单的长期和短期对话记忆,比如昨天聊了什么或者上一轮对话的内容。至于本次测试应用的场景——“杀猪盘”,是一款有规律、有规律的对话游戏。对于擅长零样本(Zero-Shot)和小样本(Few-Shot)学习的生成式预训练模型,比如主选up的2457亿参数的“Source1.0”,可以是regularizedinasmallnumber(1~3)在例子演示下,我们对我们希望实现的“对话策略”有了很好的理解,比如反套路,用语料扔梗等等。因此,为了引导模型有针对性地学习如何与说谎者交谈,up主在提示示例的基础上加入了先验规则。而其中使用的示例语料就是前面提到的哔哩哔哩和贴吧的热门评论。其实原因很简单:1.评论是一种自然的对话形式,有明确的回复和回复者关系。2、自古评才,有些金句梗可以让人机对话不那么生硬。此外,为了让AI更“人性化”,up主还做了如下设计:设置每条消息的回复间隔,模拟真实打字速度,添加通用表情替换关键词(表情包暂未发布)支持)当对方在限定时间内发送多段文字时,微信会保持本轮对话,直到对方结束。这种情况下,对方的输入会被拼接成一句话再输入给AI,AI只会回复一次。最后,up主使用开源的wechaty框架在云端搭建后台,然后通过本地python脚本调用puppet服务,让AI无缝接入微信。只需登录预注册的微信账号,AI即可回复任意私聊或群聊。值得注意的是,框架的三个模块,server端、local端和model端,可以分别解耦迭代或替换。目前,这款破解防骗子的应用已经在Github上开源。项目地址:https://github.com/Turing-Project/AntiFraudChatBot核心:超大规模中国AI模型那么,up主搞出这个会耍骗子的AI的基础模型是什么?巧合的是,up主在浏览Github的时候,偶然发现了一个很有意思的项目——AI脚本查杀。这个AI在游戏中扮演的角色,不仅可以和其他玩家顺畅交流,甚至可以为了完成任务主动对人类玩家说谎。而这个项目使用了国内为数不多的开源(专注)预训练中文模型之一——“元1.0”。AI脚本杀:https://github.com/bigbrother666sh/shezhangbujianle当然,这里还有一个重点:《元1.0》的API接口不仅简单易用,而且免费使用。论文地址:https://arxiv.org/pdf/2110.04725.pdf简单介绍,“Source1.0”是浪潮于2021年9月发布的单一海量自然语言处理模型。与GPT-3模型的1750亿参数和570GB的训练数据集相比,“Source1.0”在参数规模上领先40%,在训练数据集规模上领先近10倍。单个模型参数数量达到2457亿,这意味着该模型具有更强的表达能力。训练数据达到5000G,基本涵盖了近5年中文互联网的所有优质文本知识。“元1.0”一经发布,便斩获全球最大的中文AI模型,获得中文理解基准CLUE榜单零样本学习和少样本学习类别冠军,同时也刷新了八项任务的最高准确率。此外,《元1.0》还在当时的中文语言能力理解和生成评价基准CUGE(智源指数)浓缩榜中名列前茅,实现了语言理解(章节级)、语言生成、对话交互、多语种、在包括数学推理在内的5项评估中取得最佳成绩。ZeroCLUE零样本学习榜单(2021年9月)FewCLUE小样本学习榜单(2021年9月)在算法、数据、算力、社区算法层面,注意力层和前端采用Transformer结构“source1.0”end优化了feed层的模型空间结构,改进了attention机制,专注于文章内部链接的学习。在数据层面,浪潮针对中国训练数据海量数据获取难、数据清洗难、缺乏统一的质量评估标准等现状,研发了自己的海量数据过滤系统(MassiveDataFilteringSystem,MDFS)。通过建立从数据采集、粗过滤、质量分类、精过滤的全自动化端到端数据工作流程,清洗了866TB海量数据,打造了业界最大的高达5TB的优质中文数据集获得。在算力效率方面,针对大规模模型训练中计算模式复杂、算力集群性能低的问题,“Source1.0”在大数据中采用了张量并行、流水线并行和数据并行的三维并行策略。规模分布式训练。同时,“元1.0”还首次提出了针对效率和精度优化的大规模模型结构协同设计方法,围绕深度学习框架、训练集群IO、通信进行了深度优化。在仅2x200G互连的情况下,算力效率达到45%,远超MT-NLG、GPT-3等国际知名模型,算力效率全球领先。此外,“元1.0”发布后,为开发者打造了一个开源开放的平台,开发不同领域的应用,不仅降低了人工智能开发的门槛,还有效提升了人工智能开发的效率。目前,“元1.0”开源平台汇集了近3000名开发者,诞生了很多有趣的应用,比如前面提到的AI脚本杀。网友评论说,凭借强大的基础模型,加上哔哩哔哩的支持和贴吧的热评,“小源”不仅口语流利,而且熟悉网络俚语,句句炸裂。以后和网友聊天的时候,非常有必要试一下对方是不是AI。难怪受过专业PUA培训的骗子上当受骗。毕竟公司的培训教材再强,还能比得上哔哩哔哩、贴吧这些人才济济的人才吗?对此,志辉先生表示,或许未来让骗子失业的是AI。另外,也有网友分享了自己从来没被抓到过杀猪锅的绝招,一个字——挑。“我们的朋友都挺好的,为什么要取钱?你不知道这样做会没有朋友吗?”四川共青团也在评论区进行了反诈骗宣传。用魔术打败“魔术”方法1月6日,在新智元与浪潮联合举办的AI反欺诈论坛上,“图灵猫”为我们详细讲解了上述AI大战“杀猪盘”的故事。现在你可能有点好奇,为什么“杀猪”的骗子没有意识到跟他们说话的人可能是一个AI呢?首先,“source1.0”模型本身就有非常大的知识储备,基于这个模型的知识储备,可以做一些更深层次的应用。例如,可以通过一些短词评论来训练和引导AI,使其更加拟人化。在这一点上,“小源”不同于那些频繁发表长篇演讲的长文AI。可以用短句和段落来表达,让聊天更日常。其次,在“杀猪盘”中,骗子对于不同的关键词都有一套逻辑。而我们可以让AI把这个逻辑反过来,给骗子准备一套词。当关键词被触发时,我们既可以直接观察并人工干预,也可以通过AI引诱骗子炫耀,从而帮助提高案件侦破效率。