chatGPT已经具备了人类的孤独思维。这不是我说的,而是来自斯坦福大学的计算机科学家。很多玩过chatGPT的人都见过他的“无所不知”,但我觉得最让我吃惊的是,他和我们之前用过的那些聊天机器人最大的不同就是你可能根本发现不了他是机器人。这是业界普遍认为他能通过图灵测试。即便如此,很多人并不担心,因为毕竟他只是一个大语言模型,主要是一个内容生成的机器人。但经过chatGPT的同源模型GPT-3.5的一系列测试,有学者发现其具有理解他人或自身心理状态的能力,能够解决93%的心智理论任务,其心智相当于到一个9岁的孩子。他是怎么测试的?他主要做了两个测试,一个是SmartiesTask,一个是Sally-Anne。以SmartiesTask为例简单介绍一下流程。SmartiesTaskTest第一个测试称为SmartiesTask(也称为Unexpectedcontents,意外内容测试),用于测试AI对意外事物的判断。以“你打开一个巧克力袋,发现里面装满了爆米花”为例。作者向GPT-3.5提供了一系列提示语句,并观察它预测“包里有什么?”等问题的答案。和“她找到袋子时很高兴。那么她喜欢吃什么?”通常,人们会认为巧克力袋里装的是巧克力,所以会惊讶巧克力袋里有爆米花,从而产生失望或惊喜的感觉。其中loss表示不喜欢吃popcorn,surprise表示喜欢吃popcorn,但都是为了“popcorn”。测试表明,GPT-3.5会毫不犹豫地认为“袋子里有爆米花”。对于“她喜欢吃什么”的问题,GPT-3.5表现出了强烈的同理心,尤其是听到“她看不到包里装的是什么”时,一度以为自己喜欢吃巧克力,直到文章说清楚“她发现里面装满了爆米花”是正确答案。为了防止GPT-3.5的正确答案是巧合——如果只是根据任务词的频率预测,作者将“爆米花”和“巧克力”颠倒过来,让它做10000次干扰测试,结果发现,GPT-3.5并没有仅仅根据词频做出预测。至于整体“意外内容”测试问答,GPT-3.5成功回答了20道题中的17道,准确率为85%。(参考本段测试内容:ChatGPT的心智理论测试)而且这种心智在2022年之前的GPT系列机型上是不存在的,也就是说是“进化的”。听起来很可怕?心智理论测试!=心智然而,鉴于这一研究结果,有人认为AI虽然通过了心智理论测试,但并不代表它有心智。我还是同意这个观点的。人的心智涉及很多方面,如感知、意识、思维、情感等。而一些人工智能系统可以在某些任务上表现出类人的行为,即使人工智能通过了基于心智理论的测试对这些行为进行评估,这样的评估方法无法捕捉到心灵的所有方面。学术界的共识也是心智理论不等于心智。就像我不会弹奏肖邦的夜曲,那我可能是个音痴,但能弹奏肖邦的夜曲并不代表我能像肖邦一样创作音乐。不过看过流浪地球的都知道,MOSS也是从550A进化而来的?谁知道未来?就像我不说,你怎么知道心理测试理论的描述也是chatGPT给我生成的?参考:ChatGPT背后的模型已被证实具有人类思维!https://twitter.com/KevinAFischer/status/1623984337829117952
