ChatGPT最近以其强大的功能风靡网络,起草法律合同,写小说,甚至为你编程。但这些似乎是人类在测试AI,那么ChatGPT能否从与人类的对话中获取一些有用的信息呢?但事实证明,ChatGPT的技术确实可以做一些事情,比如帮助检测阿尔茨海默病的早期症状。根据德雷克塞尔生物医学工程大学的一项研究,阿尔茨海默病(通常称为“老年痴呆症”)最常见和最明显的症状之一是语言问题,例如语法错误、停顿、重复或忘记单词的意思在费城。研究发现,ChatGPT可以通过与人类的对话发现是否存在此类症状,从而及时提示患病风险。论文地址:https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000168使用ChatGPT检测早期阿尔茨海默病,准确率达80%早期发现阿尔茨海默病可显着改善治疗选择,并让患者有时间改变生活方式,从而减缓疾病进展。诊断这种疾病通常需要脑部成像或长时间的认知评估,但这可能既昂贵又耗时,因此不适合广泛筛查。费城德雷克塞尔生物医学工程大学教授梁说,随着人工智能技术的发展,自动语音分析是早期检测阿尔茨海默氏症的一种很有前途的途径,阿尔茨海默氏症是该病最常见和最明显的症状之一。正是语言问题,如语法错误、停顿、重复或遗忘的单词,导致人们越来越关注使用机器学习来发现人们说话方式中疾病的早期迹象。“我们希望我们可以使用机器学习来获取这些信号,从而使我们能够进行早期诊断。”通常,这种技术依赖于专门构建的模型,但梁和他的同事们想看看他们是否可以重新利用ChatGPT背后的技术——OpenAI的大规模语言模型GPT-3——来发现阿尔茨海默氏症的迹象。他们发现ChatGPT确实可以以80%的准确率区分来自阿尔茨海默氏症患者和健康志愿者的录音。“像GPT-3这样的大型语言模型非常强大,它们可以发现这些细微的差异,”Liang说。“如果研究对象有某种问题[涉及]阿尔茨海默氏症,并且该问题已经反映在语言中,我们希望能够使用机器学习来获取这些信号,从而使我们能够做出早期诊断。研究人员测试了从健康志愿者和阿尔茨海默病患者身上获取的237段录音,这些录音使用预训练的语音识别模型转换为文本。为了从GPT-3获得帮助,研究人员利用了其鲜为人知的功能之一。它的API可以将一段文本输入模型并让模型输出“嵌入”——一段文本的数字表示,对其含义进行编码,可用于评估其与其他文本的相似性。尽管大多数机器学习模型都处理“嵌入”,但GPT-3的一个新特性是它足够强大,可以为整个段落生成“嵌入”。并且由于模型的巨大规模和用于训练它的海量数据,它能够生成非常丰富的文本表示。研究人员利用这种能力为阿尔茨海默病患者和健康个体的所有转录本创建“嵌入”。然后,他们选择这些“嵌入”,组合标签以指示它们来自哪个组,并使用它们来训练机器学习分类器以区分两个组。Fine-tuning其实是降低了准确率,以后还有工作要做。根据《公共科学图书馆 · 数字健康》杂志报道的一篇论文,当Thebestclassifier在unseentranscripts上进行测试时,准确率达到了80.3%。这明显好于研究人员采用的更传统的语音数据方法所达到的74.6%,后者依赖于声学特征,而这些特征必须由专家仔细识别。他们还将他们的技术与几种使用大型语言模型的尖端机器学习方法进行了比较,这些方法还包括使用一些文本来微调模型的额外步骤。有趣的是,当研究人员尝试微调时,GPT-3的性能实际上下降了。这似乎有悖常理,但Liang指出,这可能是由于用于训练GPT-3的大量数据与可用于微调的少量特定领域训练数据之间存在大小不匹配。多伦多大学计算机科学副教授FrankRudzicz表示,虽然该研究小组确实取得了最先进的成果,但依靠私有模型进行此类研究确实会造成损失。“这些封闭的API受到限制,部分原因是我们无法检查或深入修改这些模型的内部结构,或进行更完整的实验来帮助阐明我们需要避免或纠正的内容,”他说。潜在的错误来源。梁对这种方法的局限性也持开放态度。他说,该模型远不够准确,无法正确诊断阿尔茨海默氏症,该技术在现实世界中的任何部署都将作为初步筛查步骤,旨在引导人们去找专家进行全面的医学评估。与许多基于AI的方法一样,当模型检测到阿尔茨海默氏症时,可能很难确切知道模型检测到了什么,这对医务人员来说可能是个问题。“医生很自然地会问你为什么会得到这些结果,”梁说。“他们想知道哪些功能真正重要。”尽管如此,梁还是看到了这种方法的巨大前景,他和他的同事们正计划开发一款可以在家里或医生办公室使用的应用程序,以简化疾病筛查。相关报道:https://spectrum.ieee.org/gpt-3-ai-chat-alzheimershttps://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000168
