麻省理工学院的研究人员最近开发了一种神经网络,可以以相对较高的准确度诊断个体患有认知功能障碍的概率并做出预测。
所以在某种程度上,我们可以把它理解为抑郁症检测器。
当然,这并不准确,我们稍后会更详细地探讨。
由麻省理工学院研究人员 Tuka Alhanai、Mohammad Ghassemi 和 James Glass 组成的研究小组在 Interspeech 会议上展示了他们的工作成果。
根据该论文,他们开发了一种上下文无关的方法,使机器能够分析一个人的文本或音频表达,以检测该人的抑郁评分。
最关键的当然是这个人工智能解决方案的“无情境”因素。
一般来说,治疗师会结合经过验证的问题和直接观察来共同诊断一个人的心理健康状况,例如抑郁症。
麻省理工学院团队表示,他们的人工智能无需条件问题或直接观察即可实现类似的结果。
换句话说,它不需要上下文信息,只需要数据。
以下是该团队发表的论文的部分内容:麻省理工学院的研究人员详细描述了一种神经网络模型,该模型可以通过采访分析原始文本和音频数据,以发现可能表明抑郁症的因素。
表达模式。
给定一个新话题,它可以准确预测相关个体是否压抑情绪,而不需要任何其他相关问答信息。
那么,这是检测还是预测?虽然看似无关,但检测和预测实际上是完全不同的两件事。
预测一个人是否容易患抑郁症的算法只是代表标记的数据,这些数据将提交给治疗师进行进一步审查。
然而,抑郁症的检测要求其给出的确定性结果确实与目标个体的心理状态一致。
当然,研究人员也意识到了这一点。
论文第一作者图卡·阿尔哈奈(Tuka Alhanai)表示,“这不是针对抑郁症的测试,而是根据言语中常见的信号对个体的认知障碍进行一定程度的评估。
”幸运的是,他们似乎在明确强调这是一个预测,而不是一个测试。
但正是这种微小的差异使得这项工作本质上很可怕。
为了测试这种人工智能方法,研究人员进行了一项实验,其中由人类控制的虚拟代理提出一系列问题来筛查受试者是否患有抑郁症。
AI事先不知道问题内容,??受访者可以以任何形式自由回答。
问题的格式不是单选,AI需要从言语线索中识别抑郁症。
在这项研究中,参与者的回答将以文本和音频格式记录。
在文本版本中,人工智能在大约 7 个问答序列后就能够预测抑郁症。
但有趣的是,在音频版本中,AI 需要大约 30 个序列才能做出决定。
据研究人员称,其平均准确率达到惊人的 77%。
有什么问题?显然,我相信任何能够接受医生直接治疗的患者都不会选择这种预测方法。
在办公室观察患者的治疗师显然相信他们的诊断能力远远超过算法。
这种人工智能解决方案与使用图像来识别/检测癌症不同。
人类医生可以通过医学成像发现并切除癌症(在大多数情况下),但无法以同样的方式验证人工智能对抑郁症的诊断。
从理论上讲,当计算机和人类听相同的对话并最终得到完全相反的抑郁症诊断时,我们如何判断对话的真实性?或者,如果有人愿意,当计算机检测到一个人潜在的抑郁症迹象时,我们是否应该做同样的检查以确保医生的非抑郁症诊断是准确的?在这样的情况下,自动化机制存在的意义何在?更重要的是,当这种“抑郁探测器”被医疗专业人员以外的人使用时,会产生什么后果?论文中的一些表述似乎证明这些算法确实是为了麻省理工学院实验环境之外的实际应用而开发的:抑郁症患者会被消极和悲伤的情绪困扰多年。
要治疗抑郁症患者,必须首先对其进行诊断。
为了获得诊断,受试者必须主动联系心理健康专家。
事实上,由于行动不便、费用和动机等因素,抑郁症患者可能得不到应有的专业关注。
在这种情况下,人工智能解决方案提供的对人类交流内容的自动检测将解决这些局限性,并提供更好的抑郁症筛查服务。
对人类通信的自动监控似乎代表着噩梦般的反乌托邦未来。
我们可以想象,人们将在不知不觉中面临一系列问答序列,他们的心理健康状况将由机器进行评估。
我相信大多数人都会意识到,在未经同意的情况下使用神经网络等黑匣子进行心理健康评估从来都不是一个好主意。
想象一下,如果企业在面试时使用“抑郁检测器”等人工智能解决方案来测试你的心理状态,或者律师在儿童监护案件中使用算法解读你的陈述,会造成什么可怕的后果?影响。
更糟糕的是,我们甚至可以想到警察局使用人工智能黑匣子来监控嫌疑人在审讯过程中的精神状态。
毕竟,世界各地的执法机构需要投入大量资金和宝贵的时间来对嫌疑人进行心理分析,而人工智能据说能够更好地“探测”对方的情绪状态。
可以想象,如果全面推广,这种解决方案最终会进入审讯室、就业面试和其他不可预测的环境。
我们永远不应该被人工智能的判断所左右:机器完全没有办法检测我们是同性恋、有罪还是抑郁,它们只是做出猜测。
作为人类,我们应该非常谨慎地使用这种猜测。