当前位置: 首页 > 科技观察

AI读心术:电脑是如何还原脑电波的?

时间:2023-03-13 07:47:24 科技观察

图片来源:视觉中国“我的身体像潜水钟一样沉重,但我的心渴望像蝴蝶一样自由飞翔。”这句台词出自电影《潜水钟与蝴蝶》,也是《ELLE》杂志前主编兼记者JeanDominique的真实经历。在中风瘫痪后,让·多米尼克失去了身体的语言和运动功能。他不能自己说话也不能呼吸,只有一只眼睛和意识可以自由活动。在这种情况下,他还是“写”了一本散文集。这本书是这样完成的:助理把给让·多米尼克的信一封一封读完,直到他眨眼,然后记下这封信……以此类推,直到这些字母形成单词、句子、片段,最后打印成一本书。显然,这个恢复思维的过程是非常艰巨和原始的,但至少为他的灵魂留下了一丝自由遨游的可能。对于更多缺乏发声能力的普通人(如中风患者、植物人等),无法与正常人交流,生活停滞不前。科技能否帮助他们“说出不能说的话”,提高生活质量?答案是肯定的。科学家们正试图自动“揭示”那些看不见摸不着的思维活动。通过电脑,将大脑中的思想转化为声音,说出来。这种“读心术”离现实有多远?《潜水钟与蝴蝶》(2007)剧照AI读心术:电脑是如何还原脑电波的?我们先泼一盆冷水,就是要把人们想象中的词句转化为言语。现在的电脑还做不到这么精湛的做工。然而,一些研究人员已经成功地使用AI来恢复人们听到或说话时声音很小的句子。该技术的实现原理并不复杂。人的发声运动是由大脑神经元的电信号刺激下颌骨、嘴唇、声带等部位形成的。因此,只要将相关大脑区域的神经运动信号发送给AI系统,深度学习网络就会将信号与相应的语言或嘴巴运动逐层匹配,推断出具体说了什么,然后语音合成器将这些信号转换成可听语音。那么这项技术的可靠性如何?哥伦比亚大学计算机科学家NimaMesgarani进行了一项实验,让听众“聆听”一组与故事和数字相关的听觉皮层数据,其中75%的人能够正确识别数字。加州大学旧金山分校的研究小组也成功进行了类似的实验。在深度学习网络的帮助下,癫痫患者大声朗读句子的大脑活动被记录下来并重构为书面句子。结果显示,AI复述的句子有80%是正确的。既然将神经信号翻译成书面语言已被证明可行,下一步就是走出实验室,真正帮助失声者“说出自己的想法”。麻省理工学院的研究人员开发了一种植入式智能增强设备,由可穿戴设备和相关计算系统组成。设备中的电极拦截由内部语音触发的下巴和面部肌肉运动,这些运动被反馈到机器学习系统,该系统将神经信号与特定单词相关联。用户还可以使用骨传导耳机,通过面部振动将外部信息传递到内耳,无需中端对话。目前,根据观众定制的可穿戴设备,平均转录识别准确率达到92%以上!如果说还属于辅助医疗的范畴,倒是有点开放这里的迹象。比如在象棋比赛中,如果棋手戴上这样一副耳机,岂不是可以在不被察觉的情况下“听”电脑的走棋?麻省理工学院媒体实验室流体界面组研究员ArnavKapur在AlterEgo项目中展示了一台可以“读心术”的脑机:脑-脑交流能否成为现实?用AI读取脑电波,这项技术不仅看起来很酷,更重要的是应用空间巨大。从理论上讲,不依赖生物发声器官就可以达到交流的目的,这为医疗、工业、刑侦等领域带来了新的交互可能。例如:1.为失音患者提供声音。人类一旦中风、脑外伤、脊髓损伤或美国手语运动神经元病(史蒂芬霍金是美国手语患者),大脑就无法直接刺激语言的产生,患者只能在沉默中死去。如果将来应用大脑语音合成器,帮助失音患者恢复语言功能,对他们的治疗和生活都有很大的帮助。2.特殊环境下的工作协助。并不是所有的工作环境都能保证正常分贝下的语言交流,比如机场的喷气噪音、航母的驾驶舱、发电厂或印刷厂的车间、佩戴防护装备的实验室等,要么声音太大,要么声音太大静音,很容易错过关键信息。在这种特殊环境下,脑音转写技术可以有效解决沟通不畅的问题,聋哑残疾员工也可以与他人无障碍交流。3.从重建听觉到重建视觉。除了转录文本和语音,类似的AI神经网络也可以被训练来恢复模糊图像,比如恢复记忆中的人脸,可以用于刑侦破案。4.用思想操作假肢。佩戴语音转录装置后,截肢/截瘫患者仅凭思维??就能自由控制假肢装置,这显然比语音命令更容易接受。5.高度自动化的智能助手。这款脑机接口设备更大的作用在于,它可以直接根据人的内心想法完成各种任务,比如控制灯光、做读书笔记、发布VR游戏指令,甚至可以用来控制车辆。日产已经有一款类似的耳机可以监测司机的脑电波。例如,一旦检测到驾驶员有踩刹车的意图,该装置会在驾驶员做出制动动作之前开始制动,反应时间比手动操作快半秒之多。就连Facebook也推出了一个读心术项目,研究如何让用户用脑电波发送FacebookMessenger信息。总而言之,这项富有想象力的技术解决了一个长期存在的问题:如何将无形的意识转化为有形的信号,让人类从身体“潜水钟”的限制中喘口气。但说实话,虽然技术在慢慢成熟,但要在现实中实现华丽的理想,还有很长的路要走。不可阻挡的科技之翼尽管学界和商界对这种“读心术”趋之若鹜,但在实际应用中,这种语言转录的脑机接口还存在诸多隐患需要一一解决。1.植入难度太大。技术推广最直接的障碍是,为了获得准确的实验数据,受试者必须通过开颅手术将电极植入大脑的相关区域。侵入性溶液大大降低了参与实验的积极性,在实际应用中,还会给植入者带来排斥、感染等不可预知的风险。2、词汇资料不足。脑电波-语音转录效应依赖于大规模的词汇量,但每个参与者对同一种语言的神经元映射不同,因此AI系统学习和推断的结果很难具有泛化能力。转录的准确性只能通过为不同参与者定制独特的思维语料库来保证,难以大规模普及。3.商业化问题。设备植入的难度和系统定制化带来的大量门槛,决定了它只能在极少数的应用群体中发挥作用,比如少数危重症患者和一些狂热的极客。4.道德困境。即便补齐了装备和制度的短板,也没有几个人愿意在公共场合穿着这样的一套装备,别人很难不觉得被冒犯。这有点像谷歌眼镜刚出来的时候,只有设备,却没有相应的行为准则,导致很多人担心和质疑其是否侵犯隐私。同样,脑电波“读心术”究竟会带来隐私还是另一种不公平,恐怕还需要大量的社会学研究来支撑。总而言之,虽然“AI读心术”很容易让人感受到它的社会价值和商业潜力,但在应用中显然还存在不少问题。如果你想和你的大脑交流,至少还有几十年的时间。走。它给我们带来的更多,或许是一种高度可行的解决问题的思路。如果人体注定要像潜水钟一样慢慢沉入深海,至少可以让“思考”的蝴蝶有片刻的自由。