当前位置: 首页 > 科技观察

人工智能取得重大突破,实现了意识识别

时间:2023-03-12 20:40:47 科技观察

参与者在说出50个句子时将收集他们的神经活动。机器学习算法可以预测收集到的数据的含义。系统的准确性各不相同,但结果令人鼓舞。这只是一个开始,但它非常令人兴奋:一个将大脑活动转化为文本的系统。对于那些无法说话的人,例如患有闭锁综合症的人,这将改变他们的生活。现在,这有点像透过迷雾看东西,但加州大学旧金山分校Chang实验室的研究人员已经训练了一种机器学习算法,可以从神经元数据中提取意义。“我们还没有做到这一点,但我们认为这可能是语音修复学的基础,”该研究的合著者约瑟夫·马金发表在《自然神经科学》杂志上。为了训练他们的人工智能,Makin和合著者EdwardF.Chang试听了四名参与者的神经活动。作为癫痫患者,每个参与者都植入了脑电极以监测癫痫发作。向参与者提供了50个句子,让他们至少朗读三遍。正如他们所做的那样,研究人员收集了神经数据。(还录制了一段录音。)该研究列出了参与者引用的一些句子,包括:“那些音乐家和谐地融合在一起。”十颗珠宝。”“厨房里乱七八糟。”该算法的任务是分析收集到的神经数据并预测何时生成这些数据。(与参与者录音中捕获的非语言声音相关的数据首先被丢弃。)研究人员的算法很快学会了预测与神经数据块相关的词。AI预测当说“alittlebirdiswatchingthemotion”时生成的数据将意味着“thatlittlebirdiswatchingthemotion”非常接近,而“savethecat”和带梯子的人”被预测,例如,“将使用哪个梯子来拯救猫和人。”准确度因参与者而异。Makin和Chang发现,基于一个参与者的算法在训练另一个参与者时处于领先地位,这表明人工智能训练可以随着时间的推移变得更容易和重复使用。卫报采访了专家克里斯蒂安赫夫,他发现该系统令人印象深刻,因为它为每个参与者使用了不到40分钟的训练数据t,与其他从神经网络学习的尝试相比。从数据中提取文本所需的大量时间。“通过这样做,他们可以达到迄今为止尚未达到的精度水平,”他说。之前从神经活动中提取语音的尝试都集中在构建语音的音素上,而Makin和Chang则专注于整个单词。虽然单词的数量肯定多于音素,因此这带来了更大的挑战,“连续语音中任何给定音素的产生都受到其前身的强烈影响,从而降低了其可区分性,”该研究称。为了尽量减少基于单词的方法的难度,口语句子总共使用了250个单词。显然,还有改进的余地。AI还预测“那些音乐家有大和声”是“菠菜是个有名的歌手”。“她穿着温暖的羊毛羊毛工作服”被误认为“绿洲是海市蜃楼”。“那些小偷偷了三十颗珠宝”被误解为“鹅妈妈在哪个剧院放映”,而算法预测的数据“厨房里乱七八糟”的意思是“帮他偷了饼干”。当然,这项研究涉及的词汇是有限的,句子示例也是如此。“如果你尝试超过[50个句子],解码会变得更糟,”Makin指出。另一个明显的警告来自于这样一个事实,即人工智能是根据每个参与者大声说出的句子进行训练的。是的,这对于被封锁的患者来说是不可能的。不过,Makin和Chang的研究仍然令人鼓舞。对于其中一位参与者的预测,只需要进行3%的小幅修正。这实际上比人类转录中发现的5%错误率要好。