当前位置: 首页 > 科技观察

AI人工智能只需要6秒就可以通过听你的声音来描述你的外貌

时间:2023-03-18 15:51:49 科技观察

你相信吗?AI人工智能最近已经进化到只需要6秒就能听到你的声音,可以说出你的性别,除了年龄和种族,甚至可以描述你的外貌。这个由麻省理工学院(MIT)打造的AI,使用由数百万个电影片段组成的数据集,在一个名为Speech2Face的神经网络模型上对自己进行训练,网络操作大致分为两部分,一个是语音编码器,主要负责对输入的语音进行分析,预测相关的面部特征;另一个是人脸解码器,主要负责人脸特征的输入。整合并生成图像。从最终结果来看,通过声音还原人脸只用了6秒,效果令人满意。研究团队表示,他们的目的并不是准确还原说话人的外貌,Speech2Face模型主要是研究语音与外貌之间的相关性。目前,Speech2Face已经可以识别性别,可以轻松区分白种人和亚洲人。在年龄部分,30、40、70岁年龄段的语音点击率会更高。除了基本的性别、年龄和种族,Speech2Face还可以猜测一些面部特征,比如鼻子结构、唇厚和形状、咬合等,还可以猜测大概的面部骨架,基本上是语音输入的时间。时间越长,这个AI的准确率就越高;不过,研究人员也承认,人工智能的听觉也会出错。有判断错误的时候,甚至是年龄错误的时候。研究人员表示,Speech2Face之所以存在局限性,部分原因在于数据集中说话人的种族多样性并不丰富,因此在识别不同种族人的声音方面能力相对较弱。然而,一些人认为这项技术背后隐藏的隐私和歧视令人担忧;他们认为,虽然这是一项纯粹的学术调查,但面部信息的潜在敏感性是一个需要进一步讨论的道德因素。这应该经过严格的技术测试,并确保实际数据代表预期的用户群。