当前位置: 首页 > 科技观察

MIT新研究表明机器学习不能标记假新闻

时间:2023-03-12 14:14:09 科技观察

麻省理工学院的新研究表明机器学习无法标记假新闻在各种研究人员表明计算机可以在没有太多人工监督的情况下令人信服地生成虚构新闻故事之后,一些专家希望可以训练基于相同机器学习的系统来检测此类新闻。但麻省理工学院博士生TalSchuster的研究表明,虽然机器学习模型擅长检测机器生成的文本,但它们无法识别故事的真假。许多自动事实核查系统都是使用称为事实提取和验证(FEVER)的真实陈述数据库进行训练的。在一项研究中,Schuster和他的团队表明,即使他们知道正面陈述是真实的(“Greg说他的车是蓝色的”),机器学习事实核查系统也难以应对负面陈述(“Greg从未说过他的车不是蓝色的”蓝色”)研究人员说,问题在于数据库充满了人为偏见。创建FEVER的人倾向于将他们的错误条目写成负面陈述,将他们的真实陈述写成正面陈述——因此计算机学会了将带有负面陈述的句子评定为错误。这意味着该系统正在解决比检测假新闻更容易的问题。“如果你为自己设定一个简单的目标,你就可以实现那个目标。但是,它仍然不允许你将假新闻与真实新闻区分开来,”麻省理工学院教授ReginaBarzilay说。这两项研究均由Schuster领导,并由麻省理工学院的一组合作者完成。底线:第二项研究表明,机器学习系统可以很好地检测机器编写的故事,但无法区分真假故事。