当前位置: 首页 > 科技观察

论文图片误用?AI:这条路已被我堵死了

时间:2023-03-20 16:06:26 科技观察

纸张图像滥用?AI:这条路被我挡住了。现在AI已经开始参与论文的打假了!就像这样,人眼可能无法识别旋转、拉伸和缩放的图片,但AI可以看到数百个相似的特征:完整的图像到自己的图像,一眼就能分辨出来:对于AI来说,这可能是一个可以秒级识别的工作,即使是一张完整的图像复杂的论文,也只需要几个小时。2分钟。但是对于人眼来说并不是那么简单。例如,著名的学术造假者ElisabethBik花了整整两年的时间,在不同的论文中寻找使用同一张图片的不同实验结果的例子。对于出版商而言,发表与撤稿之间的损失更大……因此,近年来AI造假者越来越频繁地被引入论文评审,尤其是图像问题。例如,自今年1月以来,全球最大、历史最悠久的癌症研究专业协会美国癌症协会(AACR)开始使用AI软件审查其期刊文章中的图片篡改或重复。官网上也有说明:投稿中的所有图片都需要经过AI软件筛选。不仅是AACR,世界第五大出版商SAGE,老牌经典医学期刊JCI、JCIInsight都用过这种方法。自动图像校对这些期刊和出版商使用以色列公司Proofig开发的同名软件。Proofig软件基于AI技术和图像处理技术,适用于各种科学手稿中的图像,包括所有类型的显微照片(光学、电学、共聚焦)、载玻片、Westernblot、体内和体外图像、植物图像等。该软件识别论文中的图像,然后提取它们共有的特征进行比较。这些“共同特征”包括图像整体的缩放或旋转、部分重复或重叠以及方向上的一些差异。此外,该软件还可以额外检测一些问题,例如压缩伪影或将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。一张普通的试卷,一般不到2分钟就可以查完,最多不超过10分钟。对于许多出版商而言,学术不端行为(例如已发表的科学手稿中的图像剽窃)平均每篇文章要花费数百万美元,从调查和撤回到随后的法律费用。因此,许多出版商愿意引入具有成本效益的AI与人工审核团队一起工作。AACR的一位期刊运营总监说:许多作者也乐于在出版前注意到一些“无意的”图像复制错误。对我们来说,严谨的数据是我们期刊的显着标志,所以这个(Proofig)绝对值得投入时间和金钱。出版商联合起来在科学手稿中复制或剽窃图像的情况并不少见。2016年,Nature的一篇文章对约2万篇生物医学论文进行了人工分析,发现其中4%的论文可能存在上述问题。通常每年只有1%的手稿得到更正,因此被撤回的文章较少。因此,去年5月,包括荷兰出版巨头Elsevier、Wiley、SpringerNature和Taylor&Francis在内的一群出版商联合起来组成一个小组来解决论文中的图像问题。Elsevier表示,该小组的最终目标是“创造一个能够帮助我们自动识别图像变化的环境”。也有很多出版商试图自己解决这个问题,比如瑞士出版商Frontiers,它开发了自己的论文图像检查软件,作为自动检查系统AIRA的一部分。Frontiers的一位女发言人表示,该软件自2020年8月以来一直在使用,大多数被标记的论文都没有问题,只有大约10%需要人工审查团队跟进。而一些尚未引入AI手段的出版商也对这种方式表示了质疑:在可靠性方面,AI检查还没有大规模投入使用。比如Elsevier的软件,目前进度还在“测试中”,只对部分期刊开放。在成本方面,AI软件偶发的“误杀”仍然需要人工参与,甚至可能引发其他纠纷。不过,这个问题是从另一个角度提出来的:如果所有论文都是开放获取的,那么图像滥用/复制问题将更容易审查,训练AI也会更有效率。