去年,一对美国夫妇(Steven和AndreaFrank)开发了一个人工智能程序来帮助专家识别艺术品。此前,他们使用这个人工智能程序来识别伦勃朗和梵高的画作。最近,两人又把目光投向了达芬奇的画《救世主》(救世主)。这幅画是拍卖市场上有史以来最昂贵的艺术品。2017年在纽约佳士得夜拍以4.5亿美元(约合人民币29亿元)成交。不过,这是否真的是达芬奇所画,仍有疑问。使用CNN检测艺术品伪造:从解决问题开始夫妻俩开发AI程序的过程可谓一清二楚,发现问题,解决问题。首先,他们分析了使用神经网络分析绘画的难度。一个是尺寸,一张高分辨率的画作图像对于传统的CNN来说太大了,而适合CNN的图像可能缺乏区分所需的信息。二是数据。神经网络需要数千个训练样本。“数量就是质量。”然而,即使是最多产的艺术家,也无法在一生中画出这么多画作。意识到困难后,两人感叹道:“难怪电脑对解决画作的归属纠纷贡献甚微。”放弃是不可能的!Steven很快发现这些图像可以像病理学家处理数字活检切片的方式一样被分解成更小的片段。这样就解决了size和data这两个难点。因为单个图像可以生成大量训练块,尤其是当这些块可以重叠时。此外,他们的系统可以在训练和测试后确定瓷砖的最佳尺寸。Rembrandt《年轻的绅士肖像》的400×400像素图块接下来,确定哪些图块可以使用。这也是一个难题。比如《救世主》的部分区域图像信息非常丰富,而部分区域只是背景,不起眼,难以区分。在训练CNN时,信息较少的区域可能起不到作用,甚至可能误导CNN。因此,计算机需要某种标准来帮助自动且一致地识别可行的图块。经过一番思考,史蒂文受到了信息论的启发。他发现在选择背景和视觉单调区域时可以排除低熵块。信息论的创始人克劳德·香农发现,计算机挑选的牌很可能与人自己挑选的牌相匹配。《救世主》中,选用的方块有耶稣的脸、侧卷、祝福的手,这与学者争论作者身份时的关注点是一致的。一旦解决了这个问题,就该数据集了。他们决定开始尝试荷兰大师伦勃朗的肖像画。这个数据集应该包括伦勃朗本人和其他人的画作。然而,问题又来了。如果你拿50张伦勃朗的肖像和50张随机选择的其他艺术家的肖像,经过训练的系统可以区分伦勃朗和毕加索(两者风格截然不同),但很难区分他的学生和模仿者制造者,更不用说伪造者了。但是,如果在训练集中,所有不是伦勃朗画的作品都与他自己的画太相似,CNN就会过拟合。这时候安德莉亚上台了,她整理了一个非伦勃朗画作的数据集。其中,有的作品与伦勃朗本人的作品非常接近,有的作品让人联想到伦勃朗,但又很容易与他自己的作品区分开来。他们还发现简单的CNN设计比更复杂(和更常见)的设计表现更好。因此,他们使用的CNN只有五层。在一次区分伦勃朗画作的实验中,准确率超过90%。在区分文森特·梵高的风景画时准确率也非常高。完成这一系列的工作后,两人用这个AI系统来识别《救世主》。因为,这是一个更大的挑战,达芬奇现存的画作数量实在是太少了,不到20幅,还有一些还是未完成的素描……不过最后,他们得到了一个合理的瓦片分类,而且是一个很有说服力的概率情节产生了。原来画的背景和祝福的手都有嫌疑。这与专家的意见是一致的。这幅画已被广泛修复,包括对背景进行了全面的重新粉刷。另外,专家们对谁画了祝福之手意见不一。至于CNN究竟是如何找到关键细节的,史蒂文表示自己也不知道。“CNN的中间部分是一系列的卷积层,可以逐渐分解图像的细节,然后以某种不可思议的方式对其进行分类。”夫妻二人共同创建CNN。令人惊讶的是,Steven并不是计算机科学家,而是MorganLewis的律师IntellectualPropertyAttorneyatMorganLewis。2012年,在EdX上完成IntroductoryElectronics后,他发现自己爱上了这些在线课程,而且停不下来!随后,他通过在线学习获得了哥伦比亚大学的人工智能研究生证书。他的妻子安德里亚(Andrea)是一位艺术史学家,致力于策划艺术形象,目前正在考虑退休。史蒂文指出,科学测量可以确定一幅画的年代和细节,但不能直接确定其创作者,因为它需要准确判断风格和技巧。然而,计算机分析非常适合这项判断任务。特别是神经网络,擅长检测模式的计算机算法。目前CNN已经得到广泛应用,包括人脸识别、辅助自动驾驶等。那么为什么不使用CNN来解决更多现实世界的问题呢?因此,两人共同完成了“使用CNN检测艺术品伪造”的项目,并将他们的AI系统命名为“TheA-Eye”。
