如今,除了文字之外,人们还经常使用各种图像进行在线交流。
就像Facebook这样一个月活跃用户超过20亿的社交平台,每天都会出现大量的图片和表情包。
如何避免用户在屏幕前看到或发布不恰当的表情、图片或视频?通过言论违反在线内容政策怎么办? Facebook 创建并部署了一个名为 Rosetta 的人工智能机器学习系统来解决这个问题。
Facebook独立开发的技术使用光学字符识别系统来定期处理大量内容。
在Facebook的社交网络上,Rosetta每天从超过10亿张图像和视频帧中实时提取文本,并且可以识别多种语言。
Facebook 在一篇博客文章中描述了 Rosetta 的工作原理:它首先检测图像中可能包含文本的矩形区域,然后使用卷积神经网络来识别和转录其中的文本内容,甚至可以使用诸如阿拉伯语和印地语。
此类非英语单词或带有非拉丁字母的文本也可以被识别。
为了更好地实现识别功能,Facebook 使用混合人机注释的公共图像对 Rosetta 进行了训练。
Facebook 和 Instagram 的多个团队已经在使用 Rosetta 来处理大量内容并管理平台的内容审核,并且该公司计划继续增加 Rosetta 可以阅读的语言数量,使其能够更高效地从其中提取文本。
视频帧。