谷歌推机器学习标注图片中物体界面,整体速度提升3倍操作人员快速标注图片中物体的轮廓和标签,整体标注速度最高提升3倍。由于基于深度学习的现代计算机视觉模型的性能取决于标记训练数据的数量,因此更大的数据库将使机器学习性能更好。谷歌在多项深度学习研究中多次提到,获取高质量的训练数据并不容易,这个问题已经成为计算机视觉发展的一大瓶颈。识别基础的工作尤其如此。传统的方法需要用户手动使用标记工具圈出图片中物体的边界。Google提到使用COCO加上Stuff数据集,标记一张图片需要19分钟,标记整个数据集需要53000小时,太耗时了。效率不高。因此,谷歌探索了一种新的训练数据标注方法——FluidAnnotation,可以利用机器学习帮助用户快速找到图像对象轮廓上的标签。流体标注从强语义分割模型的输出开始。用户可以使用自然的用户界面在机器学习的帮助下进行编辑和修改。无法明确识别的部分。为了给图片打标签,谷歌用大约一千张带有分类标签和信任分数的图片预训练了语义分割模型(Mask-RCNN),初始标签中可以使用置信度最高的片段(Segment)。流体标签可以生成一个简短的列表,用户可以通过点击快速标记对象,用户还可以添加范围标记来覆盖未检测到的对象,并通过滚动形状选择最佳的。此外,除了可以添加之外,还可以删除已有的对象标记或更改对象的深度顺序。当前阶段的流体标记旨在使图像更快、更容易,将整体数据集标记速度提高三倍。接下来,谷歌将改进对象边界标记,并以更多的人工智能加速界面操作,并扩展界面以处理目前无法识别的类别。
