本文介绍了5个很棒的标注工具,希望能帮助您创建计算机视觉数据集。如果你是计算机视觉领域的数据科学家,你可能也会意识到你需要一个快速简单的标注工具,而原因至少是以下两个原因之一:PoC(译者注:ProofofConcept)或者研发实验需要创建数据集以保证数据质量,使其不会影响深度学习算法的性能很棒的工具列表:列表一、列表二、列表三,或查看此博客)。我花了相当多的时间比较了最有前途(和活跃)的项目,发现这些工具中的大多数只能实现以下三个设计目标之一:1.如果你想在注释行业创业,你需要一个。高级项目管理功能b.足够的特征来完成任何标记任务c。提高效率的自动化工具2.如果你属于一家创业公司,你可能需要:a.API,或者至少是标签工具连接到私有API的简单方法b。直观的用户体验(UX)使您临时雇用的每个注释者都可以立即开始工作3.如果您只是为自己工作,您:a.不关心API或项目Adminb。只想尽快开始标记!下面列出了我最喜欢的工具,这些工具允许为计算机视觉应用程序标注边界框(用于对象检测任务)和多边形框(用于分割任务)。如果您发现这些工具不起作用,请尝试在Chrome中运行它们。计算机视觉标注基础知识简述【可选】在计算机视觉中,训练算法的数据主要有3类:图片+分类器训练标签(ResNets)边界框+检测器标签(YOLOv3,FasterR-CNN...)Polygons+用于分割应用的标记(MaskR-CNN)注意分割数据(蓝色)和检测数据(紫色)之间的区别正如您可能已经意识到的那样,影响AI项目成功的最重要因素之一是“好的数据”提供给你。我所说的计算机视觉应用的“好数据”的意思是:每个图像/标签都有一个适当的标签每个边界框或多边形紧紧围绕着要训练的对象。尽管后一种定义显然缺乏客观性,但我们希望我们的算法能够达到人类水平。因此,我们需要“人类级别”的注释。TheBestOpenSourceAnnotationToolforLabelingCompaniesComputerVisionAnnotationTool(CVAT)ComputerVisionAnnotationTool(CVAT)在推出OpenCV将近20年后,Intel又回到了计算机视觉领域,发布了CVAT,一个非常强大和完整的注释工具。虽然学习和掌握需要一些时间,但它包含了大量用于标记计算机视觉数据的功能。优点:它很容易安装和扩展,因为它是一个在Docker中运行的Web应用程序它包括很多自动化工具(比如使用TensorFlow对象检测API的自动注释、视频插值......)它允许协作工作管理,例如不同的成员团队可以一起完成同一个标注任务缺点:UI相当复杂。例如,对于第一次设置标注任务的用户来说,这可能会很棘手,一开始使用起来不是很直观,可能需要几天时间才能掌握其他解决方法查看现场演示:https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces!BestOpenSourceAnnotationToolforStartupsVisualObjectAnnotationTool(VoTT)VisualObjectAnnotationTool(VoTT)VoTT由Microsoft开发,它提供了出色的用户体验,可以在注释时为您节省大量的时间和精力。此外,创建项目非常简单,因此您无需深入了解其文档即可使用它。优点:代码写得很好(在React中)并且界面定义完美,因此很容易获取代码并添加您需要的额外功能正如我所说,用户体验非常完美,它有一个深色主题和虚线跟随鼠标的网格,因此很容易知道从哪里开始标记边界框。这看起来像是额外的奖励,但请相信我,这对标注来说真的很重要!它建议使用深度学习算法自动检测对象(它带有在COCO数据集上训练的SSD模型)它是一个网络应用程序和一个电子应用程序。这允许您将它用作重型客户端,或作为在Web浏览器中运行的应用程序缺点:要使用Web应用程序版本,您需要将数据托管在微软的云计算服务Azure上(但是,Electron应用程序允许使用硬盘上的数据,但需要使用npm安装程序)它不提供内置API(但是,调整代码非常容易,以便您的私有API可以与其通信)您不能标记整个图像:您只能绘制带有相关标签的边界框(或多边形)。因此,它不适合创建分类数据库点击https://vott.z5.web.core.windows.net/查看web应用!DataTurksDataTurksDataTurks是一家成立于2018年的初创公司,提供图像、视频和文本标注服务。然而,直到最近它才成为开源软件(这可能与沃尔玛在2019年2月购买它有关),你必须为此付费。虽然从那以后他们很少说话,似乎已经停止了任何开发,但这个注释工具很棒,现在是免费的!当你使用它的时候,不要在意任何许可,也不要考虑任何无处不在的非商业使用限制。Dataturks现在是免费的,您可以使用它的所有功能(我已经尝试和测试过)!优点:说到CVAT,它是一个在Docker中运行的Web应用程序(查看https://medium.com/@dataturks/dataturks-on-prem-a-fully-self-hosted-data-annotation-solution-86b455bf0634获取Dockerimages)允许协作和异步工作:在同一数据集上工作的两个队友不会获得相同的注释图像提出一个用于创建和获取注释任务的API缺点:DataTurks似乎已经停止开发他们的产品UX还可以,但一些小的调整可以让它变得更好查看https://dataturks.com/projects/Dataturks的现场演示!定制最好的开源图像标注工具Make-SenseMakeSense.aiMake-sense于2019年6月刚刚发布,已经拥有令人难以置信的用户体验。上手打标从未如此快速!进入网站,拖放图片,然后开始标注。优点:快速、高效,但最重要的是,简单!出色的用户体验至于您上传的图片的隐私,请不要担心,因为他们说,“[我们]不会存储您的图片,因为我们不会将它们发送到任何地方。”缺点:不提供任何项目管理功能或任何API单击https://www.makesense.ai/开始标记!希望本文能帮助您选择适合您需求的标记工具,如果您找到更好的工具,请随时在评论中告诉我们!附言这是我没有提到但非常酷的其他一些工具的简短列表。VGGVIA,牛津机器人实验室开发的一款非常好用的标注器。它被编码在一个单独的html/js文件中,因此很容易开发!LabelMe,由麻省理工学院开发。可以在此处查看在线版本,或在此处运行。Coco-Annotator看起来功能很全,但是很新(用户认证系统,API接入点)。在此处查看演示(用户名:admin密码:password)
