当前位置: 首页 > 科技观察

五种图像标注介绍

时间:2023-03-12 13:50:09 科技观察

【.com速递】你有没有被要求寻找一张图像中不同图形区域的标注信息?在当今人工智能(AI)和机器学习(ML)盛行的环境中,各类AI开发人员和研究人员需要访问大量高质量数据才能实现其项目目标。同时,随着“数据为王”的理念深入人心,可以说“没有数据,就没有所谓的数据科学”。在视觉中),对大量图像进行标注,使其成为实用的图像数据。本文将从以下几个方面与大家探讨图像标注的概念和类型:什么是计算机视觉?什么是图像标注?2DBoundingBoxes3DBoundingBoxes/CuboidsPolygonsLinesandSplines(直线和样条线)语义分割(SemanticSegmentation)什么是计算机视觉?计算机视觉作为人工智能研发的重要领域,旨在使计算机能够“看到”并解读自身所处的环境和状态。从自动驾驶汽车,到无人机勘测,再到医疗诊断,再到人脸识别识别,计算机视觉在实际应用中发挥着巨大的作用。为了成功地模仿或超越人类的视觉功能,计算机视觉需要在开发和处理目标设备的过程中通过大量模型的训练来实现图像的标注。什么是图像标注?图像标注是给图像添加标签的过程。目标的范围可以从整个图像上的一个标签到图像内像素组内的多个标签。一个简单的例子就是:当我们把各种动物的电子图像提供给幼儿时,我们可以在每张图像上标注正确的动物名称,让幼儿在接触图像的时候就能知道它们的名字。当然,具体的标注方式取决于实际项目中使用的图像标注类型。有时,我们可以将通过地图APP采集到的groundtruth数据作为标注图像输入计算机视觉的相应算法中。通过反复训练,该模型可以将标记的实体与那些未标记的图像区分开来。最常见的图像标注类型上面的例子很简单,我们将在汽车自动驾驶等领域使用更复杂的图像标注和计算机视觉技术。那么,我们如何知道哪种图像标注类型更适合手头的项目呢?下面我将向大家介绍五种常见的图像标注类型及其相关应用。1.2DBoundingBox2DBoundingBoxAnnotation是指:提供图像给那些人工标注者(humanannotators),并负责在图像中的某些对象周围绘制框。边框应尽可能靠近对象的每个边缘。这项工作通常在不同公司的定制平台上完成。如果一个项目有独特的要求,服务公司可以调整他们现有的平台来满足这些需求。边界框的一个典型应用是用于汽车自动驾驶的开发。注释者需要在捕获的交通图像中识别车辆、行人和骑自行车的人等实体,并在它们周围绘制边界框。因此,开发人员通过为机器学习模型提供标有边界框的图像来帮助自动驾驶车辆实时区分各种实体并避免接触它们。2.3Dcuboids与边界框非常相似,3Dcuboidannotations是在立体图像中识别的对象,并在它们周围绘制了边框。与仅描绘长度和宽度的2D边界框不同,3D长方体标注了对象的长度、宽度和近似深度。使用3D长方体注释,人工注释者可以绘制一个包围感兴趣对象的框,并在对象的每个边缘放置锚点。如果对象的边缘不可见或被图像中的另一个对象遮挡,则注释器会根据对象的大小、高度和图像的角度来估计边缘的位置。3.多边形有时,由于光照或角度的原因,图像中对象的形状、大小或方向无法很好地适合2D边界框或3D长方体。同时,开发者希望更准确地标注图像中的物体,比如交通图像中的汽车、航拍图像中的地标建筑等,在这些情况下,我们可能需要选择多边形进行标注。使用多边形时,标记器通过在要标记的对象的外边缘放置一些点来绘制线条。这个过程有点类似于我们小时候玩的“连点成线画轮廓”的练习。基于此,我们使用一组预先确定的实体类(例如:汽车、自行车、卡车)来标注由这些点和线包围的区域内的空间。另外,当我们分配多个类时,它们被称为多类注释。4.线条和样条虽然线条和样条可以用于多种目的,但它们在这里主要用于训练驾驶系统识别车道及其边界。顾名思义,标记器将简单地按照既定的机器学习方法来绘制边界线。通过标记道路和人行道,它可以训练自动驾驶系统了解其边界并留在车道内以避免越线或转弯。此外,直线和样条曲线还可以用来训练仓库中的机器人将箱子整齐地并排放置,或者将物品准确地放置在传送带上。5.语义分割不同于上述分类主要关注绘制对象的外部边缘(或边界),语义分割更加精确和具体。它是将整个图像中的每个像素与标签相关联的过程。在需要语义分割的项目中,我们通常为人工标注器提供一组预定义的标签,它可以从中选择要标记的内容。语义分割使用类似于多边形标记的平台,允许标记器在需要标记的一组像素周围画线。当然,这些操作都可以在AI辅助平台上完成。例如,虽然处理程序可以大致画出汽车的轮廓边界,但为了避免出错,在分割过程中需要剔除汽车下方的阴影部分。在实际应用中,标注器接收到自动驾驶的训练数据后,需要根据道路、建筑物、骑行者、行人、障碍物、树木、人行道和车辆对图像中的所有内容进行分类。分割。此外,人类注释者使用一个单独的工具来裁剪掉不属于主题的像素。语义分割的另一个常见应用场景是医学成像。对于提供的患者照片,标注器将从解剖学的角度用正确的部位名称标记不同的身体部位。因此,语义分割可用于处理“在CT扫描图像中标记脑部病变”等困难的特殊任务。原标题:5种图像标注介绍,作者:LimarcAmbalina