当前位置: 首页 > 科技观察

这个CV数据集生成器火了,支持13类CV任务,DeepMind等打造

时间:2023-03-18 19:00:02 科技观察

这款CV数据集生成器很受欢迎,支持13种CV任务,由DeepMind等人创建。如今,AI玩家越来越难找到合适的图像数据集。不仅数据质量参差不齐,而且合适的数据类型也很难找到(比如光流图、深度图等)。为了解决这些问题,来自谷歌、麻省理工学院、DeepMind、MILA和剑桥大学等11个机构的34名研究人员联合创建了一个名为Kubric的数据集生成器,它不仅可以自行渲染,而且图像效果非常逼真。.不仅可以做各种图像数据,还可以一键生成语义分割、深度图或光流图等“特殊数据”:还可以控制渲染的真实感,渲染出来的视频可以达到真实效果:据作者介绍,目前Kubric支持13种CV任务的数据类型生成,效果不比用已有数据集训练的差。如何开始使用这样的数据集生成器?它可以生成13种CV任务所需的数据。让我们来看看这个Kubric数据集生成器是什么。简单来说,它有点像专门为图像AI打造的“数据车间”,基于跨平台开源物理引擎PyBullet和3D图像渲染软件Blender。其中,PyBullet为用户提供了一个模拟3D物体运动的平台,例如可以模拟两个球之间的弹性碰撞参数。(当然除了PyBullet,还可以扩展到MuJoCo等其他物理引擎)Blender是一个渲染3D动画的平台,但它的优点是操作简单,不仅可以制作照片-逼真的渲染图像,还输出3D动画效果。(比如有的设计师用它来设计服装的质感)这时候你可能会问,与自己手动渲染视频或者图像数据集相比,Kubric有什么方便之处?一方面,Kubric自带了一系列经过预处理的基础图像数据库。除了11个基本的3D模型外:还内置了来自GoogleScannedObjects(GSO)室内家具数据集的一系列模型,以及包含背景、光照和材料纹理等参数的Polyhaven数据集,以及作为ShapeNet数据集(包括55种常见物品类型和51300个3D模型)。也就是说,如果你对渲染不是很了解,也可以使用内置的数据库快速生成想要的图像。另一方面,Kubric直接提供了从“渲染数据”到输出“AI训练数据”的管道,无需将渲染图像转换为特殊数据(如深度图、光流图),或额外的集合如场视野、相机参数、灯光等数据烦恼。这也使得Kubric能够支持生成13种CV任务所需的图像数据,包括光流、NeRF、位姿估计、3D重建等。没错,即使这些生成的图像中有2D和3D类型,所需的数据量从MB到TB不等,但Kubric可以满足。嗯,作者也尝试了Kubric专门针对各种视觉任务生成的数据集,强调“他们生成的数据集更好”。△Kubric生成的光流图那么,如何使用这样的数据集生成器呢?内置Python接口的作者提供了一些简单的操作程序。安装完成后,第一步是创建一个默认场景:然后,通过这两个步骤,创建一个地板和一个球体(或者可以改变其他形状):下一步是在场景中添加灯光,并渲染camera抓图:导出文件后,可以得到一个3D球体的图像:△如果Blender中的效果需要深度图、灰度图等特殊图层,几行代码就可以搞定:更简单比手动导出更方便:当然,如果你还是觉得上手难,作者也直接提供了示例代码,你可以通过更改参数来使用:在原来的基础上,增加5行代码直接运行动态视频版:貌似做完了数据集,就算不会渲染的也能变成半个行家(doge)。目前,新一批内置数据集仍在建设中。有兴趣的朋友可以先试试~项目地址:https://github.com/google-research/kubric论文地址:https://arxiv.org/abs/2203.03570