当前位置: 首页 > 科技赋能

这家AI公司的图像识别技术让谷歌和微软甘拜下风

时间:2024-05-22 16:13:14 科技赋能

这家AI公司的图像识别技术击败了谷歌和微软。

今年7月,在国际权威计算机视觉竞赛PASCAL VOC comp4目标检测竞赛中,Yi+AI团队获得目标检测单一模型第一名,超越现有目标检测模型。

微软研究院、谷歌、阿里巴巴达摩院、Face++等多家国内外知名公司均以90.7%的准确率打破世界纪录,成为全球首家总分超过90%的计算机视觉公司。

同时,在Pascal VOC“comp3”中,首次超过80%,创下新的世界纪录。

Pascal VOC comp4是众多国内外企业物体检测团队证明实力的地方。

此次Yi+力压群雄,取得了90.7%的成绩,比物体检测领域第二名阿里巴巴达摩院高出1.5个百分点。

,1.5个百分点意味着它需要比对方检测到“更多”的正确框。

另外值得注意的是,这次Yi+AI团队使用了难度更大的单一模型,而第二名的方法是多模型融合。

PASCAL VOC可以说是视觉识别竞赛的鼻祖,包括物体分类、目标检测、图像分割等任务。

PASCAL VOC对计算机视觉的发展产生了深远而巨大的影响,后续ImageNet比赛的任务设置基本遵循其设置。

此前,微软、英特尔、卡内基梅隆大学、Facebook、加州大学伯克利分校等国际顶尖研发团队均曾在此排名中创下新纪录。

Yi+AI负责人表示,在本次Pascal VOC comp4比赛中,Yi+AI团队使用的方法称为FXRCNN,其中“X”代表“多个”,这意味着Yi+AI使用的结构不仅是高精度模型还适用于多种场景,包括移植到移动端(通过改变Backbone和Head)、实现图像分割(添加Mask分支)、实现人体关键点(添加关键点分支),并实现人脸检测(Add Face分支)。

Yi+提交的深度学习模型虽然采用了Faster RCNN的基本结构,但也有很多不同之处:1)采用ResNeXt作为基础网络,结合FPN实现多尺度特征融合; 2)后处理阶段,SoftNMS与多尺度Frame投票融合; 3)通过Yi+海量数据进行预训练; 4)多尺度训练,进一步加强数据增强。

近年来,Yi+不断加大人工智能、大数据等新技术的研发和应用。

此次提交的模型是Yi+多年来技术积累的成果,也是不断攻克实际问题的结果。

这是Yi+内部模型不断完善优化的结果,Yi+ AI的FXRCNN在速度、内存、精度、应用范围等多个维度进行了全面优化。

在人工智能领域,目标检测技术应用广泛,是Yi+AI场景落地的关键技术之一。

Yi+将目标检测技术应用于图像搜索引擎和图片视频结构化引擎。

Yi+图片搜索引擎可检测品类超品类,涵盖服装、3C超市、家居、日用品、交通等; Yi+图片视频结构化引擎采用业界最先进的基于深度学习的通用目标检测算法,支持100多种常见物体的目标检测和识别,可实现场景、人、车辆、以及视频和图像中的物体(轮廓)。

, 追踪;可以识别近10种物品和场景。

目前,Yi+AI已将目标检测技术应用于多个使用场景,包括“智能硬件”、“营销”、“新零售”、“智慧城市”等解决方案。

具体应用于场景广告平台、新零售平台、大屏AI助手、智能安防、智能交通、智慧社区等众多领域。

下一步,Yi+将结合现有技术优势,继续深耕智慧城市、新零售、智能营销、智能硬件等领域,让计算机了解世界,用技术提供人工智能服务,帮助人们看到非凡,看到不同。

Yi+获得阿里巴巴等B轮融资。

服务过很多实力雄厚的客户。

团队成员大部分来自顶尖企业和大学,如哥伦比亚大学、帝国理工学院、耶鲁大学、普林斯顿大学、普渡大学、新加坡国立大学、南洋理工大学、清华大学、北京大学等以及微软、IBM、英特尔、阿里巴巴、腾讯、百度、华为等公司。