当前位置: 首页 > 科技赋能

揭秘阿里巴巴视觉计算团队的秘密!用机器代替人眼看照片视频的秘密

时间:2024-05-22 16:24:07 科技赋能

文章| 2020年春节前夕,阿里巴巴公布了第三季度财报,其中该季度阿里云计算业务收入为17.64亿元,同比增长%,付费用户数达到76.5万,同比增长%。

这是阿里云营收连续第七个季度保持超过%的增长。

2020年10月,阿里云计算项目“城市大脑”在杭州启动测试。

通过接入交通监控视频等数据采集,可以对整个城市进行全局实时分析,自动分配公共资源。

它最终将进化成为能够治理城市的超级人工智能。

聪明的。

如果说人工智能=数据+算法,那么大数据和云计算就可以称为人工智能的底层架构。

据IEEE院士、阿里云计算机视觉科学家华先胜博士介绍,阿里云目前在人工智能领域的重点是计算机视觉、智能语音交互和数据智能应用。

近年来,随着计算机视觉领域在深度学习方面陆续取得突破性成果,计算机视觉已成为阿里云的主要实现技术之一。

(IEEE院士、阿里云计算机视觉科学家华先胜博士)什么是云计算和计算机视觉?云计算的概念和人工智能一样广泛而模糊。

简单来说,云计算平台的服务模式分为三类:SaaS(CRM、Email、网络游戏等)、PaaS(数据库、Web服务器、开发工具等)、IaaS(网络带宽、服务器、存储空间等)用户不再需要将资源下载到计算机上,只需要接入网络即可享受网络服务。

计算机视觉是人工智能学科的一部分,可以理解为用机器代替人眼。

它涵盖了图像和视频分析、目标检测和分割、人脸识别、物体识别、目标跟踪、视觉搜索等,其背后的要求是强大的视觉算法支持。

近年来,由于深度学习的兴起以及计算机视觉技术对深度学习的运用,在人脸识别、物体识别等方面取得了很多成果,是谷歌首席科学家李飞飞的研究领域之一最近比较出名的就是计算机视觉。

她还参与创建了最大的图像识别数据库ImageNet。

“城市大脑”诞生的那一年,曾在微软工作14年的华先胜博士加入阿里巴巴,负责电商图像搜索引擎优化。

最终的产品是在淘宝、天猫APP上应用的“Pola淘”。

——用户用手机拍摄商品照片后,可以搜索相同或相似的商品。

年初,华先生加入阿里云,创立视觉计算团队,负责云上的智能视频图像分析、识别、搜索、生成和挖掘服务。

据华博士介绍,“八丽淘”、人脸识别“虚拟试妆”等电商相关项目均由集团内部团队负责。

阿里云主要负责对外业务,如交通、安防、广告、行业应用等。

2020年10月,阿里云重要计算项目“城市大脑”在杭州启动测试,类似技术也在广州得到应用。

“城市大脑”项目的主要技术重点是:1、大规模视频分析与处理。

依托阿里云计算平台+视频分析功能,搭建大规模视频分析平台,全面清晰了解整个城市的交通状况。

2.城市地图搜索。

将电商图像搜索技术延伸到城市场景,完成城市索引。

例如,公安部门可以接入该系统,对特定车辆类型、车牌进行跟踪和搜索。

3、流量监控。

除了基本的城市观察(交通流量、人流)外,还可以检测车辆转向、速度、属性,以及监控和识别公共场景中的特殊事件:车牌跟踪监控、交通事故、违章停车、过马路等。

4、流量模型建立和流量优化。

挖掘大量数据之间的关系,发现模式和相互约束。

通过对交通、车牌、车型等数据的实时了解和分析,可以判断交通流量并优化调整信号灯等。

不仅可以进行周一至周日的离线优化,还可以进行实时遇到交通事故或交通拥堵时,对交通信号灯进行时间调控。

一方面,由于城市监控摄像头数量众多,产生的视频数据量巨大,计算消耗大,吞吐量大。

城市大脑需要以可控成本提供大规模计算能力,并保证计算效率——计算平台需要“能吃”、“能消化”。

华博士介绍,阿里巴巴的“飞天”云计算平台是一个拥有数百万个CPU和60万个硬盘的超级计算机系统。

另一方面,由于视频处理的时空相关性:时间相关性,每一帧图像都依赖于之前的相关图像;空间相关性,交通场景中的当前视频需要与其他视频结合起来做出决策。

因此,有必要研究视频处理中时空相关性的优化算法,以提高计算效率。

数据红利和算法优势正在逐渐减少。

深入探索行业,建立优秀商业模式。

华博士认为,现在很多人工智能公司都是从算法起家的,但算法之间的差异可能会越来越小。

另外,基于深度学习的方法,随着各种开源算法的出现,专家之间的算法差异不会太大。

例如,在ImageNet图像识别竞赛中,获胜者之间最终的数据差距都在小数点后。

虽然真实场景中仍然存在差异,但随着实践,差异会逐渐减小,甚至数据差异会越来越小。

数据优先股息也将逐渐减少。

除了算法之外,优秀的业务应用场景对于人工智能公司同样重要。

一个好的AI商业应用需要兼顾算法、数据、用户、平台、商业模式5大方面。

这五点虽然维度相同,但不同的商业应用却有不同的侧重点。

对于人工智能企业来说,需要认真考虑自己是否有良好的商业应用,能否真正渗透行业产生价值,这五个基本要素是否全部具备。

目前,人工智能已经开始应用于金融领域的人脸识别,并在安防、交通、工业等领域得到初步应用。

设备端AI工具、智能伴侣、机器人、智能冰箱等等,包括用AI优化的搜索引擎,听起来可能没有“Alphago”那么先进,但人工智能已经渗透到我们生活的方方面面。

结论:AI时代的“基础设施”。

阿里云的智能语音识别、图像搜索、人脸识别等相关智能技术均由阿里巴巴内部技术团队孵化。

他们原本服务于电商系统,后来被转移。

进入阿里云计算平台体系,合作共建云计算生态,开放API,寻求合作伙伴。

这就像苹果、安卓建立操作系统后,各种APP陆续进入市场一样。

阿里云强大的计算能力是无数中小企业无法企及的。

然而,通过开放的云计算平台,阿里云用户获得了提供人工智能服务的能力,阿里巴巴继续占据入口,试图成为AI时代的“基础设施”。