当前位置: 首页 > 科技赋能

宇视科技人工智能产品线总工程师李从亭:安防AI应用现状与展望

时间:2024-05-22 12:13:53 科技赋能

“中国(上海)国际人工智能展览会”由中国高科技产业门户OFweek微科网、Hi -科技协会,由OFweek人工智能网主办。

“OFweek(第二届)国际人工智能产业大会”于8月30日至9月1日在上海成功举办。

本届展会形式多样,大咖云集。

第一天主论坛有关AI技术的演讲异常精彩。

香港科技大学机器人学院院长、IEEE院士王宇、深圳云天励飞首席项目总监王军等专家或企业代表出席了会议,为会议增添了不一样的风采。

其中,宇视科技人工智能产品线总工程师李从廷发表主题演讲,介绍了安防行业的网络化、高清化、智能化三大变革,重点关注现阶段的智能化。

转型阶段。

首先简单介绍了网络化和高清化,然后提出了智能安防阶段的一个热门研究领域——人脸识别。

举出公安、教育、机场、新零售等例子,证明人脸识别的实际落地已经渗透到很多细分行业。

此外,李从廷先生认为,虽然人脸识别技术在安防领域已经很完善,但仍面临诸多挑战。

首先,相关算法无法实现100%正确报警。

其次,成像方面存在挑战。

三是技术含量不足。

高,设计与实际实现偏差较大。

最后提出智能交通,指出智能交通是安全人工智能的一个主要方向,并引出了安全人工智能的三个展望。

李从亭先生 以下为李从亭先生现场演讲内容。

OFweek编辑在不改变原意的情况下进行了整理编辑:朋友们下午好,我是宇视科技的李聪婷。

今天下午给大家分享的主题是安全AI应用。

现状与前景。

熟悉安防的朋友可能知道,安防行业总共经历了三个变革,即网络化、高清化、智能化。

其中网络化、高清化是已经完成的改变,而智能化是我们目前正在经历的改变,也是我们这次分享的重点。

温故知新,我们先简单回顾一下前两次的变化到底发生了什么?网络,大约是在那个时候发生的。

当时安防行业的现状是监控室。

监控系统的规模通常是几十个通道,最多可能是几百个通道。

换句话说,各个监控系统之间无法进行通信。

在安全的城市里,没有办法在一个地方看到城市各个角落的视频。

因此,当时的一个技术突破就是将IT技术应用到安防领域,将一个城市数十万个摄像头互联起来。

然后我们后来转向高清。

我刚才提到的网络解决了看不见的问题。

高清需要解决的问题是视力不清晰的问题。

在高清出现之前,我们标清视频的分辨率只能达到×。

而事实上,很多视频监控系统的尺寸可能只有×。

在这样的分辨率下,我们怎样才能看清人脸和车牌呢?随着三色镜头编解码技术的快速迭代,我们已经快速进入高清时代。

经过几年的发展,10000分辨率已经非常普及,并成为行业标准。

在一些中高端应用中,分辨率达到10000、10000甚至更高。

那么这两个变化有什么共同点呢?我认为有两点。

第一点是技术突破。

网络是IT技术在安全方面的应用。

高清是镜头三色编解码等技术的快速发展。

二是共性,这是产业链、行业的洗牌。

十年前,安防行业厂商众多,其中包括十几家国外品牌,以及大量的中小型设备提供商和解决方案提供商。

如今,国外品牌安防厂商已基本退出中国大陆市场,中小企业数量也在逐年下降。

从总体上看,这次智能革命其实和前两次非常相似。

首先,有一个技术拐点,就是大家熟知的深度学习技术的出现。

其次,这从某种意义上来说也是一次行业洗牌。

对于能够跟上技术迭代并大力投资技术的制造商来说,这可能是一个机会。

对于无法跟上这种技术迭代的制造商来说,最终将被淘汰。

那么在这个智能化的时代,前两次的网络化、高清化就打下了非常好的基础,使得这些我们过去看不清、看不见的图像变得清晰可见。

图像。

在安全智能的革命中,最热门的事情之一就是人脸识别。

人脸识别已成为安防AI最热门、最重要的应用方向。

为什么要进行人脸识别?我认为首先,安全市场对面部识别的渴望太久了。

过去几十年并不是没有人识别这个东西,但是它确实不好用,甚至在一定程度上伤害了我们的用户。

甚至有一段时间大家都认为人脸识别是一个骗局,但随着深度学习技术的出现,它发生了质的变化。

人脸识别的识别率有了巨大的提升,而这个提升过程中所花费的时间非常短。

当然,深度学习技术并不是这几年才出现的,只是这几年才真正在安全上得到落地,并开始大规模应用。

人脸识别技术已经渗透到安防行业的各个细分领域。

以警察为例,动态黑名单部署、现代数据库中的人脸比对、轨迹碰撞等都是非常流行的应用。

以教育行业为例,过去我们对人员、学生、宿舍学校人员的控制基本上都是手动控制。

现在我们很多高校都安装了人脸快速闸机,也就是具有人脸识别功能的闸机。

另外,在机场,我们对身份证的验证过去都是手动完成的。

现在机场、高铁基本上都是用机器进行识别。

另一个例子是新零售。

我们可以应用人脸识别技术来提供VIP识别,我们还可以做很多业务分析。

那么面部识别技术在安全方面已经很完善了吗?已经很成熟了吗?我认为这还远远不够。

目前我认为它还处于起步阶段。

我们来看看人脸识别。

当前存在哪些问题和挑战?首先,第一个是算法。

该算法无法实现100%正确报警。

我们会漏掉阴性和误报。

事实上,有些漏报和漏报是很难通过算法解决的。

但客户的期望是百分之一百的。

所以这是我们面临的第一个挑战。

第二个挑战来自成像。

当我们给客户做演示时,我们通常会向他们展示我们最好的一面。

然而,在实际应用中,我们可能会遇到各种复杂的情况,比如宽动态问题、严重背光情况等。

下面,脸部很可能太黑或曝光过度。

这个时候,如果我们一味地纯粹依靠算法来解决问题,显然这条路是不对的。

那么晚上应该做什么呢?很多时候在晚上,自然环境光不足,此时我们的脸部可能就看不清楚了。

于是我们想到安装补光灯,可以弥补自然光的不足,但不能打在人脸上。

为什么?因为它直接照在你的脸上,对于普通人来说,你会觉得这个东西非常刺眼,但是对于犯罪分子来说,它就相当于一个预警,提前告诉你,这个地方很可能会逮捕你,他们就会避开。

镜头,所以这是我们要解决的一个问题。

还有一个问题。

人脸识别对安装工程有相对规范的要求,但实施起来有一定难度。

比如我们去装修家里的时候,我们可以设计得非常清晰,把每一个开关、每一个螺丝都细节化。

但最终,如果你让工人完成装修,当你再看的时候,你可能会看到和你最初想象的很不一样。

同样,在安全领域的项目实施中,在实施过程中也往往容易出现一些违规行为,最终导致效果不佳。

还有一个问题。

上述三点实际上是首要问题。

正如后面提到的,这是一个整体性的问题。

人脸识别用于安防,但演示容易,实施困难。

我们认为,在实施安全人工智能的过程中,需要克服三个障碍。

第一个坎是核心技术的突破。

我相信很多企业已经迈过了这个坎。

现在在人脸识别领域,大多数公司都迭代到了深度学习,使用了新的算法;那么第二个坎是示范实施的坎,或者说是一个小坎。

实现规模化的障碍是许多公司已经克服的;第三个难关是规模化,这个难关并不容易克服。

几十条道路的规模和几千甚至几万条道路的规模是不一样的。

面临的挑战完全不同。

在大规模实施中,我们不仅要解决算法问题、人工智能问题,还可能要解决网络平台、大数据、云存储、硬件产品等。

我们需要一一解决这些问题。

其次,建设成本高。

安防客户对成本非常敏感,安防AI目前多应用于高端市场。

在高端市场,其价格也高于非AI产品。

其设备的成本可能是其两倍甚至更多。

因此,我们需要通过不断的产品迭代来降低价格门槛,但质量当然不能降低。

还有一个问题是我们很多厂家都困扰的。

根据个人需求进行场景定制。

比如人脸识别的1:1比较只是1:1比较。

理论上我们可以提供一类产品,但实际上在实施过程中,我们可能针对公安、司法、教育、机场等不同的场景,硬件产品的形态也可能完全不同。

同样,软件需求也会有很大差异。

作为设备和方案厂商,或者AI算法厂商,不可能做这么多的应用。

该怎么办?或者说我们如何抽象一些基本组件。

人脸识别在安防领域如此火爆,以至于长期以来,大家都有一个误区,认为安防AI就等于人脸识别。

事实上,人脸识别只占安防AI应用的1/4。

那么,另外的 3/4 是什么呢?首先不得不提的是智能交通。

事实上,16年前,智能交通其实是安防AI的主要方向。

然而,由于汽车是钢制车身,因此使用传统的CV方法我们可以获得相对实用或高精度的结果。

我们的车牌识别率可以达到99.9%。

利用传统的CV方法和深度学习技术,将其引入智能交通领域是量变,而不是质变。

因此,在当前的安防AI中,可能很容易忽视其技术迭代和进步之一,以及视频结构化的应用。

你可能会觉得奇怪,我们能清楚地看到面孔、识别面孔、看到车牌。

为什么?我们还需要识别人体并构造这样的小型人体和车辆。

我们思考一个问题,人脸识别的进入条件是什么?我们认为,要达到比较好的识别率,人脸的像素必须达到80像素以上,或者瞳距必须大于40像素。

那么容量为10000的摄像机,监控宽度是多少呢?大约三米。

那么对于用户来说,建设成本相当高,而且不可能既无盲区覆盖监控场景,又能够看清人脸。

这是一个矛盾,而且这个矛盾可能会持续很多年。

无法协调和解决。

所以我们在关键出入口的时候,需要建设人脸卡口和车辆卡口。

但从监控无盲点覆盖的角度来看,我们还需要沿着传统视频监控覆盖的场景范围继续建设。

那么这么多海量视频,单纯靠手动观看显然是不现实的。

因此,我们需要对其视频内容进行分析,并对其进行结构化的描述。

是汽车吗?一个人?男人?女士?衣服颜色?我们需要通过图像来寻找他。

我们可以选择一个人,然后通过摄像头搜索,找到他的轨迹,快速定位到这个人。

这是视频结构化的应用。

还有另一类应用程序是行为分析应用程序。

过去,传统的CV方法和这些检测算法用于周界入侵防御的效果并不理想,误报较多。

那么利用目前的深度学习技术就可以大大减少误报。

这也是行为分析产品的质变和产品替代。

那么我们简单谈谈我们对安全未来的看法。

首先,我认为安全AI的竞争将从三要素演变为六要素。

事实上,过去几年业界对于这三个要素已经达成了共识。

算法数据算力缺一不可,非常重要。

但我们认为这还远远不够。

因为在大规模落地的过程中,你需要有高性价比的产品,而给用户的只是一个认可度,而这是用户无法获得的。

用户需要行业应用的业务,所以我们需要解决方案,也需要工程规范。

没有一个好的产品,最终客户拿到并安装后,它就会是一个不好的产品。

那么第二个展望是我们认为边缘AI的需求旺盛,这将带动AI产品的快速推出。

为什么是边缘?因为边缘的数量最多,比中心设备的数量多数百甚至数千倍。

这是第一点。

其次,其建设成本最低。

无需将海量视频全部发送回中心进行智能分析。

这并不是说中心不需要,而是边缘的用量最大,边缘更有利于安防产业的快速发展。

第三个展望,我认为,未来的安全AI将是多点的技术迭代。

为什么强调多点?而不是单点,因为过去单点强调算法,未来可能会进入到每一个点的改进,从而达到整体的提升。

首先,我们认为镜头、传感器和ISP需要改进,这与成像密切相关。

其次,我们认为AI处理芯片需要改进,AI芯片的摩尔定律在未来几年肯定会持续下去。

以前我们说AI芯片的算力可以达到1T时我们会感到惊讶,但现在30T甚至更高已经很常见了。

然后我们认为背面的摄像头将成为物联网的网关。

它不仅具有视觉功能,还具有传感器和可能的语音交互等多种功能。

它需要模仿人,它是双重的目的,他需要有深度的信息。

当然,近距离不一定是双目。

那么我们相信AI算法会不断迭代,但是算法可能需要改进两点,但是计算能力可能会提高一倍或者三倍,这是很有可能的。

那么算法上还有一个趋势,可能是从人脸识别开始。

达到人体识别的目的。

还有一点就是云和边缘的结合非常重要。

边缘可能做更多结构化的事情,而云则做更多结构化的信息集成、数据挖掘、数据分析和业务应用。

将点数据串在一起。

我们简单介绍一下Uniview的解决方案之一。

它推出了名为UniAI的全集成人工智能智能解决方案。

这很容易理解。

我们把所有的前端智能、后端智能和其他智能都管理在一起,针对不同的场景提供不同的应用和产品,但又是统一的、统一的。

那么我们的六大要素就得到了充分的发挥。

那么我们这里就说说我们的软件能力吧。

IMOS是我们在安全方面推出的多媒体操作系统,我们已经迭代了十年。

目前,在智能化时代,我们也集成了很多智能化的功能和解决方案。

我们可以调度所有云端设备GPU来平衡资源的负载。

同时我们也有一个开放的生态系统,把定制化的需求留给一些本土的中小企业集成商,当然我们也会跟他们分享一部分利润。

那么我们目前的宇视智能解决方案已经在很多领域得到了应用,比如很多大学,很多平安城市等等,由于时间关系,以上是我的分享。

非常感谢。

如果有一些技术交流,我们可以下来再交流。

谢谢。