当前位置: 首页 > 科技赋能

谢亦男,北京旷视科技有限公司副总裁!中国人工智能体系与标准

时间:2024-05-22 11:31:39 科技赋能

8月30日至31日,中国(上海)国际人工智能展览会暨OFweek(第二届)人工智能产业大会在上海成功举办。

本次大会以全新视角剖析行业趋势,解读今年国内外人工智能领域最值得关注的学术和研发进展,与数千名国际知名企业高管、资深行业专家进行交流,专家分析人工智能领域的机构。

精英们进行多方分析讨论。

在30日的AI技术主论坛上,北京旷视科技有限公司副总裁谢一男向观众发表主题演讲,分享了AI企业的核心资源如何与核心生态系统对接,AI此外,谢一男副院长从四个方面分析了人工智能的落地应用,还表示,在当前人工智能产业化领域,人工智能技术在一、三、五年。

北京旷视科技有限公司副总裁谢亦楠 北京旷视科技有限公司副总裁谢亦楠从四个方面分析了人工智能的落地与应用,同时还表示,在当前领域人工智能产业化,AI技术可以在一年、三年、五年内实现爆发。

增加。

以下是北京旷视科技有限公司副总裁谢一男的现场演讲,由OFweek人工智能网整理编辑,不改变原意: 首先感谢主办方,稍后我将提出一个一般性的观点,因为我们现在正在研究人工智能。

作为企业,我们应该用什么标准和准则来衡量企业对人工智能的理解程度? AI和产业并不是说我做了AI,那就是AI产业,而是有一定的要求。

第一点是去年我们去录制一个节目。

当时导演让我们做面部识别。

导演说我面部识别也很厉害。

如果我打败了你的机器怎么办?所以我第一时间就贴了几组照片。

当时总共有40个,我没有找到太多。

我说我们试试吧。

剪辑师和导演团队花了大约十分钟的时间才完成。

很简单。

拍张照片看看是不是同一个人。

这个测试和现在非常著名的IFW非常相似。

尝试看看人类和机器之间有多大差异。

在 40 个问题中,他们答对了 20 个问题。

上面和下面的一些照片是同一个人,化了一些妆。

机器对这些照片给出了非常肯定的答案。

他们只是一个人,但是人家可以花钱,却要花很长时间才能判断他是不是一个人。

他们甚至询问了旁边的华夏最强大脑。

他说,看人的脸,不要看脸,要看耳朵。

他给了他们很多这些所谓的分数,给了他们很多。

提示,最后你还是错了一半,所以我的第一句话是为什么中国要发展人工智能产业,因为它的准确性和很多应用场景确实比人类更有效率。

效率的提升不仅体现在准确度上,更体现在准确度上。

它在速度方面也得到了提高。

当时机器只需要不到一秒钟就可以完成,而人则需要半个小时左右。

中间因为有人认为自己识别正确,所以觉得必须坚持下去,所以最后就出现了内讧。

大家都说人工智能技术很强大,那么我们应该如何判断一家人工智能公司是否很强大呢?我们现在可以看到,中国的人工智能产业公司将会催生一个新的产业,叫做数据标注产业。

我给大家还原一下整个人工智能的工作原理。

事实上,人工智能和我们人类的学习非常相似。

两者都通过经验值来学习。

机器的经验称为数据。

这对于数据来说意味着什么?比如你给Wan一张图片,告诉它这些人是男人,这些人是女人,这些人是孩子。

给出后,你标记它。

机器自我学习后,还可以举一反三。

如果那个人做这件事的话,速度会非常快。

一个孩子可能看几张脸就大致知道男人是什么样子,女人是什么样子,小孩是什么样子,老人是什么样子。

他不需要看到任何东西来教他。

给他吧,机器做不到。

这台机器需要数千人不断地训练它才能做到。

因此,中国圈子里有一句话:有多少人工智能,就有多少智能。

人工智能要想应用于工业,首先要解决的就是去人性化。

我们之前看到,所有的人工智能都叫大规模监督学习,但是人工智能公司如果想在这个行业立足,它要解决的问题不仅仅是我们刚才看到的,而是两个人是否是同一个人人。

提议,但是里面有很多很小的问题。

让我举一个例子。

例如,我们提供了一个简单的系统来在门口迎接客人。

这么简单的系统,需要识别多少场景呢?第一个叫逆光,就是说场景后面有一个白光,就是门口。

大家在门口拍照的时候都会发现一个问题。

在这种情况下,拍照者的脸是黑色的并且看不见。

这个时候人眼会自动调节进入的光量,聚焦在人身上,但是机器不能,因为有时候你在室外做欢迎场景,有时候在室内,你得给它一个非常全能的东西,所以你必须在每个小型工业应用中使用这个东西。

返回起点的过程称为时间成本。

这意味着人工智能想要应用于工业,你必须解决很多非常场景化的问题,你必须提供大量场景化的数据。

一个场景收集数据大约需要 2 至 3 周,训练可能还需要另外 1 周的时间。

一个月就可以解决。

在这个月里,机器可能只能解决一个小问题。

如果我们能够通过一个很小的场景来识别这个事情,那么我们就可以做到。

那么现在我们看一个生产算法或者功能性算法的公司,或者如果它能够在各种终端上定制一个算法或者将它放到各种产品中,那么这就可以告诉它,它的人工智能技术是非人性化的。

让我举一个例子。

我们之前去警察局办过一个案子。

当时警察给我们的所有视频都非常粗糙,粗糙到像素化。

那张脸不是人脸,而是一帧一帧的。

认清这个东西。

这个东西人类无法识别,那我们该怎么办呢?一般情况下,我们会赶着把样本全部收集完,收集完再回来修正。

当时给我们的时间是两天,所有公司都一头雾水。

我们花了大约一天的时间才完成这件事。

整个过程中,关于数据处理,目前所有的人工智能科学家,可以说有50%以上的人,包括那些厉害的人,实际上并没有进行与做算法的本质工作相关的数据清理工作。

如果我们能够真正解放他们,让他们的算法真正运行起来,我想这件事对我们来说将会有所不同。

我们研究人员的平均年龄在23岁左右,他们使用的工具都非常通用。

这个方法非常聪明。

像他们这样的孩子不需要太多的经验来解决问题。

我们直接做就可以了。

接下来两天他们可能要打一场比赛。

现在给我的结果是他们的表现还是不错的。

是的,使用的是同样的东西。

如果一个公司是人工智能产业公司,只会玩游戏,那是行不通的。

人工智能技术问题必须解决。

首先是从0到1,你要解决它的本质问题。

你想解决赚钱的问题,怎么赚钱?人工智能只是一个工具,你得想想它能用在哪里,所以旷世音响在2018年解决的第一件事就是人脸验证和在线实名验证。

如果你在这里的话,其实它并没有从根本上改变一个行业,但却是最大的催化剂。

风控的前端叫什么?致电用户开设账户。

如果它没有自己的网络,那么它就会想,如何在没有网络的情况下,用它的手机来保证我注册的每个人都和他或她的身份证上的人一模一样。

这是一个命题,也是一个场景。

你的技术能否解决这个场景的问题,是人工智能行业公司不得不思考的问题。

并不是说我只能解决99%的人脸识别问题。

%,像千足金一样,这其实是没有意义的。

当时我们做的第一个就是支付宝。

支付宝给我们的第一个提议是20万个样品。

我们之前FW里有多少样品?是的,如果你把91.5%的东西换成20万元,你会发现相乘之后还是有很多错误。

这是不允许的。

所以你想想在现实的行业、公司里,如果你要从0到1去讲这个事情,你所思考的事情、你面临的事情、你解决的问题不再是成千上万对这样的事情但对于全中国数亿人来说,在进行人脸验证时不能出错。

我们现在会看到肯德基推出了很多人脸识别支付,其实就是快手的Face ID算法。

我们第一个场景或者说人工智能行业公司的第一个解决方案就是看我们正在做的事情是否解决了。

还是只是一个解决行业本质痛点、让你觉得好玩的小工具?旷世音响之前做的也是一个工具。

例如,旷世音响最早的产品叫做《乌鸦来了》。

我用脸控制人左右摆动。

这件事我们不需要用人脸,但是开户就不能用人脸吗?有可能,但是它的风控成本会高很多,因为它甚至不能保证我注册的时候不能做第一件事。

第二件事叫双闭环开发。

其实我们看到faceID是当时苹果提出来的,但是faceID。

com是旷世音响注册的域名。

当时我们还受益于苹果的推广,让我们的流量增加了十倍左右。

如果你走过第一圈,你会发现你解决的问题是面子,第二圈你解决的问题是ID,因为如果你只解决面子的事情,两年后就会有十个人可以做和你一样的事情。

让我举一个例子。

例如,以前所有做语音识别的公司都是付费的,但现在都是免费的。

如果你还是一个工具,你会发现你的模型基本上都会被免费模型取代,所以你要知道第二圈是什么?你需要解决ID问题,也就是说我们现在给很多公司做的事情并不一定意味着我要告诉你这张脸是不是一个人,更多的是告诉你一个方案。

他一个月内在其他平台注册了四次。

我不关心你是谁,但我会告诉你这些信息。

因为我们是一个平台,这个信息对他来说非常重要。

这张照片和身份证虽然是一个人,但由于经过多次验证,意味着存在很高的诈骗风险。

当你选择一个场景的时候,你要思考这个场景是否存在障碍,或者你以后是否只能解决一个工具问题。

如果是的话,你会发现以后很多大厂商都会这么做。

这件事。

比如旷世音响在2016年就做了Face Jiajia,百度、腾讯在2016年都做了这个产品,而且都是开放的。

如果我们仍然坚持这种情况,我们基本上就会被打败,因为他们可以完全免费。

一个工业级的公司需要解决一个核心问题,并且能够找到这个问题足够高的门槛,或者说随着时间的推移可以建立的成本。

第三个叫产业赋能,直接指的是我们常说的智慧城市。

先给大家讲一个网红的故事。

这是我们实际提供给城市管理者的一个案例。

当时红圈内的人是逃犯。

我把这个逃亡社区的网红拿出来给大家做个对比:什么是产业生态连通和生态不连通?这位网红是谁?是张学友,因为张学友的演唱会有五人被捕。

所有觉得他有问题的人都喜欢去张学友的演唱会。

然而,张学友的演唱会并不是生态开放的场景。

其实就是我刚才提到的那些。

在我们到达的第一个点上,它只是从 0 到 1。

为什么呢?让我还原一下当时的场景,一张小桌子,一个笔记本,一个相机。

然后一名工作人员坐在这里,盯着桌子。

每个人进来都看。

他会做一个比较。

如果有警报,警报会响一分钟。

将会有三到四份报告。

因为系统不是很好,笔记本在做这个实验,所以它会把照片一一发给当地警方,说张队长,我发现报警了,请处理一下,这位队长有演唱会,他可能会收到当他下来时,有三十或四十个警报,他将其中三十或四十个警报发送到指挥中心,也称为审讯室。

审讯室告诉他,这个人有问题。

已经过去了多少时间?已经一个小时了。

一个小时后,张队长给当地所有民警传话,告诉他们一个人是从哪个入口进来的,穿着什么样的衣服。

所有警察都应该注意。

我们将对这个人进行现场调查。

这些人都在会场里。

他开始四处游荡,等事情结束之后,大概锁定了几个人,出来的时候就将他们打倒了。

为什么他在演唱会时被抓到?因为演唱会在里面举行了两个小时,所以这两个小时足够应付了。

所以,只有演唱会现场才能做到这一点。

这是因为生态还没有打通。

在这个过程中,并没有帮助行业解决降本增效的问题。

还需要大量的人力来处理,并且需要大量的时间来做到这一点。

就做这些事情来说,它只是解决一件事,就是提醒我有一个问题,然后解决问题的时候一群人去做。

那么生态互联环境的场景是怎样的呢?我也用这个计划来举个例子。

是在地铁里,在华东区。

当时的情景是怎样的呢?地铁站的两分钟,从进站的第一秒到出站。

当地城市经理告诉我们时间是两分钟。

为什么是两分钟?因为他进站后两分钟你就没有采取任何行动就走了。

所以两分钟之内,需要从头到尾完成,就是我们的前端摄像头,你得直接在那里做视频处理。

算法必须先塞进去。

它不能做计算,只能做检测。

本地笔记本正在进行计算。

计算完成后,将自动传输至研判中心。

研判中心得到结果后,将直接进行处理。

如果有结果返回到本站,本站会直接返回到这个位置。

它会向最近的站点提供什么信息?给出的信息是,你应该去3号站台的8号车厢门口,注意一个穿蓝色衬衫的男人,是一个东亚男性。

这个过程大约需要一分半钟。

这是一个开放生态系统的过程。

因此,算法从第一台摄像头开始,到中间计算端,到指挥中心,到研究室的解决方案,到最后的警局,最后的报警警务终端。

数据流完之后,我们谈到工业级的AI公司并不能解决问题。

它不是一个工具。

它真正要解决一个行业的创新就是两个字,一叫降本,二叫增效。

去年,酷斯为全国各地的中国城市管理者解决了多起案件。

抓获一个案件的费用约为30万元。

逮捕逃犯对于整个团队来说是一项集体二等成就。

这确实是对一个人的奖励。

对行业,或者说你能在行业生存下来的AI行业公司来说,有用的就是你能为它生产出极致的散热和机制效率。

对于一个行业来说,我们看到整个城市都在应用面部识别技术,这是十年前的事情。

现在之所以没有实施和推出,是因为它没有解决效率提升的问题。

我仍然需要同样的警察力量来解决同样的问题。

你只给我打过一次电话给警察。

我不知道这个人在哪里。

电影中的最新电影叫做《我不是药神》。

一方面,人们已经找到了监控照片,但现场的刑警仍然说要一周才能抓到我,而且要动用所有的警力来做这件事。

这就是我们目前看到的情况。

你的AI工业级产品是否是生产级产品,就是你能不能用最少的人力、最高的技术来解决这个问题。

第四个叫做升级。

我也用一个比较流行的东西来谈谈这件事。

这叫什么?这是零售。

这个例子是在杭州。

我们正在和鲜生活一起建设一个产品实验店。

在这家店里,你会看到一年前它还被称为无人店。

可以刷脸进入,刷脸支付。

你要做的就是这个栏目可以是无人店,还有一个叫扫码买东西。

在这个过程中,你会发现其实零售店并没有发生本质的改变。

零售店有哪些本质变化?评估有效性、人员有效性和产品选择是否处于最佳状态?举个例子,什么是平等效率和最佳人类效率?日本的三美莱文与中国的全家在毛利率上存在一个数量级的差异。

不好的是,店长对这个店应该卖给什么样的人,什么样的人来我的店有深刻的了解?如果深入了解,你就会发现一点:为什么有的店衣服卖得好?因为店长知道买什么样的衣服,知道衣服应该放在哪里,知道如何培训店员,知道我应该如何介绍。

这个过程是目前零售店最缺乏的,就是能够真正的数字化,然后智能化。

卖什么?你要卖给谁?你卖什么来赚钱?这是我们现在看到新零售想要解决的最大问题。

所以我们之前看到很多新零售解决方案现在可以测人流、刷脸支付、刷脸进门、甚至进门后就可以跟随。

信用账户绑定,我们看到很多这样的东西,对行业有没有升级,我们还是问一下,单店的成本有没有改变?例如,如果您现在对其进行一系列升级和更改,则不需要您。

唯一的原因是,你升级换了之后,三年内带来的毛利提升不会超过这里花费的成本。

他不会这么做。

作为一家AI公司,如果我们真的想进入这个行业,我们经常会听到AI+XX行业。

当你进入这个行业并且它使用你时,你必须解决问题。

就是我用了你之后,你能帮我吗?赚更多的钱或者赚到极致。

比如我们会看到为什么整个资本市场没有上市公司或者传统物流公司,或者说上市机会很少。

这是因为它们都是毛利润很低的行业,而且涉及的成本很高。

因此,AI想要进入这个领域,真正的解决方案是解决这里的成本和效率问题。

所以当我们真正看AI加入到行业中的时候,我们真正要思考的不仅仅是这个技术能解决什么问题,还有这个场景是否可以接受。

为什么?我们可能要等到五年后自动驾驶才会成熟,因为技术本身可能已经成熟了。

但我们问了另一个问题。

当时,这个问题是在接受采访时被问到马斯克的。

他们说,你好,马斯克先生,你已经这么确定了。

现在你的技术这么好了,你敢每天闭着眼睛坐在车里,一睁眼就到公司吗?这个过程中,你眼睛都不要睁开,就让车带你离开。

他想了两分钟,说不敢。

所以我们会思考一个技术是否可以适应场景中的场景技术进行改造。

它有时间限制。

假设人工智能已经满足了自动驾驶的要求,但是没有一家公司老板说我敢天天做,根本不用管,也不给我让座。

我只需坐在自己的车里,人工智能就会带我离开。

所以我们真正要讲的是它是一个技术,也就是说,如果你真的要把它产业化,你就得看第一个基础有没有解决问题。

也要看这个场景是否能够真正适应你的发展。

其实今天的话题和人工智能和工业也很有关系。

最后,我们在这个页面上保持安静。

最后,再次感谢主办方的邀请。