当前位置: 首页 > 科技赋能

AI手机举报! AI视觉为手机带来三大新应用方向

时间:2024-05-22 12:24:41 科技赋能

手机是承载人类数字生活和工作的最重要设备,也是近20年来改变人类社会最多的工具。

移动互联网的蓬勃发展,让手机从单纯的通讯工具变成了人们生活和工作的入口。

未来,手机不仅会成为我们身体的延伸,还将帮助人们简化生活、分担工作,成为人类的“个人智能助理”。

经过十年的黄金发展,智能手机行业已经迎来了发展的重要转折点。

据IDC统计,全年全球智能手机出货量为14.7亿部,同比下降0.3%。

这是首次同比下降。

中国市场的变化趋势更加明显。

2018年,中国智能手机出货量为4.4亿台,同比下降4.9%。

这意味着传统智能手机市场已经趋于饱和,手机厂商必须从比拼销量和价格转变为比拼质量和体验。

什么是真正的“AI手机”?报告称,从2019年开始,越来越多的手机厂商意识到AI给智能手机行业带来的价值,纷纷推出“AI手机”。

AI技术已全面引入旗舰机型,甚至搭载AI芯片的手机也正在成为市场主流。

不过,目前的“AI+手机”还处于起步阶段,很多功能应用仍然存在局限性,只能在一些特定场景下发挥作用。

真正的AI手机距离普及还有很长的技术门槛。

旷视科技副总裁谢一男表达了他对当前“AI手机”的看法。

他认为,现在很多手机不能称为“AI手机”,更多应该称为“AI相机”。

如今,改进最多的AI应用是在相机中。

无论是拍照、解锁,还是认知、优化、分析等,都是基于这个“AI相机”。

AI Camera最浅层是人脸解锁,更高层可能是AI智能优化。

计算机视觉为手机带来了三大应用方向和三种解决方案。

视觉应用是手机AI应用中最重要的需求。

2018年的调查显示,当你购买手机时,影响你购买决定的最重要的七个因素是:73%的用户会考虑电池续航,51%的用户会考虑拍照效果。

从图中我们可以清楚地看到,目前主流的手机应用大部分都与视觉应用相关(蓝色直方图)。

可以说,提高视觉技术是目前提升用户体验最直接有效的手段。

目前,基于计算机视觉开发的AI手机上的人脸解锁和人像美颜功能在手机应用中的渗透率分别高达75%和90%。

与此同时,日益旺盛的AI视觉需求也对产业链提出了更高的要求。

应用、算法、解决方案和硬件将交织在一起,缺一不可。

给用户带来超出预期的视觉体验,需要产业链的协同发展。

视觉技术的创新与产业链的发展紧密相连。

IDC将计算机视觉技术对手机安全的影响分为四个层次。

各个层面的创新既相对独立又相辅相成。

利用新设备、新算法打造新解决方案、探索新应用、改善用户体验、增加用户粘性是AI手机快速普及的重要驱动力。

从上图可以看出,计算机视觉技术在手机上的应用主要可以分为识别认证、AI摄影、3D感知三大方向。

1. 身份识别和认证。

通过高效的人脸识别算法,手机可以实现毫秒级的人脸解锁和金融级的人脸支付。

目前,该技术已广泛应用于手机上互联网金融风控、共享出行司乘人员核验、社保等行业检测欺诈行为。

2.人工智能摄影。

人工智能可以智能分析用户的年龄、肤色、体型等特征,通过人脸检测、关键点检测、场景识别等AI算法精准提升图像质量,让成像更加自然,为用户提供拥有更完美的体验。

3. 3D传感全栈解决方案。

IDC认为,3D感知将在手机领域实现计算机视觉的重大突破,为手机应用开辟更广阔的空间,比如AR游戏虚拟化、试戴等应用。

然而,目前基于3D的传感应用尚未普及。

以上所有应用都离不开摄像头解决方案。

目前,市场上的解决方案有双摄、三摄、深摄三类。

目前,市场上的双摄方案主要分为三类: 1、景深方案。

一般采用两个不同像素的传感器进行拍摄。

主摄像头像素极高,负责拍摄整体画面。

副摄像头像素稍低,负责记录景深信息。

主要卖点是主体突出,背景虚化。

2.黑白+配色。

利用后置两颗摄像头结构上的细微差异,算法融合呈现出比传统单摄像头更好的成像效果,可以有效提高像素细节的相似度,让色彩的过渡更加自然。

整体的层次感得到了很大的提升。

其最大的卖点是图像更清晰,适合夜间摄影。

3、定焦双摄方案(广角+长焦方案)。

在不同的光照条件下,手机可以自主选择合适的摄像头进行自拍。

使用长焦镜头在光线充足的场景中拍摄,实现两倍无损变焦。

当光线不足时,采用广角镜头作为主摄像头,可以更好地保证亮度。

主要卖点是变焦拍摄更容易。

三摄方案也主要分为三种: 1、彩色镜头+黑白镜头+长焦镜头的组合。

具有高倍无损变焦能力,可以在弱光表现、变焦高分辨率、景深、虚化等方面提供更好的体验。

2、在彩色镜头+黑白镜头的基础上,增加COMS辅助成像可以带来更好的耐受性。

3、在广角+长焦方案的基础上,增加了鱼眼镜头,实现超级变焦功能,提供更多的可视角度。

简而言之,三摄可以通过黑白镜头同时拥有光学变焦和无损长焦。

还可以利用黑白镜头的补光优势,保证更好的成像质量。

这为人像模式等需要模拟大光圈背景虚化的场景提供了解决方案。

更多的可能性。

在弥补脸部曝光不足的同时,可以通过额外的摄像头获得更全面的景深数据,从而使背景虚化更加完美。

深度相机按照技术分类可以分为以下三类: 1.主流技术。

2.双目结构光。

3.飞行时间算法(TOF)。

AI视觉解决方案创新手机产业链的需求随着AI视觉需求的日益旺盛,AI视觉解决方案的融合将加速,对产业链提出更高的要求。

首先,随着AI应用场景的不断拓展,视觉应用的需求愈加强烈。

但过于复杂的产业链会延长开发周期,抑制应用的快速商业化。

同时,过高的门槛也会大大增加申请成本。

其次,由于手机设计的特殊要求,如轻薄、省电、产品迭代快、使用环境多样化等,要求产业链提供基于手机的端到端一站式解决方案。

手机厂商的需求。

能够高效定制、快速迭代视觉技术的产业融合势在必行。

报告指出,计算机视觉技术封装将成为手机产业链的关键环节。

可以看出,计算机视觉技术在手机领域的应用日趋成熟,但就技术本身而言,还有太多的应用场景尚未开发出来。

目前,市场关注度、渗透率和技术采用率较高的应用场景,如人脸识别、物体识别、物体检测等,还处于比较基础的物体检测阶段。

在更具体的事件检测和更灵活的人体检测、计算机交互和更复杂的信息重组、自主行为等方面的应用明显不足。

目前,AI视觉产业生态系统的整合正在发生。

以高通、联发科、紫光展锐等为代表的芯片厂商,以及以OBI、AMS、舜宇光学、欧菲光等为代表的光器件、模组厂商,都在通过资本等方式进行战略合作。

与上层算法、应用公司开展深度合作。

报告预测,未来AI视觉产品生态将更加融合,竞争将从单一产品转向平台生态。

只有多个供应商的紧密合作,才能将用户体验最大化。

而且,只有拥有生态平台的企业才能在行业洗礼中脱颖而出。

未来,无论是计算机视觉技术本身,还是“AI手机”行业的市场前景,仍然有很大的想象空间。

如何面对AI手机发展带来的问题。

人工智能在行业落地的关键是找到人工智能和这个行业的重合点,以及可以解决行业中哪些潜在的或者显着的问题。

谈到用户数据保护,谢一男分享了旷视科技的做法。

他表示,公司从一开始就通过“数据脱敏”的不可逆转的方式来保护数据。

如果数据被盗,在不获取算法源代码的情况下,无法恢复脱敏数据。

成人脸,这样对用户隐私的影响较小。

旷视是一个提供技术服务的平台。

人脸识别比对后,仅反馈相似度结果,不存储数据。

在谈到AI手机未来的发展时,谢一男认为,数据的缺乏是一个大问题,所以有两件事需要解决。

首先是在时间上,能否快速地直接从一小部分数据中生成注释。

其次,是如何“去人性化”数据标注的问题。