当前位置: 首页 > 科技赋能

对话商汤科技徐莉!解读单目实时动作捕捉技术SensePose

时间:2024-05-22 14:23:07 科技赋能

文章| Lina 在上周结束的 NVIDIA GTC(GPU 技术大会)上,在 NVIDIA 展台旁边的显着位置,一个深蓝色的大盒子非常醒目——这就是国内 AI 公司商汤科技的展台。

商汤科技此次展示的内容包括基于AI图像/视频识别技术的各类应用,包括智能视频、移动影像、互联网娱乐APP等。

其中,SensePose单目相机运动估计解决方案首次向公众亮相。

展会结束后,志东西与多家媒体联合对商汤科技CEO徐立进行了详细采访。

1. SensePose 人体运动分析和姿势恢复 SensePose 是单目相机解决方案。

用户站在镜头前挥动手臂并移动头部,面前视频中的皮影傀儡也会根据你的动作挥动。

用户无需佩戴传感器即可实现运动估计,降低了运动捕捉设备的制造成本,并在10像素以内定位人体关节上的关键点,从而实时、准确地识别视频中的人体姿势。

(体验SensePose)徐立表示,SensePose的技术主要在于视频的实时处理和分析。

传统的人体运动分析和姿势恢复需要使用红外光或结构光,而SensePose只需要使用普通的RGB相机即可完成要求。

,这不仅降低了成本,还增加了成本。

该技术未来可应用于游戏、AR等领域。

目前商汤科技已经在与一些互动游戏公司洽谈合作。

在去年的GTC China上,商汤科技还发布了视频结构化处理系统SenseVideo。

用于安防监控视频时,可以精准检测人、车、非机动车,并标注所有属性和标签,如人的年龄、性别、衣着等。

2、携手NVIDIA辐射下游公司。

除了在GTC设立展位外,商汤科技还是NVIDIA的战略平台合作伙伴,也是本次GTC大会的赞助商之一。

事实上,虽然商汤科技目前拥有超过2000颗GPU,但对于英伟达来说并不是一个很大的数字。

徐立表示,商汤科技与NVIDIA主要是在生态链方面进行合作。

通过商汤科技在NVIDIA底层架构上构建的AI应用,可以触达众多下游企业,比如使用商汤科技产品的安全、金融客户。

,可以逐步培育使用GPU的客户,扩大下游生态链。

一个典型的例子是:商汤科技的算法入围国家网信办视频审查系统时,最初使用的是CPU集群。

商汤推荐使用GPU,因此国家网信办几乎完全重构了GPU系统。

另一方面,NVIDIA的新品也将尽快与商汤科技进行对接。

例如,SenseFace的人脸识别系统SenseFace现在运行在NVIDIA今年3月刚刚推出的Jetson TX2上。

(智慧城市背后的心脏,解读NVIDIA人工智能工作站Jetson TX2)3.初创公司必须站在技术的最前沿。

随着深度学习应用的重大突破,近年来开始涌现一大批人工智能初创企业。

近期,不少大公司也逐渐进入这一领域,为客户提供人工智能解决方案。

初创企业如何与如此大的公司竞争?徐立认为,大公司会更加专注于自己的主业。

例如,谷歌的云技术也非常好,但亚马逊的云服务仍然占据市场主导地位,因为它们的主要业务侧重点不同。

对于初创公司来说,如果所有员工都专注于本地努力,在细分领域实际上会“以多胜少”。

因此,对于科技创业公司来说,公司必须在这个细分领域处于技术前沿,才能在市场竞争中拥有优势。

例如,商汤科技创建了一个原创的深度学习平台,可以处理多层网络;然而,目前的开源框架如Facebook的Caffe2和Google的TensorFlow不足以满足多层的需求。

4、人才是第一生产力。

然而,人们对深度学习应用需求的快速增长也带来了一个问题——人才短缺。

今年以来,专注于深度学习的AI人才短缺问题引起了众多企业的强烈关注。

Facebook和谷歌建立内部人工智能学院、培养内部工程师的消息也见诸报端。

国内,从BAT到大大小小的公司都在招募和发掘人才。

例如,3月份,微信事业群发布了30名AI高级学员的招聘信息。

针对目前的这种情况,智东西也向商汤科技询问了解决方案。

徐立表示,商汤科技采用内生式人才培养机制,由公司内部培养了大量经验丰富的导师。

中国其实有很多优秀、聪明的人才。

“二年级和三年级的学生真的很棒。

”因此,整个商汤团队都比较年轻,一来对公司业务比较熟悉,二来成本也低很多。