文章| 4月简介:今年的创投圈,“VR/AR”、“智能交通”成为接近摇钱树的标签。
人才争夺战正在暗中进行。
基于这样的背景,很难想象有一个创业团队:从Magic Leap辞职的SLAM负责人没有追求AR,从百度自动驾驶项目辞职的总工程师没有选择自动驾驶。
今年3月,刘少山离开百度硅谷研究院,张喆离开Magic Leap。
两人毅然放弃了炙手可热的“行业”,开始了自己的项目Perceptln——为机器人提供完全基于视觉的SLAM解决方案。
与主流激光雷达SLAM相比,Perceptln的单目/双目视觉解决方案在性价比和通用性方面更具优势。
有望进一步普及机器人视觉系统,推动中低端产品智能化升级。
SLAM技术,通俗地说,是指为移动设备提供实时定位和空间关系信息,通常包括地图构建和路径规划。
我第一次知道少山先生是在2月份的一篇关于开源项目Alluxio的报道中。
当时,他还是百度的总工程师。
他此前曾在 LinkedIn、微软、英特尔和博通工作过。
九个月来,刘少山完成了从打工到创业的转变。
他经历过怀疑、彷徨然后冷静,也经历过权衡诱惑然后冷静。
他为我们梳理了Perceptln的创业逻辑和背景故事。
这也是人工智能时代初期众多中国硅谷创业者的一个明显缩影。
1、创业前两个月:没钱、没HR 刘少山和张哲相识于2000年,他们在微软总部一起工作,参与了微软机器人、Windows Phone等项目。
今年3月,两人先后辞去时下最热门的AR创业项目Magic Leap和百度硅谷研究院的职务,开始自己创业。
确定机器视觉领域后,两人将目标方向植入公司名称Perceptln(中文译名:普斯英察),即“感知+洞察/智能”(Perception + Insight/Intelligence),提供室内定位、深度学习、路径规划等软硬件一体化解决方案为移动机器人产品提供了一对“真知灼见” 留美留学、硅谷工作的刘少山经历了从芯片时代到PC普及和机器人时代的重要转变。
互联网、O2O、移动社交等技术浪潮正在快速迭代,移动互联网的窗口期不会太长。
如果错过了这个节点,再进入的机会就不多了。
”基于人工智能技术第三次浪潮,刘少山和张哲决定抓住这个机会。
在选择创业细分方向时,结合了兴趣和专业领域两个因素。
张喆毕业于纽约州立大学,获得机器人学博士学位。
他的研究兴趣包括地图重建、位置跟踪和机器人自主避障导航。
年初在Magic Leap工作,从事SLAM相关工作。
现在主要负责核心算法的解决方案。
刘少山拥有加州大学欧文分校计算机科学博士学位。
他的研究兴趣包括智能传感计算、系统软件和体系结构。
现任百度硅谷研发院总工程师,从事自动驾驶项目操作系统和硬件交互研发。
现在主要负责系统架构和集成。
随着安创孵化器深圳分公司的成立,刘少山表示将把更多的精力放眼全国。
创业后,他举家迁往深圳。
此前,两人已经在大学/大公司工作了很长时间,习惯了按部就班的节奏。
创业后,他们的心态和工作状态面临双重冲击。
“前两个月,公司没有钱,连HR都没有。
”刘少山回忆道。
处理一切是每个创业者早期都必须经历的忙碌状态。
在不断地追问和追问创业的初衷后,刘少山恍然大悟,“总结起来,就是一个节奏的问题。
一旦适应了快节奏、多线解决问题的生活,你的自信心就会下降。
”就足够了。
”人才一直是科技公司发展的核心竞争力,将研发中心设在硅谷可以充分利用当地优势。
“无论是产品还是人才储备,美国仍然走在前列。
”刘少山说。
从团队扩张速度来看,Perceptln的节奏比较稳定。
目前团队有近20人。
硅谷团队主要负责核心技术研发,深圳团队负责技术产品落地和供应链协调。
据智喜喜独家获悉,Perceptln正在跟进新一轮A轮融资,融资规模超过3000万元,预计年底完成。
2、深圳考察:机器人市场存量超预期。
虽然有扎实的技术支撑,但缺乏可靠、严谨的业务逻辑对于初创公司来说仍然是非常危险的。
从国内实际调查数据来看,服务机器人行业仍然是一个不冷门、不冷门的领域。
除了扫地机器人这种家电较多之外,一家企业年出货量6万台也算是一个乐观的数字。
如果基于如此有限的市场存量,B端解决方案提供商的机会将非常有限。
对此,刘少山带来了不同的视角。
“在项目初期,我们也查找并对比了多家咨询公司的报告,对家庭机器人市场的整体预期呈上升趋势,预计今年全球出货量将达到1万台。
” “而且,实物市场远远大于一些统计数据。
”这是刘少山深入考察硬件之都深圳后的感受。
他表示,中国制造商的海外出口量是一个被忽视的统计缺口;此外,在我国许多南方城市,还有一批“默默发财”的五金企业。
“他们不需要去找风险投资,也不需要媒体。
”曝光在默默无闻中保持高效运转。
”当然,更重要的是,“他们对高性价比技术解决方案的渴望非常强烈。
”刘少山说,一些非传统的机器人产品也需要视觉解决方案。
“比如行车记录仪“它本身可能不会移动,但对于倒车、导航等场景中的建模和时空信息的捕捉是非常有必要的。
”刘少山还介绍,应用于农业场景的苹果采摘机器人就是Perceptln的海外客户之一。
“在美国,劳动力成本非常高,农业机器人的市场规模每年达到50亿。
”刘少山分析道,在刘少山看来,Perceptln瞄准的是更具潜力的市场3.投资者来了。
到你家门口:“只要你造自动驾驶汽车,我就投资你。
”今年的创投圈,“VR/AR”、“智能交通”已经成为接近摇钱树的标签,而人才争夺战正在进行。
基于这样的背景,很难想象有一个创业团队:从Magic Leap辞职的SLAM技术负责人没有追求AR,从百度自动驾驶项目辞职的总工程师没有选择自动驾驶。
在刘少山看来,资本对人工智能技术的追捧似乎有些疯狂。
据他回忆,在他创业期间,一位硅谷投资人主动表示,只要他从事自动驾驶汽车项目,他就会投资。
“现阶段,我们要权衡这是否是一个真正的风口。
”基于理科生客观求实的思维习惯,Perceptln在进行技术分析和方向决策时更加冷静:1)VR/AR本身比较空虚,实际上并没有达到预期的规模。
市场仍需培育。
“但这并不意味着团队已经完全放弃这个市场。
”基于手机的AR/VR游戏是Perceptln的平行产品线; 2)无人驾驶汽车涉及到几十种甚至上百种技术的融合,初创公司深度涉足这一领域其实希望和空间都非常小。
诞生于理念较为激进、创投氛围较浓的硅谷,Perceptln的风格显得有些“保守”。
在外人看来,Perceptln选择的视觉SLAM解决方案可能不像AR和智能汽车那么华而不实;但这是目前比较合适、可行的路径。
在产品进展方面,刘少山表示,团队专注于市场研发和产品定位;明年上半年,软硬件产品将陆续推出,其中一款基于双目视觉的AR/VR游戏将在中国和美国同步推出。
SLAM解决方案开发套件,以及合作的最终产品。
4.实施的产品:三种类型的集成解决方案目标是标准化。
具体来说,Perceptln基于核心算法和集成优势,提供了三类解决方案产品。
刘少山表示:1)纯软件AR/VR游戏,在手机上发布。
从硬件进入AR领域风险太大,而软件游戏有更多的使用场景和用户群体。
2)SLAM模块包括双目摄像头、智能手机级芯片、传感器组。
它是提供室内机器人等消费产品的交钥匙解决方案,可以实现地图构建、自主导航、路径规划和避障功能。
。
产品的优势体现在其高性价比。
3)基于标准化解决方案的高端定制,订单量超过10000台,实现产品个性化的深度定制,产品仍以室内使用为主。
目前,Perceptln的合作伙伴包括扫地机器人、ADAS厂商等,产品预计将于明年上半年推出。
此外,刘少山提出,团队提供的解决方案还包括基于单摄像头+六度陀螺仪的低成本解决方案,利用有限的传感器采集周边图像,无需提前扫描或外部传感器,以及在算法层面进行集成。
对采集到的大数据进行处理,生成准确的周围环境地图和自身定位。
从产品形态来看,Perceptln的双目视觉解决方案与英特尔已经实施数年的Realsense类似。
不过,在刘少山看来,两者在市场定位和受众群体上存在差异。
Perceptln的意义在于普及和低成本,以及更简单的适配,涵盖多个品牌和定位的移动芯片。
但后者更喜欢基于自有芯片的封装解决方案。
Perceptln的基本思想是在核心算法框架的基础上,根据实际场景和需求添加若干模块,搭建硬件平台。
由于简化了激光雷达、红外等传感器方案,刘少山坦言在产品精度上做了一些妥协,“对于消费级机器人产品来说,没有必要达到毫米级的方案。
我们最大的优势是集成度,单个SLAM算法和系统,只有融合才能带来更好的产品。
” 5、讨论:摄像头替代雷达的妥协方案可靠吗?坚持使用主流激光雷达选项之外的相机有什么意义?刘少山表示,他并不是故意躲避雷达。
“当前的激光雷达解决方案在价格和可扩展性方面非常有限,”他说。
普通4线雷达平均价格在万元左右,且雷达只能采集二维信息、避障和地图建模信息。
维度太少。
双目视觉可以基于深度学习实现三维综合信息并识别物体。
与实验室或前沿研发不同,消费类产品的技术解决方案对可靠性和安全性有更高的要求。
随后,笔者与刘少山就“手机芯片”和“单目相机SLAM”两个关键信息点进行了集中讨论。
1)手机芯片能否承载大计算负载? “移动芯片还有很大的潜力,GPU、DSP等都可以利用。
”刘少山说。
在具体性能层面,Perceptln可以在手机芯片上实现5-8公里/小时速度的机器运动SLAM计算,并为不同级别的手机芯片提供最适合的算法。
2)单目相机的SLAM方案可靠吗?刘少山表示,之所以考虑单目摄像头,是因为很多移动设备中双目摄像头的良率太低。
据刘少山介绍,部分AR眼镜的双目SLAM方案良率仅为20%。
问题的症结在于,双目相机在安装时的标定过程要求过高,需要人工干预。
基于手机的单目摄像头+IMU方案主要用于近距离检测。
主要原因是六轴陀螺仪的误差随着时间的推移而增大。
将前后帧率控制在33ms以内,可以实现厘米级误差。
此外,刘少山表示,模组解决方案还将引入相关校正算法,以满足实际场景需求。
七、结语:与刘少山谈话中感情的延续,让我回想起20世纪90年代初期国内互联网兴起带动的创业回国浪潮。
在人工智能带来的新世界里,他们勇敢无畏,不远万里回到祖国,实现更大的抱负。
与此同时,他们也承担着未知的风险和挑战。
他们的精神和勇气值得赞扬。
在Perceptln项目中实现,由于不需要提前扫描,不需要外接传感器等易用性,并且在模块体积和性价比方面有较大的提升空间,因此有望应用于室内机器人、AR/ VR、智能汽车等已经实现的硬件平台上的应用和普及,才能真正实现消费级品类的智能化升级。
单目/双目视觉SLAM方案虽然看上去偏离了主流激光雷达方案,但它确实是基于市场和B端客户需求的衍生产品。
无论是商业模式还是市场空间都是站得住脚的,而且有创新性,也更接地气。
气体。
谈起机器人的出现,刘少山可以追溯到十年前比尔·盖茨的一篇前瞻性文章。
在《每个家庭都有一个机器人》(A Robot In Every Home)一文中,比尔盖茨不仅预言每个家庭除了拥有一台电脑之外,还建议我们人人都应该拥有一台机器人。
“仙童半导体和英特尔带来了基于芯片的创新,然后微软将个人电脑普及到了家庭;然后谷歌通过搜索引擎连接了信息网络;Facebook将人类的社交行为转移到了线上,亚马逊、Uber和Airbnb将人类带入了互联网。
有一天,机器人会做所有这些事情,我们已经谈论机器人太久了,但我们希望基于我们自己的技术来推广这一天。
”这大概就是关于Perceptln的机器人梦想。