当前位置: 首页 > 科技赋能

探索人工智能算法的秘密!地平线科技三剑客解读

时间:2024-05-22 17:33:58 科技赋能

智能物联推荐词:地平线机器人是原百度深度学习研究院(IDL)常务副院长余凯博士的创业项目。

目前专注于汽车和机器人智能领域。

人工智能被认为是跨领域新技术革命的中介力量,但它仍然显得非常抽象。

地平线在余凯博士的带领下,拥有一批技术人才。

通过三位技术专家对AI算法的解读,我们可以一窥什么是人工智能,以及这些研究人员使用哪些算法来实现智能。

本文已由智动智授权发表:黄畅:做能真正解决实际问题的算法黄畅博士,地平线联合创始人&算法副总裁。

毕业于清华大学计算机科学与技术系,获学士、硕士、博士学位。

曾任南加州大学、NEC美国研究院研究员。

2011年加入百度美国研发中心,2006年参与成立百度深度学习研究院(IDL),担任高级科学家、首席研发架构师。

长期从事计算机视觉、机器学习、模式识别和信息检索方面的研究。

作为相关学术界和工业界的知名专家,发表的论文多次被引用,并拥有多项国际专利。

他开发的人脸检测技术创造了全球第一个大规模应用计算机视觉技术的成功范例,占据了数码相机市场80%的份额,并被苹果iPhoto等众多图像管理软件采用。

领导百度IDL图像技术团队,负责公司内部各项图像核心技术研发,推出全网人脸图像搜索、PK名人、全网相似图像搜索、自然场景文字识别、百度手机图片搜索、图片凤巢等重要产品。

在校期间获得年度微软学者奖学金、2018年清华大学优秀博士论文、2018年北京市优秀博士论文等荣誉。

“视觉媒体几何计算理论与方法”项目荣获2016年度高??校科研优秀成果奖一等奖。

获奖,并参与国家规划项目“面向立体空间的互联网中文信息处理理论与方法”。

初识人工智能应用研究 黄畅参与的第一个学术项目与解决实际问题有关。

在我大三的时候,人工智能还处于低谷。

但一次偶然的机会,让黄畅与导师艾海舟一起参加清华大学与日本欧姆龙公司的技术合作项目,研究图像识别领域非常重要的人脸检测问题。

当时他并不知道,他后续的研究成果将成为早期计算机视觉技术大规模商业应用的成功范例,诞生了世界上第一颗人脸检测专用芯片。

如今,这项技术已经以“芯片+软件”的模式广泛应用于生活的各个角落,从数码相机、智能手机,到苹果iPhoto等软件系统,占据了很大的市场份额。

这项技术在我们今天随处可见的镜头中实现了自动脸部对焦和智能调整曝光肤色,彻底改变了相机诞生以来人们的拍照方式。

当时,人工智能领域的大部分技术都很难在业界找到适合的发展方向,因为技术尚未成熟,大部分还处于实验室阶段。

即使黄畅博士毕业时,人工智能产业的规模还相去甚远。

很多从业者觉得这个行业“不靠谱”,纷纷转投互联网或者金融行业。

该项目的成功标志着人工智能实际应用迈出了重要一步。

这个成功的例子向世人证明了人工智能在应用中可以发挥的巨大潜力,使得人工智能开始受到相关人士的关注并得到越来越多的投资。

对于黄畅个人来说,也让他更加看好人工智能的未来,让他一路走下去。

十年轮回,黄裳在接下来的十年里继续努力。

黄畅完成硕士和博士学位。

比其他人用更少的时间。

受邀到南加州大学Ramakant Nevatia教授做博士后研究两年,后加入硅谷NEC美国研究院。

在这段时间的工作中,黄畅收获了两件“人生大事”——真正从产业角度对人工智能进行了深入思考和研究,并结识了亦师亦友的余凯。

回国后加入百度IDL,带领优秀图像技术团队打造全网人脸图像搜索、PK名人、全网相似图像搜索、自然场景文字识别、百度手机图像搜索、图片凤巢等。

和其他重要产品。

鉴于这些出色的工作成果,他和他的团队获得了价值100万美元的“百度最高奖”。

在实际应用中,这些产品也展现出了巨大的“威力”。

比如,图片丰巢的技术成果让百度广告收入增加了5%-6%。

2009年离开清华前夕,在与其他同学讨论未来行业发展趋势时,他曾表示,“5-10年这个行业肯定会实现重大突破并得到广泛应用。

”这一预测今天也得到了证实。

很好的证明——从2009年开始,以深度学习为代表的人工智能大量复兴,今年甚至被称为“人工智能普及年”。

在深度学习中,卷积神经网络广泛用于图像识别。

加入地平线后,他开始了“算法+芯片”的研究工作。

仅仅十年的经历和思考,让他对“算法+芯片”有了前所未有的深刻思考和清晰认识。

算法应该用来解决实际问题。

在加入地平线时,黄畅就已经形成了自己对于AI算法研究的一套价值观,那就是:算法是用来解决实际问题的。

它是一个工具,而不是目的。

这也是整个Horizo??n算法团队所秉承的理念。

因此,当很多公司的很多团队还在算法数据集上争夺“第一名”时,地平线的算法研究方向已经在朝着下一个目标迈进。

具体来说,他认为,如果想让算法真正解决实际问题,在考虑算法之前,必须正确地对这些复杂的实际问题(公式化)进行建模,选择甚至定制一个合适的系统(系统),基于它的驱动大量的数据并结合模型和知识的表达来解决这个实际问题。

没有这个轴,我们做出的算法就没有实际意义。

现在很多人讨论算法,往往忽略了要解决的问题的本质。

没有正确的抽象和建模,也缺乏坚实的体系来承载和可持续的积累。

这种过分强调算法本身的结果通常会导致建模过于简单化(即使用单一算法和系统来解决实际上非常复杂的问题)。

导致该算法很难取得实质性突破,更谈不上真正应用。

的产品。

例如,在自动驾驶领域,一些公司声称正在利用深度学习进行端到端训练,直接学习从传感器输入到控制器(刹车、油门、转向等)输出的功能映射。

我们无法对这个黑匣子模型进行有效的分析,很难找出使用过程中出现故障的原因。

自动驾驶是一个对可靠性要求极高的领域,需要考虑很多长尾条件下的极端情况。

这种建模方法没有提供自动驾驶问题的正确形式化描述。

在此基础上构建系统和研究算法是非常低效甚至徒劳的。

基于这些思想,地平线算法团队在黄畅的带领下,继续在许多重要的算法研究方向上努力,包括基于贝叶斯网络的推理系统和感知-决策-控制的强化学习系统等,并努力将Horizo??n的算法技术水平推上了一个新的台阶。

基于深度神经网络增强学习的理性决策 此外,在全智能、万物互联的时代,人工智能技术正日益从云端走向终端,催生了“端上设备”的巨大市场人工智能”。

这也意味着地平线的算法研究中,必须增加一个新的思维维度——与芯片更好的集成,实现高精度、高效率、高吞吐量、低功耗、低成本。

替换通常花费数千美元并消耗数百瓦能源的原始 GPU 架构。

凭借算法、硬件等团队的努力,地平线已成为全球嵌入式人工智能领域的领导者。

罗恒:忽视Trick将难以解决实际问题 罗恒是地平线机器人公司的高级算法研究员,负责深度学习模型压缩和加速。

他毕业并获得博士学位。

2011年获上海交通大学博士学位,后师从Yoshua Bengio从事博士后研究。

2016年加入百度深度学习实验室,参与深度学习在搜索中的应用以及PaddlePaddle的研发。

8月加入地平线机器人公司。

罗恒有点胖,经常自嘲“需要减肥”。

方框眼镜后面的眼睛睿智而明亮。

作为一名算法工程师,他的生活常常处于高速的脑力运转之中,这让他的每一秒时间都弥足珍贵,走得快如风。

2016年从上海交通大学获得博士学位后,罗恒跟随Yoshua Bengio从事博士后研究。

回忆起自己的深度学习之旅,罗恒抚摸着眼镜说道:“那是一次非常有趣的经历。

”他似乎准备好讲故事了。

计算机专业的罗恒在AI大师Yoshua Bengio门下读研究生时,偶然了解到机器学习,觉得很有趣。

从此,他开始关注机器学习的学术动态。

在攻读博士学位期间,罗恒看到了Yoshua Bengio教授关于深度学习的技术报告。

虽然当时不懂深度学习,但罗恒仍然强烈地感觉到,这可能是机器学习的下一个最大突破。

“读完Vapnik的书后,我感觉自己还没有赶上这一波浪潮(研究热潮),所以我想,下一波浪潮是什么?当时我觉得深度学习应该是下一个学术浪潮,那就是“罗恒的博士后导师:Yoshua Bengio 教授,蒙特利尔学习算法研究所所长,CIFAR 神经计算和自适应感知项目联席主任,加拿大统计学习算法研究主席,Geoffrey Hinton。

、Yann LeCun 并称为当今人工智能“三巨头”。

他们共同创造了自 2008 年开始的深度学习复兴,并实现了人工智能的第三次研究热潮。

他带领一批研究生和博士后开展机器学习,对整个学术领域影响很大(谷歌学术发现年中引用次数超过0,H指数为84)。

与此同时,Yoshua Bengio也在不断指导他的团队研究深度学习语言,其中神经机器翻译系统最近取得了令人兴奋的成就,比如最新版本的谷歌翻译,其翻译水平甚至可以与专业人工翻译相媲美。

当时,AI大师正好在招博士后。

虽然罗恒只发表了两篇论文,但这两篇文章却得到了 Yoshua Bengio 的极大认可。

在采访罗恒之后,Yoshua Bengio 收留了他。

就这样,罗恒飞赴加拿大,开始攻读深度学习博士后,开启了研究深度学习的学术之旅。

压缩加速模型实现嵌入式AI 罗恒学成归来,已经是20年前的事了。

回国后,他发现业界已经开始深度学习研究。

“研究工作能够付诸实践是很少见的。

我发现自己不仅赶上了研究的浪潮,也赶上了实际应用的浪潮。

当时于凯先生在百度创办了IDL,所以我选择了加入。

“当我加入百度IDL时,罗恒和他的团队主要做的是如何利用深度学习进行搜索排名。

但他发现,近年来,为了保护隐私、安全,避免对网络的依赖,越来越多的深度学习算法模型开始在终端上运行,这对模型的规模、速度、能耗、性能提出了现实的要求。

从云到端,让各种智能模型在我们身边随手可得,于是,2006年,他加入了余凯创办的Horizo??n,专门从事神经网络模型的压缩和加速。

高性能低功耗IP,提供软硬件结合的端到端人工智能解决方案,推动嵌入式人工智能产业生态链的建立,在此过程中,算法模型压缩和加速是必要的一环。

的技术实施。

他喜欢当老师,并且非常重视魔术识字。

大家都称呼罗恒为“罗老师”。

这或许也受到了他的导师 Yoshua Bengio 的影响。

Yoshua Bengio 是人工智能三巨头中唯一仍然坚持学术立场的深度学习大师。

他全身心投入学术界,进行纯粹的学术研究,带头培养了数千名科学家和工程师。

罗恒继承了恩师的为师精神。

除了致力于应用研究之外,他还非常重视人才培养,尤其是技巧素养的提高。

刚进入人工智能行业的同学常常感觉自己的研究无从下手。

理论文章虽多,但似乎实际用处不大,常常感到一头雾水。

与其他沉浸在理论中的人不同,罗恒善于引导他们改变思维,从Tricks入手,并利用这些Tricks更好地带领新人解决实际问题,比如使用训练好的神经网络来采样数据并更快地发现数据。

机器学习的很多研究都是基于理论,但实际上很难描述一些现实生活中的问题。

Trick是一种实用的方法,从研究的角度来看可能看起来不太优雅,但在很多实际问题中,忽视trick是不明智的。

“Trick对于大家来说是解决实际问题的好办法,尤其是对于刚入行的同学来说。

招新人,抓学术应用在人工智能研究的大潮中,算法人才从来都不是紧缺资源。

”罗罗恒一直希望志同道合的人能够成为他的伙伴,他会像他的老师一样带领新生力量投入到深度学习的研究中,本科生罗恒在模型压缩和加速方向招收了三名实习生。

他觉得这是一个美妙的转变,六个月后,他将带领实习生一起追求学术和应用。

“实习生来到这里和我们一起写代码,做实验,验证各种想法,写论文。

如果他们有好的结果。

我们还会带领实习生针对同一主题尝试多种解决方案。

通过尝试和错误取得进步。

》罗恒一直在等待。