当前位置: 首页 > 科技赋能

对话阿里巴巴达摩院付强!年初阿里巴巴完成收购未来语音专用芯片或推出

时间:2024-05-22 12:49:46 科技赋能

Zhidxcom(公众号:zhidxcom) 文字 |据央视东西网5月3日消息,今日,阿里巴巴宣布全资收购北京先设互联网技术有限公司。

声学互联网创始人、原中科院声学研究所研究员付强博士,正式加入阿里巴巴达摩院机器智能技术实验室,负责语音交互前端处理技术和解决方案的研发。

先测互联网是智动智重点关注的早期创业项目。

也是国内最早从事语音增强和FarVoice语音交互界面技术的团队。

已为阿里巴巴、百度、小米等多家公司提供FarVoice语音交互软硬件解决方案。

智动智去年7月与其创始人付强进行了深入交流(中科院出来的一个小创业团队扼住了智能音箱的咽喉!)。

(图中红衣人为付强博士,背景为智动系前办公室。

)阿里巴巴宣布收购先声互联网后,智动也第一时间联系了付强。

在得到对方确认的同时,他也收到了有关此次收购的更多信息。

付强曾任中国科学院声学研究所研究员,在语音信号处理领域拥有20多年的深厚经验。

此次加盟阿里巴巴,他和他的团队将会演绎怎样的故事? 1、阿里巴巴全资收购于今年年初正式完成。

据付强介绍,阿里巴巴全资收购先声互联网主要是技术和人才的收购,并于今年年初正式完成。

本次共有5名技术人员加入。

其中大部分是傅强在中科院的原班人马,其中就有来自著名的杜比实验室。

“团队的核心算法成员有我以前教过的学生,也有从杜比实验室出来跟我一起创业的人,他们的共同特点就是文武双全,都能给国际顶级期刊写学术论文在IEEE trans等领域的文章也可以深入到实际的产品研发中。

”付强说。

在谈到为什么选择加入阿里巴巴时,付强坦回忆说,他从硕士毕业后就一直在做语音处理20多年。

当时语音处理还不流行,但他通过他的工作能够做到这一点。

这种精神一直延续至今。

“与善良、正义的人一起做有价值的事”解释了他内心的声音。

无论是最初12年在声学研究所的研究,选择创业,还是今天选择加入阿里巴巴,对他来说一直都是一样的。

这是他声学生涯的一个阶段,相信他会在这条路上走得更远。

付强和他的团队在语音增强等领域创造了多项国内第一。

在中科院声学研究所期间,与团队完成国家自然科学基金等科研项目30余项,并参与IEEE Trans.在权威学术期刊和会议上发表论文70余篇。

此外,他还积极将学术成果与实践相结合。

他分别于2016年和2016年与通用汽车和大众汽车合作,将远程语音解决方案应用于车辆。

这也是国内最早在消费级产品上的远程语音探索。

通过收购先声互联网,付强团队的远场语音交互技术解决方案也成为阿里物联网场景落地的关键一环。

2、准备建设声学实验室,实现更多场景下的语音交互。

加入阿里巴巴达摩院机器智能技术实验室后,付强负责语音交互前端处理技术及解决方案的研发。

他的短期目标是帮助语音交互技术在多种场景和终端上落地,并在复杂环境下保持正确的识别率。

让万物听得见的第一步就是让机器“听清楚”,但真实的场景往往伴随着各种噪音。

比如地铁、机场等场景:有人流、喇叭、嘈杂的背景音;家庭场景:噪声没那么复杂,但涉及到混响和回声处理;车辆场景:不远不近,混响小,但涉及胎噪、风噪等扩散场噪声。

在这些场景中,付强表示,他们都有不同的终端产品已经或即将投入量产。

在这些现有成果的基础上,他们将在技术深度和解决方案的可复制性方面有更多的布局。

尤其是针对智能家居的需求,付强团队正在研发低功耗、低成本、高度集成的端云一体化语音交互技术和基于小阵列语音增强技术的硬件解决方案。

近期,付强还计划与他的团队建设两个物理声学实验室。

其中之一是标准的全消声实验室。

该实验室将由付强和去年11月加入阿里巴巴iDST的前Polycom声学设计和信号处理首席工程师冯金伟领导。

共同建设。

另一个声学实验室用于复杂声学环境下语音交互系统的在线端到端测试。

这与现有的远程语音交互测试认证方法不同。

其特点是在局部区域(家里、汽车等)建立真实的声场场景,并在这个环境下建立一套完整的自动化测试流程,从而提高语音交互的准确性。

实现交互式物联网终端设备的效率和产品质量。

付强还表示,随着阿里巴巴在芯片上的战略布局,他们也会在语音专用芯片方面取得更多进展。

这让我想起2018年7月诞生的中国第一颗专用语音芯片,是由四川长虹和中科院声学研究所付强团队联合研发的。

该芯片在语音识别的基础上,集成了多种语音增强功能,包括语音降噪、回声消除、波束成形等,支持低功耗唤醒,可实现远场语音采集。

可以预见,不久的将来,付强团队也可能为阿里巴巴带来语音专用芯片。

猜你喜欢