知知西(公众号:知东西)林奇5月20日,微软宣布收购了一家位于加州伯克利从事“对话式AI”研发公司Semantic Machines,以推广Cortana的语音服务和Azure Bot等产品服务。
此次收购后,微软将在伯克利建立对话式AI中心,推动AI语音交互的发展。
二十多年来,微软一直在对话式人工智能的基础算法上进行研究和寻求突破,例如语音识别和自然语言理解。
他们的目标是将计算机开发成能够看到周围场景、听到和理解人类语言的终端。
2017年,微软在对话式AI的两大方面取得了新进展,即Bot的基础算法和AI语音助手的语义识别和自然语言理解的基础算法,这使得他们在对话式AI领域又向前迈进了一步。
。
迈出了一大步。
通过本次收购Semantic Machines,微软打算将其语义机器技术与自有的人工智能技术相结合,将会话式AI技术提升到更高的水平,为用户带来更强大、自然、高效的体验。
除了微软对Semantic Machines现有技术的兴趣之外,该公司非凡的研发团队带来的潜力或许也是此次收购的一大原因。
无论微软是看他们的技术还是他们的团队,都表明了他们开发对话式人工智能的决心。
这也表明他们并没有在与其他品牌的激烈竞争中屈服,比如三星的Bixby 2.0和谷歌的Google Assistant。
1、语义机核心技术。
Semantic Machines之所以被微软收购,是因为他们开发了适合不同语言的新技术平台,让人工智能不仅可以识别人类发出的命令,还可以理解人类的语音。
对话。
他们开发的新平台代表了一种更强大的范例,使计算机能够沟通、协作、理解目标和完成任务。
该范例的实现利用专有的机器学习技术。
目前公司核心技术包括: 1、对话引擎。
Semantic Machines 的对话引擎是一种基于语音和文本对话建模人类对话的新方法。
该引擎从自然输入的声音和文本中提取语义意图,然后生成对话状态、文本和意图的自学习框架。
该对话引擎的自然语言生成(NLG)技术基于用户的对话和文本。
2.深度学习。
Semantic Machines 为一系列关键功能开发新的神经网络系统,从语义分析到对话状态,再到声音和语言模型、NLG 和语音合成。
3.语音识别。
该公司的语音团队包括来自 Dragon Systems、Voice Signal、Nuance 和苹果 Siri 部门的研究人员,他们都主导了 ASR 技术的开发。
现在他们正在构建一个新的语音平台,打破以前音响系统的限制。
该公司的 ASR 技术为对话算法提供了独特的功能。
4.语音合成。
这对于对话算法至关重要。
计算机的声音可以代替显示器,为用户提供他们想要的信息。
现有的语音合成技术,尤其是韵律模型,无法实现有效的会话计算。
该公司利用广泛的自然语言处理和机器学习来开发专有的语音合成技术,首次实现对话算法。
5、加强学习。
这是他们新平台的核心组件。
强化学习技术使系统能够不断向用户学习并实时扩展其能力。
这种重复学习使得系统能够提高对语义的理解,提高学习新领域知识的速度。
6. 数据库。
为了让机器学习说话和写作,他们正在建立世界上最大的训练语料库。
其专有技术可以捕获、自动注释和格式化大规模数据,使机器学习人类行为成为可能。
因此,该数据库是开发会话计算模型的关键。
7. 多语言架构。
他们开发的对话式AI技术是基于独立的语言框架。
语音和语言识别技术最初使用英语,但也可以支持其他模式,例如普通话等语言。
8、开发工具。
为了能够增强和定制对话式人工智能的功能,他们正在创建一套可在内部和合作伙伴中使用的工具。
通过使用这些工具,开发人员可以使他们的对话式人工智能适应他们自己的场景,并教他们新技能。
这一系列核心技术构成了他们的对话式AI模型。
通过建立深度学习的数据库,然后引入对话引擎、语音识别和语音合成,它们形成了一套可以应用于不同语言架构的开发工具。
这就是他们构建平台的目的。
通过收购该公司,微软掌握了他们的核心技术,并利用他们构建的完整深度学习平台来训练对人类语音有更彻底语义理解的程序,并将其应用到他们的人工智能服务中,例如 Cortana 和 Bot 服务。
,让它们与人类的沟通更加顺畅,提高产品的服务质量和水平。
2、Semantic Machines的团队 Semantic Machines之所以被微软收购,不仅是因为其技术专长,还因为它还拥有一支实力雄厚、潜力无限的研发团队。
微软可以借用这些人才来推动对话式AI的更多发展。
公司联合创始人兼首席执行官 Daniel Roth 并不是语音识别领域的新手。
十多年前,他创立了一家名为 Voice Signal Technologies 的公司,开发手机语音识别和合成系统。
苹果也使用了他们的技术。
很快,他们被 Nuance Communications 以 3 亿美元收购。
随后,他的第二家企业——一家小型激光技术公司Shaser BioScience也被收购。
这一次,他回到原来的声场,开始了第三轮创业。
此外,他第一家创业公司的老同事拉里·吉利克(Larry Gillick)也加入了新公司,担任首席技术官。
Larry 在语音领域拥有 30 多年的行业和研究经验。
他曾带领Dragon Systems团队开发了第一个语音听写产品。
后来,他加入了丹尼尔的语音信号技术公司。
该公司被 Nuance Communications 收购后,他担任新公司移动设备研究副总裁。
之后,他加入了苹果Siri语音助手团队。
作为该领域的先行者和长期实践者,Larry 拥有出色的技术能力并了解当下最重要的需求。
研究团队中除了Larry之外,还有很多杰出的学者。
例如,加州大学伯克利分校教授丹·克莱因(Dan Klein)。
他是自然语言处理领域公认的专家。
他曾任微软研究员、Adap.tv 首席科学家。
他发表了多篇关于 NLP 和机器学习的论文。
还有斯坦福大学教授Percy Liang,曾在谷歌工作过一年,是语义分析团队的创始人之一。
他还在顶级学术期刊上发表论文60余篇。
如今,他是该公司的首席科学家和计算机科学助理教授。
团队中的其他研发人员大多毕业于加州大学伯克利分校、斯坦福大学、麻省理工学院,也有在行业领先公司的项目经验。
通过收购这家公司,微软在波士顿和伯克利附近增加了业务,同时也增加了与对话式人工智能领域许多最优秀人才的联系。
微软人工智能与研究部首席技术官David Ku表示:“微软将基于伯克利强大的科研背景挖掘更多的人才和技术。
因此,他们将在伯克利建立人才基地,并通过基地”这个人才中心将与微软的其他对话中心合作,如Cortana研究部门、微软位于澳大利亚墨尔本皇家墨尔本理工大学的Cortana智能研究所、以及位于华盛顿雷霆的Cortana智能研究所。
” Demond的微软AI和研究小组。
3. 对话式应用Cortana 中的人工智能 Semantic Machines 开发的对话式人工智能技术在微软产品中的应用将集中在 Cortana、Xiaoice、Azure Bot Service 和微软认知服务,以及微软在一系列产品上的使用,包括用于客户服务和其他领域的人工智能解决方案。
面向企业客户的会话计算技术。
那么,对话式 AI 技术将如何改变 Cortana? Cortana是微软语音产品团队从2016年开始开发的,直到2016年Build大会才向公众亮相。
最初,Cortana 作为应用程序集成到 Windows 10 系统中,随后微软将 Windows 8.1 的通用 Bing SmartSearch 功能集成到 Cortana 中。
用户可以发出命令,让它通过搜索引擎自动完成一些事情,比如在餐厅网站上查找营业时间。
、显示网站的零售优惠券或在地址栏中显示天气信息等任务。
用户需要按设备上的“搜索”按钮将其唤醒,然后使用语音而不是键盘来发出命令。
自今年10月推出Lumia Denim手机系列以来,Cortana就新增了聆听功能,你可以用一句“Hey Cortana”来唤醒它。
多年来,Cortana 不断添加新功能。
但这些发展都集中在平台用途的扩展或者服务范围的扩大上。
2006年,微软将其集成到Skype中。
作为机器人,它开始与人类进行对话。
然而,它只能识别人类对话中的关键词并提供简单的搜索引擎式响应。
这种对话通常是另一种形式的命令。
Cortana 可以为用户提供响应或服务,例如订餐、预订、录制视频消息和进行日历约会。
可见,Cortana只是基于用户在PC或移动端留下的数据信息,并集成搜索引擎或第三方应用来满足用户日常生活和工作中的简单需求。
但与用户的沟通,尤其是情感互动却有所欠缺。
与小冰听到有人说脏话就会立即呼叫人类相比,Cortana 在理解人类语言并进行交流的能力上稍显逊色。
不过,David Ku 表示:“如果将语义机器的技术融入到 Cortana 中,它将变得更加智能、更加灵活,能够用更少的言语完成更多的任务。
” “从最终用户的角度来看,我们将使用语义机器方法来创建新的功能,可以识别更复杂的语言变化。
例如,您可以发出命令,然后回来说,‘不,我的意思是不要发送将此信息发送给我的老板,将其发送给我老板的“老板”,让系统自适应地从上下文中找出您的语义,这样您就不必从头开始重复您之前所做的事情,它更具弹性和适应性。
David Ku 在接受 VentureBeat 采访时表示,Cortana 目前的语音应用程序是使用 Azure Bot Service 或 Microsoft Bot Framework 创建的。
此次收购后,微软将把 Semantic Machines 技术集成到微软产品中。
,开发者可以利用深度学习来训练语音应用的新功能。
结论:左手技术和右手人才微软推动对话式AI的发展,通过收购Semantic Machines,微软不仅拥有了他们在语音识别和自然语言方面的技术。
语言理解,还收获了许多对话式AI人才。
而这些人才将会吸引更多的同一领域的人才共同致力于推动该领域的技术发展。
从微软目前的收购来看,他们对人工智能的下一步计划是让他们能够更快速、更准确地识别人类语言中的意图,并更像人类一样做出反应,而不仅仅是局限于功能。
高效完成任务是一个非常重要的发展方向。
日前微软在北京举办的人工智能大会上,他们在对小冰的介绍中表示:“在小冰的发展中,最重要的是信任。
” 信任源于理解。
对于人工智能产品来说,理解意味着语音识别、自然语言理解等方面的技术突破。
微软正在建立这种信任,并创造更多可以与人类顺畅沟通的产品和功能。