当前位置: 首页 > 科技赋能

阿里巴巴人工智能实验室如意独家专访!智能音箱是让更多人享受AI乐趣的重要接口

时间:2024-05-22 10:26:11 科技赋能

2019年11月,亚马逊悄然发布了智能音箱Echo。

这款硬件产品看上去与其他音箱没有什么不同。

它可以通过语音交互播放音乐、报告天气等。

闹钟提醒等,做一些简单的服务输出。

当时,人工智能在中国还没有那么流行,BAT正在为次年火热的外卖大战做准备。

从AlphaGo与李世石的世纪之战开始,“人工智能”一词迅速进入大众视野,成为科技圈当年的热门话题之一。

不过,相比神秘的AlphaGo,消费者更熟悉的是另一种人工智能产品,那就是“智能音箱”。

智能音箱对于普通人来说并不陌生。

随着大数据、物联网、AI等技术不断成熟,谷歌、小米、百度、阿里巴巴等公司正在推动智能家居迎来又一波发展,而这波浪潮的主角就是智能音箱。

在今年的亚洲CES上,天猫精灵带来了多款产品。

OFweek智能家居网编辑独家专访了阿里巴巴人工智能实验室终端产品总经理如毅先生。

天猫精灵价格为何跌至两位数?阿里巴巴给天猫精灵这个硬件什么样的资源?来听听他怎么说吧。

如意Q:OFweek智能家居网答:如意Q:您有做音箱的经验吗?您之前的工作经历对您从事天猫精灵音箱终端工作有帮助吗?答:在大多数用户的潜意识中,扬声器越大越好,品牌知名度和音质越高越好。

智能音箱不仅要求能够发出声音,从结构、系统,甚至音箱设计等细节上来说,只有一切设计完美,才能展现出良好的品质。

多年在小米电视事业部研发岗位的工作经历,让我对智能音箱有了很好的体验。

在音箱的音质测试中,我们会从“平坦的曲线”上提出要求,比如频段内没有破音,这就需要扎实的基础。

音质方面,要达到品牌级标准,有些地方要柔和一些。

,那么其中的某些部分需要进行相应的处理。

不同的人对音质的主观感受完全不同,但在保证基本音质和音效的前提下,我们也会有自己的特点。

其实我们的产品并不像普通音箱品牌那样强调我们的低音特别好,达到发烧友的水平。

我们强调让老人、孩子或整个家庭在家居环境中听起来更加舒适。

这就是我们对音质的理解。

我们内部的号召是“完整的内部语音,满足用户的家庭听音效果,设计高品质音箱下最好的产品”,所以我们把产品做了天猫精灵,希望更多的人购买这个产品,并且我们会进一步优化让更多的人体验这个产品,体验AI。

该产品实际上有两个优点。

首先,我们的产品在国内率先采用双麦克风,在3米范围内拾音效果非常好。

第二个是我们是国内第一家推出前置扬声器声音,即前置扬声器声音的智能音箱公司。

目前,前置扬声器是最好的。

该产品是技术能力最强的。

为此,我们有世界赫尔曼五级金耳朵负责聆听。

我们还引入了BTS的后处理技术来专门帮助我们调整音效。

由于互联网的音源和音质内容与传统音源不同,BTS处理可以更好地还原音质中的问题。

这是我们的第一次独家合作。

这就是音质补偿。

我们还制作了自动音量均衡器。

在网上听不同的音乐时,录制的音量不同,导致声音变大或变小。

调整自动音量均衡器后,即使用户听完整张专辑,声音也会变大或变小。

不会感觉到音量变化。

此外,我们还实现了人声增强功能,专业术语称为“对话增强”。

该技术主要用于增强人声效果,使话音更加清晰。

通过这项技术并与人工智能相结合,可以说这个产品是目前最好的产品。

智能音箱是人工智能落地的新赛道。

音乐只是智能音箱的功能之一,而不是唯一的功能。

我们将智能音箱定义为语音交互的人机入口。

他们不仅能提供音乐,还能提供无限的想象力。

Q:智能音箱对音质和系统有特殊要求。

天猫精灵是阿里巴巴支持的项目,集团会提供一定的资源吗? A:用户在天猫精灵上购物的时候,比如点河马快餐、充话费等等,集成起来会让他们变得更聪明,把阿里生活服务里的东西实现起来。

这些不仅对我们来说更加方便。

功能其实就是这个语音交互入口可以服务多少人。

PC诞生之初,即互联网时代,其所能触及的用户数量为数千万,主要群体为学生和白领。

主要用于学习和工作。

它是一种工作设备。

百度是百度问答,腾讯的优势是娱乐和社交,小米的优势是智能家居对接,阿里巴巴的优势是电商和生活服务,其次是阿里巴巴投资的各种公司,比如饿了吗?河马和天猫超市。

在此基础上,我们的核心优势就是最大限度地发挥阿里巴巴的优势和国内巨头的优势。

据不完全统计,中国约有7亿智能手机用户,但并不是所有人都享受到了互联网的红利。

也就是说,我的父母还不知道怎么用滴滴打车,只能用微信和我们简单交流。

打字速度也比较慢。

虽然这些人没有享受到互联网的红利,但其他接触互联网的人数却从千万增加到了数亿。

智能音箱,我们称之为人机语音交互系统,带来的不是几亿用户,而是数十亿人。

理论上,它们可以让数十亿中国人接入互联网,享受互联网带来的便利和便利。

互联网的红利,所以我们讲阿里巴巴为什么做智能音箱。

其实我们希望通过这种互动升级,能够把互联网的价值带给更多的人,让更多的人感受到我们给他们带来了什么。

方便,这就是我们要做的。

所以音乐是人机语音交互系统的一部分。

目前,这是其最重要的服务。

但在接下来的十年里,我认为将会出现更多的应用程序来帮助人们的日常生活。

现在这只是一个开始。

A:从互联网到物联网再到智联网是一个阶段吗?目前天猫精灵售价89元,百度和猎豹只有一款智能音箱产品。

那么天猫为何采取这样的策略呢?问:我们的视角和维度叫做交互。

在交互的基础上,你会发现人首先向机器学习,最后发展到机器理解人。

天猫精灵目前拥有三款产品。

去年推出的一款名为天猫精灵S1。

这是我们的第一个产品。

这就是我们所认可的音质比较好的产品,受到用户喜欢的产品。

我们这样定义它,然后把它推出去。

今年3月,它被称为天猫精灵,Cookie,是天猫精灵X1的缩小版。

目前,天猫精灵方糖已上线,售价89元。

这就是我们对这个产品的看法。

智能音箱有多种形式。

我们做出改变是希望任何人都可以享受AI,以非常低的成本感受到AI带来的便利,然后我们推出它。

后来我们发现这个产品最受欢迎,然后我们就开始策划新产品。

这个产品是一个非常终端的产品,希望能够给消费者带来温暖的体验,也希望通过这个产品,我们的合作伙伴和渠道能够去门店体验一下,感受天猫精灵带来的便利。

我们的产品做到了以下几点: 1、充分发挥自身优势。

比如娱乐方面,音箱是为了音乐,所以我们解决了虾米音乐的版权问题,也解决了儿童版的问题。

视频方面,我们和优酷结合起来进行控制和点播。

2、自身优势:本地生活,用户可以缴纳电话费、水费、电费,还可以去天猫超市购买物品。

3、智能家居。

天猫将对支持阿里云的智能家居企业提供一定的支持。

目前,可连接的设备已达数千万台。

但就智能家居而言,我认为蓝牙mac是一个将智能家居和语音完美连接的协议,而且它的控制非常简单。

传统WiFi智能家居中需要复杂的链接模式,而蓝牙只需要近距离链接,从而避免了各种复杂的操作模式。

高频设备通常可以通过语音控制,例如灯、插座、风扇、空调等设备。

几年前的控制模式中,通常都是通过手机APP通过WiFi来控制各种设备。

不过现阶段,使用语音控制来控制各种设备会更加容易。

A:为什么选择智能音箱作为智能家居的入口?天猫精灵未来会做出什么硬件选择吗?你害怕失败吗?还是被淘汰? Q:这也是我们选择智能家居的一个过程。

当我们选择智能家居语音入口时,我们需要选择其中一款家电产品作为切入点。

如果是以电视、冰箱、空调等产品作为切入点,那么用户更换这种家电将会花费不菲。

以音箱为突破口,周期相对较短。

同时,用户在拥有一套音箱后,也会购买其他品牌的音箱作为试用。

其次,普通音箱的成本并不高。

人机交互最基本的要素是“听和说”。

音箱本来就具有“说”的功能,我们只需要给它加上“听”的功能,就具备了与人沟通最基本的能力。

通过与云大脑的配合,可以完成很多智能的事情。

所以这也是很多厂商选择智能音箱作为产品的原因。

我们有一个非常核心的想法:我们只会做互动入口。

因为我们研究的方向是语音交互,然后是视觉交互,然后是移动性。

这些能够给人们带来便利,成为交互入口,能够带来交互升级的产品,是我们要研究的方向,但是我们未来可能会有什么样的产品,如果是一个交互入口,那么我们就会尝试去做。

如果没有,那么我们也不会偏离,因为我们能做的就是交互,我们的优势是后台的云端和大脑,可以处理、可以分析。

创新的路上总会遇到一些意想不到的事情,从而导致失败,但我相信,如果你对事件有清醒的认识,对未来有长远的思考,你就可以避免失败。

但要确保大方向是正确的。

我们从语言开始,但就目前而言,纯粹的语言交互是不够的。

对于人来说,他们是由五种感官组成的。

在未来的趋势中,如何与人更好地沟通将成为未来的发展趋势。

下一步可能是视觉,下一步可能是控制行动的能力。

而在产品衰退更替的过程中,我们可能会思考如何让机器视觉变得更好,如何增加移动性,使其更加智能。