3款未上市智能音箱独家体验！三个女人的美声和智商

时间：2024-05-22 11:50:24 科技赋能

Zhidixcom（公众号：zhidxcom）|鱼洋当当~智能音箱体验大赛第二季来了！！上月初，智动西开启第一季智能音箱体验PK，使用了京东&科大讯飞的叮咚音箱A1、阿里巴巴的天猫精灵X1、Rokid的若琪、国外“大哥大”亚马逊Echo和谷歌Home采用中外音箱“混战”的模式，让国内外早期的智能音箱进行“较量”的同时，也让我们感叹人类“智商”的伟大！（左起：叮咚音箱A1、亚马逊Echo、Google Home、天猫精灵X1）仅过去一个月，中国又推出了一波新的智能音箱，包括雷军的小米AI音箱、京东和科大讯飞家居的叮咚2代，AI初创公司出门问问的家用音箱目前，小米AI音箱刚刚开始公测，叮咚音箱的最新产品叮咚2代尚未上市。

也在众筹中，抱歉，这三款现在都买不到了！您是否渴望体验最新一代的产品？没问题！本次智能音箱体验赛，智动用这三款国产最新音箱给大家深度体验！顺便“剧透”一下，他们的“智商”正在不断提高。

1. 每位发言者“登台亮相”。

下面隆重介绍一下本次智能音箱体验大赛的三位“选手”。

它们是小米的“小米AI音箱”和京东科大讯飞的“叮咚2代”。

”，以及来自 Gomovojia 的“Tichome 扬声器”。

（左起为小米AI音箱、叮咚二代、微信音箱）小米AI音箱是小米首款智能音箱产品。

7月26日发布，8月22日正式开启公测，超低价已上市，正式上线日期尚未确定。

该音箱采用了声智科技的6麦克风环形阵列，Nuance、Spirit等十家语音识别公司的技术，小米大脑、海智智能、三角兽等语义技能以及猎户星的语音合成技术。

堪称是一位综合百家之首的“小声音怪物”。

（小米AI音箱）叮咚2是玲珑科技推出的第二代智能音箱产品。

玲珑科技的背后站着电商巨头京东和语音巨头科大讯飞。

叮咚2的售价在万元左右（尚未上市），体积比叮咚A1小很多。

这款音箱依然采用8麦克风环形阵列，顶部配备了LED屏幕。

它支持声纹识别和自定义唤醒词。

。

（叮咚二代）Wevoi音箱是出门问问推出的首款智能音箱。

8月24日发售，售价0.05元。

该产品上线不久，目前还在众筹中。

该扬声器采用 Conexant 的 2 麦克风阵列和 MediaTek MT 芯片。

由于音箱还没有量产，为了让大家一睹为快，使用出门问问的工程机对这款智能玩意进行了测试。

因此，可能会存在一定的稳定性问题，这里我想解释一下。

（问讲者）为了给他们更好的PK，我们从开箱体验、网络分布时间、远场唤醒率、噪音唤醒率、音质、端到端响应时间等角度入手、语义理解、多轮互动、内容丰富。

下面我们再进行其他方面的实际体验，看看各个产品的表现如何。

测试结果均来自特定环境，因此测试结果可能会受到网络环境等因素的限制，结果不具有决定性的比较意义，仅供我们更深入地体验产品。

2.开箱体验乍一看，小米AI音箱是空气净化器Mini的缩小版。

它采用塑料外壳、立方体机身设计、白色配色，延续了小米产品的简约与时尚。

从“三围”来看，三款音箱中，小米音箱的“高度”适中，为21.16厘米，略低于闻沃音箱（24厘米），但“重量”与小米音箱相差无几。

叮咚2代。

Dong 2 代表克。

小米音箱的“昵称”是“小爱同学”。

当你叫醒它时，它会甜甜地回应你“嘿”！小艾就像一个邻家女孩，甜美的声音是万千宅男的福音。

叮咚2的外观与Google Home有些相似。

本体呈圆柱形，由网状材料制成。

顶部同样是斜面，配备LED屏幕，可以结合声音显示个性化内容。

轻轻敲击 LED 屏幕即可将其唤醒，手掌覆盖屏幕即可“休眠”，在屏幕周边滑动即可调节音量，提升交互体验。

声音方面，研发两年多的叮咚音箱，有“亲切随和的女声”、“甜美的童声”、“有钱的男声”等多种“音箱”可供选择。

与其他两款扬声器相比，文文扬声器体积更大，直径为11厘米，“高度”为24厘米。

它也更重，这可能是由于硬件配置的差异。

包包外观呈椭圆形，采用羊毛混纺材质，手感细腻。

顶部采用了类似Amazon Echo的音量旋钮，带有阻尼滑块，并配备了36颗LED灯珠。

声音方面，Wenvoi音箱采用了较为标准的女声。

所谓标准类似于《欢迎来到新闻联播》。

3、稍显意外的实测体验 7月底，我们刚刚对五款主流智能音箱进行了实测体验，对它们的“智商”深感担忧。

在这次实际测试中，我已经做好了“把音箱虐到精疲力尽”的预期。

结果令我惊讶。

尽管仅仅一个月前，但这一代音箱在“智商”和体验上都有了明显的提升。

如果说上一代智能音箱可以算是1.0产品，那么这一代音箱就是2.0产品。

1、网络分发时间：显着改善联网是用户操作智能音箱的第一步。

联网时间的长短直接影响用户体验。

本次测试的网络配置时间包括“开始联网-输入WiFi密码-连接网络并成功”的过程。

其中，小米音箱采用蓝牙分配模式，通过手机的蓝牙帮助音箱连接网络。

整个过程耗时20.58秒。

织弗音箱采用WiFi分配模式，通过手机自动连接音箱的临时热点，从而帮助音箱连接互联网。

整个分发时间为28.59秒，在WiFi分发网络中是比较快的。

最后来说说叮咚2代的分销网络吧！与叮咚A1的声波网络配置相比，叮咚2代采用了蓝牙分配网络。

相比叮咚A1耗时近1分钟的漫长网络配置“年”，叮咚2代整个过程耗时13.52秒！网络分发是三位演讲者中最快的，令人印象深刻。

总体来说，三个音箱的网络分布时间相比上一代有了很大的提升。

一方面，相比天猫精灵、叮咚A1的声波网络分布，这一代产品更倾向于蓝牙网络分布。

此外，在软件和硬件配合方面也有一定的优化。

2、唤醒速率：叮咚2的唤醒是人机语音交互的第一步，即通过唤醒词（昵称）将设备唤醒进入工作模式。

这一步直接影响用户后续的体验。

本次唤醒率测试分为安静环境、噪声环境和超噪声环境三个环节。

唤醒率测试分别在2米、4米、6米距离进行。

（1）安静环境下（图为安静环境下5次测试中不唤醒次数统计）。

在安静的环境下，我们用相同的声级（相对）分别在2米、4米和6米的位置对3款车型进行了对比。

智能音箱各测试了 5 次。

所有扬声器在安静的环境下都表现得非常好。

只有小米音箱和Wevo音箱在6米距离唤醒一次失败。

（2）噪声环境下（图为噪声环境下5次测试的唤醒次数统计）。

在嘈杂的环境下，我们将手机音量调至30%，并将其放置在音箱后面作为背景噪音，分别在2米、4米、6米处。

表位置，使用相同的声音测试5次。

其中叮咚2代表现出色，仅在6米噪音环境下出现一次唤醒失败的情况。

小米音箱在4米噪音环境下唤醒一次失败，在6米噪音环境下唤醒两次失败。

Wevo音箱和小米音箱在这种嘈杂环境下的表现大致相当。

总体来说，三款音箱在嘈杂环境下的表现都比较不错。

（智能音箱在噪声环境下的唤醒情况）（3）强噪声环境下（图为强噪声环境下5次测试的唤醒次数统计）但是就像这，我还不满意！每个智能音箱的唤醒限制是多少？为了“折磨”他们，我加入了更强的噪音测试，将手机音量调到50%，放在音箱后面作为背景噪音，用上面的方法进行测试。

（注：这个噪音相当于非常吵闹的环境，并非模拟家庭环境，仅用于极限测试）果然，在如此高强度的噪音下，小米音箱在距离2米的地方只醒了3次。

米，其余的都被“彻底歼灭”。

文文音箱也是如此。

它只在2米的距离醒来两次，并开启“睡眠”模式。

不过，让我惊讶的是叮咚2的战斗力，在这么吵闹的环境下，所有手机在2米处唤醒，在4米处全部唤醒，只有一次在6米处唤醒失败。

不禁感叹，叮咚2确实是下了很大的功夫，才把唤醒打磨得如此稳定。

（智能音箱在强噪声环境下的唤醒情况） 3、误唤醒：整体相对稳定的唤醒与误唤醒密切相关。

唤醒灵敏度的增加也可能伴随着错误唤醒的增加。

叮咚2有这么强的唤醒能力，我就开始怀疑它的误唤醒率会不会很高？为此，我们将三款智能音箱在办公环境中放置了一天，声源为办公室里的日常对话以及大家对三款音箱的调侃。

经检测发现，白天只有小米AI音箱在与其他音箱交谈时被意外唤醒一次，其他音箱均被唤醒，没有出现错误。

需要注意的是，办公室场景中的误唤醒并不能代表家庭环境中的情况，因为家庭环境中可能存在电视声、手机声、谈话声等更加多样化的声音背景，而相应的误唤醒也可能略有不同。

增加。

4.音质：各有侧重好听的声音，肯定能得到某些用户的喜欢，比如小爱同学邻家女孩的甜美声音。

但作为音箱，音质也是最基本、最重要的功能。

三款音箱的音质表现不能太高，也就是传统PC多媒体音箱的水平，但也各有特点。

我们选择《渡口》和《偏偏喜欢你》进行高低音测试。

其中，小米音箱的声音爆发力很强。

在相同音量级别（例如 50%）下听起来声音最大。

低音厚实，高音响亮。

但由于其机身较轻，当音量调大时，机身会明显震动，不够“稳”。

。

叮咚2是最小的，音质还不错，高音和低音都不大。

Wewen音箱据说配备了最齐全的发声单元，但同样50%的音量相对于同一首歌的音量来说太小了。

不过调大后，声音的深度感更强，声场更宽广。

毕竟价格是人民币，总体来说一分钱一分货。

5、端到端响应时间：叮咚的屏幕成了一个矛盾。

作为语音助手，能否快速回答主人的问题是用户体验的关键。

在特定的网络环境下，我们向三台智能音箱询问了天气、百科、服务等问题，并测试了每台音箱的端到端响应时间（这个时间是从发出命令结束到得到答复的时间）智能音箱）时间成本）。

在这三类问题中，智能音箱对天气相关问题的响应时间明显快于百科和服务相关问题。

三款音箱中，小米音箱和Wevo音箱比叮咚2代速度更快。

具体来说，小米音箱对于天气相关问题平均花费2.29秒，对于百科全书问题（马云是谁？）平均花费2.63秒。

由于小米音箱目前接入服务（订外卖）较少，因此2.46秒的服务响应时间没有参考价值。

WeQiao音箱使用的天气和百科类别几乎相同，分别为2.40秒和2.43秒，而服务类别则花费了2.73秒。

其中，QQ在百科搜索方面更具优势。

叮咚2的响应时间比其他两款稍慢。

原因可能在于LED屏幕的使用。

目前叮咚2采用的是语音、图片多维交互。

这种组合交互可以调动用户的视觉和听觉，体验会更好。

但或许正是声音与画面的协调，降低了叮咚2的响应时间。

6.语义理解：要求说话者做得更好。

所谓语义理解，是指智能音箱能否理解主人的意图。

这是智能音箱必备的品质。

我们选择了有关天气和服务的问题，并针对每个问题使用了多种询问方式，看看智能音箱是否能够理解用户的意图。

天气是最基本的问答内容。

围绕“今天天气怎么样？”，我们向三个智能音箱询问了“今天温度多少？”、“今天下雨了吗？”、“今天空气质量怎么样？”、“今天热吗？” ， ETC。

。

在这个基本问题上，三款音箱都能够识别用户“询问天气”的意图，但小米音箱和微信音箱可以根据不同的询问方式优化答案，给予更好的体验。

叮咚2经常使用相同的答案来回答不同的问题，用户体验仍需优化。

（三位发言者“天气”问题的语义理解）放心，我不会那么轻易放过他们的！服务问题中，我们重点关注“美食推荐”，比如“我饿了”、“我想吃东西”、“我肚子咕咕叫”、“附近有什么好吃的”。

其中，小米音箱目前不支持外卖或美食推荐服务。

他们会回答你诸如“饿了就吃吧”、“快点去吃饭吧”等问题。

叮咚2本身就有美食推荐，但不够“友好”。

当你问“我饿了”时，它会告诉你“我可以帮你查看附近的食物”，或者只是说“如果你饿了，就去吃吧”。

只有当你要求它推荐附近的美食时，它才会告诉你附近有什么好吃的。

QQ音箱在语义理解上表现更好。

无论你问“我饿了”还是“我想吃东西”，它都会推荐大众点评附近的美食。

（三位演讲者对“服务”问题的语义理解） 7、多轮互动：QQ演讲者表现出色。

多轮交互是指智能音箱可以在了解上下文的情况下与用户展开多轮对话。

目前通用语言下的多轮交互体验很差，基于特定任务的多轮交互是智能音箱竞争的关键点。

还记得上一季的演讲者在多轮互动中表现得一塌糊涂，充分肯定了人类“智商”的伟大。

我本来对这款音箱的体验并没有抱有太大的期望，但最终我还是对智能音箱的发展速度感到有些惊讶。

这种多轮交互涉及到天气、音乐、百科等用户经常使用的几个场景。

在第一次天气测试中，我们会不断地问三位演讲者“北京的天气怎么样？” “明天怎么样？” “那上海呢？”对此，小米音箱和微信音箱都可以准确识别天气情况。

上下文并理解我的回答意图。

叮咚音箱有点别扭。

在正常模式下，它无法理解上下文。

当你问“明天怎么样”或者“上海怎么样”时，它会回答错误的问题。

但当你开启它的“AIUI”模式时，你可以“强制”它理解上下文并准确回答信息。

（“天气”问题中三位发言者的多轮对话）在第二场音乐播放中，我们采取了以下任务：“我想听陈奕迅的《红玫瑰》”、“换一首他的歌” ，“换一首歌曲”，看看智能音箱能否理解我的意图，准确地进行多轮对话。

其中，小米音箱可以准确识别“他”并完成任务；而叮咚2代中间出现了错误，经过一番调整，也算是识别出了“他”；文文音箱在这个游戏中有点“状况”。

它将识别“他”视为扮演“他”。

考虑到Wenvoi音箱是工程机，要么不是很稳定，要么Wenvoi在音乐中的语义理解和多轮对话还需要优化。

（“音乐”题三位发言者多轮对话）第三轮我准备了最难的八卦百科问答，“李小璐是谁”、“她老公是谁”、“他女儿叫什么名字”什么”。

小米音箱在这个环节跟不上节奏，无法回答第二个问题。

《叮咚2》也是如此，但有一个有趣的插曲。

还记得上次我们用刘强东调侃叮咚A1吗？当我们问它“刘强东是谁”，再问它“他的妻子是谁”时，叮咚A1就听不懂了。

我们只能直接问它“刘强东的妻子是谁”，它才回答正确。

这次叮咚2非常“酷”，直接表示不重视此类问题。

相反，演讲者的多轮对话表现良好。

它可以准确地回答“她的丈夫是贾乃亮”，对于“他女儿叫什么名字”的问题，它回答“我猜你问的是贾乃亮的女儿，她叫贾云馨”。

可以看出，Weaver音箱在语义理解和多轮对话方面做得很好。

不过，我们也采用了一些其他的提问方式进行复制和验证，发现在使用“他的孩子叫什么名字？”时。

答案是错误的。

可见QQ音箱对于多轮对话来说还不够成熟，还需要继续打磨。

（《百科》题中三位说话人的多轮对话） 8.声纹识别：稍无用处。

目前小米音箱不具备声纹功能，而叮咚2和微信音箱则具备声纹功能。

不过，由于该音箱尚未正式量产，目前使用的APP版本不具备声纹功能。

可见声纹识别还不够成熟，出门问问还在打磨中。

虽然叮咚2使用了声纹功能，但目前还没有使用场景。

设置好声纹后，对它说“你好”，它也能跟你打招呼“你好XX”。

除此之外，还没有看到其他应用。

智能音箱作为家居产品，不可避免地需要声纹识别来提供个性化服务并增强安全性。

但从目前的发展来看，声纹识别还需要一段时间的打磨。

9.内容资源：快速跟进。

这三款智能音箱的功能基本相同，主要是播放音乐等有声读物、设置闹钟提醒、百科问答、家居控制等。

目前叮咚2代拥有近10项技能，Wenvoi音箱和小米音箱也拥有40多项技能。

相比已经发展了2年多的叮咚音箱，文沃音箱和小米音箱的内容跟进速度相对较快。

我们主要测试了三台音箱的曲库丰富程度，代表性选取了10首音乐进行测试，分别是：陈奕迅《浮夸》、赵雷《南方姑娘》、五月天《突然好想你》、刘德华《忘情水》、李宗盛《少年往事》、Coldplay《something just like this》、Maroon5《maps》、Michael Jackson《heal the world》、愚人花园《Lemon Tree》、Muse《Unintended》。

通过测试发现，三名音箱都有上述中文歌曲，但由于对英文的识别差异或者英文曲库不同，内容存在一定的差异。

其中，小米音箱有9首音乐，叮咚2代有8首音乐，微信音箱有7首音乐。

考虑到Wenvoi音箱同时接入QQ音乐和腾讯云小微，音乐资源应该比较丰富。

可能演讲者在英语识别和合成方面还存在一定的问题，需要进一步打磨。

另外，每款音箱还具备新闻播报、查禁线、八字、计算器等功能。

一般来说，各音箱厂家跟进速度很快，在各大类目上都已经具备了技巧，但具体的丰富程度还需要不断积累。

（三款音箱丰富内容展示） 10、新奇技能与上一代智能音箱相比，本次PK的三款音箱还有一些差异化的亮点功能，值得单独介绍。

叮咚2提供了一些独特的功能。

目前，您可以自定义唤醒词。

例如，您可以将其叫醒服务设置为您的男朋友或女朋友的名字，以便您可以响应所有呼叫。

此外，它还可以直接通过扬声器拨打电话。

小米音箱的内容主要采用与第三方合作的模式。

其中一个有趣的功能就是“问声音”，比如“大象怎么叫？”小爱同学会发出大象的声音。

此外，小米还推出了“AI训练计划”，用户可以创建自己的训练技能。

如果这个技能被小米采用，所有小米音箱用户都会使用你训练过的技能。

确实是一家可以培养粉丝的公司。

微信音箱中的功能比较实用。

它与高德地图、大众点评、滴滴等合作，知道你的位置，可以为你叫外卖，或者给你叫车。

4.关于智能音箱体验的八个结论通过实际测试，首先我最想表达的是，在“前人铺路”的基础上，无论是产品还是整个产业链都已经基本成熟，音箱较晚进入游戏的玩家可以通过合作的方式快速跟进，小米音箱就是玩家之间合作的代表例子。

其次，小米AI音箱整体表现不错。

在唤醒、远场识别、语义理解、内容资源性能方面均超越了前代产品。

虽然没有太多惊艳的功能，但加上甜美的声音、超低的价格、相对不错的体验，未来还是很有竞争力的。

第三，叮咚2代从产品角度来说确实很了不起。

LED屏的组合、强大的远场唤醒能力、自定义唤醒词、扬声器通话等都是对上一代产品的突破。

此外，Zao Layout拥有的丰富内容资源也值得肯定。

不过，相比上一代叮咚A1，叮咚2在语义理解和多轮对话方面并没有太大进步。

从三款产品的对比来看，叮咚2在语义理解和多轮对话方面有落后于其他两款产品的趋势。

第四，刚刚推出的Wevo音箱目前在语义理解和多轮对话方面是三者中较好的，尽管测试单元仍然存在一定的不稳定。

但作为一款新推出的音箱，它在唤醒、音乐、英文识别等各种场景上还需要更深入的打磨。

第五，相比上一代国产产品在语义理解和多轮对话方面表现不佳，这一代智能音箱在基于特定任务的多轮对话方面取得了显着进步。

第六，虽然通用语言的多轮对话和语音交互仍然难以实现，但在用户的容忍范围内，特定场景和特定任务的多轮对话是可以实现的。

这也需要相关玩家深入研究自然语言理解和知识图谱领域，进一步打磨技术的实现。

第七，虽然声纹识别不像语义理解那么难以突破，但从目前的产品来看，声纹技术还需要进一步打磨，围绕声纹的应用也需要进一步探索。

第八，智能音箱产品将不断层出不穷，但每款产品的“技能”依然稀缺。

高品质“技能”和“技能商店”的需求成为亟待解决的问题，需要更多玩家参与应用。

深耕服务内容。

结论：智能音箱行业快速成熟。

在上个季度测试了智能音箱产品后，我对智能音箱的体验结果略显失望，感叹“路漫漫其修远兮”。

不过，这次体验了最新三款国产智能音箱后，不得不说，国产音箱追赶和跟进的速度还是值得称赞的。

短短几个月的时间，这一代产品在产品体验、语义理解、多轮对话等方面都有所提升。

一切都有所改善。

这种提升的背后是智能音箱产业链的成熟。

产业链各个领域的玩家正在向不同方向发力，形成聚合效应。

相信随着小米AI音箱价格的强势进入以及众多其他品牌音箱产品的涌入，用户和市场将会得到快速培育，最终推动整个行业的成熟。

上一篇：TicWatch多条战线出击！ Apple Watch 正面和背面着火如何救援？

下一篇：二代Moto360四大亮点解析！我只想做一块手表

3款未上市智能音箱独家体验！三个女人的美声和智商相关文章