当前位置: 首页 > 科技观察

人机交互技术的现状和演进未来我们将如何与机器对话

时间:2023-03-15 15:13:56 科技观察

计算机和其他机器是非常棒的工具,可以让我们提高工作效率、学习更多知识并保持联系。然而,为了使用它们,我们需要以某种方式与它们“交流”。从历史上看,这是使用鼠标和键盘(或触摸屏)进行手动输入,使用屏幕读取计算机返回给我们的内容。在过去十年左右的时间里,我们看到了一种与机器对话的新方式:语音和语音识别。但这种“与机器对话”的模式会在未来继续下去吗?如果是这样,它将如何演变?技术现状首先,让我们看一下现代技术的现状。人们仍然使用键盘、鼠标和触摸屏进行大部分日常交互,但越来越多的人转向基于语音的交互。我们可以用一个简单的短语在流行的搜索引擎上运行搜索。我们可以大声说出要输入的内容,我们的手机可以将其翻译成书面文本。我们甚至可以安装可以与客户交流或直接与他们互动的数字标牌。多年来,基于语音的交互变得非常复杂。在这项技术发展的早期,它基本上是一场赌博。在大多数情况下,系统没有正确地“听到”您的声音,或者误解了您的意思。但是今天,最流行的数字助理和语音识别程序可以像人类一样准确地检测和理解人类的语音。与此相符,人类逐渐习惯了基于语音的交互。在2010年,您可能会愚蠢地对着您的其中一台设备说“OKGoogle”或“HeyAlexa”之类的话。但在2020年,这已经司空见惯。事实上,当我们看到有人很少以某种方式与他们的机器交互时,这很奇怪。为什么声音接管了?为什么语音识别近年来取得了如此惊人的增长和发展速度?有几种可能的解释。首先,用语音做任何事情比用手更方便。如果您正在开车并且想在打字时将手放在方向盘上,您可以简单地“大声”思考并处理它。如果您的手指因整天打字而酸痛,您可以切换到基于语音的打字,让您的双手休息一下。如果您的起居室附近没有设备并且需要知道您刚刚观看的节目中演员的姓名,您可以大声说出您的查询并在几秒钟内得到解决。就技术发展而言,声音也是一种唾手可得的成果。正如我们将看到的,还有其他更复杂的人机交互模型,可能需要几十年才能完全发展,但实际上,我们在短短几年内就掌握了语音搜索。消费者看到了好处,技术也在不断进步。因此,为什么基于语音的与机器的交互成为新常态是有道理的。语音的潜在问题尽管如此,即使从长远来看,基于语音的机器交互也存在一些潜在问题:数据隐私。每一项新技术都会带来对隐私的担忧。我们基于语音的搜索和语音识别技术很多时候都在我们身边。我们身上有一部智能手机,客厅角落里有一个智能扬声器。这些系统是否在我们不希望它们收听我们的对话时收听它们?他们正在收集哪些数据并将其发送给科技公司高管?误会了。即使近年来发展迅速,语音识别也会失败。当人们说话时带有口音,或者由于各种原因无法表达完整的思想时,尤其如此。学习曲线。可访问性也可能是一个问题,特别是对于那些仍然难以说话的人。为获得最佳效果,您必须以清晰、直接的声音说话,并且每个字都准确无误。这对所有用户来说都不直观。背景噪音。如果有很多背景噪音,高质量的语音识别仍然会变得混乱。这意味着语音识别仅在某些位置和上下文中是理想的;例如,您不能在摇滚音乐会或建筑工地使用它。心理影响。我们仍处于语音搜索的早期阶段,但从长远来看,我们可能会发现基于语音的机器交互会产生心理影响。例如,我们可能会发现很难在不感受到某种情感依恋的情况下与机器交谈,或者由于我们与机器的互动,我们可能会限制自己以不同的方式与世界互动。如何改进语音技术公司一直在寻找可以改进语音交互并使自己在竞争中脱颖而出的方法。这些是最重要的关注领域:准确性。语音识别系统至少已经和人类一样好,其中一些已经超越了人类的能力。然而,在准确性方面仍有改进的空间,尤其是在边缘情况下。预测功能。结合预测分析,语音和基于语音的交互会更加令人印象深刻。机器不依赖于我们的单向输入,而是可以向我们提出建议性问题,并就我们可能需要什么提出主动建议。情感背景。同样值得考虑的是数字助理中情感语境阅读的发展,甚至在回应中模仿人类情感内容。例如,数字助理可以通过你的语气告诉你你生气或害怕,并且可以用一种技术模拟的同理心来回应你。虽然“令人毛骨悚然”的因素在这个维度上可能很高,但它可能会导致更自然的互动。语音替换那么,我们是否要将语音作为与机器交互的一种方式?这还有待观察,但有些竞争者有朝一日可能会同时取代语音和手动输入,即使它们距离全面开发还需要数年时间。手势。最有趣的可能发展之一是以手势形式与机器通信。无需明确指示设备应该做什么,您可以以特定模式移动眼睛以调用特定功能,或在空中移动手指以操作全息界面。手势是无声的,比言语更抽象,使手势在许多方面更简单、更容易理解。然而,学习曲线可能仍然很陡峭,而且该技术还没有准备好成为主流。主意。一些公司正在研究直接脑机交互的可能性。换句话说,也许有一天你可以用你的意念来控制一台电脑,就像你控制你的胳膊和腿的运动一样。对于许多人来说,这是一个可怕的想法,因为它意味着连接性互动可以双向发挥作用。但是,该技术仍处于早期阶段,因此很难预测是否会出现问题。其他通讯方式。很难想象人机交流的未来会是什么样子,所以我们不能排除其他更抽象模型的可能性。一些技术创新者可能想出了一种我们甚至想都想不到的新颖的直接通信方法。目前,基于语音的控制和通信仍然是我们与机器交换信息方式的主导力量。该技术非常复杂,其潜力很容易被大多数人利用。它的使用存在一些问题,包括隐私问题和有限的预测能力,但随着进一步的发展,这些问题可以得到缓解(或消除)。