2017年,我们看到了围绕“会话界面”的持续兴奋和炒作——界面允许用户使用自然语言与机器进行交互。虽然会话体验还包括基于文本的对话,比如我们与聊器人的对话,但这篇文章将重点放在基于语音的对话。语音用户界面(VUIs)正在成为主流,在我们的日常生活中变得无处不在。我们可以在智能手机、智能家居、电视和一系列其他产品中找到它们。在日常生活中,语音交互功能的快速发展表明,这项技术很快就会成为图形用户界面的替代品。
“根据Gartner的数据,到2018年,我们与技术的互动中,30%将通过与语音系统的对话来实现。”
在我们深入了解VUIs的细节之前,了解VUIs突然流行的原因很重要。有一些东西可以快速地采用这种新的交互媒介。
VUIs之所以如此吸引人的一个主要原因是,使用词语的对话是人们交流的一种自然形式。尤其重要的是,人们把声音与他人的交流联系在一起,而不是与技术交流;人类的大脑从根本上来说,是将语言的来源理解为人类的。这意味着,对于绝大多数用户来说,语音交互系统是一种比可视界面更自然的交互方式。通过移除可视的界面,用声音替换它,用户就会被置于一个更加熟悉的中。
长期以来,人们一直在使用称为界面的中介来与技术交互。大多数现代交互系统都基于一个称为图形用户界面(GUI)的中介。不幸的是,GUI并不是与数字产品交互的最明显的方式;它要求用户首先学习如何使用界面,并在下一次交互时回忆这些信息。在许多情况下,语音比GUI更方便,因为与VUI交互只需要用户与设备对话。一个不用户学习和回忆特定的指令或交互方法的界面会产生更少的摩擦。
虽然VUIs看起来像是一个新概念,但它们早在第一个GUI出现之前就已经存在了。最早的VUIs之一,叫做“shoebox”,是由IBM在上世纪60年代早期创建的。它是今天语音识别系统的。
VUI系统的进一步发展受到计算能力的。它需要大量的计算能力来实时分解和解释人类的语言,并且花了超过50年的时间才达到可能的程度。现在,我们进入了一个计算机时代的新时代,机器学习和人工智能的进步正在创造出对话的潜力,成为与技术互动的新模式。另一个对VUI开发有很大影响的重要因素是支持语音交互的设备数量。如今,全球近1/3的人口拥有可用于语音交互的智能手机,而且很容易预测,大多数用户已经准备好采用语音界面。
尽管目前的语音VUIs并不能解决任何新问题,但它们可以通过一种可以显著改善许多人生活的方式来解决现有的问题。查看天气,设置闹铃,回复信息,搜索食谱——这些都是我们很多人的日常任务。当然,使用智能手机或电脑的图形界面也可做到这一点,但这需要用户将注意力转向设备。人们通常更喜欢语音,因为这是免持交互的好处,主要是在家里或汽车里使用。
VUIs将成为个人助理。新技术将使人们更容易为人们提供量身定制的数字体验,所以想象一个私人助理不仅能理解你当前的需求,还能预测你未来的需求。它将能够帮助你生活的方方面面,甚至是你不考虑的领域。
现在,网络和移动都是一团糟;每次用户必须购买或使用服务时,他们必须下载一个应用程序并创建一个账户。这就是基于语音的系统能够真正进化的地方。VUIs将用户安装许多不同的应用程序,或者为他们使用的每一项服务创建单独的账户。相反,他们会通过对话把他们聚集在一起。当你可以将这些服务连接到一个聊天界面(你与他人同样的交谈方式),为什么要下载一个预订航班或订购披萨的应用程序呢?
现在,不仅是手机和电脑连接到互联网上。智能恒温器、灯、电水壶和其他许多物联网设备也有互联网连接。我们已经有了这些无线连接的设备,这些设备现在正在填充我们的生活,但并不是所有的设备都适合图形用户界面。使用VUI将有助于轻松地将这些设备集成到我们的中。
基于语音的交互将在用户和系统之间创建一个更深层次的个人连接。即使在今天,许多亚马逊Echo和Google Home用户都与他们的设备建立了紧密的联系——他们认为这款设备更像是朋友而不是产品。
改进的可访问性是语音用户体验最有效的好处之一。VUIs可以将计算能力扩展到无法使用屏幕和键盘的用户。只要阅读亚马逊Echo的评论,你就会发现许多令人鼓舞的故事,这些故事都是由视觉受损的用户分享的,他们讲述了这个设备如何改变了他们的生活。
很明显,语音用户界面设计将很快成为设计师的一项重要战略技能。这里有一个真正的挑战:大多数用户体验设计师都受到为物理输入和图形输出制作经验的培训。另一方面,语音设计与图形设计非常不同,设计师不能应用相同的设计和指导原则。创建基于语音的系统的需求将鼓励设计师更多地关注设计的以下方面:
VUIs的主要目标是最小化用户与系统交流互通的努力。很明显,用户和机器之间的基于语音的交互可能会导致来自用户的无限可能的命令,而设计人员不可能预测每个可能的用户命令,但仍然有可能创建上下文驱动(场景)的用户流。成功的关键是让对话的流程正确。为了实现这一点,理解用户的初始意图(首先进行交互的原因)很重要,并尝试在对话的每个阶段预测用户的需求和期望,从而形成适当的响应。
在图形用户界面上,设计师可以清楚地向用户展示可用的选项。在语音界面上做同样的事情是不可能的;对于VUIs来说,根本没有视觉上的提示。因此,如果你只看一款支持语音交互的设备,用户就不知道界面的功能了。设计人员需要使用特定于上下文的声音,以对语音交互系统能做什么有明确的期望。
虽然图形界面可以同时显示许多不同的选项,但语言内容要求设计者保持信息简短,这样用户就不会感到困惑或不知所措(在10到15秒的时间里,人们会失去注意力)。设计师需要记住“少即是多”的原则,并将优化信息应用到最终用户提供的对话中。
对语音用户体验的需求是真实存在的,这些体验已经改变了人们每天的生活。虽然语音界面可能不会在短时间内取代现有的视觉体验,但添加语音用户界面来扩展已有的体验会对用户产生重大影响。希望这将引导我们一个更容易接近的世界。
推荐: