亚马逊在苹果、谷歌前找到了语音识别的答案,它是怎么做到的?(2)

发表于:2016-08-16来源:企鹅智酷作者:企鹅智酷点击数: 标签:亚马逊
但问题是,智能手机拥有成熟的输入方案文字输入法比语音更便捷、更高效,语音服务缺乏足够的使用理由。研究机构Creative Strategies的调查显示,62%的安

但问题是,智能手机拥有成熟的输入方案——文字输入法比语音更便捷、更高效,语音服务缺乏足够的使用理由。研究机构Creative Strategies的调查显示,62%的安卓用户表示很少或偶尔使用语音助手,iPhone对应的比例为70%。

为了“迫使”用户使用语音,亚马逊Echo只提供语音一种交互方案。除了扬声器和麦克风,Echo没有其它交互接口。

Echo对交互的限制,保证了语音交互的纯粹性和持续性:用户只能使用语音,不会被其它输入方式带走。当习惯养成后,他们会持续不断地用语音与设备互动。

三 · 定位于家庭,缓解与机器对话的尴尬

只提供语音交互并非Echo成功的唯一因素。如果没有解决用户不愿使用语音的根本问题,这样做可能会带来另一个问题——用户放弃使用产品。亚马逊显然不愿看到这样的结果。

Echo成功的另一因素在于它定位于家居,而非手个人助理。

Siri和Google Now定位于个人助理,于是它们依附于手机,期待通过手机的高频使用普及服务。但手机作为个人设备,多数情况下在公开场合下使用。在公开场合下用语音对手机发号施令,使用者很容易陷入尴尬。

Creative Strategies调查了300名手机用户在公开场合下使用语音助手的比例。结果显示,安卓用户中,只有12%会在公开场合下使用语音助手;iPhone的比例更低,只有3%。

产品和使用场景没有恰当匹配,造成了Siri和Google Now的使用尴尬。

Echo采用了不同的产品定位,巧妙地避开了用户使用语音助手的尴尬。它从一开始就定位于家庭设备——体积较大,不宜随身携带;没有独立电池,必须连接室内电源才能使用。尽管对着机器说话依旧怪异,但家庭环境缓解了用户的使用压力。用户面对的是熟悉的家人而非公共环境下的陌生人。

四 · 提供针对性软、硬件优化,适时开放产品

在明确Echo的交互方式和产品定位之后,亚马逊对它进行了针对性的硬件和软件优化。

为了能让用户在家中的任何位置都能唤醒Echo,亚马逊设计了一个名为ARS的自动语音识别处理系统。ARS由七个麦克风和一个音频信号过滤系统构成。七个麦克风组成的列阵能让Echo捕捉到环境中的细微声音,音频信号过滤系统过滤掉环境噪音,从而辨别出人声。使用ARS后,即使用户在25英尺(7.62米)之外发出命令,Echo也能够准确识别。

原文转自:http://tech.qq.com/a/20160816/004962.htm