智能家居设备市场将迎来强劲增长。据IDC预计,到2019年,智能家居设备出货量将同比增长26.9%,达到8.332亿部。到2023年,全球将有近16亿台设备投入使用。
亚马逊对此寄予厚望。Dashbot最近的一项调查显示,75%的受访者每天至少使用一次Alexa等语音助手,其中23%的人说他们用助手控制智能家居设备。在这一群体中,63%的人每天会多次使用家庭自动化助手。
因此,Alexa在控制灯泡、车库门开启器、智能锁和其他智能设备方面变得越来越熟练,或许也就不足为奇了。
为了更好地理解亚马逊在智能家居生态系统中与Alexa相关的工作,我们采访了Nathan Smith,他是为Alexa智能家居客户创建新功能的客户体验团队的负责人。下面是经过编辑的讨论记录。
Nathan Smith认为,智能家居目前正处于大规模应用和扩展的阶段。从传统意义上讲,它包含了更多技术领先的早期应用者,但我们已经超越了这一点。现在有超过60000种产品与7400个不同的制造商的Alexa合作,我们看到的一个趋势是Alexa正在使这些设备的控制越来越民主化。
今年最有意思的是一个新功能,它使用机器学习和人工智能来帮助Alexa,不仅能理解你所说的,而且理解你真正的意思,然后提供一个简单的用户体验。
Smith的团队致力于让Alexa更加人性化。如果你对Alexa下类似“嘿,Alexa,打开沙发灯”之类的指令,但实际上你想打开的灯被称为客厅灯,Alexa不确定你指的是哪个,她会友好地建议“你是说客厅灯吗?”
这项技术使人们在家里可以更随意地说话,并且超越了Alexa之前理解的严格的语法,它在许多不同的实际用例中都有帮助。一种是有类似发音的单词,另一种是混合字符,比如人们在自己的或在Alexa智能手机应用程序的设备名称中添加表情符号。它可以在不严格要求准确发音的情况下解析单词,甚至可以在多语言情况下提供帮助。如果你使用不同语言的混合名称,Alexa可以从中学习。
Smith的团队试图建立一个让Alexa可以更自然地理解你的世界,而不是训练人们用Alexa的语言说话。如果Alexa非常清楚你在说什么,就可以简单地执行预期的任务。
Alexa从去年12月底开始在美国推出这一功能,最近又将其扩展到加拿大、澳大利亚、英国和印度。就早期结果而言,当Alexa向客户提出建议时,在平均80-90%的时间里客户都会接受建议。
Alexa在决定如何响应一个命令时,还考虑了哪些其他因素?
收集实际实况,并将它们吸收到语义和行为模型中,这些模型以一种非常人性化的方式向你学习就像一个孩子问有关世界的问题的方式支撑着Alexa的机器学习。我们的模型真正做的是根据设备状态和行为信号(比如哪些设备通常在什么时候打开)以及日期和时间等环境信号对信号进行分层。在生成建议时,模型会考虑上述所有因素。
我们还有很多工作要做。我们看到越来越多来自各行各业和不同技术背景的客户使用支持Alexa的智能家居设备,这是采用尖端技术并利用它帮助简化客户体验的第一步。
你和你的团队正在用人工智能解决的其他挑战是什么?
人工智能和机器学习是Alexa的核心,从语言处理和理解,到智能地将命令路由到正确的功能。
功能方面,我们有Hunches,Alexa通过它从连接的传感器或设备中获取信息。当你说“Alexa,晚安”之类的命令时,它会检查你的车库灯是否还亮着,以及它们是否在一天中的那个时候通常是关着的,这就会通知响应。Alexa会说类似这样的话“晚安。顺便说一句,我注意到你车库的灯开着。要不要我帮你把它们关掉?”并在智能家居常规的某些阶段给客户提供有用的反馈,而不需要他们去钻研一堆应用程序屏幕。
这些功能使用AWS支持的机器学习技术。我们在SageMaker平台上大规模运行这些实时功能,这使我们能够更快地迭代。
你还有哪些方法可以让首次购买者在使用时更简单?
我们已经在这方面努力了很长一段时间了,最让我们兴奋的事情之一就是这种零触控设置的能力。去年,我们发布了Wi-Fi简易设置,它可以让你快速配置亚马逊的Wi-Fi设备,比如亚马逊Smart Plug。基本上,只要你插上电源,Alexa就会说:“嘿,我找到你的新设备了。”不需要其他设置。我们将同样的体验带到蓝牙低能耗灯泡上,比如飞利浦新推出的Hue产品,我们正在努力扩大这项技术的广泛应用。
至于如何进行设置之后的配置,去年年底,我们发布了几个功能,可以帮助你做一些其他的设置,通过语音获取环境信息,你可能需要与Alexa进行完全自然的交互。我们希望客户能够把他们的设备放在房间里,这样当他们在一组设备中提到一个设备时,Alexa就能做出正确响应。
这就是为什么我们在去年推出了一种对环境更加敏感的设置体验。如果你说“Alexa,把灯打开”,她就会用声音引导你,然后把灯打开。我们已经看到客户真正接受了这一点,因为它不会妨碍设备的控制。
你是否必须考虑不同的Alexa设备形式因素?例如Echo Dot和Echo Show。
我们认为它是不同模式(应用程序、语音和屏幕)之间的一个网格,因为每种模式都有不同的优势。当你想做一些不用手就能完成的事情时,语音很方便,但当你想安静地做一些事情时,语音就不太合适了。这就是我们依赖于基于屏幕的交互的地方。
我们真正感到兴奋的是确保,随着越来越多的不同客户开始使用Alexa,我们能够跟上他们的需求,而不是向后看,然后说:“好吧,我们如何向这些客户传授过去的模式?”相反,我们使用机器学习等技术来展望未来,并从中学习。
关键是使用的这项技术要适合问题的类型,无论是检查行为模式或试图用实况建立语义库,然后调优一个元模型,将那些个人信号考虑其中,产生一个有用的用户体验,而不是仅仅是做假设。
(审核编辑: 林静)