自2017年开始,国内智能硬件市场上对智能音箱的关注度飞速提升,几家大厂先后推出自己的智能音箱产品。而在此之前,国外巨头包括谷歌、亚马逊,也都已经推出自己的智能音箱产品,尤其是亚马逊的Echo,2016年的销量超过1400万台。
为什么智能音箱产品在所谓智能硬件元年过了两三年之后才火起来?其实火爆的并不是智能音箱产品本身,而是智能音箱背后的语音助手,比如亚马逊的Alexa、苹果的Siri等。
前面我讲了一个智能灯类产品的案例,这类产品通常需要用户去找手机、打开App,然后才能开灯。这个过程的体验差在哪里?交互方式。
我们和电灯原来的交互方式是通过墙上的开关,如果是床头灯,直接伸手就能够到了,智能灯反而把这个交互方式复杂化了。
类似电灯这类的产品智能化,与手机电视不一样,是没有屏幕的,因此最好的交互方式应该是语音交互。
苹果公司旗下的智能语音助手Siri,目前已经支持自然语言输入、实时翻译等多种功能,可以让一定版本以上的iPhone手机或iPad(平板电脑)变身为智能化机器人,听上去十分酷炫。
此外还有亚马逊的Alexa,我国现在也出现了各类语音识别技术和应用软件,智能语音助手品类已经非常之多。可是即使技术已研发多年,甚至有公司表示其产品的语音识别能力已经可以媲美人类,但至今语音交互也没能成为主流应用。
原因有两方面。
第一个是语音交互还不太符合人们的使用习惯。智能手机上的很多输入法现在已经支持语音输入,并且效果还不错,但绝大多数用户在掏出手机后,最大的习惯不是对着手机说话,而是用手指触摸。我们还没有形成对着手机说话这类使用习惯,而且如果是在公共场合,由于要保持素质,也不适合大声讲话。
今天的很多年轻人会选择在网上订餐,但很少有人在订餐前便已经考虑好要吃什么。他们会打开一个订餐的App,根据相应推荐进行选择。在购买火车票或飞机票时也是如此,触摸、点击、滑动才是最习惯、最直接的人机交流方式。
当然,使用习惯不是语音交互没能成为主流应用的主要原因,主要原因是当前语音交互技术仍然存在较大的应用障碍。虽然目前语音识别技术已经可以说比较成熟,用户说的标准官方语言如普通话、英语,甚至部分地区的方言,语音识别软件都可以快速识别并转换成文字,但是,语音识别只是语音交互的基础,语音交互更大的挑战在于语义识别。而语义识别,对于当前的人工智能技术来说,与人类自身还存在巨大的鸿沟。
举例来说,我和智能语音助手说一句话:“这是一本讲极致产品的书。”智能语音助手能够理解的是这些文字,分别是“这”“是”“一本”“讲”“极致”“产品”“的”“书”。每个字或词,它都可以识别出来,可能根据“吞下”的词典,也大概知道“书”是什么,但是,它一定理解不了“讲极致产品的书”是什么书。
而智能硬件,比如智能空调,如果我在家比较热,我希望当我说“屋里好热”时,它能够自动调节温度;但是如果我说“屋里好热,可是孩子感冒了”,它就难以理解我后半句话的意思是不用调低温度了。
这是当前语音交互领域面临的最大挑战。
受技术限制,当前的智能硬件的用户交互体验也不十分完美,反应较慢,用户经常需要耐心等待人工智能的回应,一个回合一个回合地与人工智能交流,会磨蚀用户的耐心,这明显违背了人性。
另外,如果我们想让人工智能认识猫这种动物,可能需要让其浏览101万张猫的照片,这就意味着人工智能需要大数据的鼎力支持。在互联网和大数据的相关积累不足时,数据基数也不存在,智能硬件的用户体验便会受到很大限制。
因此,在智能硬件的交互设计工作上,无论是创业者还是巨头公司,都还有很长的路要走。
瑕不掩瑜,即使智能硬件确实存在各种问题,暂不可能在一两年内就改变世界,但我始终认为它是未来发展的大势所趋,也是360重点关注且始终践行的产品方向。