首页 » 人工智能:改变世界,重建未来 » 人工智能:改变世界,重建未来全文在线阅读

《人工智能:改变世界,重建未来》人工智能助手的兴起

关灯直达底部

2016年1月,Facebook首席执行官马克·扎克伯格公布了其最新的新年计划。作为世界上最大社交网络的联合创始人,扎克伯格的个人资产净值预计为460亿美元,他已经创造了我们几辈子都创造不出来的财富。然而,这位年轻的创新者并未因此而停下前进的脚步,他每年都会制订一个新年计划,目的是“学习新东西,扩展Facebook以外的领域”。早些年,扎克伯格每个月都要读两本书,学习普通话,并且坚持每天认识一个陌生人。2016年,一切又变得不一样了。

他在Facebook上发布了一条状态:“2016年,我个人面临的挑战是创造一个简单的人工智能,让它来管理我的家并协助我工作。”他用我们身边的流行文化举了一个例子:“你可以把它想象成《钢铁侠》(Iron Man)中的贾维斯(J.A.R.V.I.S.)。”

这是一个大胆的宣言,截止到这本书完成的时候,我们尚未看到最终结果。扎克伯格的“个人挑战”首次提出了一个不能惠及大众的新年计划。毕竟,将其计划比作《钢铁侠》中的人工智能管家贾维斯,这就像将虚构作品中的亿万富翁托尼·斯塔克(Tony Stark)作为现实生活中的亿万富翁的参照一样。这也有点像埃隆·马斯克(Elon Musk)宣布他计划用自己的财富来建造《星际迷航》中联邦星舰“进取号”的全自动版本。

实际上,在过去的5年里,聊天机器人已经越来越多地渗透到我们的日常生活中。其中最著名的就是苹果自带的人工智能助手Siri了。2011年底,Siri搭载在iPhone 4s(苹果第五代手机)上首次亮相。iPhone用户可以用自然语言向Siri提问,例如“今天天气怎么样”或“在帕洛阿尔托找一家好一点的希腊饭店”,然后Siri会给出准确的语音回答。

尽管Siri编程时带有很多非生产性的聊天功能,但它能做到的远比我在“勒布纳奖”竞争中看到的那些聊天机器人多得多。例如,如果问Siri“生命的意义是什么”,它就会参考道格拉斯·亚当斯(Douglas Adams)的《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)给出“42”这个答案。如果像《星球大战》中那样宣称“我是你的父亲”,Siri将回答:“我们能够像父亲和智能管家那样统治银河系!”据报道,当史蒂夫·乔布斯首次在iPhone 4s上使用Siri时,他问道:“你是男是女?”(Siri回答:“先生,我还没有性别。”正是这一回答赢得了乔布斯的认可。)

与Mitsuku这样的聊天机器人相比,Siri的不同之处也是更有用之处,在于它能够回答现实世界中的实际问题。举例来说,Siri回答知识性问题的一个方法就是使用Wolfram Alpha,这是一款由英国数学家、科学家史蒂芬·沃尔夫勒姆(Stephen Wolfram)博士开发的搜索引擎。Wolfram Alpha由1 500万行科学计算软件Mathematica的代码组成。普通搜索引擎通常会给用户提供一个与所问问题的答案有关的文档清单或网页。而与这些搜索引擎不同的是,Wolfram Alpha通过计算来回答问题。如果问它100万以内的质数的个数(78 498),或哪个国家的国内生产总值最高(摩纳哥),它就会通过实际运算来回答这些问题。

其他情况下,Siri的推理能力使其能够从我们的句子中提取相关概念,将其与网络服务和数据联系起来,并且将它对你日益增多的了解应用到一系列规则、概念和上下文中。最后得出一个将问题转化成行动的做法。“我想在上周吃饭的那家餐馆用餐”,这是一个十分明确的句子,但是为了使其更加有用,像Siri这样的人工智能助手不仅需要使用自然语言处理来理解你所述的概念,还需要联系相关上下文找到适当的编程规则。Siri使用的语音识别程序是当今世界上最先进的语音识别企业Nuance Communications公司开发的。Nuance公司的杰出科学家罗恩·卡普兰(Ron Kaplan)对我说:“我们的任务就是找出所问问题或判断所给指令中的内在逻辑。然后必须对其进行解释,并将其转化为可执行的指令。如果问题是‘我可以预订12点的晚餐吗’那么单是理解这个问题是不够的,还必须用这一信息做些什么。”

结果正如Siri创始人之一亚当·奇耶尔(Adam Cheyer)所说的那样,这是对普通搜索引擎的模仿。奇耶尔解释道,搜索引擎本身是一个伟大的工具,但是只完成了人们要求它完成的工作的一半。他说:“搜索引擎的工作原理是,用户在多个网域内提问,然后引擎将返回多个它认为能够很好地回答这一问题的网页链接。点击最接近问题的链接之后,你就可以开始你的任务了。”奇耶尔和团队其他成员想要的实际上是建造一个“操作引擎”。搜索引擎可以将相关材料呈现给一个人,任其查询。相比之下,操作引擎则是通过智能实体来找出解决问题的方案。

如果在谷歌搜索引擎中输入“喝醉了想要搭车回家”,该搜索引擎应该链接到酒后如何搭车回家的网页上。而当我试着查询的时候,显示的竟然是《告诉我回家的路》(Show Me the Way to Go Home)的歌词。如果在操作引擎中输入相同的问题,结果将大不相同。操作引擎将查询你的位置,并且派一辆优步出租车去接你。奇耶尔说:“如果你想找的是一个网页,那么请使用搜索引擎。如果你想要完成某件事,就得使用操作引擎。”