Siri的联合创始人亚当·切耶说,生成式人工智能有可能使语音助手回到最初的科幻轨道上。“我确实认为这与质量有关。”他说,“从根本上说,这项技术将实现上一代语音助理所没有的广度、灵活性和复杂性。我认为会出现复兴。”
随着与ChatGPT的开发机构OpenAI的合作成果良好,微软似乎越来越有自信,近日,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在接受英国《金融时报》采访时表示,语音助手“笨得像块石头”,“无论是Cortana、Alexa、谷歌助理(Google Assistant)还是Siri,所有这些都不起作用。”他宣称,新型人工智能将引领潮流。
十多年来,尽管科技巨头一直在尝试各类语音助手,但事实却表明,苹果的Siri、亚马逊的Alexa以及谷歌助理都发展不顺利,在中国,一批类似的产品也陷入了尴尬境地。《纽约时报》首席消费科技作者布莱恩·陈(Brian X. Chen)评论道,语音助手过去遇到了发展瓶颈,正因如此给了AI聊天机器人崛起的空间,让微软和OpenAI在人工智能竞赛中遥遥领先。
那么,苹果、亚马逊和谷歌是如何输掉这一轮人工智能竞赛的?
误入歧途的语音助手
12年前一个雨天,苹果公司(Apple)的高管们在一个拥挤的礼堂登台发布iPhone 4s。这款手机看起来和之前的版本没什么区别,但有一个新功能很快就引起了观众的热议:语音助手Siri。
时任苹果软件主管的斯科特·福斯特尔(Scott Forstall)按下iPhone上的一个按钮,召唤出了Siri,并向它提问。在他的要求下,Siri查看了巴黎的时间,定义了“有丝分裂”,并列出了14家评级较高的希腊餐厅,其中5家位于加州帕洛阿尔托。
“我在人工智能领域工作了很长时间,这仍然让我大吃一惊。”福斯特尔当时说。
如今,Siri早已成为被调侃为“人工智障”的对象。Siri的联合创始人亚当·切耶(Adam Cheyer)告诉《金融时报》,ChatGPT理解复杂指令的能力,让现有的语音助理看起来相对愚蠢。“之前的能力太尴尬了。”他说,“没有人知道它们能做什么或不能做什么。它们不知道自己能说什么或不能说什么。”
其他语音助手的技术也一直停滞不前,成为被取笑的对象。亚马逊搭载Alexa的智能音箱Echo甚至作为笑点出现在2018年《周六夜现场》(Saturday Night Live,美国脱口秀节目)的小品中,而最初,亚马逊创始人杰夫·贝索斯(Jeff Bezos)曾经在白板上兴奋地勾勒出他对Alexa的愿景:网上购物,控制小工具,甚至给孩子们读睡前故事。
事实上,Siri、Alexa和其他语音助手也曾在公众中引发过类似ChatGPT的热情,但在过去十年里,它们浪费了在人工智能竞赛中的领先机会。
前员工表示,亚马逊和谷歌错误地估计了语音助手的使用方式,导致他们投资了一些很少有回报的领域。当这些尝试失败后,公司对这项技术的热情就减弱了。
2014年,亚马逊发布Echo,希望该产品能够让消费者通过与Alexa对话来下单,从而帮助其增加在线商店的销量。但一位参与Alexa的前亚马逊高管表示,虽然人们很享受Alexa回答天气提示和设置闹钟的功能,但很少有人用Alexa订购商品。
亚马逊智能音响Echo嵌入了语音助手Alexa。
这位前高管表示,亚马逊可能在制造新型硬件方面投资过度,比如现已停产的与Alexa兼容的闹钟和微波炉,这些产品的售价低于或等于成本。
此外,他表示,亚马逊在创建一个让人们轻松扩展Alexa功能的生态系统方面投资不足,虽然亚马逊的商店也提供Alexa相关的第三方插件,但设置和使用十分困难,这与从应用商店下载应用程序的顺畅体验完全不同。
去年年底,亚马逊负责Alexa的部门是该公司18000人裁员的主要目标,一些Alexa高管已经离开了公司。
一位曾在“谷歌助理”工作的前经理表示,亚马逊在Alexa上的失败可能导致谷歌误入歧途。谷歌的工程师花了数年时间对其语音助手进行试验,以模仿Alexa的功能,包括设计智能扬声器和声控平板电脑屏幕,以控制恒温器和电灯开关等家用电器。该公司后来将广告整合到这些家居产品中,但这并没有成为主要的收入来源。
随着时间的推移,谷歌意识到大多数人只将语音助手用于数量有限的简单任务,例如启动计时器和播放音乐。2020年,当谷歌高管普拉巴卡·拉加万(Prabhakar Raghavan)接管“谷歌助理”时,他的团队将这个虚拟伴侣重新定位为Android智能手机的附属功能。今年1月,当谷歌的母公司解雇了12000名员工时,负责家庭设备操作系统的团队失去了16%的工程师。6月,它将终止专门为其语音助理制作的第三方“对话操作”的访问。
和ChatGPT基于不同技术
这些语音助理产品和类似ChatGPT的聊天机器人虽然功能类似,但本质上基于不同类型的人工智能模型。聊天机器人由大型语言模型提供动力,这些模型是经过训练的系统,能够根据从网络上抓取的大量数据集识别和生成文本。
相比之下,Siri、Alexa和“谷歌助理”则通过所谓的指挥控制系统进行工作。它们可以理解有限的问题和请求列表,比如“纽约市的天气怎么样?”或“打开卧室的灯”。如果用户要求虚拟助手做一些代码中没有的事情,机器人会简单地说它无法提供帮助。
这几家公司都尝试过将语音助手进行升级,但该类技术的升级难度似乎远超生成式人工智能,曾参与Siri开发的苹果前工程师约翰·伯基(John Burkey)说,Siri的设计很繁琐,增加新功能也很费时间。2014年,他受命改进Siri,但发现Siri的数据库包含一个巨大的单词列表,他说,这就形成了“一个大雪球”。如果有人想在Siri的数据库中添加新词,代码会“越滚越多”。
因此,看似简单的更新,比如向数据集中添加一些新短语,就需要重建整个数据库,这可能需要长达六周的时间。添加更复杂的功能,比如新的搜索工具,可能需要将近一年的时间。他说,这意味着Siri不可能通过升级成为下一个ChatGPT。
相比之下,苹果的处境还好一些,他们利用Siri吸引了消费者购买iphone。而亚马逊和谷歌的前高管则表示,Alexa和“谷歌助理”依赖于与Siri类似的技术,但这两家公司很难通过这些语音助手产生有意义的收入。
谷歌助手被嵌入在该公司的家庭设备中,如谷歌家庭迷你智能音箱。
在中国,市面上主要有小爱同学、小度、天猫精灵等主流的AI语音助手,被用在手机、电脑、电视、音箱等多种电子产品上,也是连接各种智能家居产品的中枢。但是,其用户体验却备受诟病,比如识别度不高、数据库不够完善,很多产品在用户家中处于半闲置状态。
语音助手准备如何“翻盘”?
根据布莱恩·陈的说法,尽管微软现在在创新竞赛中抢占了领先地位,但谷歌仍紧随其后。秉着“打不过就加入”的原则,将生成式人工智能带来的搜索引擎领域的技术进步引入语音助手,可能只是时间问题。
一些人工智能专家也表示,在未来,聊天机器人和语音助手的技术将会融合。这意味着人们能够通过语音控制聊天机器人,要求虚拟助手帮助他们完成工作,而不仅仅是查看天气等简单任务。
最近,这些大型科技公司都在竞相对ChatGPT做出回应。2月,苹果在总部举行了年度人工智能峰会,这是一个内部活动,让员工了解其大型语言模型和其他人工智能工具,两名了解该项目的人士说,Siri团队成员在内的许多工程师每周都在测试语言生成功能。
科技媒体Techradar表示,苹果虽然没有发布新的语音助手,但这可能只是在等待时机,然后再出手夺回人工智能阵地。一些敏锐的用户已经在将ChatGPT嵌入Siri,用户这种增强Siri功能的渴望也是苹果可以利用的潜力。
此前,谷歌已经发布了聊天机器人巴德(Bard),3月14日,谷歌表示它将很快发布生成式人工智能工具,帮助企业、政府和软件开发人员构建带有嵌入式聊天机器人的应用程序,并将底层技术整合到他们的系统中。
3月16日,百度开放大模型“文心一言”的测试。百度创始人、董事长兼CEO李彦宏表示,百度将在所有业务中全面集成文心一言,包括与语音助手小度进行集成,升级小度智能设备和服务。
AI初创公司Perplexity的创始人Aravind Srinivas说:“这些产品过去从未有效,因为我们从未拥有人类层面的对话能力。”“现在我们做到了。”
Siri的联合创始人切耶说,生成式人工智能有可能使语音助手回到最初的科幻轨道上。“我确实认为这与质量有关。”他说,“从根本上说,这项技术将实现上一代语音助理所没有的广度、灵活性和复杂性。我认为会出现复兴。”