关于人工智能,最近一段时间要说什么最火,那当数OpenAI推出的ChatGPT。
这个连马斯克都大赞「scary good」(好得吓人)的大型语言模型,甚至被预言即将取代谷歌。
有推特用户通过同一问题问谷歌和ChatGPT,后者不仅回答得更为有条理、清晰明白,而且还给出了可以执行的代码。
我也试了一下。让ChatGPT写一份Python代码,抓取微博前十个热搜条目,还真给出了代码示例,可以直接「Copy code」运行,不过不保证一定能够正常工作。而同样的问题你拿去谷歌搜索,却无法给出这样的答案。
不仅会写代码,ChatGPT还会写诗、写小说、翻译、做阅读理解、进行头脑风暴以及陪你聊天等。
相对于Siri、小爱同学的「播放音乐、定闹钟、拨打电话」来说,ChatGPT明显是一个更聪明的AI助手。
ChatGPT虽好,但是想要超越谷歌,却还需要些时间,比如由于不能联网爬取网页内容,所以ChatGPT往往无法获取最新的资讯。而谷歌自己其实也有一个聊天机器人LaMDA。
实际上,就我个人的使用情况来看,ChatGPT虽然暂时无法取代谷歌,但是取代智能手机的「人工智障们」,却是有可能的。
Siri们为什么一点也不「智能」?
对于智能手机的定义,业内有一个普遍的共识:
智能手机是具有独立的操作系统,独立的运行空间,可以由用户自行安装软件、游戏、导航等第三方服务商提供的设备,并可以通过移动通讯网络来实现无线网络接入的手机类型的总称。
这个定义相对于不那么「智能」的功能机来说,没什么问题,但是相对于大众想象中的「智能」来说,还是差了好几个银河系,特别是如今ChatGPT横空出世的情况下。就以手机行业的鼻祖型人工智能Siri来说。
比如把「我是一个单身狗」这句话,同时和Siri和ChatGPT说,后者会表示很遗憾,并且鼓励继续加油寻找。而Siri则像智障一般表示:你说了算。
如果你再问「我朋友‘阳’了,我该怎么办」,ChatGPT会准确理解「阳」的含义,并给出非常贴心的建议。而Siri一直卡在理解「阳」究竟是个什么意思的阶段:这个问题我还真答不上来。
没有对比,就没有伤害,Siri这种傻呆傻呆的人工智能助手,在ChatGPT这种全面进化的AI Assistant面前,不像人工智障像什么?
那么问题来了,苹果作为全球市值最高的科技公司之一,就不能复制ChatGPT的能力,给到Siri吗?
查了一下资料,之所以Siri的智能程度远低于同行,这里面主要有两个原因:一是苹果公司不愿意这么做;二是即使苹果愿意这样做,最终也会因为成本而放弃。
先来说第一点。
不知道你发现没有,最近几年以来,Siri的关注度越来越低,而且十几年来好像也没啥进步。现在我们唤醒iPhone,似乎也和十几年前做的事差不多:「打电话给妈妈」,「播放周杰伦的歌」。
除了这种傻瓜式的基础指令执行外,一旦你试图想要让Siri再多做一些事情,问一些复杂一点的问题,这货就开始进入「摆烂状态」。这也导致,Siri出道即巅峰,后面持续被iPhone用户和媒体嫌弃。
一个显著的证据就是,国外著名媒体The Verge间隔六年多,两次截然相反的评论。
2011年,在乔布斯逝世前一天,苹果正式发布Siri。这时The Verge的评论是:「Siri 最牛的地方就是它的工作原理——至少在大多数情况下,它的水平都能超出用户的预期。」
到2017年时,The Verge提出Siri已经「明显跟不上时代发展」,用户对它的不满情绪也开始蔓延。
之所以大家感觉Siri越来越退步了,有两点原因,一是其他人工智能助手进步得太快了。刚刚我们提到的ChatGPT就不说了,亚马逊的Alex在控制智能家居方面,表现就比Siri好很多,谷歌的Google Assistant,则在语义对答和搜索方面,大放光彩。
而Siri之所以进步得慢,也和其生态系统比较封闭,阻碍了第三方厂商接入,从而让Siri丧失了面对更多用户场景进行调校的经验有关。此外,苹果的隐私政策也使得其在收集用户的问题上,比较谨慎。
二是苹果对于Siri本身的定位其实不够清晰,导致在这方面的投入不够坚定。一直以来,虽然苹果对外宣传Siri是像一个真正的虚拟助手那样执行复杂任务,但实际上用户体验的感觉却是,它只提供了一种通过语音控制手机的途径,比如傻瓜式的「播放音乐、查找网页」等。
苹果之所以会有这样的定位摇摆,主要也是因为内部意见的分歧:一方认为,Siri应该专注于搜索功能,而另一方则认为Siri应该往一个智能型、多任务型助理方向发展。
正如一位前苹果员工在接受The Information采访时所言:「乔布斯在Siri推出后的第二天去世了,苹果也由此失掉了(Siri的)前进方向。」
第二点,如果苹果想要利用类似ChatGPT的技术来应用到Siri上,那么这个费用即便是「土豪如苹果」,也负担不起。
我在使用ChatGPT的时候,就遇到过这家伙频频罢工的情况。这背后一方面原因是ChatGPT的运营机构OpenAI在面对突然爆发至上百万激增用户时,面临的短时间服务器扩容不及;
另一方面则在于,ChatGPT的交互成本很高。
目前,GPT-3是目前市场上最大的语言模型之一,拥有1750亿个参数。而ChatGPT使用的技术则是位于GPT-3和明年即将到来的GPT-4中间的GPT-3.5,这个语言模型在Azure AI超算基础设施(由 V100GPU 组成的高带宽集群)上进行训练,总算力消耗约3640 PF-days(即每秒一千万亿次计算,运行3640个整日)。
如此大的数据规模,这就导致ChatGPT的单轮回答成本非常高,大概是几美分。按照1毛钱(人民币)算,10句话就是一块。
要知道苹果全球有十几亿iPhone用户,2018年时,Siri的活跃用户量就超过了5亿,即便每人每天只问Siri一句话,费用也高达5000万,这个成本明显是无法承受的。
这也是为什么ChatGPT至今仍只在少数几个国家开放内测。
所以,纵观主流手机厂商的人工智能助手,苹果的Siri,三星的bixby,华为的小艺,小米的小爱同学,vivo的Jovi,以及oppo的小布,都仍未达到ChatGPT的水平,更远未达到和人自然交流的程度。
当然了,Siri们虽然无法有ChatGPT的水平,但是如今的手机其实已经在不知不觉中,运用人工智能技术改善我们的用机体验了。
让智能手机变智慧
在华为2017年的财报中,有这么一段话:
打造开放生态拥抱未来作为未来智能世界的重要入口之一,智能手机将演进成为智慧手机,从被动的个人工具变成人类的分身,成为主动为消费者服务的日常AI助理。
正是在这一年,华为发布了集成专用神经元网络单元(NPU)的人工智能处理器麒麟970,以及搭载人工智能处理器的HUAWEI Mate 10系列手机。
由于首次在SoC内集成了独立的采用HiAI移动计算架构的AI硬件处理单元NPU,麒麟970开创了手机人工智能计算的先河。华为官方介绍,有了这款芯片,智能手机不仅能「听」和「看」,而且能听懂、看懂、会思考!能理解用户的诉求,积极做出响应。
这个NPU有什么用呢?比如说在相机APP中引入的「AI场景识别」概念,就可以在我们拍照时,根据当前的场景及物体自动设置最佳拍摄参数,让小白轻松拍出好照片。
那么,五年过去了智能手机有没有变得「更智能」呢?
对于这个问题,可能很多人难以回答。相对于AlphaGo大战李世石这种让大众感知到AI强大实力的事件来说,智能手机里的AI应用,显得比较润物细无声。就像空气一样,平时我们不会有很大的感知,但是它确确实实存在,甚至不可或缺。
实际上,如今的智能手机已经无法离开AI的帮助了。
从手机最关键的芯片,到底层操作系统,再到应用层面的APP,甚至只是一个小小的图片文字识别功能,都有人工智能的身影。
就拿最新推出的第二代骁龙8来说,集成了两个AI处理器,与前代产品相比,AI性能提升2倍。
对此,高通高级副总裁及CMO莫珂东表示,「我们把人工智能作为设计第二代骁龙 8 的关键技术,将全新的旗舰移动平台打造成一个创新引擎,一个真正的 AI 大师。」
值得一提的是,在第二代骁龙8芯片的支持下,手机终端具有了更强大的自然语言处理(NPL)能力。比如基于第二代骁龙 8的AI性能,小米宣布会在2023年推出离线版小爱同学,支持离线对话、语音唤醒、离线翻译等功能。这一方面可以保护我们的隐私,另一方面也让AI的使用不再依赖于网络。
手机操作系统本身的人工智能应用,也相当庞大。据我观察,凡是手机厂商宣传中提及「智能」两个字的功能,都主要是AI的功劳,比如说ColorOS的智能识别能力;
凡是手机厂商的操作系统中,有「自动化运行」、「智能化推荐」等属性的应用,都是人工智能的应用结晶,比如MagicOS的YOYO建议。
这两个「凡是」,基本上是我们肉眼能感知到人工智能在手机上的应用实例。而在更深层次的系统底层,人工智能也在发挥作用,比如说OriginOS 3为了保证前台应用算力充足,使用的「不公平调度」功能。
写在最后
如果把人工智能在手机的应用比作一座悬浮于大海的冰山,那么Siri们就是我们感知最强的部分,智能推荐、识图、AI拍照等是感知的第二层次,第三层次则是更底层、更不容易感知、但技术也更强大的系统后台调度、隐私保护以及芯片算力设计等。
可以看到,人工智能在智能手机上的应用,已经远不止Siri们。让Siri们拥有ChatGPT的功能固然好,但即便Siri们永远也比不上ChatGPT,也无法阻止人工智能技术渗透进入智能手机中,使其演进为华为年报中所说的「智慧手机」。