0°

为ChatGPT做嫁衣,谷歌做梦都想复仇

  自从去年末ChatGPT在全世界引起大模型狂热后,“先驱”谷歌已经在后辈的光环里暗淡了一整年。在庞然大物的谷歌面前,OpenAI只是一家小型创业公司,即便背后有微软的大力支持,但跟谷歌丰沛的AI人才储备、雄厚的资金实力和天量的算力资源相比,OpenAI就像是巨龙鼻息下盗宝的飞贼。

  这个“小飞贼”,成功偷走了谷歌的AI桂冠,率先一步踏上通往AGI(Artificial General Intelligence,通用型人工智能)的路,一下子取代谷歌成了AI浪潮的引领者,这是深耕AI十多年的谷歌无法接受的。

  Gemini,对谷歌来说不只是一款迟到的产品,更是一场蓄谋已久的复仇。

  文 | 曹婷婷 赵磊

  编辑 | 赵磊

  运营 | 圈圈儿

  谷歌复仇归来

  对标GPT-4,超越GPT-4,这是谷歌最新推出的大模型Gemini与生俱来的使命。早在几个月前,当Gemini的研发消息流传出来时,就能感受到谷歌对其寄予的厚望:

  将Google Brain和DeepMind合并,集合公司最资深的AI科学家和产品经理们,数百人加班加点,耗尽谷歌内部几乎所有可用的计算资源,尽可能用最快的速度,训练出一个能够追赶甚至超过GPT-4的大模型。

  于是,十几天之前,当Gemini面世时,尽管ChatGPT已经夺走了“人工智能的iPhone时刻”,但谷歌希望能再次重现当年人工智能第一次向世界展示伟力的“AlphaGo时刻”,借此完成对OpenAI的“复仇”。

  Gemini确实在GPT一统天下的AI世界撕扯出一道裂隙。谷歌放出了一系列测试结果,Gemini是第一个在MMLU(大规模多任务语言理解)测评上超过人类专家的模型,它在此项取得的成绩是90.0%,领先于人类专家的89.8%,而GPT-4则为86.4%。也就是说,在专业知识问题上,它不仅超过了GPT-4,甚至比人类专家懂得更多、更能给出合理的回答。

  Gemini更大的优势在于,它是一个原生多模态的大模型,而已有的其他多模态大模型都是拼接而成的。用谷歌的话说:“从第一天起就是多模态大模型,跨越文本、图像、视频、音频和代码的无缝推理。”

  ▲ 图 / 官网截图

  比起ChatGPT,Gemini更像人类的大脑,可以同时搜集、组合、理解不同类型的信息,输出信息的时候也可以语言、手势、动作、表情一起上。同一个大脑处理不同的信息,信息不会在“翻译”的过程中丢失,与人类的沟通交流就会更顺畅。

  比如我们正常人,看到“老虎”两个字就能直接联想到老虎的形状和跑起来的样子,甚至脑海中会出现老虎的咆哮,而其他多模态大模型更像是一个聋哑人,需要先把声音写成文字或打出手语,才知道别人说了什么,不同信息在转换中难免产生误解。

  在谷歌的演示视频里,Gemini用年轻男子的语气,一边看着用户绘画、变魔术、放视频,一边实时对画面进行分析,并主动与用户对话交谈。那个场景,颇有《钢铁侠》里贾维斯与托尼一起探讨钢铁战甲该如何设计的感觉。

  某种程度上,谷歌确实再一次为AI的演进树立了一块新的里程碑,正如当年谷歌猫项目、AlphaGo大战李世石和提出Transformer架构掀开AI新篇章那样,谷歌在长达十多年的时间里,用一次次震惊世界的举动,为人工智能的发展标注出一条清晰的路径。

  但自从去年末ChatGPT在全世界引起大模型狂热后,“先驱”谷歌已经在后辈的光环里暗淡了一整年。在庞然大物的谷歌面前,OpenAI只是一家小型创业公司,即便背后有微软的大力支持,但跟谷歌丰沛的AI人才储备、雄厚的资金实力和天量的算力资源相比,OpenAI就像是巨龙鼻息下盗宝的飞贼。

  这个“小飞贼”,成功偷走了谷歌的AI桂冠,率先一步踏上通往AGI(Artificial General Intelligence,通用型人工智能)的路,一下子取代谷歌成了AI浪潮的引领者,这是深耕AI十多年的谷歌无法接受的。

  年初,微软上线GPT-4支持的Bing Chat版搜索引擎后,更让谷歌感到不安。很快,谷歌宣布推出Bard,一个自有大模型支持的聊天机器人。

  在谷歌的描述里,Bard既拥有ChatGPT一样随机应变的聊天功能,还能更“负责任”。彼时,ChatGPT正因一本正经的编瞎话而广受诟病,谷歌成功阴阳了一把。这也让外界对Bard期待值拉满。后来的故事就像演电影一样,戏剧性十足。在Bard的宣传视频中,竟然出现了事实性错误。

  Bard被问了一个问题——“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?”表面上,就像一位循循善诱的老师,Bard流畅地回答了这个问题。然而,却把拍摄太阳系外行星第一张照片的人名说错了。

  第一次演示就说错话。虽然谷歌迅速下架了相关演示视频,然而事情一旦发生,破碎的信任便难以挽回。股价应声大跌9%,市值缩水1000亿美元。原本想靠Bard追上微软和OpenAI的先发优势,却栽了个大跟头。在这场夺回AI领地的大战中,谷歌出师不利。

  ▲ 图 / 视觉中国

  随着ChatGPT加速迭代,留给谷歌的时间也越来越紧张。谷歌本习惯每年五六月发布新品,这次却选在年底。据美国媒体报道,谷歌的管理层担心OpenAI、ChatGPT、微软的Copilot正在成为AI领域的代表,谷歌不能再等下去了。

  目前,Gemini的效果还有待验证,已经发布的Gemini Pro只是优于GPT-3.5,还没法全面赶超GPT-4。甚至有产业大佬质疑谷歌Gemini宣传视频有剪辑痕迹,放大了产品的效果。谷歌倒是承认了视频进行了后期处理,还放出了更为具体的交互过程图文解析。

  黑红也是红,或许是为了营销,或许是太想做出炫酷的效果,总之,谷歌的复仇大作,又多了几分戏剧效果。毕竟,谷歌这口气,实在是憋了太久了,它太需要一次成功来证明自己。

  起了个大早

  谷歌开始大规模投入人工智能的时候,OpenAI还不存在。

  2012年,谷歌用4400万美元的代价,拍下了一家成立不到一个月、没有产品、没有收入,只有三个员工和几篇论文的公司。

  这家公司由多伦多大学教授杰夫·辛顿(Geoffrey Hinton)带着自己两个学生创立,他们建立的神经网络算法AlexNet,在ImageNet图像识别比赛中以84%的准确率夺得冠军,训练成本之低,只用了4颗英伟达GPU。

  这让谷歌感受到巨大的挫败。早在2011年,谷歌就创立Google Brain人工智能项目,目标是研究深度学习和神经网络,以改进谷歌产品和服务的性能,几乎早于所有的美国科技公司。神经网络是一种机器学习的方向,通过模拟人类的大脑识别大量数据的模式,谷歌很早就意识到,这可能是让机器学会听说读写乃至最终可以思考的一个路径。

  Google Brain搞了一个The Cat Neurons(谷歌猫)研究项目,简单说就是可以用神经网络算法在YouTube的视频里识别猫,谷歌猫项目不仅有来自斯坦福的顶尖人工智能学者吴恩达和谷歌首席科学家杰夫·迪恩(Jeff Dean)带领,更有谷歌创始人拉里·佩奇(Larry Page)的倾力支持,动用了遍布谷歌各个数据中心的16000个CPU来进行训练,才达到74.8%的识别率。谷歌内部也做了ImageNet数据集的测试,识别率远低于辛顿团队。

  在巨大的差异面前,恰逢辛顿团队组织了一场“自我拍卖”,谷歌决定不惜一切代价收揽人才。当时参与竞拍的共四方,除谷歌外,还有微软、百度以及一家英国的人工智能实验室DeepMind。实际上,百度是最早向辛顿教授提出邀约的科技公司,但谷歌给的钱实在是太多了。

  辛顿带着两个学生进入谷歌后,很快就拿下了ImageNet图像识别比赛的冠军,但这已经不重要了,最重要的是谷歌收揽了这几位顶级人才,两个学生之一就是后来OpenAI首席科学家的伊尔亚·苏茨克维(Ilya Sutskever)。

  太浩湖拍卖之后,大型科技公司都加入到抢人的行列。百度成立深度学习研究院,挖来了谷歌猫负责人吴恩达,Facebook挖来了“深度学习三巨头”之一的杨立昆(Yann LeCun),苹果挖来了辛顿的学生Ruslan Salakhutdinov,担任苹果首任AI总监。

  参与竞拍的DeepMind,也逐渐意识到财大气粗的科技公司正在不惜代价收购人工智能人才,作为创业公司的DeepMind毫无竞争力,只能选择卖掉自己。这家公司从2010年就开始研究神经网络,致力于实现AGI,建造了一个能够学习玩如《太空侵略者》、《乒乓球》和《打砖块》等经典雅达利游戏的系统,特斯拉创始人埃隆·马斯克、硅谷创业教父彼得·蒂尔是DeepMind的早期投资人。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论