人工智能:ChatGPT究竟改变了什么
“狂飙式”的热潮过后,青岛日报记者对话从业者探讨行业变局
5天时间用户数破百万、两个月月活用户数即破亿,2023年一开年,美国人工智能公司OpenAI开发的聊天机器人ChatGPT就一路“狂飙”,成为史上增长最快的消费者应用。
ChatGPT的“聪明”,只要与它“聊”过都有所体会。流畅开展多轮日常对话、编写应用程序、撰写科幻小说……不仅如此,ChatGPT还轻松通过了很多被认为是难度较高的专业测试,如美国执业医师资格考试、谷歌编码L3级(入门级)工程师测试,甚至还通过了美国宾夕法尼亚大学沃顿商学院MBA的期末考试和明尼苏达大学四门课程的研究生考试。“AI(人工智能)终于不再是‘人工智障’!”有人如此感叹。
在全球科技圈,ChatGPT掀起了近些年少有的巨浪。成立于2015年的OpenAI由埃隆·马斯克等众多科技大佬联合创办,于2019年首次获得微软投资,成为微软的重要合作伙伴。ChatGPT上线后,微软进一步加码,于1月底宣布将再对OpenAI投资数十亿美元。有业内人士称,该投资可能高达100亿美元。与此同时,一向在人工智能领域不遗余力投入的谷歌,也不甘落后。先是紧急向正在开发类ChatGPT产品的人工智能初创公司Anthropic投资近4亿美元,后又在巴黎举行AI发布会,向外界正式披露聊天机器人产品Bard。
而在国内,百度宣布类ChatGPT项目——“文心一言”(ERNIE Bot)计划于3月份完成内测,面向公众开放。科大讯飞表示AI学习机将成为该项技术率先落地的产品,并将于今年5月实现产品级发布。京东云旗下言犀人工智能应用平台计划推出产业版ChatGPT——ChatJD。此外,腾讯、阿里巴巴、360等多家企业也在加大相关项目研究和投入。种种迹象均显示,一场新的人工智能“军备”竞赛正在拉开序幕。
ChatGPT为何会受到如此多的关注?如果它只是一个聪明的聊天机器人,显然无法引起如此轩然大波。ChatGPT对人工智能发展究竟具有怎样的意义,业界对ChatGPT背后的机遇又是如何看待?带着这些问题,青岛日报记者采访了青岛的人工智能从业者。
ChatGPT和传统AI有何不同
传统AI即决策性AI,它根据已有数据开展分析、判断、预测,看的是“对错”,结果往往具有唯一性,目前已有非常普遍的应用,小到车牌识别、大到辅助驾驶系统都依靠决策性AI。业内人士介绍,传统的语音助理使用的主要也是决策性AI。
以ChatGPT为代表的生成式AI的核心是创造,即通过从数据中学习要素,进而生成全新的、原创的内容或产品。
“超级好用”需要超级算力
ChatGPT需要强大的算力支撑。从目前的访问量来看,ChatGPT单月运营所需算力约4874.4PFlop/s-day。据微软介绍,微软为OpenAI开发的超级计算机,具有超过28.5万个CPU核心、1万个GPU和400GB/s的GPU服务器网络传输带宽。
青岛已展开算力布局。在崂山区的青岛市人工智能产业园,两个算力中心已经浮出水面。其中,青岛人工智能计算中心已于今年2月正式上线,一期拥有100P算力,相当于每秒10亿亿次的计算速度;即将启动建设的青岛“海之心”人工智能计算中心,一期拥有算力150P,预计年内上线。
AI重塑互联网
业界普遍认为,ChatGPT将在智能办公、智慧科研、智慧教育、智慧医疗及游戏、新闻等领域迅速落地。在金融、传媒、文娱、电商等领域,ChatGPT可以为各类消费群体提供个性化、高质量的服务。
青岛企业也已经在积极思考应对ChatGPT所带来的变革。在极视角联合创始人、高级副总裁罗韵看来,随着生成式AI的持续进步,基于多模态的AI分析将是大势所趋,这对极视角以及整个产业来说都是新的机会。
杀手级应用
人工智能(AI)的“iPhone时刻”、不亚于互联网的发明,英伟达创始人黄仁勋和微软创始人比尔·盖茨分别如此评价ChatGPT。纵观近些年全球科技发展史,能赢得大佬如此一致高评价的产品屈指可数,ChatGPT的划时代意义显然毋庸置疑。
ChatGPT是基于GPT模型开发的聊天机器人产品。让这款产品变得如此“聪慧”的,也正是GPT模型。“GPT拆解来看,G即Generative,代表生成式AI;T代表Transformer,是继卷积神经网络模型之后新一代深度学习模型架构。GPT简单来说就是应用Transformer架构开发出的一种生成式预训练语言模型,无论是在数据集的使用和制造上,还是训练所用的策略上,都不同于过往的决策性AI。” 山东极视角科技有限公司联合创始人、高级副总裁罗韵介绍。
从20世纪50年代人工智能概念诞生以来,人工智能技术经历了多轮迭代和进化。科学家和工程师不断开发新的模型和网络架构,努力让人工智能更加“智能”。而从决策性AI到生成式AI,就是人工智能进化的一个重要分水岭。
决策性AI也被称为传统AI,它根据已有数据开展分析、判断、预测,看的是“对错”,结果往往具有唯一性,目前已有非常普遍的应用,小到车牌识别、大到辅助驾驶系统都依靠决策性AI。业内人士介绍,传统的语音助理使用的主要也是决策性AI。
而生成式AI的核心是创造,通过从数据中学习要素,进而生成全新的、原创的内容或产品。2020年,生成式AI首次出现在国际研究和咨询机构Gartner的技术成熟度曲线上。2021年底国际知名市场调研机构Gartner预测,到2025年生成式人工智能将占所有生成数据的10%,而彼时这一比例还不到1%。
OpenAI并非唯一涉足生成式AI的公司,也并不是第一个应用Transformer架构开发预训练语言模型的公司。但OpenAI之所以能够“一战成名”,核心在于它率先开发出了基于Transformer的杀手级应用——ChatGPT。
“这个意义是巨大的。好比基础研究与产业化,OpenAI验证了依托Transformer能够开发出一款能够推向市场的产品,完成了从0到1,其他公司便可以放心大胆地在这条路上下注开发,而无需再担心投资在‘未知’上,行业很快便能实现从1到N。”青岛一位人工智能资深从业者表示。
有意思的是,Transformer架构最初是由谷歌研究院于2017年在一篇论文中提出的。与以往的架构相比,Transformer使得训练生成式AI所需的时间明显更少,被认为奠定了生成式AI领域的游戏规则。此后,谷歌一直也在开发类似的语言模型,但效果似乎并不理想。ChatGPT爆火之后,谷歌匆忙发布了竞品Bard,但首秀即“翻车”,导致市值一夜间蒸发超1000亿美元。
“这在人工智能行业其实十分普遍。模型训练简单来说就是‘调参’。影响结果的参数可能有很多,调哪些参数、怎么调,全靠工程师的经验。所以即使用同一个开源模型做训练,最后开发出来的产品也可能差异巨大。模型越大,参数越多,‘调参’的可能性也越多。别人想到的‘调参’方式你没想到,那也没辙。”上述从业者介绍,GPT模型自2018年发布以来已多次迭代,到GPT-3参数数量已增加至1750亿个,多过人脑拥有的860亿个神经元数目,是名副其实的“大模型”。ChatGPT由GPT-3.5微调而来,参数量虽大幅下降,但也达到13亿个。
算力革命
ChatGPT问世,隐匿在大模型背后的算力革命也十分值得关注。
“生成式AI的核心是大模型,而大算力是大模型训练的重要支撑。只有算力不断提升,生成式AI的能力才会越来越强。”以萨技术股份有限公司副总裁姚巍说。
所谓算力,指的是实现AI系统所需要的硬件计算能力,是支撑人工智能持续进步的基础设施。从实验室训练模型到用户使用产品聊天,ChatGPT都需要强大的算力支撑。据券商测算,ChatGPT训练阶段总算力消耗约为3640PF-days(以一千万亿次每秒的速度进行计算,需耗时3640天)。而从目前的访问量来看,ChatGPT单月运营所需算力约4874.4PFlop/s-day。而据微软介绍,微软为OpenAI开发的超级计算机,具有超过28.5万个CPU核心、1万个GPU和400GB/s的GPU服务器网络传输带宽。
某种意义上,近些年来算力的巨大进步成就了OpenAI和ChatGPT。
在算力低下时代,算力的单位成本非常高且计算能力很低。事实上,在人工智能概念诞生之初,业内已经有人提出深度学习、神经网络这些理论。但在那时,一台计算机的体积几乎和一间房子那么大,但即便如此,它要运算一个大一点的矩阵都还需要很长时间。中国工程院院士、阿里云创始人王坚在前不久于上海举行的一场人工智能论坛上表示,计算能力曾经是开发者的瓶颈。一定程度上,在过去很长时间里,是算力限制了人工智能发展的速度。
但随着半导体等信息技术的持续突破,算力领域迎来巨大革命。算力来源于芯片。全球芯片巨头英伟达如今在AI芯片领域称得上“一骑绝尘”,其GPU芯片是训练大模型的必需,英伟达创始人兼CEO黄仁勋曾表示,过去十年,英伟达通过芯片、系统和算法让人工智能的速度和性能提升了整整100万倍。
与此同时,全球算力规模也在飞速增长。根据中国信通院发布的数据,2021年全球计算设备算力总规模达到615EFlops(每秒浮点运算次数),增速达到44%。预计到2030年,全球算力规模将达到56ZFlops,年均增长65%。
早在1961年,“人工智能之父”约翰·麦卡锡就提出,“有一天,计算可能会被组织成一个公共事业,就像电话系统是一个公共事业一样”。如今,他的设想已然成为现实。
算力成为核心资源。聚焦算力的产业竞争变得日益白热化。相关数据显示,近年来,我国AI芯片企业注册量快速增长,由2017年的1110家飙升至2021年的超过1.3万家。阿里、百度等大厂以及众多央企均有所布局。在ChatGPT带动下,寒武纪、富瀚微、龙芯中科等国内芯片相关上市公司都迎来了一波上涨行情。算力中心建设进一步提速,工业和信息化部2022年公布的数据显示,近5年我国算力总规模年均增速超过25%。IDC公司预计,未来5年我国智能算力规模的年复合增长率将达52.3%。
青岛在算力上亦有所布局。在崂山区的青岛市人工智能产业园,两个算力中心已经浮出水面。其中,青岛人工智能计算中心于去年11月试运营,今年2月正式上线,一期拥有100P算力,相当于每秒10亿亿次的计算速度;即将启动建设的青岛“海之心”人工智能计算中心,一期拥有算力150P,预计年内上线。
新应用将大量产生
正如iPhone不仅刷新了手机的理念,而且重构了整个互联网,ChatGPT所代表的不只是人工智能技术的巨大进步,它也将带来互联网世界又一次天翻地覆的革命。
作为语言大模型,ChatGPT的出现标志着自然语言理解技术迈上了新台阶。机器对人类语言的理解能力越来越高,越来越“懂”人,全新的交互方式产生在即。我们在使用互联网时,再也不用绞尽脑汁变换无数种说法让网络更好理解我们的意图。只要像跟朋友交流一样正常说话,AI就能为我们准确找到我们想要的。有人工智能从业者表示:所有分发都可以用AI再做一遍,所有UI都可以用自然语言再做一遍。
换言之,语言大模型不是指向某几款具体的产品,它将是一种新的技术平台。“早在很久以前,人们就说AI未来会成为像水电一样的新型生产力。但在ChatGPT之前,并没有出现能真正展现AI这种价值的杀手级产品。ChatGPT及其背后的大模型,让我们看到AI成为一种基础设施和底层能力的时代很快就会到来。”罗韵表示。
AI重塑互联网的时代正式拉开序幕,真正的智能化革命正式宣告开启。
对互联网大厂来说,这是又一场具有关键意义的平台和入口之争。国内外巨头均纷纷跟进,矛头也都是指向于此。而对大量的中小创业公司来说,更多机会则在应用层。中国信通院云大所人工智能部副主任曹峰在接受媒体采访时曾表示,以大规模预训练模型ChatGPT为代表的产品,逐渐显示出智能基础设施的属性,即少量企业训练大模型提供服务,大量企业基于大模型形成各类消费端和商业端的应用。“ChatGPT是一个开端,下一步在与传统行业结合的基础上,会有更多创新产品出现。”姚巍说。
青岛企业也已经在积极思考应对ChatGPT所带来的变革。极视角目前主要涉足视觉和视频分析,即用算法是模拟人脑的视觉系统。虽然当前与语言大模型的结合还不多,但在罗韵看来,随着生成式AI的持续进步,基于多模态的AI分析将是大势所趋,这对极视角以及整个产业来说都是新的机会。
“模态”可以简单理解为数据类型。“文生图”就是典型的多模态应用。基于多模态的AI分析将有利于各行各业打破数据孤岛,进而从数据这一底层生产要素推动AI向认知智能进化,以此帮人们解决场景更复杂的问题。近两年,这一领域已经成为投资人关注的前沿投资热点。
未来已来,谁能更早洞察及拥抱变化,谁就有望在AI的大航海时代发现“新大陆”。(青岛日报/观海新闻首席记者 孙欣)