ChatGPT在技术路径上采用的是“大数据+大算力+强算法=大模型”路线,又在“基础大模型+指令微调”方向探索出新范式,其中基础大模型类似大脑,指令微调是交互训练,两者结合实现逼近人类的语言智能
据估算,此类大模型的训练一次的成本接近千万美元,运营成本一个月要数百万美元。“OpenAI为了让ChatGPT的语言合成结果更自然流畅,用了45TB的数据、近1万亿个单词来训练模型,大概是1351万本牛津词典。”
新一代网络操作系统和生态雏形初显,“英伟达+微软OpenAI”封闭生态有可能成为智能时代的“Wintel”联盟
文 |《瞭望》新闻周刊记者 朱涵 彭茜 黄堃
ChatGPT会带来一个不同的未来吗?
带着这个问题,记者询问了ChatGPT“本人”,它的回答是这样的:
“随着ChatGPT的普及,它开始被广泛应用于各种领域,从在线交流、信息搜索、机器翻译、文本生成,它的准确性和高效率使得许多工作变得不再困难。然而,人们也开始对它产生了担忧……”
ChatGPT正在成为我们生活中的一部分,ChatGPT会是人工智能通往未来的坐标吗?人工智能的发展,离不开人与人工智能的结合,技术与人类能无缝结合吗?
学生们在长沙华夏实验学校和机器狗互动(2022年6月22日摄) 薛宇舸摄/本刊
ChatGPT会是人工智能通往未来的坐标吗
与人类连续对话,拒绝不合适的问题,短时间内完成写邮件、文案、代码、诗歌,轻松通过工程师、MBA、研究生、医师资格等难度较高的专业级测试……推出2个月即拥有1亿月活用户,ChatGPT已成为史上用户增长最快的消费级应用程序。
在语言智能程度呈现跨越式提升的背后,ChatGPT是一场工程创新的“大力出奇迹”。
“ChatGPT的成功,首先是选择了合适可行的技术路径,然后就是数据和人力资源的巨大投入。”北京智源人工智能研究院院长黄铁军说。
黄铁军说,ChatGPT在技术路径上采用的是“大数据+大算力+强算法=大模型”路线,又在“基础大模型+指令微调”方向探索出新范式,其中基础大模型类似大脑,指令微调是交互训练,两者结合实现逼近人类的语言智能。
“OpenAI为了让ChatGPT的语言合成结果更自然流畅,用了45TB的数据、近1万亿个单词来训练模型,大概是1351万本牛津词典。”浙江大学人工智能研究所所长吴飞说。
业内人士表示,OpenAI的主要支持方微软构建了一个算力规模位居全球前列的超算平台以支持其研发,OpenAI在全球范围雇佣了近千名专人进行数据处理。据估算,此类大模型的训练一次的成本接近千万美元,运营成本一个月要数百万美元。
“ChatGPT是人工智能技术‘量变’引发‘质变’的代表,标志了目前机器学习大模型、大训练数据和大算力能够到达的新高度。”之江实验室副主任鲍虎军表示,ChatGPT在GPT模型基础上,采用人类反馈强化学习(RLHF)的训练机制和提示导引模式,促使模型越来越顺应人类的思考逻辑,更加符合人类认知和习惯,这是工程实现上的重要创新。
中国科学技术大学机器人实验室主任陈小平说,迄今为止,人工智能的所有理论和技术都没有解决真实性难题,都不能让机器本身拥有真实创造的能力,但创造效率的提高将产生巨大的效益和多方面的影响。
“目前,人类面临着前所未有的重大机遇。”陈小平说。
ChatGPT能否预示着一个新时代启幕
“ChatGPT的成功不仅是一个新一代聊天机器人的突破,它将为人工智能乃至整个信息产业带来革命。”黄铁军说,ChatGPT将成为点燃人工智能的“网景时刻”“iPhone时刻”。
“网景时刻”和“iPhone时刻”,分别是互联网和移动互联网发展的里程碑事件。网络浏览器诞生于1990年,但直到1994年网景导航者(Netscape Navigator)问世,大多数人才开始探索互联网。第一部智能手机IBM Simon诞生于1993年,2007年苹果iPhone的横空出世,重新定义了智能手机并开启了移动互联网的新时代。
同样地,ChatGPT极有可能预示着又一个新时代的启幕:
——新一代网络操作系统和生态雏形初显。多位专家受访时表示,ChatGPT正在演变成新一代操作系统平台和生态,用户将能直接用日常语音或者文字与人工智能进行交互,大部分计算负荷由大模型为核心的新一代信息基础设施接管。
在微软算力支持下,OpenAI已相继研发出GPT-3、ChatGPT等通用泛化能力越来越强的闭源大模型,并通过微软云平台提供智能云服务,支持智能应用开发,这将成为智能时代的基础性“操作系统”。再加上在AI芯片市场已占领超主流市场份额的英伟达GPU芯片,形成的“英伟达+微软OpenAI”封闭生态有可能成为智能时代的“Wintel”联盟。
“大模型及其软硬件支撑系统的生态之争将成为未来十年信息产业的焦点。”黄铁军说。
——人工智能直接连接大众,个体深入参与技术发展。“从短期来看,ChatGPT正在从实验室基础科技向产业应用转变,一切还处于‘爆炸式创新’的前期,正如云计算催生了APP应用爆炸,基础模型很可能催生AI应用规模化。”人工智能资深研究专家、科技评论员田涛源说。
“人们将能够直接与我们最新、最强大的语言模型互动,作为搜索的伴侣,以实验和创新的方式。”谷歌CEO桑达尔·皮查伊(Sundar Pichai)说。
“相较于以AlphaGo这一现象级产品针对于某一个特定领域、其算法模型需要附着在某一个产品中才能赋能使用的模式,ChatGPT能直接面向大众使用者,且具备盈利模式,这将改变很多人工智能企业高成本、低回报的经营模式。”吴飞说。
——重构传统互联网商业模式,催生数字经济新突破。北京瑞莱智慧科技有限公司副总裁唐家渝认为,ChatGPT的应用除了聊天机器人外,还包括涉及文字生成和信息查询的智力工作、低难度的编程等内容创作领域,从而普遍提高这些行业的生产力。也能够与其他生成式技术融合,比如提高数字人的语义交互水平等,打造更具象化的形象,提升交流中的情感链接。
田涛源表示,从中长期发展趋势上预测,“生成式AI+决策式AI”很有可能重构传统互联网的搜索、广告、社交、游戏、电商模式,部分程度上颠覆原有的互联网平台,同时遵从数实融合、以虚强实原则赋能科研、制造、能源、交通等实体企业做强做优做大。
国家超级计算成都中心科研人员在巡检机房设备(2023年2月14日摄) 刘坤摄/本刊
技术与人类能无缝结合吗
ChatGPT引发的全球关注,令许多人回忆起2016年AlphaGo战胜人类围棋世界冠军的时刻。当时社会上同样兴起了一场人工智能大讨论。
在这场热潮中,我国抢抓人工智能发展的重大战略机遇,在2017年发布《新一代人工智能发展规划》,推动人工智能一业赋百业。
目前,ChatGPT已引发全球科技公司的新一轮人工智能竞赛。谷歌发布了下一代对话AI系统Bard,微软发布了整合了ChatGPT的全新必应Bing和Edge浏览器,宣布旗下Office、Azure云服务等所有产品都将全线整合ChatGPT。百度表示将在今年3月完成人工智能聊天机器人“文心一言”的内测,随后对公众开放,阿里巴巴达摩院预训练语言模型体系已开放内测。
回顾历史,人工智能的发展并非一帆风顺。自1956年诞生以来,人工智能发展经历三次浪潮,期间充满波折。在人工智能深度学习迅速发展的近10年里,产业上也还没有出现里程碑式的爆发。
事实上,ChatGPT在带来惊艳体验的同时,也有明显“缺陷”。比如,它的知识存在事实性错误、知识盲区、常识偏差,也将面临着隐私泄露、技术滥用、造假、社会公平等伦理问题。因其模型能力出众、用户众多,这些风险隐患还会被放大。
“ChatGPT的应用离不开人的‘提示’,性能的持续提升离不开研发者的算法改进和设计,风险隐患的应对离不开人的引导和治理。”业内人士表示。
人工智能的发展,离不开人与人工智能的结合,我们的未来,也将是人与人工智能共同进化的时代。
正如ChatGPT描绘的人工智能未来世界:
机器人们像人类,
思想智慧已涌动。
在这梦幻的世界里,
技术与人类无缝结合。
生活如同一首诗,
平静而美好,永不停歇。■