新旧之交,一个万能程序的幽灵在全球游荡,这个幽灵便是OpenAI公司研发的ChatGPT。它横空出世的时间如此之迅速,以至于尚未起好中文名字就已经拥有了过亿用户。人工智能对话聊天机器人ChatGPT,英文缩写Chat Generative Pre-Trained Transformer,学名聊天生成性预训练转换模型,在互联网世界中火爆出圈、迅速走红,短短2个月时间,就完成了全球用户数突破1个亿的小目标,为了达到这个目标,电话用了75年,手机用了16年,网站用了7年,苹果公司的应用软件iTunes和AppStore分别用了6.5年和2年,社交软件Twitter、WhatsApp、Instagram、抖音分别用了5年、3.5年、2.5年和9个月。
△图源“北京日报”微信公众号
ChatGPT之所以能在很短时间内与1亿用户确认过眼神,主要是源于其强大的交互能力。它既能创作诗词歌赋,又能修改程序代码,既可以求解某些数学问题,也可以撰写专业学术论文。尤其是针对论文撰写,引发了很多争议,据某些消息报道,美国89%的学生在使用ChatGPT撰写论文、完成作业,这也促使当前全球很多高校禁止学生使用ChatGPT。由此可见,相较于其他一些聊天机器人应用,ChatGPT确实在交流精准程度、知识涉猎广度、上下语境理解、多轮对话交互、用户意图揣摩、主动承认错误、质疑用户问题等方面确实展现出了非同一般的功能升级与性能提升。有些场景下,与ChatGPT交互很像是人与人之间的真实互动,相互学习分享,表达观点。
从理论研究、技术创新的角度分析,可以确定,ChatGPT所应用的技术是当前生成式人工智能技术(AIGC,AI Generated Content)浪潮中最明亮的星。生成式人工智能技术拓展决断式人工智能应用边界,利用人工智能技术来生成内容,突破了专业生成内容(PGC)、用户生成内容(UGC)在写作、绘画、音乐、教育等领域进行创造性工作的“垄断”,就像运用ChatGPT创作诗词,撰写文稿。作为生成式人工智能技术领域的新贵,ChatGPT的核心是GPT模型(生成性预训练转换模型),这是一种自然语言处理的模型,其设计思路简单来讲,是通过特定算法预测下一个单词的概率分布,通过在大型文本语料库中训练模型学习语言模式,并基于此来生成自然语言文本。从2018年GPT-1模型问世,到如今GPT-3模型的大热,GPT模型的智能化程度持续提升,更大的语料库和参数规模、更高的准确性和适应性、更强的计算能力与自我学习能力,以及更加通用的预训练铸就了ChatGPT的功能升级与性能提升。GPT-4模型预计将在2023年初发布,相较于GPT-3和3.5,GPT-4的性能将会跳跃式提升。当然,ChatGPT最朴素的技术原理来源于概率统计。简单优雅、深刻隽永的贝叶斯定理是其发展的基础,通过贝叶斯定理, ChatGPT 可以计算出在已知语言模式中生成某个句子的概率,以及面对已知信息和问题做出相应特定回答的概率,从而选择最优回复,实现交互,这再次说明了是数学在引领着人类世界前行,数字经济也是数学经济。
数字化时代,任何一个应用的规模化普及,都需要技术与市场的双轮驱动。ChatGPT也不例外,这就不得不提ChatGPT的研发团队OpenAI。2015年,OpenAI由大名鼎鼎的企业家埃隆·马斯克、阿尔特曼、彼得·蒂尔等人创立,是一家人工智能研究公司,拥有硅谷众多重量级企业的资金支持。近期微软官方证实,会继续向OpenAI追加数十亿美元投资,后续预计达100亿美元,这必将成为人工智能领域的一段佳话。OpenAI建立初期是非盈利性的研究机构,但是现在最新版本ChatGPT也不再开源,正式启动了商业化运作。由此不难看出,ChatGPT的背后依然隐藏着资本市场的激烈博弈。微软公司宣布将ChatGPT应用于自己的搜索引擎Bing,谷歌公司在自然语言处理领域也进行大量投入,研发BERT模型(双向Transformer编码器表达,Bidirectional Encoder Representation from Transformers),并计划推出聊天机器人“巴德”抗衡ChatGPT,这些事实也进一步印证了互联网大鳄运用资本市场加速圈定技术创新高地的明争暗斗。
△图源“北京日报”微信公众号
ChatGPT在用户体验层面展现出强大性能,也有一部分声音又开始担心个人或者行业被人工智能取代,包括OpenAI的几位创始人也就相关的问题进行过讨论,其中阿尔特曼表达过:研发生成式人工智能技术的目的是为人类创造者提供工具、拓展能力,旨在增强、而非取代,而且所有深层生物学的东西无法被取代,包括与他人互动、享受乐趣、创造新事物的动力。也有人通过实验向ChatGPT询问它会取代哪些职业,得到的回答是包括四个方面:数据输入和处理、服务和帮助客户处理常见问题、翻译任务、撰写报告和生成内容。但是ChatGPT同时也展现出满满的“求生欲”补充道:“重要的是,请注意,虽然有些任务可能会实现自动化,但像我这样的技术也可以帮助和提升人类工作者,使他们在工作中更加多产、高效。”
从另一个层面分析,ChatGPT在技术与成本等方面存在的问题和弊端,也表明当前其无法真正取代行业或者个人。ChatGPT在其未经大量语料训练的领域缺乏“人类常识”和引申能力,导致会一本正经地“胡说八道”;无法处理复杂冗长或者特别专业的语言结构,医学、自然科学等等;处理接受在线新知识的能力不足。同时,它依然是黑盒模型,无法确保不产生攻击性表达,为了让ChatGPT生成的内容更符合人类习惯,OpenAI曾雇佣40多个人给生成的内容打分,这40位老师只为有帮助的、真实的、无害的文本打高分,包含不良内容的打低分,这也让ChatGPT这位学生更温和、更加充满正能量。ChatGPT同样需要非常强大的算力成本支撑,从GPT-1到GPT-3,模型训练参数的数量从1.17亿增长到了1750亿,GPT-3训练一次的费用是460万美元,总训练成本高达1200万美元,这个数字已经极为惊人,但是据某公司测算,该企业使用ChatGPT的成本每年约为1000亿元,不禁让人惊掉下巴。
基于以上分析,不难发现ChatGPT等聊天机器人并不真正具备分析、理解、判断能力,它所能做的更像是人云亦云,或者加权后更加贴近真实场景的人云亦云,是更靠近上层应用的AIGC框架,本质上仍需要底层计算能力的支撑,是算智能最新的人工弱智能,未来还有许多值得期待的演进,比如,进一步改进算法使之与数据、算力更加匹配,在文本和图像互相转换基础上进一步加强模态的转化,以及在使用过程中不断自我优化升级能力的提升。突破这些问题将推进科技革新向更为广阔的应用场景延伸,也推动人工智能向感知智能、认知智能持续迈进,从而更好地帮助人类创造新知识,推动社会进步。
最后,无论将ChatGPT定义为生成式人工智能技术创新的里程碑,或是揭示其背后对于人工的依赖,及其引发的资本市场的无情博弈,一个不争的事实是ChatGPT的横空问世貌似偶然,实则必然,OpenAI创立至今,经历了八年的磨砺,对于理想的长久坚持转化成为了ChatGPT今日的成就,这值得我们对于中国的科技创新事业开启更深层次的思考。2021年中国人工智能领域的专利申请数量首次超过美国,但在原创关键技术、核心算法等方面依然存在很大差距,比如ChatGPT背后的算法深度残差网络(ResNet)是由微软提出的,论文是发表在顶级会议“计算机视觉与模式识别”(CVPR)的最佳论文;另一个基石算法Transformer,是由谷歌提出的,利用独特的机制,可以一次性处理所有输入的数据。此外,某些高校、科研院所、科技企业中,依然存在急功近利的浮躁心态,“长期主义”是最近被ChatGPT带热互联网热词,也许有些人觉得“长期主义”只是社会和公司画的大饼,但OpenAI和ChatGPT的出彩确实让人看到了“长期主义”的力量,所谓循序渐进、稳中有进、日拱一卒、功不唐捐。为此建议从需求、供给、政策环境和基础设施方面构建更加完整的创新生态,深耕在基础研究领域的科学家很有创造性想法,更多资金、平台、人才和制度应涌向基础科学,让基础研究工作者能够永葆任凭风浪起,稳坐钓鱼船的气度,潜心钻研、推陈出新,为中国科技创新自立自强创造更多“0到1”的突破。
ChatGPT只是人工智能时代的又一个开端,这个时代将会在很多基础学科研究天才的手上带来更多的惊喜,希望下一个天才就是你!