中国版ChatGPT“报名费5000万美元起” 谁能抢到“入场券”？

　　本报记者曲忠芳李正豪北京报道

　　由OpenAI推出的通用型对话机器人ChatGPT持续引发全球范围的“AI狂欢”。一时之间，资本圈、产业界、创业者等无不趋之若鹜，试图抓住新一轮人工智能的重大产业机遇，国内大小企业同样不想错过。

　　截至2月15日，百度、腾讯、科大讯飞、阿里巴巴、京东、360、网易有道、寺库、万兴科技等众多国内厂商纷纷发声，称已有ChatGPT相关的技术积累，或即将推出对标ChatGPT的产品、整合新技术到既有业务中，以至于“中国版ChatGPT”“中国版OpenAI”等概念在社交媒体成为热门话题。不过，在喧嚣与热闹之中，究竟谁在“蹭热点”，谁有“真本事”，显然并不取决于谁的“嗓门高”，而是有待市场的检验。

　　需要指出的是，ChatGPT并不是开源软件，产品在国内市场尚未开放，目前是以API(应用程序编程接口)调用的方式服务。ChatGPT带来的技术突破背后需要投入多大的成本?国内科技大厂及AI企业如何追赶这一波技术浪潮?所谓“中国版ChatGPT”将如何落地实现?……针对这些业界关注的问题，《中国经营报》记者采访了多位业内人士以及第三方专家，尽管对ChatGPT的看法见仁见智，但受访人士普遍认为，ChatGPT是继2006年深度学习(Deep Learning)提出之后一个里程碑式的技术革命，有望从底层推动社会生产力跃升，进一步加速AI发展和应用。

　　5000万美元入局够吗?

　　就在2月13日，已“退休”两年的美团联合创始人王慧文在社交平台高调发声，称“打造中国OpenAI，设立北京光年之外科技有限公司”，并表示“出资5000万美元，估值2亿美元”，据媒体报道已有包括源码资本等在内的风投机构认购2.3亿美元。对于王慧文此举，源码资本创始合伙人曹毅通过朋友圈表示“支持”。

　　关于王慧文究竟是要创立一家类似OpenAI的企业或组织机构，还是要组队研发一款类似ChatGPT的产品，以及如何实现其“中国OpenAI”的愿望，本报记者通过邮件联系王慧文希望进一步核实与采访，但截至发稿暂未获得回复。

　　几乎同一时间，出门问问创始人兼CEO李志飞也发声评论，他认为“2023年是AI大模型时代元年”，如果把搞中国版OpenAI/ChatGPT“比作一场运动竞赛，那么2023年Q1(第一季度)是报名阶段，目前的报名费是5000万美元起”。

　　OpenAI创立于2015年，最初的定位是一家开发造福全人类AI技术的非营利性组织，后来变成非营利性与营利性的混合式组织。因为并非上市公司，OpenAI的财务状况没有公开。据美国媒体报道，2022年该公司的营收约为3600万美元，但成本花费约5.44亿美元，也就是仅2022年就亏损了5亿美元。从2018年起，基于谷歌提出的、开源的Transformer神经网络架构，OpenAI开始发布生成式预训练语言模型GPT，可用于生成文章、代码、机器翻译、问答等各类内容，每一代GPT模型的参数量(指模型中含有多少个参数，是衡量深度学习算法的重要指标)都实现迅猛增长，第一代参数量为1.17亿，而2019年2月的GPT-2参数量为15亿，2020年5月发布的GPT-3参数量达到了1750亿。ChatGPT则是基于GPT-3.5架构开发的对话AI模型，被视为在GPT-4正式推出前的演练。

　　ChatGPT火爆的同时，其背后的成本支出也引发业内的关注。作为OpenAI早期投资人的埃隆·马斯克在推特平台提问ChatGPT“每次聊天的平均成本是多少”。OpenAI的CEO山姆·阿尔特曼回复称，ChatGPT平均每次的聊天成本为“个位数美分”，并表示正在试图更加准确地计算，同时也在努力优化(成本)。

　　国盛证券计算机团队在研报中粗略估算了ChatGPT的访问算力和前期训练两项费用，其中初始投入近十亿美元，单日电费达数万美元;在公有云下，单次训练约为百万至千万美元。该研报援引研究机构SimilarWeb的数据——2023年1月，平均每天约有1300万独立访客使用ChatGPT，访问阶段算力每天发生，其成本成为衡量ChatGPT最主要投入的关键指标。以英伟达A100芯片、DGX A100服务器、现阶段每日2500万访问量等假设条件为基础，估算得出，在初始算力投入上，为满足ChatGPT当前千万级用户的咨询量，投入成本约为8亿美元，对应约4000台服务器;在单日运行电费上，参考美国平均0.08美元/kWh工业电价，每日电费约为5万美元，成本相对高昂。模型的前期训练成本同样值得关注，基于参数数量和token(指客户端不断向服务端请求数据，服务端不断去数据库查询用户名和密码并进行对比)数量估算，GPT-3训练一次的成本约为140万美元;对于一些更大的LLM(大型语言模型)模型，采用同样的计算公式可得出，训练成本介于200万美元至1200万美元之间。报告指出，百万至千万美元级别的训练成本并不便宜，但对于科技大企业而言尚在可接受范围内。

　　谦询智库合伙人龚斌指出，ChatGPT是基于超参数AI大模型，大模型LLM的参数增长是指数级增长的，对算力和电力需求惊人，LLM训练的能耗和碳排放巨大。如此高的资金、算力和能源门槛，传统的开源模式已经玩不转了。这个游戏要持续能玩，5000万美元只是起步价，快速追赶者的投入起码要5亿美元，计算领域的生产工具和生产资料，正在快速集中化和“寡头化”。

　　深度科技研究院院长张孝荣认为，所谓中国版ChatGPT，因各家的技术路线并没有详细披露，或许跟ChatGPT不一样。这些产品能否持续发展、获得市场认可，还不好说，需要等上线后持续关注和观察。

　　搜索引擎“首当其冲”背后

　　2023年2月2日，微软宣布旗下所有产品将全线整合ChatGPT，包括Bing(必应)搜索引擎、Office、云平台Azure等。5日后，微软整合ChatGPT技术的Bing搜索引擎和Edge浏览器亮相。需要指出的是，微软从2019年起投资OpenAI10亿美元，并提供云服务支持。未来，微软还将继续投资数十亿美元，据美媒报道，微软计划投入资金将达100亿美元。

　　值得注意的是，ChatGPT的上线以及微软在搜索领域的“挑战”动作，让全球搜索市场的“霸主”谷歌拉响“红色警报”。谷歌CEO桑达尔·皮采亲自挂帅，紧急推出了基于其人工智能技术的聊天机器人Bard。不过，因为产品演示出现错误，拖累了谷歌母公司Alphabet的股价表现。

　　据美国网站通信流量监测机构Statcounter在2022年3月发布的数据报告称，在全球搜索引擎市场，谷歌占据91.55%的份额，微软Bing的市场份额为1.5%，百度占比1.47%。在中国搜索市场，百度以84.3%的份额位居第一位，排在其后的必应、搜狗的份额分别为6.7%、3.08%。

　　作为国内搜索市场的“老大”百度，在2月7日官方确认将推出类似ChatGPT产品的消目，项目中文名为“文心一言”，预计3月完成内测，面向公众开放。据媒体报道，该项目由百度CTO(首席技术官)王海峰带队，由百度文心大模型团队实际推进。对此，百度方面暂未透露更多信息。

　　曾在国内搜索市场中扮演“挑战者”角色的360方面透露计划推出类ChatGPT技术的demo(样片，试用版)产品，发布日期和实际效果存在不确定性。作为创始人的周鸿祎公开表示，如果企业搭不上ChatGPT这班车，很可能会被淘汰，360不会放弃对该技术的跟踪。

　　ChatGPT为何一出现就搅动了多年变化微小的搜索市场?众所周知，搜索引擎作为互联网时代的代表产物，既是用户流量的入口，又是主动“暴露”需求的途径，长久以来形成了一套生态系统。随着移动互联网时代的来临，App商店及大繁荣的App应用抢食了浏览器及搜索的入口流量。ChatGPT对自然语言的理解能力，打破了搜索引擎那种传统的一问一答与程序格式指令模式，有望重塑搜索市场。

　　上海人工智能研究院副总工程师沈灏向记者指出，ChatGPT作为一种通用型的产品形态展现在用户面前，对普通大众的认知与影响力是巨大的。它对搜索市场来说会产生较大的冲击，改变搜索的模式和习惯。市场格局的变化暂时还不好说，毕竟还没有看到国内的产品情况。从用户体验来说，整体可能会逐渐向搜索、浏览、对话的混合模式发展。

　　在思必驰联合创始人、首席科学家俞凯看来，搜索引擎和基于搜索的相关产业未来有可能被颠覆。搜索引擎类的应用，甚至信息搜索类的应用，属于基础性应用。当底层搜索引擎被颠覆的时候，所有和信息搜索相关的这种产业都会发生变革。从垂直领域来看，被影响的行业就更多了。无论是从金融、医疗、制造等各领域，凡是需要用到信息搜索，都有可能会发生相应的变革。

　　对国内AI企业的启发

　　沈灏认为，ChatGPT的火爆是一个从量变到质变的结果，为了形成质变，无论从算力硬件、核心技术、数据挖掘、人才团队、投资环境等各方面都需要关注。

　　云从科技创始人兼董事长周曦在财报电话会议中表示，ChatGPT是大数据大模型下的延续。通过分配范式，一方面将核心技术投入通用化，另一方面快速将应用场景化，从而带动边际效应，加速各个行业的智能化进程。

　　旷视研究院基础科研负责人张祥雨则指出，在能力上，ChatGPT背后的关键技术底座是生成式大模型，而模型设计能力也是旷视研究院多年来积累的核心能力。生成大型式大模型有望突破图像大模型的上限，并推动底层架构的统一。旷视研究院会坚定投入生成式大模型的研发。

　　俞凯也表示，GPT的核心是大模型技术和对话智能技术，其中大模型技术主要有三块：上下文学习，思维链推理，指令学习。大模型的算法是通用的，而数据量在超过千亿级之后，对比也就不再那么明显。换言之，底层基础的算法是公开的，并不存在算法上的明显差距。当数据量足够大，微不足道的数据差距影响没那么明显。目前，国产AI需要追赶与提升的方面，其实是在工程化能力、基础架构设置方面，另外还有人员经验的问题、长期信念决心的问题。

　　老牌AI企业科大讯飞副总裁、研究院执行院长刘聪表示，“兴奋归兴奋，关键是要踏实把科研做好，把产品做好，把服务做好”。科大讯飞提出人工智能红利能否兑现的三大标准是，有没有看得见摸得着的真实应用案例，有没有能够规模化推广应用的产品，有没有统计数据能够证明的应用成效。

　　海银资本创始合伙人王煜全认为，AI语言大模型属于“产业增强”类型的热潮，这一轮看似热闹，但因为高额的投入门槛，最后赢家只会上少数几个平台。第二轮热潮会在中国版ChatGPT真正出现后到来，属于大多数人的“模式创新”机会。中国ChatGPT的开发既要解决算法上的问题，还要积累一个与超大规模算法匹配的优质数据库，前者靠聪明的大脑或许能加速不少，但后者就是实打实的苦功夫，会成为不少AI企业面对的最大难点。