讯飞星火整体已超越ChatGPT，刘庆峰：国产大模型要走出自己的路

　　10月24日，科大讯飞(002230.SZ)推出的大模型讯飞星火V3.0如约而至。

　　讯飞星火V1.0于今年5月6日正式发布时，科大讯飞曾提出要在“10月底整体赶超ChatGPT”。

　　经历两次迭代，讯飞星火大模型先后突破开放式问答、代码能力，并升级了多轮对话能力、多模态交互能力，此次推出的讯飞星火V3.0也像当初承诺的一样，实现了整体超越ChatGPT。

　　根据第三方测评，讯飞星火V3.0的综合能力已超越ChatGPT，达到国内领先、国际一流水平，尤其是在医疗、法律、教育行业的表现格外突出。

　　不仅如此，科大讯飞的董事长刘庆峰喊出了新一步的目标——明年上半年对标ChatGPT-4!

　　随着多家企业推出通用大模型，当前大模型行业已进入全新的阶段——拼落地应用，各大模型正在应用落地领域掀起一场全新的“百模大战”。

　　而作为大模型第一梯队的“国家队”选手，讯飞星火V3.0在经历两次迭代后，其重心已渐渐落在行业应用中，此次，科大讯飞联合不同行业的龙头企业共同发布了12个行业大模型，如工业、科研、金融、汽车、运营商和住建等领域，深入到各大行业中。

　　讯飞星火V3.0如约而来达成目标“整体赶超ChatGPT”

　　10月24日，在第六届世界声博会暨2023科大讯飞全球1024开发者节上，科大讯飞正式推出了讯飞星火V3.0。

　　红星资本局注意到，讯飞星火早前的版本曾被麻省理工科技商业评论誉为“中国最聪明的大模型”，而此次讯飞星火V3.0的七大能力持续提升，尤其是在数学能力和代码能力等上有了明显的“进化”。

　　以数学能力为例，讯飞星火V3.0已具备自动提炼规律的能力，它能通过观察新算式、小样本学习发现其中规律，并运用到全新的算式中进行计算。

　　比如，给讯飞星火V3.0提供两个算式及示范：a△b=(a+b)+ab+(a-b)+a+b、a&b=(a-b)+ab+(a-b)+a+b，再向它提问“(2△3)&3等于多少”，它能准确给出答案。

　　从数学能力到逻辑推理，再从代码能力到多模态能力，单项能力的不断突破也让讯飞星火V3.0全新升级，带来了诸多新功能，其中最亮眼的功能或为虚拟人格功能。

　　科大讯飞的董事长刘庆峰称，目前，讯飞星火V3.0的各类应用已有超过1200万用户，经过跟踪调研，他们发现：部分用户希望大模型不仅能回答问题，还要有个性。

　　讯飞星火V3.0做到了这一点，用户可以通过“友伴”从性格、情绪、表达风格等方面设定AI助手的基本人设，且可以导入特定的知识、相关对话记录形成个性化的记忆。

　　图说：与拥有哪吒人设的AI助手进行对话

　　这些点点滴滴的进步汇聚在一起，让讯飞星火V3.0真正拥有了和ChatGPT抗衡的能力。

　　国务院发展研究中心国研经济研究院的测评报告显示，星火大模型V3.0的综合能力超越ChatGPT，已达到国内领先、国际一流水平，在医疗、法律、教育行业的表现格外突出。

　　据刘庆峰介绍，科大讯飞根据《通用认知智能大模型评测体系》构建测试集，采用盲测进行测试，结果显示：讯飞星火V3.0的中文能力客观评测已超越ChatGPT。

　　另根据OpenAI在官网发布的英文任务测试集，在10月16日至20日的测试中，星火V3.0的英文能力对标ChatGPT48项任务结果相当，二者得分分别为85.1%(星火V3.0)和84.3%。

　　以大模型解放生产力首先在科研和工业上造福人类

　　事实上，随着多家企业推出通用大模型，大模型行业已进入全新的阶段——拼落地应用。

　　不同的行业有不同的需求和应用场景，当通用大模型能够适应这些行业的特点并进行具体的优化和调整，提高该行业的业务效率、切实创造经济价值，这才是大模型的关键竞争力。

　　讯飞星火是其中的佼佼者，刘庆峰就认为，“大模型首先要能够在工业和科研领域造福人类，这才是我们真正解决社会刚需的地方。”

　　据了解，在工业领域中，9月20日，基于讯飞星火和羚羊工业互联网平台的羚羊工业大模型已正式发布，通用人工智能正在成为新型工业化的核心引擎。

　　公开资料显示，羚羊工业互联网平台是在工信部指导下建立的国家级“双跨”平台，致力于用工业感知、工业认知、工业大模型推动制造业智能化转型。

　　而羚羊工业大模型具有文本生成、理解计算、知识问答和代码生产等能力，比如，该大模型可以通过非接触“听”声来智能判断设备的异常点，能把检测时间从3小时缩短至10分钟。

　　据刘庆峰介绍，在羚羊工业大模型发布后，从9月20日到10月23日，该平台的用户总量提升了59%至68.7万，服务企业次数提升了88%至370.6万次。

　　同时，在科研领域，讯飞星火V3.0与中科院文献情报中心联合打造科技文献大模型，可以实现成果调研、论文研读、学术写作三大功能。

　　科大讯飞研究院院长刘聪在论坛上进行实测，通过科技文献大模型将十几份量子计算相关的论文一键生成综述报告，为科研人员快速了解某领域的最新论文大幅提效。

　　有测试数据显示，在使用了科技文献大模型后，学者的成果调研效率提高超过10倍，论文研读有效率和学术写作采纳率均超90%。

　　“假如能让350万正在高校读书的研究生和博士生把他们在调研、写作等过程中花的时间和精力减少20%-30%，这将极大释放中国未来的创造力和想象力。”刘庆峰说。

　　不仅仅是工业和科研领域，刘庆峰强调称，“在大模型时代，我们要跟各个行业更深度地对接。”

　　红星资本局获悉，科大讯飞此次还联合不同行业的龙头企业，共同发布了12个行业大模型，涉及金融、汽车、运营商、住建、物业、法律、传媒和水利等行业。

　　与伙伴共建产业生态明年上半年能对标ChatGPT-4能力

　　在讯飞星火快速迭代的背后，是自主创新的算力底座。

　　刘庆峰回忆称，今年年初，他们曾经很担心讯飞星火项目，怕技术和算力赶不上国际水平，但在和华为沟通后，双方加强了战略合作，华为甚至派出“特战队”与他们一起熬夜加班。

　　在过去半年的时间内，通过孵化大模型融合算子、多维度分布式并行、算网存系统级的智能运维、基于CANN的联合深度优化，科大讯飞和华为“特战队”共同实现了讯飞星火大模型的训练和推理效率翻番。

　　华为的轮值董事长徐直军也出席了此次论坛，他称，他很高兴看到双方团队的精诚合作，并透露华为目前在全球使用的智能终端语音技术都来自科大讯飞，而且不仅仅是中文，涉及几十种语言。

　　在论坛上，科大讯飞还联合华为重磅发布基于昇腾生态的“飞星一号”大模型算力平台。

　　同时，刘庆峰宣布，对标ChatGPT-4的更大参数规模的星火大模型训练正式启动，力求在2024年上半年达到这一目标。“国内的大模型和ChatGPT-4比还是有差距，我们必须正视差距。大模型赋能千行百业是一场硬仗，只有实事求是的科学精神才能真正超越ChatGPT-4。”

　　“大模型时代的序幕刚刚拉开。”刘庆峰认为，当前不应只是简单的技术对标，“我们要走出自己的技术路线，走出自己的产业方向，形成自己完整的生态。”

　　事实上，讯飞星火大模型已带动相关产业生态的发展。自5月6日至今，讯飞开放平台新增143万开发者团队，同比增长331%，其中新增大模型开发者17.8万。

　　未来，随着技术不断进步，相关产业的生态逐渐繁荣，讯飞星火赶超ChatGPT-4的同时或能走出真正属于国产大模型自己的方向和道路。