10月24日,第六届世界声博会暨2023科大讯飞全球1024开发者节在合肥隆重开幕。大会上,科大讯飞发布了讯飞星火认知大模型V3.0、十二个行业大模型,还与华为联合发布基于昇腾生态的“飞星一号”平台。科大讯飞董事长刘庆峰在会上表示,星火认知大模型V3.0已经超越了ChatGPT(GPT3.5)。
刘庆峰表示,大模型时代的序幕才刚刚拉开,只有与众多开发者、合作伙伴共创、共享,才能实现共同进化,他认为“要把认知大模型赋能千行百业”是一场硬仗,绝不是靠吹牛能做成的,只有实事求是的科学精神才能真正实现超越。
刘庆峰还给出了下一步“里程碑”的时间:2024年的上半年,讯飞星火V4.0发布,对标GPT-4,“对于讯飞来说,这绝不仅仅是一个简单的技术对标问题,我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。”
说到做到 星火V3.0中文能力客观超越ChatGPT 英文能力旗鼓相当
早在今年5月,科大讯飞就公布了自己的技术升级路线“时间表”,并表示要在10月24日整体赶超ChatGPT。
5个月后,科大讯飞做到了。
在本次大会上,刘庆峰公布了一组数据:根据《通用认知智能大模型评测体系》构建测试集,在10月16日至20日的测试中,星火认知大模型V3.0的中文能力客观测评超越ChatGPT,而根据OpenAI在官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文能力对标ChatGPT48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。
根据现场的演示,星火认知大模型V3.0相比上一版本在文本生成、逻辑推理、代码能力等七个方面的能力有了3%到9%不等的提升。
国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,达到国内领先、国际一流水平,在医疗、法律、教育行业的表现格外突出。
星火V3.0 进一步升级了数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。
在代码能力方面,搭载讯飞星火V3.0的智能编程助手iFlyCode2.0正式发布。刘庆峰举例,科大讯飞内部近期完成了Windows到Linux的跨平台移植,其中涉及20万行代码,正常需要3个月时间完成这项工作,但在iFlyCode赋能下,整个过程只用了1个月时间。据悉,iFlyCode自8月15日发布以来,已与京东云、软通动力等107家机构实现深度对接应用。
此外,大模型不仅要有专业的知识,还要具备个性化的AI人设,为星火注入“灵魂”。在现场演示中,星火大模型V3.0被要求“以孔夫子的人设写一篇演讲稿”,星火大模型最终以文言文形式呈现演讲稿,并植入多个孔子经典名言语录。刘庆峰透露,讯飞星火大模型V3.0新增了虚拟人格功能,它可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。
在现场,当科大讯飞研究院院长刘聪点击已创建的“诸葛亮”人格来对话时,诸葛亮的声音和语言风格便展现出来。用户通过星火大模型的“友伴”,还能创建自己的人格。刘聪现场在个人人格助手里上传个人背景知识,大模型便能用他的风格进行对话。
不过,相比拥有庞大数据量级的GPT4,刘庆峰始终秉持科学理性,表示和GPT4相比,科大讯飞“还有一个学习的过程”,不过他也给出了超越GPT4的时间表:2024上半年,星火V4.0发布之时。
联合华为 百模大战进入应用落地阶段
本次大会的另一大看点是,科大讯飞与华为的“强强联合”。
刘庆峰与华为轮值董事长徐直军在大会上共同发布了基于昇腾生态的“飞星一号”大模型算力平台。徐直军介绍,目前华为公司在全球所有使用的智能终端的语音技术,都是来自于科大讯飞,而且不仅仅是中文,是几十种语言。“星火大模型V3.0是双方合作的又一里程碑,同时还将为强大的星火大模型V4.0提供支撑。”实际上,早在今年8月,科大讯飞就携手华为发布了星火一体机,让所有企业都可以在国产自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。
根据民生证券发布的研报,星火一体机基于昇腾芯片,或代表国内最强AI一体机水平,昇腾AI芯片为核心提供2.5PFLOPS,通过算力软硬件协同优化 构建了算力集中、性能优越、供给稳定、数据安全的大模型训练集群。其具有130/650/1750 亿的模型参数可选,做到开箱即用、安全可控。
刘庆峰在本次大会上介绍,讯飞和华为“联合特战队”半年内实现星火大模型训练和推理效率均翻番。同时,自主创新的算力底座,带来了讯飞星火蓬勃的生态。
据了解,讯飞星火采取了差异化的定位和落地逻辑,以解决社会刚需,围绕医疗、教育、工业、代码、科研等领域进行生产力的解放,共建产业生态。大会期间,科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等,持续加速大模型行业落地。
以在此次活动中发布的讯飞星火医疗大模型为例,据刘庆峰介绍,GPT-4在国外已经在医疗领域大展拳脚,而讯飞星火医疗大模型在医疗海量知识问答、医疗专业文书生成等六大核心能力超越GPT4,通过了由中国信通院牵头并联合20余家产学研用机构发布的全国首个医疗健康领域大模型应用技术标准的测评。
“讯飞的智医助理最近又立了大功。一个年轻的妈妈到基层去看病,本以为是简单的妊娠反应,结果我们的智医助理及时提醒非常有可能是先兆流产,因为得到了及时救治,从而挽救了一个新的生命。”刘庆峰说。
在科研领域,讯飞星火和与中国科学院文献情报中心联合打造了科技文献大模型,可以实现成果调研、论文研读、学术写作三大功能。根据科大讯飞研究院院长刘聪现场实测,科技文献大模型可以将十几篇量子计算论文一键生成综述报告。测试显示,学者成果调研的效率被提高超10倍,论文研读有效率和学术写作采纳率均超90%。
在工业领域,9月20日,基于星火的羚羊工业大模型正式发布。1个月内,羚羊工业互联网平台的工业文本生成、知识问答、理解计算、代码生成、多模态5大核心能力再度升级,不到一个月时间平台用户总量提升59%,平台服务企业次数增加88%。
在今年的亚运会上,科大讯飞跟中国移动联合推出来基于星火大模型的5G新通话,接完电话之后,只要愿意申请服务,马上就会转成文字、生成纪要、生成待办事项。亚运工作人员刚挂电话,代办事项就能自动生成。据了解,该功能将惠及中国移动7亿多的5G用户。
开发者生态持续领先 多企业使用星火大模型
随着大模型持续突破,讯飞AI开发者生态持续领先。自5月6日星火发布以来,讯飞开放平台新增143.4万开发者团队,同比增幅331%,汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万,讯飞正与10万+企业客户、7万+个人用户携手,以星火创新应用新体验。大模型也显著降低了开发者门槛,在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。
在本次大会期间的科博展上,超6700平方米的展馆内展示了大模型在工业、教育、医疗到科学、艺术等多个方面的应用。
在汽车展台前,工作人员介绍,以往行业内长期存在无法唤醒、指令识别错误等人机交互痛点,伴随软硬件技术提升,尤其是依托人工智能大模型的认知理解、逻辑推理等优势,促使车载交互系统能理解更为复杂的指令需求,通过关联海量知识给出最优答案,并能进行多轮对话。
在医疗企业展台前,工作人员介绍,大模型嵌入医生工作站,可以帮助医生提高诊疗效率,让老百姓享受更好的医疗服务。
在一款智能鼠标展台,工作人员介绍,通过结合大模型的智能算法和数据处理等能力,智能鼠标可以在原先语音识别的功能基础上,再根据语音输入的要求进行文章、表格等的创作。
“在9月5日讯飞星火正式对全民开放以来,现在星火的各类应用已经有超过1200万名用户,这些用户对认知大模型的更高期待是什么?不仅能回答问题,还要能提出问题;不仅要有知识,还要有个性。”刘庆峰表示,“大模型不仅要能回答问题,还要像人一样主动提问,大模型想要赋能民生百业,需要实现从多轮对话、主动对话再到启发式对话的跨越,实现星火的智慧阶跃,推动行业纵深应用。”
“唯有生态繁荣,才有人工智能大未来。自2010年发布讯飞开放平台以来,科大讯飞持续构建AI开发者生态,让AI像水和电一样落地各行各业。今年依托星火大模型,讯飞将AI普惠更多用户。讯飞星火正日益成为解放生产力工具。”刘庆峰说。