ChatGPT崛起背后：人工智能踏上“通用与工程化”之路？

　　21世纪经济报道记者白杨北京报道

　　2022年末，ChatGPT横空出世，让人工智能产业再起涟漪。

　　人工智能(Artificial Intelligence，简称“AI”)诞生于1956年，至今已六十余年。在漫长的岁月中，一些新技术或新方法的出现，给AI产业带来过乐观浪潮，但随之而出现的，则是数次AI寒冬。

　　如同任何新兴事物一样，人工智能的发展没有一蹴而就，而是历经坎坷和挫折。直到近十年，得益于深度学习算法的突破，以及算力提升和大数据的积累，人工智能才真正迎来从实验室研究走向产业实践的黄金时代。

　　2016年，谷歌AlphaGo与人类围棋冠军李世石进行的人机大战，让AI走向社会舞台中央，同时，也推动了AI商业浪潮的来临。

　　过去五年，人工智能与千行百业加速融合，其价值在很多场景得到释放，并催生出一大批AI公司或团队。然而，在产业实践过程中，AI也面临新的瓶颈：解决单一场景问题，AI的能力毋庸置疑，但如何复用解决更多场景的问题，成为很多AI公司盈利的掣肘。

　　而AI工程化，是解决这一问题的重要手段。此前，Gartner已连续两年把AI工程列为年度战略技术趋势之一。在Gartner看来，AI工程化是AI大规模发展的必经之路。因为任何行业或企业，只要有场景、数据和算力，都可以落地AI应用，但落地效率、周期会远超预期。

　　因此，AI要成为企业的生产力，就必须以工程化的技术来解决模型开发、训练、预测等全链路生命周期的问题。所以在2022年，AI工程化成为AI行业的一个关键词。

　　ChatGPT走入大众

　　以ChatGPT为例，它其实也是AI工程化的产物。一位AI领域专家告诉21世纪经济报道记者，AI工程化的过程包括需求分析、模型设计、模型训练、模型部署等环节。

　　其中，在需求分析阶段，需要明确人工智能技术应用的目标和需求。比如OpenAI开发ChatGPT，其目的就是满足人们对自然语言处理技术的需求，希望通过自然语言交互的方式给人们提供帮助。

　　而在模型设计阶段，需要根据需求分析的结果，设计合适的模型来解决问题。就像ChatGPT其实是一种被称Assistant的大型语言模型，为了让它能够理解和回答用户的问题，并生成用户可读的回复，OpenAI选择用Transformer深度学习模型进行训练。

　　在训练过程中，则需要通过训练大量的文本数据，让模型学习如何对话。它需要先识别用户输入文本中的语法、语义和结构，更难的则是要学会如何生成更像是人类回复的文本。

　　“ChatGPT能实现目前这样自然的语言交互，与过去几年AI产业在算法、算力、数据等方面的不断突破密切相关，但光有技术上的创新还不够，人们能够如此便捷的体验到ChatGPT，则是AI工程化的功劳”，该AI领域专家表示。

　　其实早在2020年，OpenAI就推出过大型语言生成模型GPT-3(Generative Pre-training Transformer 3)，其训练参数量达到1750，在当时，这已是世界之最。

　　虽然都是使用深度学习技术开发的大型语言模型，但GPT-3比ChatGPT要更大，训练数据也更多，所以GPT-3的能力要强于ChatGPT。然而，GPT-3的能力只能通过API的形式开放给外界，这也让很多普通用户无法体验到GPT-3的强大。

　　而ChatGPT在定位上，就是一款To C产品，上线仅5天，便吸引了超过100万用户。而且它给社会带来的震撼，要远超AlphaGo，毕竟相比只能远观AlphaGo，现在人们可以直接与ChatGPT对话，感受AI的魔力。

　　对业界来说，ChatGPT的出现，更是让人看到了AI工程能力的又一次进化。真格基金管理合伙人戴雨森当时便表示，“从ChatGPT中，我看到新一代的AI技术随着不同组件走向成熟，已经进入乐高化模块化的趋势。这意味着迭代速度会越来越快，原来需要单独开发的部分变成了公用的、可复用、可调用的组件。”

　　规模与效率

　　在产业界，AI工程化则带来了更直接的经济效益。

　　近日，阿里巴巴集团副总裁、AI科学家贾扬清提出，工程化和开源是AI普惠最重要的两大支撑。而实现AI工程化的关键，是要提升三个效率：通过云原生的计算，提升计算效率;通过标准研发范式，提升研发效率;通过大数据AI一体，提升数据应用效率”。

　　贾扬清以阿里达摩院上云为例称，通过一个云原生的AI平台PAI，就支撑算法团队从规模、效率和易用性上面不断突破。在规模上，可以支撑10万亿参数的预训练大模型，在效率上，通过AI开放服务平台OpenMind则可以服务日均1万亿次左右的调用。

　　借助AI工程化体系，阿里云服务了非常多云上的客户，而腾讯云，也凭借AI工程化解决了规模化的难题。

　　2021年初，腾讯云帮助上海富驰高科技股份有限公司(简称“富驰高科”)解决了一个大问题。作为一家金属粉末注射成型(MIM)产品专业制造商，如何提高质检效率，一直困扰着富驰高科。

　　过去，富驰高科的质检工作主要是由人工完成，这并非它不愿意使用自动化手段，而是市面上几乎没有能够满足其质检需求的方案。后来，腾讯云研发团队经过半年的艰苦攻坚，成功敲开了工业质检的大门。

　　但是，让腾讯云副总裁、腾讯云智能研发负责人、优图实验室研发负责人吴永坚头疼的是，做完富驰高科项目后，该如何把AI质检能力复制到更多项目中。吴永坚告诉21世纪经济报道，“如果每个项目都要像在富驰高科这样投入，那成本方面，腾讯云承担不起”。

　　在又做了几个项目之后，腾讯云终于找到了可行办法。“我们拆解算法里的每一个流程，精细到每一步明确要做什么，然后将其沉淀到腾讯云AI开发服务平台——TI平台上，最终形成了一个面向工业质检场景的产品化平台”，吴永坚说。

　　今年，生产3C产品金属结构件的立铠精密也成为腾讯云的工业质检客户。相比富驰高科，立铠精密的产品种类更多，涉及的工艺也更复杂，但在服务立铠精密时，吴永坚觉得容易了很多。

　　“当初我们还需要派大量算法工程师去富驰高科驻场办公，但现在，只需在项目前期派少量算法人员过去，其余大部分工作都可以在TI平台上完成，效率提高非常多”，吴永坚说。

　　这种转变，就是AI工程化价值的体现。现在，面对不同的质检场景，腾讯云都可以通过工业质检训练平台来提供解决方案，这背后，依靠的已不仅仅是算法团队，而是需要工程、产品、数据运营等团队共同支撑，进行的是一种体系化建设。

　　奔向通用AI

　　中国信通院今年发布的《人工智能白皮书(2022)》(以下简称“白皮书”)指出，未来，人工智能除了重视技术创新以外，还会更加关注工程实践和可信安全，这也构成了新的“三维”发展坐标，牵引人工智能技术产业迈向新的阶段。

　　其中，工程实践能力正成为释放人工智能技术红利的重要支撑。白皮书提到，AI行业在工程实践方面的努力，最早可追溯至Caffe、TensorFlow、PaddlePaddle等开源框架的诞生，通过屏蔽底层硬件和操作系统细节，大幅降低模型开发和部署难度，有效推动了人工智能技术的扩散。

　　而当前，人工智能与云计算、大数据等技术的融合不断深入，围绕着数据处理、模型训练、部署运营和安全监测等各环节的工具链不断丰富，也使得人工智能研发管理体系日益完善。

　　白皮书认为，随着工程实践能力的不断提升，“小作坊、项目制”的AI赋能方式正在成为历史，未来将会更加便捷、高效地实现人工资高就能落地应用和产品交付。

　　具体而言，AI工程化主要聚焦于工具体系、开发流程、模型管理全生命流程的高效耦合。在工具体系层面，体系化与开放化成为研发平台技术工具链的发展特点;开发流程方面，工程化关注AI模型开发的生命流程，追求高效且标准化的持续生产、持续交付和持续部署。

　　而模型管理方面，随着企业智能化应用的逐步加深，模型种类和数量大幅增长，企业需要建设对模型生命周期的管理机制，并对模型的版本历程、性能表现、相关数据、衍生的模型档案等进行标准化的管理运维。

　　所以接下来，AI企业能否快速赋能各行各业，响应多样化需求，关键因素就在于企业的工程化能力。

　　另一方面，通用人工智能(AGI，Artificial General Intelligence)作为AI领域的终极目标，实现的过程也需要依靠AI工程化能力。虽然目前距离实现真正的通用人工智能还有很长一段距离，但是，在一些特定场景下的通用AI，已经出现。

　　比如ChatGPT，便是一种自然语言处理的通用AI模型，因为它可以回答覆盖各种领域的问题，而不是专门针对某一个领域设计的模型。

　　目前，在很多领域人工智能已经赶上甚至超过人类水平，比如语言理解、语音识别、视觉识别等。当人们能够借助AI工程化能力，把这些AI技术规模化应用到诸如工业质检、机器人等产业当中时，将大幅提升人类的工作效率和质量，而这，也是人工智能产业致力于实现的目标。