阅读蕴藏着无尽可能,有益于明理、增信、崇德、力行,让人生绽放光彩。
在近 10 年 AI 发展的前两个阶段,人工智能的进展更多体现在基于规模的技术突破,如 2015-2020 年,用于模型训练的计算量增长了 6 个数量级,同时随着规模的增大,输出结果的质量亦迎来质变,在语言文字、书写、图像识别等领域皆表现出超越人类的水平。但在使用层面,由于所需要的算力巨大,往往需要特殊的 GPU 配置,同时训练过程相对封闭,大多数人并无法使用,因此技术无法被多数人触达。而人工智能的第三个阶段,随着更新的技术、更优的算法、更大的模型出现,算力的成本越来越低,使得模型训练与运行所需成本持续下降,
而算法从封闭测试到开放测试、开源的逐渐普及,亦降低了使用门槛。由此人工智能无论在经济性与可获得性上都达到了支持普及的水平。得益于 AIGC 基础设施可获得性的逐步提高,平台层变得更加稳固,算力成本持续下探,模型逐渐趋于开源与免费,应用层爆发式发展的节点正在靠近
目前我们正经历从 Web2.0 开始向Web3.0 转型的启航阶段,我们已经看到内容创造从专业创作(PFC)转型为了用户创作(UGC)。而 Chat-GPT 的出现以及中短期内的产业化落地将会为从用户创作(UGC)到 AI 创作(AIGC)的转型提供关键的辅助支持。结合 Chat-GPT的底层技术逻辑,我们认为 Chat-GPT 中短期内产业化的方向主要分为四大板块。1)Chat-GPT 对于文字模态的 AIGC 应用具有重要意义,在归纳性的文字类工作中展现出了其优异的表现。中短期内 Chat-GPT 能在办公辅助类工具中迅速落地,例如会议总结、文件翻译、例行报告等,提升办公效率并节省人力成本。
代码开发相关的工作更加规整也非常适合 AI 辅助生成。2021 年中与Github、微软合作上线的 Copilot 是目前最成熟的 AI 代码补全工具,根据 Github数据,测试一年来已有 120 万用户,这些用户编写的代码中 40%是由 Copilot自动生成,而截至 2022 年 10 月,Copilot 已经融资 2200 万美元。Chat-GPT在目前测试中表现出的代码生成能力相比于 Copilot 更加灵活,但欠缺一些底层的稳定性。在进行针对性的优化后,基于新 GPT 模型的 AI 代码辅助工具也有望在中短期内落地。3)图像生成领域成为了 2022 年下半年一级市场公司布局的热点,随着 Dalle2 的热度,在上稿方面用 AI 取代人类画手的思路基本明确。
GPT 模型在图像生成领域目前效果略逊于扩散模型,但扩散模型可以利用Chat-GPT 生成较佳的 Prompt,对于 AIGC 内容和日趋火热的艺术创作,提供强大的文字形态的动力。4)Chat-GPT 最适合直接落地的项目就是智能客服类的工作。根据模型现有的完成度,在垂直行业针对性地做人工反馈训练,Chat-GPT 就可以落地为智能客服产品,在 toC 场景中率先应用。对比目前的智能客服,Chat-GPT 支撑的客服将在灵活性与人性化服务方面有显著的进步。
关于ChatGPT
1、ChatGPT:更智能的 AI 对话交互工具
ChatGPT 是由 OpenAI 公司于 2022 年 11 月发布的聊天机器人模型,可以通过对话形式实现交互,能够回答连续问题,承认错误,质疑不正确的前提,并拒绝不合理的需求。ChatGPT 的对话互动可以实现普通聊天、信息咨询、撰写诗词作文、修改代码等,由于更类人的智能化表现,ChatGPT 推出后受到广泛关注,上线不到一周用户量突破 100 万。2023 年 1 月,微软 CEO 表示计划将 ChatGPT 等人工智能工具整合到所有产品中,并作为平台提供给其他企业使用。Buzzfeed 和亚马逊也在探索 ChatGPT 应用场景。
GPT 引入新的模型训练方法,AI 行业发展有望加速GPT通过Transformer为基础的预训练语言模型,此前已公布GPT-1、GPT-2、GPT-3 三个模型,ChatGPT 是对 GPT-3 模型(又称为 GPT-3.5)微调后开发出来的对话机器人。ChatGPT 引入了 RLHF(基于人类反馈的强化学习)方法,
方法分为三个步骤: 1)有监督地调优:预训练的语言模型在少量已标注的数据上进行调优,以学习从给定的 prompt 列表生成输出的有监督的策略(SFT 模型);2)模拟人类偏好:标注者们对相对大量的 SFT 模型输出进行投票,创建一个由比较数据组成的新数据集,训练建立模型(RM);
3)近端策略优化(PPO):使用 RM 作为强化学习的优化目标,利用 PPO算法微调 SFT 模型。我们认为,ChatGPT 的成功展示出 AI 大模型的应用潜力,新方法的引入有望加速 NLP 算法及 AI 行业发展。
3、巨头坚定投入,开启 AI 新浪潮2023 年 1 月 18 日,微软宣布将于 3 月底前在全球裁员 1 万人,约占员工总数的 5%;1 月 23 日微软在其官方博客宣布,已与 OpenAI 扩大合作伙伴关系,微软将向 OpenAI 进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能领域的技术突破,此前微软已分别于 2019 年和 2021 年对OpenAI 进行投资1 月 20 日,谷歌母公司 Alphabet 宣布将裁员约 1.2 万人,占该公司员工总数的 6%以上,同时谷歌 CEO 表示,公司将会进一步聚焦AI 技术核心业务的研发投入。我们认为,微软、谷歌、亚马逊等全球巨头坚定投入 AI,展现出 AI 应用广阔的发展前景,AI 行业有望开启新发展浪潮。
Chat-GPT 的成功,是在前期大量坚实的工作基础上实现的,不是横空出世的技术跨越。这些进步主要来自数学层面上的优化带来的结果匹配精准度提高,而并非算法真正为 AI 带来了创造性与完整的逻辑性,也不是能够从训练的数据中学习到新的知识。它在“解锁”(unlock)和挖掘 GPT3 学到的海量数据中的知识和能力,但这些仅通过快速地In-context 的方式较难获得。InstuctGPT 找到了一种面向主观任务来挖掘 GPT3 强大语言能力的方式。因此从这样的底层技术逻辑出发,我们能迅速找到中短期内适合 Chat-GPT的产业化方向:一个真正全方位的智能内容生成助手。
Chat-GPT 的成功证明了两点:
1)单纯扩大模型参数并非唯一出路;
2)让模型再造定期开放给大众测试并收集人类反馈数据更有利于模型迭代。之前两个阶段,人工智能的进展更多体现在基于规模的技术突破,如 2015-2020 年,用于模型训练的计算量增长了 6 个数量级,同时随着规模的增大,输出结果的质量亦迎来质变,在语言文字、书写、图像识别等领域皆表现出超越人类的水平。
但在使用层面,由于所需要的算力巨大,往往需要特殊的 GPU 配置,同时训练过程相对封闭,大多数人并无法使用,因此技术无法被多数人触达。而人工智能的第三个阶段,随着更新的技术、更优的算法、更大的模型出现,算力的成本越来越低,使得模型训练与运行所需成本持续下降,而算法从封闭测试到开放测试、开源的逐渐普及,亦降低了使用门槛。由此人工智能无论在经济性与可获得性上都达到了支持普及的水平。
互联网巨头接连曝光ChatGPT 布局动态,华为下周或也有大动作,行业可能迎来格局骤变据21财经8日报道,阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。从曝光截图来看,阿里巴巴可能将Al大模型技术与钉钉生产力工具深度结合。受此影响,阿里巴巴盘前涨近2%。
此外,据上证报报道,接近百度人士透露,此次ChatGPT项目文心一言落地,首站将直接接入百度搜索。另外今日早些时候消息称,网易有道未来或将推出ChatGPT同源技术产品,应用场景围绕在线教育。
另据中国证券报了解,腾讯也有相关技术储备,包括Al大模型、机器学习算法以及NLP等领域。腾讯混元Al大模型团队推出了万亿级别中文NLP预训练模型HunYuan-NLP-1T,该模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。
除了巨头动作外,2月13日,北京市科委、中关村管委会等携手华为、中关村发展集团、百度等联合举办北京人工智能产业创新发展大会。大会将发布人工智能基础模型、展示领先技术、分享客户及伙伴的优秀商业实践和成果等。