0°

ChatGPT 与 OpenAI:再造下一个互联网巨头?

  如果你近期关注过 AI 领域的新闻,对 OpenAI 这个名字一定不陌生。是的,它就是近期引起业界广泛关注的 ChatGPT 对话聊天机器人背后的公司。

  单从名字上看,OpenAI 好像是一家从事 AI 的开源或非营利性组织,不过它的早期创始人埃隆·马斯克却批评它「OpenAI 应该更加 Open 一些」,这又是为什么呢?本文就带你一起来深入了解下 OpenAI。

  发展历程

  自从人工智能(AI)这一概念被提出以来,AI 会不会作恶、未来会不会凌驾于人类之上,一直是一个大众关注的话题。各类影视作品里,也常见到 AI 或机器人拥有自主意识后,对人类社会进行破坏的情景。随着近 10 年深度学习的飞速发展,AI 迎来了历史上发展的第三波浪潮。

  出于规范 AI 发展能够「造福人类」这一目标,OpenAI 在 2015 年 12 月成立了。它最初的定位是一家非赢利性的科研机构,主要出资人包括特斯拉 CEO Elon Musk、YC 前主席 Sam Altman、领英创始人 Reid Hoffman、PayPal 创始人 Peter Thiel 等硅谷大佬,初始筹集资金 10 亿美元。

  比较有意思的是,AWS 虽然也是 OpenAI 的早期出资机构之一,不过从 2016 年开始,OpenAI 就开始和微软合作,把大部分的训练工作搬到了微软的 Azure 上面。不得不说,微软这一举措非常具有前瞻性,虽然投入了不菲的硬件成本,但也给后续在商业化上的优先合作奠定了基础。

  2018 年 2 月,OpenAI 发布公告,宣布 Elon Musk 将离开 OpenAI 董事会,不过仍然会作为出资人继续捐赠及提供发展建议。背后主要的原因是特斯拉不断加强在自动驾驶及 AI 领域的投入,这可能导致未来和 OpenAI 的潜在冲突。

  OpenAI 关键发展历程

  作为非赢利性组织运作三年多后,OpenAI 迎来了其历史上最关键的一个转折 —— 它在 2019 年 3 月宣布成立 OpenAI LP 公司 —— 这是一家盈利性的商业公司。

  众所周知,支撑 AI 快速发展的机器学习是非常吃资源的,每个模型的训练背后都可能是百万美金级别的投入。另外在硅谷这样的地方吸引人才,光靠「造福未来人类」这一宏伟的使命愿景显然也是不够的,得有类似其他创业公司的股票期权激励机制。要支持这样一个机构更高效、更长期地运转,OpenAI 得有自己的商业化造血能力。

  不过在设计 OpenAI LP 公司时,公司董事会也是煞费苦心。它把 OpenAI LP 设计为一家「盈利封顶」的公司,超过投资额 100 倍回报的盈利,都将划给 OpenAI Inc(也就是原来的非盈利公司),并且控制权也掌握在 OpenAI Inc 手里,以确保「初心」的实现。

  OpenAI 公司架构

  不过在这个新闻曝光后,互联网上就开始出现批评的声音,比如 Hacker News 上就有网友评论道“谷歌的早期投资者已经获得了大约 20 倍的资本回报,你敢打赌,你将拥有一个回报率比谷歌高出几个数量级的公司结构,但又不会过度集中权力?这将如何运作?”。

  当然,如果通用人工智能(AGI)的愿景得以实现,OpenAI 成为一家超过 Google、Facebook 这类巨头的公司不在话下,但一旦成为这种巨头,势必也会面临社会治理层面全新的巨大挑战。

  伴随着 OpenAI LP 的成立,OpenAI 很多研究成果也不再开源提供,甚至会「比较保守」地公之于众,比如 GPT-2 刚研究出来时,就宣称「担忧被恶意使用」而只公布了一个小模型示例,直到 9 个月后才完整对外。

  在 2019 年 7 月,OpenAI 宣布获得微软 10 亿美金的投资。在 PR 稿里,它提到 Azure 会成为 OpenAI 专属的云服务商,且会与微软共同开发大规模 AI 计算的基础架构,并给微软开放首批 AGI(通用人工智能)技术的商业授权。

  由于 Elon Musk 彼时已经离开 OpenAI Inc,新成立的 OpenAI LP 自然也就和他没有任何关系了。坊间有传闻他对于 OpenAI 转向盈利、拥抱微软有不同看法,这也可以理解为什么他在 Twitter 上吐槽 OpenAI 应该更加 Open 了。

  2020 年 6 月,OpenAI 发布了OpenAI API,这也是它的第一个商业化产品。OpenAI 为什么选择将 API 商业化,而不是像之前开源对应的模型呢?主要是 3 个原因:1-确保有足够的资金支撑后续的研究;2-降低模型的使用门槛,毕竟对众多中小企业来说,独立部署一套大模型的成本更高,是个双赢的选择;3-确保技术不会被错误地使用,这也是再次回归了其初心。

  2022 年 12 月,OpenAI 发布了 ChatGPT,这是一款具备多轮对话能力的聊天机器人,融合了 OpenAI 之前在 NLP 及代码生成领域最领先的技术,一发布就引起了业界震动,并再次将其曝光在媒体的聚光灯下。ChatGPT 仅用 5 天就获取了百万用户,公司的估值也由此涨到了 290 亿美金。

  不过 ChatGPT 也不是一天练成的,下面我们就来看看 OpenAI 历史上发布过的主要产品,进一步了解下它为什么能做出 ChatGPT,以及后续还可能往哪些方向发展。

  主要产品

  早期 OpenAI 的产品更多面向算法模型领域,不少还都是开源的,如面向强化学习领域的 Gym、Baselines 工具包,以及 PPO、RL-Teacher 等算法。

  由于定位是通用人工智能,OpenAI 非常注重从游戏领域训练 AI,发布了 Universe 这样的游戏 AI 训练平台,会玩 Dota 2 的 OpenAI Five,并在推出一年半后,就打败了人类专业玩家的世界冠军。

  Universe 和 OpenAI Five

  自从 2019 年成立 OpenAI LP 以来,OpenAI 推出的产品更侧重于「离商业化场景更近」的领域,如自然语言处理、图像处理、音乐生成,典型的有自然语言处理领域的 GPT-1、GPT-2、GPT-3。GPT 领域的成功经验,很快也被复用,它紧接着推出了基于文本生成图像的 DALL·E 和 DALL·E 2,面向代码生成领域的 Codex,面向音乐生成的 MuseNet 和 Jukebox。其中 GPT-3、DALL·E 和 Codex 均已通过 API 的方式对外商业化。

  OpenAI API

  生态企业

  OpenAI 的商业模式是对外提供 API,而自己专注在技术门槛最高的大模型研究与训练领域,这也注定了它要成功,必须伴随着一批「长在 OpenAI」平台上的生态企业的成功。

  出于这个定位,OpenAI 成立「创业基金」,投资了一批使用它能力的生态企业。

  Descript 是一款音视频剪辑工具,它结合强大的自然语言处理技术,提供了「像编辑文档一样简单」的能力,可以快速对音视频内容进行剪辑或修改,在视频创作者、播客创作者中的口碑非常好。

  Descript

  Harvey 是一个面向律师群体的 AI 助手工具,借助强大的生成式语言模型的能力,它可以在律师的工作流程中,帮助处理一系列繁杂的工作,如研究、起草、分析法律相关条文。Harvey 可以回答用自然语言提出的问题,例如“告诉我租约中的这一条款是否违反加州法律,如果违反,请重写它,使其不再违规”。如果你近期使用过 ChatGPT,相信你对它处理法律这种专业领域的重复性工作不会感到吃惊。

  Harvey 目前还在内测阶段,网上暂时还没有它更详细的介绍或界面流出。

  Mem 是一个轻量笔记工具,口号是「打造世界上第一款自动组织的笔记产品」。它基于 OpenAI 的技术,给用户提供预测,如相关度最高的笔记、推荐的标签等。

  Mem.ai

  Speak 是一个英语学习 app,目前在韩国有 10 万付费用户。它最大的特点是 AI 助理可以基于对话内容,提供实时的反馈,包括发音、语法、词汇等。

  Speak app

  另外,市场上还有一批垂直领域的明星初创,虽然没有获得 OpenAI 的投资,但也是基于 OpenAI 的 API 开发,并在各自垂直领域崭露头角。

  最有名的是 Jasper 这个公司,仅成立 2 年,但在 2022 年就做到了 9000 万美金 ARR,目前估值 15 亿美金。Jasper 主打营销类文案的生成,官方内置了大量的模板,如邮件营销、社媒软文、电商商品介绍、博客,自媒体或企业营销团队可以基于它快速生成大量内容,由于基于海量的营销类数据进行训练,结合 OpenAI GPT-3 的能力进行微调,整体的效果优于人工,带来的人效提升也非常明显,企业也自然愿意持续付费。

  Jasper.ai

  不过 ChatGPT 发布后,它的很多官方案例和 Jasper 接近,也有不少用户甚至切换到 ChatGPT 上,给 Jasper 带来了不小的压力。经过和 OpenAI CEO 的紧急磋商,Jasper 也拿到了 OpenAI 的承诺,ChatGPT 一方面未来会收费,另一方面也不会直接和 Jasper 这类平台上的服务商直接竞争。

  另外一些笔记类产品如 Craft、Lex 也都使用了 OpenAI 的 GPT-3 服务,提供头脑风暴、内容生成、内容续写等服务。也有像 Tome 这样的产品,结合了 GPT-3 和 DALL·E 用来生成幻灯片的内容及图片。

  OpenAI 和微软

  前面提到,微软通过给 OpenAI 投资,以及提供 Azure 云做模型训练,实现了与 OpenAI 的深度绑定,拿到了一系列的商业化授权。

  在之前微软的发布会上,它就公开提到 Bing 搜索引擎会提供 DALL·E 2 图片生成的结果,并且也会把这一技术应用到即将推出的新产品 Microsoft Designer 中。

  Bing 搜索图片

  Microsoft Designer

  在 ChatGPT 爆火后,也开始有媒体报道,微软正在进一步尝试将 ChatGPT 与 Bing 搜索、Outlook、Office 等产品进一步结合,这无疑将对 Google 形成正面冲击。不过以微软的特色,市场部门一向领先产品部门半年到一年“对外发布产品”,要等到产品面世还需要较长的时间。

  后续预测

  伴随着 ChatGPT 的发布,OpenAI 近期的发展无疑走上了快车道,据报道它在 2023 年的收入预计可达 2 亿美金,2024 则是 10 亿美金,而公司估值也达到了 290 亿。

  在 2023 年,AIGC 无疑将进一步加速发展,在 OpenAI 平台上势必会长出更多的 Jasper,从而进一步助推 OpenAI 的发展。

  以下是本人的一些预测,今年年底可以再过来看看有哪些应验了:

  微软将进一步加大对 OpenAI 的投资,甚至实现绝对控制

  Google 会推出产品,应对 ChatGPT 的挑战

  今年推出的 GPT-4 将进一步突破大众想象,ChatGPT 也会进一步融合 DALL·E 2 和 WebGPT 的能力,并以收费 API 的方式对外

  市场上涌现出 10+ 基于 OpenAI 平台生态的独角兽

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论