OpenAI 的开发者大会,让 AI 界炸了锅
如果你是一个 AI 爱好者,那么你一定不会错过 OpenAI 的开发者大会,号称科技届的春晚。
在北京时间 11 月 7 日凌晨,OpenAI 的创始人 Sam Altman 和他的团队,用不到一个小时的时间,就向全世界展示了他们的最新杰作:GPT-4 Turbo。
这是一个比 GPT-4 更强大、更快速、更灵活的模型,它不仅能够处理超长的上下文,还能够根据开发者的需求,进行各种控制和定制。
而且,OpenAI 还大幅降低了 API 的价格,让更多的人能够享受到 GPT-4 Turbo 的魅力。
但这还不是全部,OpenAI 还推出了一个让人惊叹的功能:GPT S。
这是一个让你用自然语言就能创建自己的 GPT 的工具,你可以根据自己的知识库和目的,来定制一个专属于你的 AI Agent。
然后,你还可以把你的 GPT 上传到 OpenAI 的应用商店:GPT Store,和其他人分享你的智慧,甚至还能赚钱。
这就像是 OpenAI 给你一个「iPhone」,还给你一个「App Store」,让你随心所欲地创造和使用 AI 应用。
这无疑是一个对 AI 行业的巨大挑战,也是一个对 AI 生态的巨大贡献。
OpenAI 显然不满足于只是「AI 炼丹」,而是要打造一个「AI 世界」。
让我们一起来看看,OpenAI 是如何做到这一切的。
01
开发者大会刚一开始,Sam Altman 就宣布了一个惊喜:GPT-4 Turbo。
这是一个对 GPT-4 的重大升级,它在 ChatGPT 和 API 版本上都同步推出了。
Sam Altman 说,他们一直在听取开发者的反馈,针对他们关心的问题,做了六大改进,分别是:
更长的上下文长度
更强的控制
模型的知识升级
多模态
模型微调定制
更高的速率限制
前四项都是关于新模型性能的提升,后两项则是针对企业开发者的优化。
在性能提升的同时,OpenAI 还大方地降低了 API 的价格,真是一举两得。

GPT 的六大升级
1、上下文长度的提升。
OpenAI 原来提供的最长上下文长度是 32k,而 GPT-4 Turbo 则将上下文长度提升到了 128k,这比竞争对手 Anthropic 的 100k 还要高出很多。
128k 的上下文,相当于 300 页的标准书籍的文字量,这意味着 GPT-4 Turbo 能够处理更复杂和更长的文本,而且还能保持更高的连贯性和准确性。
2、控制的提升。
新模型提供了一个 JSON Mode,让模型能够以特定的 JSON 格式提供回答,这样就方便了 API 的调用。
新模型还支持同时调用多个函数,还引入了 seed parameter,让开发者能够在需要的时候,让模型返回固定的输出。
接下来的几周,新模型还会增加新的功能,让开发者能够看到 log probs。
3、知识库的升级。
ChatGPT 自从诞生以来,已经有一年多了,GPT 的知识库也终于更新到了 2023 年 4 月。
Sam Altman 承诺,他们会继续更新模型的知识库,让它不会落后于时代。
「我们知道,你们对 GPT 的知识停留在 2021 年感到很不爽,我们也是。」Sam Altman 说。

内部知识库升级
除了内部知识库的升级,GPT-4 Turbo 还升级了外部知识库的接入方式,现在可以上传外部的数据库或文件,来给 GPT-4 Turbo 提供更多的外部知识。
4、多模态的提升。
新模型支持了 OpenAI 的视觉模型 DALL·E 3,还支持了新的文本到语音模型,让开发者可以从六种预设的声音中选择自己喜欢的声音。

图片多模态
GPT-4 Turbo 现在可以做到图像生成了,而且还有一个防止滥用的安全系统。
OpenAI 还表示,他们会为所有的客户提供涉及到版权问题的法律费用。
在语音系统方面,OpenAI 表示,他们的语音模型远超市场上的其他产品,并且还开源了语音识别模型 Whisper V3。
除了性能的提升,OpenAI 还针对企业开发者的需求,做了两项改进:
02、模型微调与定制。
8 月份,OpenAI 就发布过 GPT-3.5 Turbo 的微调服务,当时有早期测试显示,经过微调的 GPT-3.5 Turbo 版本在某些任务上甚至可以超过 GPT-4,但是价格比较高。
而现在,Sam 宣布 GPT-3.5 Turbo 16k 的版本也可以进行微调的定制了,而且价格比之前更低。
GPT-4 的微调定制也在申请中了。
同时,OpenAI 还开始接受单个企业的模型定制了。
「你可以修改模型训练过程的每一步,进行额外的特定领域的预训练,针对特定领域的后训练等等。」Sam 说。
不过,他也表示,OpenAI 没有能力做很多这样的模型定制,而且价格也不会便宜。
03、更高的速率限制。
GPT-4 的用户,发布会后就可以享受到每分钟的速率限制翻倍的好处。
在本次发布会中,OpenAI 还推出一个重磅发布:让不懂代码的人也能轻松定义一个 GPT。
Sam Altman 为此进行了现场展示。
「在 YC 工作过很多年,我总是遇到开发者向我咨询商业意见。」Sam Altman 讲到,「我一直想,如果有一天有个机器人能帮我回答这些问题就好了。」
接着,Sam Altman 打开了 GPT Builder,先打上一段对这个 GPT 的定义,类似于帮助初创公司的创始人思考他们的业务创意并获得建议。
接着,在对话中,GPT Builder 自己生成了这个 GPT 的名字、图标,并通过与 Sam 对话的形式,询问 Sam 是否要对对生成的名字和图标等进行调整。

「创业导师 GPT」
接下来,GPT Builder 主动向他询问这个应用该如何与用户交互,Sam 表示可以从我的过往演讲中选择合适且有建设性的回答,然后上传了一段自己过往的演讲。
即使加上讲解,整个应用也在三分钟内就完成了。访问这个 GPT 的人,会收到 GPT 自动生成的对话开头,可以与这个 GPT 对话咨询创业相关的内容,而得到的,将是一个类似于 Sam Altman 本人的回答。
Sam 表示,创建者还可以进一步为 GPT 增加 action(动作)。
创建一个这样的 GPT,本质上,用户能够定制的功能其实并不多:
指令(预设的 prompt),外设的知识库和动作。
但是,能把三者丝滑地结合起来,让一个不懂代码的人也能更简单地创建应用,确实是此次 Open AI 的创举。
GPT 发布后,应用可以选择私有,专属企业拥有和公开所有三种方式。而 Open AI 表示,将为受欢迎的应用提供利润分享。

很明显,OpenAI 在这里的发布,并没有希望普通用户能够通过自然语言创建出多么复杂的应用,其中的想象空间,更重要的在于个人和企业能够将自己的知识库上传到 OpenAI,一键构建专属应用。
比如作为一个拥有货运价格表的代理,可以将文件上传到 OpenAI 后,一键部署出自己的询价助理,这样简洁丝滑的应用部署,在之前还并不存在。
而如果发布最终能够得到用户认可的话,类似的应用也将能够填充 OpenAI 的应用商店,使其成为各种信息的宝库。
OpenAI 的技术进步是令人兴奋的,而团队所采用的商业策略,又有着超出一般创业公司的成熟——我们目睹着一个行业的潮气,也可能正在见证一个巨头的诞生。