深夜炸场！OpenAI ：新模型发布，GPT 时代来了，欲对标苹果生态！

　　距离 ChatGPT 在去年 11 月 30 日低调上线，已经接近一周年。这期间 OpenAI 处在绝对领导地位，推动着全球进入了「大模型时代」，并开启了新一轮的创新创业热潮。OpenAI 的首次 DevDay 开发者日活动，于今日北京时间 11 月 7 日凌晨 02:00 开始，Keynote 主论坛环节由 Sam Altman 主讲并在油管现场直播，配合现场的演示，展示了多款新产品的发布，整整 45 分钟，内容紧凑而真诚。

　　Keynote 亮点摘要：

　　OpenAI 开发者数据：全球超过 200 万开发者在使用 OpenAI 旗下的开发者服务，其中 90% 来自世界 500 强企业，目前 OpenAI 每周活跃用户超过一亿;

　　GPT-4 Turbo：最新发布 GPT-4 Turbo 支持 128K 上下文窗口，Token 的费用相较 GPT-4，低至原定价的 1/3 和 1/2;知识库更新至 2023 年 4 月;API 现在支持图片和文本输入;新版本中的 JSON 模式可以强制 GPT 以纯 JSON 格式响应;

　　集成 DALL-E 3、语音合成等新能力。版权保护功能：承诺为 API 用户与企业客户提供版权保护服务及侵权赔偿服务。

　　OPenAI Dev Day周边

　　Openai Dev Day现场交流会

　　定制化 GPT & GPTs 应用商店：每个人都可以构建自己的 GPT，GPTs 应用商店即将于本月晚些时候正式发布，开发者可上传自己的 GPT 并获得收入。

　　Assistants API ：开发者可以通过 Assistants API 提供的各类工具(检索、代码解释器、Python)、提供沙箱环境构建，高效创建 AI Agents。

　　多模态能力提升：GPT-4 Turbo with Vision、DALL-E 3 和 TextToSpeech 工具现已上线，发布语音合成模型 tts-1、tts-1-hd 和语音转文字模型 Whisper 3。

　　一、

　　GPT-4 Turbo 正式发布，支持 128k 上下文窗口

　　今日发布的 GPT-4 Turbo，最大的改动在于知识库的更新截至 2023 年 4 月，相较于过往版本只收录了 2021 年 9 月前的世界知识，GPT-4 Turbo 拥有了更新的知识库。

　　另外就是 GPT-4 Turbo 支持 128k 上下文窗口，相当于 300 多页文本的内容。Altman 还强调本次优化模型性能后，与 GPT-4 相比还能够极大地压缩 Token 的使用成本。

　　版本价格对比

　　GPT-4 Turbo 还加入了 JSON 模式，这确保模型将使用有效的 JSON 进行响应。新的 API 参数 response_format 使模型能够限制其输出，以生成语法正确的 JSON 对象。JSON 模式对于开发者在函数调用之外，在对话窗口就能完成 API 中生成 JSON。

　　此前网络中一直传言将在本次开发者日上正式发布 GPT-5，最终只见证了 GPT-4 Turbo 的到来。虽然不能消除开发者们对 GPT-5 不能及时发布的遗憾，但是也能感受到 OpenAI 在重大版本发布上的谨慎与克制。

　　二、

　　GPT 商店即将上线：OpenAI 的生态野心

　　科技圈常常将 ChatGPT 出现，类比于苹果发布 iPhone 这类跨时代重大事件。在这次发布会的 GPTs 这部分，就能够感受到 OpenAI 想通过模型技术建立更大生态的雄心壮志。

　　根据 Sam Altman 的解释，GPTs 是针对特定目的进行自定义的 ChatGPT 版本，无需任何写代码的经验，完全靠自然语言的输入，就可以创造出属于自己的 GPTs。现场 OpenAI 提供了自定义 GPT 示例：Canva 和 ZapierAI ，通过非常简单的交互，就可以实现自定义 GPT 的生成。目前部分自定义 GPT 已经支持 ChatGPT Plus 和企业用户试用。

　　除了在主论坛环节详细介绍 GPTs 生态之外，OpenAI 已经在官网上发布了博客文章，详细介绍 GPTs 的特性与设计理念。在官方发布的一段视频，展示了如何使用一个宠物医生 GPT 来解决狗狗日常护理的问题。

　　三、

　　多模态能力，持续推进、全面开花

　　多模态作为当前模型团队重点关注和发展的技术，开发者可以通过文本转语音 API 从文本生成人类质量的语音。

　　开发者可以通过图像 API 将 DALL·E 3直接集成到他们的应用程序和产品中，并将 DALL·E-3 指定为模型。目前 Snap、可口可乐和 Shutterstock 等公司已使用 DALL·E 3 为其客户和活动生成图像和设计的服务。

　　与之前版本的 DALL·E 类似，该 API 包含内置审核功能，可帮助开发人员保护其应用程序免遭滥用。目前提供不同的格式和质量选项，每生成一张图像的起价为 0.04 美元，可以查看 API 中的 DALL·E 3 入门指南。

　　GPT-4 Turbo with vision，开发者可以通过 API 中的 gpt-4-vision-preview 来访问。OpenAI 计划为主要的 GPT-4 Turbo 模型提供视觉支持，价格取决于输入图像的大小，例如像素 1080×1080 的图像需要的成本为 0.00765 美元。

　　另外，其中 OpenAI 本次发布的 TTS 模型(文本转语音)提供可六种预设声音可供选择以及两种模型变体，tts-1 和 tts-1-hd. tts 都针对实时用例进行了优化，并 tts-1-hd 针对质量进行了优化。

　　这次 DevDay 中，Sam Altman 在紧凑的四十五分钟内，介绍了近期的多项重要更新和产品的未来愿景，本身就像是一个精炼了知识的大模型，不断输出高密度信息。

　　这场开发者日的新品发布，是否也让你们感到惊喜呢?