OpenAI 全面发布其 GPT-4 API，并计划2023年7月底之前提供访问权限

　　OpenAI今天宣布通过其API正式发布了最新的文本生成模型GPT-4。

　　从今天下午开始，所有现有的OpenAI API开发者都可以访问GPT-4，前提是他们在过去有成功支付记录。该公司计划在本月底之前向新的开发者开放访问权限，并在此后根据计算资源的可用性逐步提高可用性限制。

　　自3月份以来，数百万开发者已经请求访问GPT-4 API，并且正在不断涌现出利用GPT-4的创新产品。OpenAI在一篇博文中写道：“我们设想未来聊天式模型可以支持任何用例。”

　　相比于其前任GPT-3.5只接受文本输入，GPT-4可以生成文本(包括代码)并接受图像和文本输入。在专业和学术基准测试中，GPT-4表现出“人类水平”的能力。与OpenAI之前的GPT模型一样，GPT-4是使用公开可用的数据(包括来自公共网页的数据)以及OpenAI授权的数据进行训练的。

　　目前，图像理解能力还没有对所有OpenAI客户开放。OpenAI正在与合作伙伴Be My Eyes进行测试。但是，他们没有指示何时将其对更广泛的客户群体开放。

　　值得注意的是，即使是当前最好的生成式人工智能模型，如GPT-4，也并非完美。它可能“产生”虚构事实并在推理时出现错误，有时候还非常自信。它也无法从自身经验中学习，在解决一些困难问题上存在失败，比如在生成代码时引入安全漏洞。

　　OpenAI表示，未来他们将允许开发者使用自己的数据对GPT-4和GPT-3.5 Turbo进行Fine-tuning，就像他们的其他文本生成模型一样。这一功能预计将于今年晚些时候推出。

　　自从今年3月GPT-4发布以来，生成式人工智能领域的竞争越来越激烈。最近，Anthropic将其旗舰文本生成AI模型Claude的上下文窗口从9,000个标记扩展到100,000个标记。上下文窗口是指模型在生成附加文本之前考虑的文本内容，而标记代表原始文本，例如单词“fantastic”将被拆分为“fan”、“tas”和“tic”等标记。

　　GPT-4以其高达32,000个标记的上下文窗口在这方面保持了先前的领先地位。一般来说，上下文窗口较小的模型往往会“忘记”甚至最近的对话内容，导致其偏离主题。

　　在相关的公告中，OpenAI还宣布将其DALL-E 2和Whisper API作为通用可用性发布。DALL-E 2是OpenAI的图像生成模型，“Whisper”是该公司的语音转文本模型。该公司还计划通过停用一些旧版模型来“优化计算资源”。由于ChatGPT的爆炸性受欢迎，OpenAI在过去几个月中难以满足对其生成式模型的需求。

　　从2024年1月4日开始，某些旧版的OpenAI模型(包括GPT-3及其衍生模型)将不再提供，并将被新的“基础GPT-3”模型取代，可以推测这些新模型在计算效率上更高。使用旧模型的开发者需要在2024年1月4日之前手动升级其集成方案，而那些希望继续使用Fine-tuned旧模型的开发者则需要在新的基础GPT-3模型上进行Fine-tune替换。

　　OpenAI写道：“我们将为之前进行Fine-tuning的模型提供支持，以尽可能顺利地完成过渡。”OpenAI还表示：“在接下来的几周内，我们将联系最近使用这些旧模型的开发者，并在新的补全模型准备好进行早期测试时提供更多信息。”

　　结论：OpenAI发布了GPT-4 API，为开发者提供了更强大的文本生成模型。GPT-4相比于前代模型有了多项功能升级，包括接受图像和文本输入以及更高的性能表现。然而，即使是最先进的生成式模型也存在一些不足，如错误推理和安全漏洞。

　　OpenAI计划允许开发者对GPT-4进行Fine-tuning，并计划停用旧版模型以优化计算资源。该公司将提供支持，帮助开发者顺利进行过渡，并将与使用旧模型的开发者联系，提供更多关于新模型早期测试的信息。数字化软件领域的竞争日益激烈，各公司在不断提升模型性能和功能方面展开竞争，为开发者提供更好的工具和体验。