OpenAI今天宣布通过其API正式发布了最新的文本生成模型GPT-4。
从今天下午开始,所有现有的OpenAI API开发者都可以访问GPT-4,前提是他们在过去有成功支付记录。该公司计划在本月底之前向新的开发者开放访问权限,并在此后根据计算资源的可用性逐步提高可用性限制。
自3月份以来,数百万开发者已经请求访问GPT-4 API,并且正在不断涌现出利用GPT-4的创新产品。OpenAI在一篇博文中写道:“我们设想未来聊天式模型可以支持任何用例。”
相比于其前任GPT-3.5只接受文本输入,GPT-4可以生成文本(包括代码)并接受图像和文本输入。在专业和学术基准测试中,GPT-4表现出“人类水平”的能力。与OpenAI之前的GPT模型一样,GPT-4是使用公开可用的数据(包括来自公共网页的数据)以及OpenAI授权的数据进行训练的。
目前,图像理解能力还没有对所有OpenAI客户开放。OpenAI正在与合作伙伴Be My Eyes进行测试。但是,他们没有指示何时将其对更广泛的客户群体开放。
值得注意的是,即使是当前最好的生成式人工智能模型,如GPT-4,也并非完美。它可能“产生”虚构事实并在推理时出现错误,有时候还非常自信。它也无法从自身经验中学习,在解决一些困难问题上存在失败,比如在生成代码时引入安全漏洞。
OpenAI表示,未来他们将允许开发者使用自己的数据对GPT-4和GPT-3.5 Turbo进行Fine-tuning,就像他们的其他文本生成模型一样。这一功能预计将于今年晚些时候推出。
自从今年3月GPT-4发布以来,生成式人工智能领域的竞争越来越激烈。最近,Anthropic将其旗舰文本生成AI模型Claude的上下文窗口从9,000个标记扩展到100,000个标记。上下文窗口是指模型在生成附加文本之前考虑的文本内容,而标记代表原始文本,例如单词“fantastic”将被拆分为“fan”、“tas”和“tic”等标记。
GPT-4以其高达32,000个标记的上下文窗口在这方面保持了先前的领先地位。一般来说,上下文窗口较小的模型往往会“忘记”甚至最近的对话内容,导致其偏离主题。
在相关的公告中,OpenAI还宣布将其DALL-E 2和Whisper API作为通用可用性发布。DALL-E 2是OpenAI的图像生成模型,“Whisper”是该公司的语音转文本模型。该公司还计划通过停用一些旧版模型来“优化计算资源”。由于ChatGPT的爆炸性受欢迎,OpenAI在过去几个月中难以满足对其生成式模型的需求。
从2024年1月4日开始,某些旧版的OpenAI模型(包括GPT-3及其衍生模型)将不再提供,并将被新的“基础GPT-3”模型取代,可以推测这些新模型在计算效率上更高。使用旧模型的开发者需要在2024年1月4日之前手动升级其集成方案,而那些希望继续使用Fine-tuned旧模型的开发者则需要在新的基础GPT-3模型上进行Fine-tune替换。
OpenAI写道:“我们将为之前进行Fine-tuning的模型提供支持,以尽可能顺利地完成过渡。”OpenAI还表示:“在接下来的几周内,我们将联系最近使用这些旧模型的开发者,并在新的补全模型准备好进行早期测试时提供更多信息。”
结论:OpenAI发布了GPT-4 API,为开发者提供了更强大的文本生成模型。GPT-4相比于前代模型有了多项功能升级,包括接受图像和文本输入以及更高的性能表现。然而,即使是最先进的生成式模型也存在一些不足,如错误推理和安全漏洞。
OpenAI计划允许开发者对GPT-4进行Fine-tuning,并计划停用旧版模型以优化计算资源。该公司将提供支持,帮助开发者顺利进行过渡,并将与使用旧模型的开发者联系,提供更多关于新模型早期测试的信息。数字化软件领域的竞争日益激烈,各公司在不断提升模型性能和功能方面展开竞争,为开发者提供更好的工具和体验。