GPT-4能力进一步提升,安全性显著增强。Open AI在当地时间2023年3月14日发布了GPT-3.5(ChatGPT 基于 GPT3.5 开发)的升级版 GPT-4,性能全面超越ChatGPT。其具备多模态能力,可以同时支持文本和图像输入。支持的文本输入数量提升至约32000个tokens,对应约2.5万单词。性能方面:
(1)理解/推理/多语言能力增强, 在专业和学术考试中表现突出,全面超越 GPT3.5, 通过了统一律师考试的模拟版本, 分数在考生中排名前 10%。

可以更准确地解决难题,具有更广泛的常识和解决问题的能力。在GPT-3.5时代,ChatGPT的精准度时常被吐槽。GPT-3.5根据从互联网上搜罗的大量文章、网站和社交媒体帖子以及用户与OpenAI雇用的人工雇员的实时英文对话进行训练的,因此在输出结果时,一些错误的源数据,也导致ChatGPT给出的答案看似合理,实际上有很大的漏洞。就以考试来衡量,上一代GPT-3.5在很多专业考试中的成绩都是倒数10%,而GPT-4在已测试的考试中,基本都是高分通过,超越了“人类的水平”。(数据来源:电子发烧友)

(2)理解能力显著增强, 可以实现“看图说话”,甚至能够理解一些幽默的图片笑话。

(3)可靠性相比 GPT3.5 大幅提升 19%。

(4)安全性指标相比 GPT3.5 有显著提升,对不允许和敏感内容的错误反应显著下降。

针对基于GPT-3.5打造的ChatGPT,曾有内测人员通过引导的方式让其表现出攻击性。同时,有很多报道都指出,上一代ChatGPT曾出现辱骂用户、表白用户、诱导用户离婚、监视开发人员等行为。OpenAI花了6个月时间使GPT-4更安全、更具一致性。在内部评估中,与GPT-3.5相比,GPT-4对不允许内容做出回应的可能性降低82%,给出事实性回应的可能性提高40% 。(数据来源:电子发烧友)