就在前些时间,ChatGPT迎来了重磅升级,支持图片和语音输入。那么在这次更新中,我们可以看到哪些进步?终极AGI,又距离我们多遥远呢?
引言
赶在国庆长假前ChatGPT迎来了重磅升级,用户可以通过语音或图片的方式和ChatGPT进行交流;OpenAI CEO奥特曼在校友分享会上,轻描淡写的一句话给大多数GPT创业项目画上了“句号”;强化学习之父萨顿联手传奇程序员卡马克All in AGI了,终极AGI离我们还有多远呢?
一、GPT更新了什么?
1. 会听——和ChatGPT语音对话
用户通过语音的方式和ChatGPT进行多轮对话,官网给出的栗子是让ChatGPT讲一个睡前故事,并且支持切换不同语音包。目前听起来还是蛮自然的,至少“机器音”并不明显。
2. 会看——给ChatGPT发图聊天
ChatGPT可以理解用户发的图片内容了,官网给出的栗子是用户拍了一张自行车的照片,希望GPT给出调低座位高度的方案。
当然,也可以把自己冰箱里仅剩的食材发给GPT,让GPT给你输出菜谱或用餐计划;或者发一张图表让ChatGPT进行数据分析。
二、OpenAI CEO 奥特曼说了什么?
那么,现在的ChatGPT 能听语音、会看图了,这对我们来说意味着什么呢?看看OpenAI CEO 奥特曼是怎么说的
OpenAI CEO 奥特曼最近在校友会上发表了一些看法,更是直接“提醒”了不少创业公司:别花太多精力在UI界面上(也就是咱们常说的套壳)。当然,除此之外,奥特曼还给出了不少干货,简单整理如下:
1. 为啥取名叫ChatGPT?
就是特意取了个ChatGPT这样的名字,让它看起来就很像机器,避免人类对它产生感情。
2. 套壳GPT的都将灭亡!
目前有不少企业正在“解决”GPT模型的小缺陷,尤其是只在UI界面上做优化的,这是肯定行不通的。因为OpenAI已经着手解决了大部分问题,而且不要尝试和OpenAI拼迭代速度。善意提醒:独立的企业必须能提供真正的、独特的价值。
3. 看好AI赋能医学和教育方向
AI诊疗(AI medical advisor):这将会体现出巨大的社会价值。
AI陪练(AI personalized one on one tutor):为用户提供一对一量身定制的辅导。
4. GPT5/6还会给我们带来什么变化?
奥特曼透露,GPT5/6会具备多模态的输出能力,比目前的GPT有更高的可靠性和个性化定制能力。
但是一说到大模型,大多数人第一反应就是贵。那GPT5/6的成本和收费会不会非常恐怖呢?奥特曼表示,摩尔定律在大模型领域依然生效,目前大模型的训练成本越来越低,因此未来调用GPT接口的价格也会更加便宜。
三、讨论:AGI离我们还有多远
1. OpenAI 奥特曼:目前距离AGI还很远
虽然GPT已经给AI领域按下了“加速键”,但是还在还没找到一个产品能让我感觉和真人在聊天。
真正的AGI是能够“自行推理”,而不是依赖大模型预训练的,它像真实人类那样根据学到的知识,写论文、做实验的AI才能是称得上是AGI。
2. Keen Technologies:2030年实现AGI可行!
近期,强化学习之父萨顿也加入了Keen Technologies,联手传奇程序员卡马克All in AGI。他们两人在阿尔伯塔大学机器智能研究所(Amii)特别活动表示,2030年可以实现AGI的目标。而且,他们相信最终的AGI源代码将会是一个人就能编写的量级,可能只有区区几万行。