2022年12月,人工智能聊天机器人ChatGPT刷爆网络,网友们争先恐后去领略它的超高情商和巨大威力。参加高考、修改代码、构思小说……它在广大网友的“鞭策”下不断突破自我,甚至可以用一整段程序,为你拼接出一只小狗。那么,ChatGPT是如何炼成的?是否意味着AI已具有人类智能呢?
chatGPT的程序小狗
图源:澎湃新闻
ChatGPT是啥?
一个超神级别的自然语言生成式AI。
ChatGPT是人工智能公司OpenAI的GPT自然语言生成式模型的最新衍生品,可以进行“你来我往”的多轮聊天。
ChatGPT被业内认为是,继2020年NLP(自然语言处理)预训练模型——GPT-3之后的“GPT-3.5”。尽管不是传闻中下一代自然语言生成模型GPT-4,但同样对NLP以及人工智能领域有重要意义。
ChatGPT被网友认为可代替谷歌搜索引擎
图源:ins
一款AI,能有多神呢?
ChatGPT是GPT(或生成式预训练转换器)文本生成AI系列的最新发展,根据从互联网上获取的大量文本样本来进行训练。
一经发布,ChatGPT便在网友的疯狂“检测”和“调戏”中表现出各种惊人的能力。OpenAI首席执行官山姆·奥特曼(Sam Altman)表示,自11月30日至12月5日,ChatGPT的用户数量已突破100万,需求大于预期。
在广大网友的不懈努力下,ChatGPT短短几天之内——
参加了美国高校的入学资格考试(SAT),成绩为中等学生水平;
用《坎特伯雷故事集》风格改写了90年代热门歌曲《Baby Got Back》;
用《老友记》主角口吻创作了剧本对白;
构思了简短的侦探小说;
简要阐释了经济学理论;
给出了消除经济不平等的六点计划;
与人类进行“心理战”,猜想人类实际上想让计算机做什么;
规划了如何毁灭世界;
生成关键词指导AI作画;
扮演OpenAI,在系统内构建了ChatGPT套娃,相当于“我”生了一个“我”……
ChatGPT的网络界面
图源:OpenAI
ChatGPT是怎么炼成的?
要想了解ChatGPT,我们首先了解一下GPT。
Generative Pre-trained Transformer是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。
2018年,GPT-1诞生,这一年也是 NLP的预训练模型元年。
它可以:
·自然语言推理:判断两个句子的关系;
·问答与常识推理:输入文章及若干答案,输出答案的准确率;
·语义相似度识别:判断两个句子语义是否相关;
·分类:判断输入文本是指定的哪个类别。
发展到GPT-3,系统的聊天能力已经无限接近于人类,甚至有超越之势。
而相对于GPT3通过海量学习数据进行训练,ChatGPT又有进步。
它被加入道德原则。
按照预先设计的道德准则,ChatGPT会对不合理或无法回答的提问和请求“说不”。敢于质疑、主动承认错误,这样的“性格”可以不断提升AI本身对用户意图的理解以及结果的准确性。当然,尽管OpenAI非常小心,这种准则也可能被聪明的提问方式绕开。
ChatGPT 指出问题错误
图源:澎湃新闻
它学会了从“人类反馈中强化学习”,即Reinforcement Learning from Human Feedback(RLHF)。
ChatGPT 使用“预训练-微调”的工作范式训练了一个初始模型:人类AI训练员提供对话,他们在对话中扮演双方——用户和AI助手,AI训练员可以访问模型编写的对话回复,并帮助AI调整回复内容。
ChatGPT训练方法
图源:OpenAI
被“调教”后的ChatGPT能够识别恶意信息,识别后拒绝给出有效回答,或记住用户之前所向它提问的内容,以各种方式组合语境想法,变成一个灵感生成器。
对于AI发展来说,创建一个迭代反馈的闭环至关重要。
除了RLHF,该研究还使用了近端策略优化算法(PPO)微调模型,对整个学习过程进行了数次迭代。上线后,ChatGPT将大量客户的反馈互动用于AI 的学习,将其变成推动AI进步的关键一环。
ChatGPT鼓励用户多交流互动以帮助其改进模型
图源:ins
AI是否已具有人类智能?
讨论AI是否已具有真正的“智能”是人类的游戏。
图灵测试(The Turing test)如今已然成为人工智能领域研究的核心目标之一。它由艾伦·麦席森·图灵提出,被公认为是人工智能学科兴起的标志。图灵测试将“思想能力”人为定义在功能和实用的范畴,为“智能”设定了条件。
图灵测试究竟是什么意思?简单来说,就是把机器关到小黑屋中,让它和人类聊天对话,然后分辨小黑屋里回答问题的究竟是机器还是人类。如果无法辨别,就说明了机器具有和人一样等级的智能,通过测试。
而迄今为止,还没有AI模型能真正通过图灵测试。
提及GPT-4会有怎样的优化,ChatGPT给出了以下答案:
ChatGPT:
GPT-4是一个大型语言模型,是目前人工智能领域最先进的技术之一。它能够在大量训练数据的基础上,模拟人类的语言表达能力,并以相似的语言来回答问题。目前,GPT-4还在不断优化,可能会有以下一些方面的改进:
GPT-4可能会增加更多的训练数据,以提高它的知识面和准确度。
GPT-4可能会增加更复杂的算法,以提高它的性能和处理能力。
GPT-4可能会增加更多的功能,例如语音合成、图像识别等,以提高它的应用能力。
GPT-4可能会增加更多的输入输出接口,例如聊天机器人、问答系统等,以提高它的使用方便性。
江湖传言:GPT-4已通过了图灵测试。
未来,AI是否可以真正具有人类智能?众说纷纭。也许奇点已然临近,也许依旧仅为空中楼阁。但不可否认的是,ChatGPT必将引领一场人工智能领域的先锋革命。