0°

疯狂出圈的ChatGPT,大的还没来

  每天一篇全球人文与地理

  微信公众号:地球知识局

  NO.2405-疯狂出圈的ChatGPT

  作者:Ziiiying

  校稿:辜汉膺 / 编辑:金枪鱼

  ChatGPT,一时间火爆全网的新晋“网红”,正被议论的纷纷扬扬。能与人类“对答如流”,会写策划方案和调研报告,写诗翻译不在话下,甚至能通过谷歌L3程序员面试。

  ChatGPT上线仅2个月,活跃用户就“狂飙”破亿。

  上一个下载神话是由我们都熟悉的抖音创造的

  尽管如此,依然耗时9个月 ▼

  ChatGPT有多智能?

  前不久,ChatGPT参加了谷歌招聘的编程面试,主要问题是技术,比如图/树,数组/字符串,动态规划,递归等等复杂算法。而根据它的回答表现,谷歌确定可以将它聘为L3工程师。虽然L3只是谷歌工程团队的最入门的职级,但依然可以秒杀一众码农,网站显示,谷歌L3程序员的年薪为18万美元。

  只要再开发一个AI训练它给自己优化编程

  那么chatgpt实现自我迭代也是早晚的事

  (图:壹图网)▼

  除了替代人类码农,ChatGPT能完成的任务不限于:给科学论文当共同作者、给以色列总统讲话写稿子、顺利通过美国医生职业考试;留学生用它来写文书、员工用它写邮件、编剧用它写剧本、备考公务员的求职者用它写申论,甚至只要你要求到位,它还可以帮你发布一段小红书……

  chatgpt在写论文上的优秀表现已经引起学术圈的警惕

  nature在期刊上发表多篇文章,倡议审慎地对待它

  (图:nature)▼

  网上流传着一个段子,有人说AI最可怕的地方在于,“你给它资料,它真学”。作为一款拥有卓越学习能力的聊天软件,ChatGPT表现出极强的“求知欲”。

  下面为一名记者与ChatGPT的对话实例——

  记者测试发现,“聪明的”ChatGPT也会给出错误答案,只是,当用户指出错误时,它会主动提出“请告诉我如何改进”的要求,并进行多次尝试。

  与传统的AI相比,它的优势在于能够根据实际情况给出真实性的指导,而不是简单的一问一答式,并且会根据用户反馈持续化更新与学习。提出的问题越详细,回答的结果越真实精细化。

  这种强大到可怕的能力,让处境不同、身份不同的人们喜忧参半。

  虽然它有说瞎话的毛病,但是认错的态度总算是积极

  (图:与chatgpt聊天)▼

  一方面,很多人庆幸自己从工作生活中解放了出来:调查显示,89%的美国大学生承认使用ChatGPT做家庭作业,53%的学生用它写论文,48%的学生使用ChatGPT完成测试。美国密歇根大学一名学生前不久使用ChatGPT生成的哲学课小论文“惊艳”了教授,得到了全班最高分。

  另一方面,许多人担忧它是否会取代自己的饭碗。ChatGPT可以根据人类提出的需求即时生成业务代码,几秒内完成一段漂亮的销售文案,给不少基层打工者带来了压力。就连各大科技巨头也为自己可能受到威胁的业务而着急上火。

  看这改稿能力,和一些专业的改稿程序可以媲美了

  (图:nature)▼

  前不久,苹果公司召开内部员工的紧急会议,以应对ChatGPT的挑战。

  谷歌公司CEO桑达尔・皮查伊周一在内部备忘录中告诉员工,需要尽快推出产品来抗衡最近爆红的ChatGPT,公司将要求所有人都来测试其新推出的对标ChatGPT的语音机器人“巴德”(Bard),员工们甚至拿出在内部进行黑客马拉松的精神来测试它。

  这不像是商业市场中试图与之分庭抗礼的姿态

  更像是被打了措手不及之后的赶鸭子上架

  “骇客松”(图:壹图网)▼

  除此之外,谷歌创始人谢尔盖・布林已经开始亲自下场写代码,自他2019年离开谷歌一线以来,这还是第一次,这显示出谷歌领导层对ChatGPT的巨大危机感。

  世界首富、曾经的ChatGPT合伙人、新任推特老板马斯克这样评价道:“ChatGPT好的吓人,我们离强大到危险的人工智能不远了。”

  近期,微软创始人比尔·盖茨将ChatGPT融嵌入自家各线产品,使公司市值一夜飙高5400多亿。他在接受采访时也说道:“ChatGPT的意义,不亚于PC和互联网诞生。”

  搭载了chatgpt技术的微软新搜索引擎new bing

  真的能像它名字一样牛逼吗?(来源:bing)▼

  ChatGPT的迭代之路

  首先,让我们来了解一下ChatGPT的前世今生。ChatGPT是OpenAI在2022年11月30日推出的可以用对话方式进行交互的智能机器人。它的诞生经历了GPT→GPT1→GPT2→GPT3→ InstructGPTChatGPT的迭代过程。

  GPT的全称,是Generative Pre-Trained Transformer(生成式预训练Transfomer模型)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。

  Transformer模型框架和GPT优化后的模型对比 ▼

  2018年,GPT-1诞生,该模型可以用于一些简单的自然语言处理任务中,比如句子关系判断,语义相似度识别,文本分类,但它对训练样本之外的新鲜数据适应能力低,只能算得上一个语言理解工具,而非对话式AI。

  GPT模型的核心主张1-预训练(pre-training)

  先填鸭式自学、再针对性辅导

  (图:REEBUF)▼

  2019年,GPT-2问世,模型使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,在生成任务的性能方面展现出了普适而强大的能力,可以聊天、阅读摘要、新编或续写故事,还能编造假新闻、生成钓鱼邮件,就连在网上进行角色扮演也不在话下。

  这个阶段则是去掉了监督微调阶段

  试图解决zero-shot问题,数据集也是跨越式地增长

  (来源:《Language Models are Unsupervised Multitask Learners》)▼

  而后,GPT-3出现了,作为一个自监督模型(在人工标注的数据中通过自己监督自己来学习到有用的信息),它可以捕捉所有的历史上下文信息,作为丰富的语料供模型学习,拥有1750亿的参数量,几乎可以完成自然语言处理的绝大部分任务。

  在少量样本学习下的综合表现是理想的

  (来源:《Language Models are Few-Shot Learners》)▼

  例如面向问题的搜索、机器翻译、文章生成和自动问答等等,且模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。

  可能是码农们自己也受够了每天输入一些繁琐的代码

  (来源:nature)▼

  2022年初,OpenAI发布了InstructGPT,通过监督学习(用标记数据集来训练特定任务的算法)+人类反馈中获得的强化学习方法,来提高GPT-3的输出质量。InstructGPT能够更好地遵循用户意图,且能将有害的、不真实的和有偏差的输出最小化。

  现在,我们每个用户都是chatgpt的训练师

  免费的纠错劳动力和数据集

  (来源:Qin-《InstructGPT 浅析》)▼

  当时间来到这一年年末,加强版模型ChatGPT问世了,这个模型沿用了监督学习与强化学习算法,另外在数据训练过程中,通过将模型生成不同结果的优劣进行人工评估,从而将模型进一步优化,再次提高了模型回答的质量。

  由此可见,如此高大上的神器,前期也经过了不断摸索与演化的过程,才以如今的样子呈现在我们面前。强大的技术底座赋予它的能力,主要体现在三个方面:复杂的问题处理能力、广泛的场景应用能力、基于用户反馈的持续化更新与学习能力。

  最终,还是钞能力成就了这一领域的奇迹

  (图:shutterstock)▼

  ChatGPT价值在何方?

  目前,ChatGPT固然存在一些局限,但它给我们带来的革新与潜在的想象空间无疑是巨大的。小到个人与企业,大到人类与社会,它会成为历史上一个值得铭记的里程碑。

  Generative AI风投市场表现充满朝气 ▼

  纵观人类的历史,就是不断寻找最精确信息的过程。

  我们的祖先跨越海洋,攀登高山,冒着疾病的危险去收集最优质的信息,拜访那些充满光明的地方。不论是为了去领略亚历山大图书馆中的智慧,参加高等学府的学习,都需要付出时间和旅程的成本。不论黄页还是大英百科全书,它们提供的价值都是让人类更快地获取信息。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论