0°

ChatGPT上线一年:被AI“重塑”的世界

  当你输入一个想法,一个问题,它能够理解,给出回答,它通常会谈及它所了解到的信息,或者告诉你应该去哪些地方寻求帮助。你利用这些信息集思广益,结合自己的经验来重塑想法、完善观点,新的idea就此诞生……

  它是谁?

  它是ChatGPT。

  OpenAI推出GPT-4.0

  ChatGPT的前世今生

  1950年,“人工智能之父”艾伦·图灵首次提出机器具备思维的可能性,他提出了一个被称为“图灵测试”的概念。将人工智能给出了一个完全可操作的定义:如果一台机器输出的内容和人类大脑别无二致的话,那么我们就没有理由坚持认为这台机器不是在“思考”。

  计算机科学之父、人工智能之父:艾伦·图灵

  图灵测试,也就是图灵所说的“模仿游戏”的操作很简单:一位询问者将自己的问题写下来,发给处于另外一个房间之中的一个人和一台机器,然后根据他们给出的答案确定哪个是真人——如果无法判断或混淆了被考察的机器和人,则可认为被测试的机器具有某种程度的智慧 从此,通过图灵测试成为了人类在AI领域为之奋斗的里程碑目标。

  图灵测试

  70年后的今天,在AI历经了数十年的不断进化、迭代后,ChatGPT的诞生,成为了人类距离这个里程碑最近的一次。

  2022 年 11 月 30 日,OpenAI通过GPT-3.5系列大型语音模型微调而成的全新对话式AI模型ChatGPT正式发布。尽管当时ChatGPT的界面看起来简单,甚至有时受到可靠性问题的困扰,但在上线短短5天就吸引了百万用户,两个月后用户数量飙升至1亿。

  每次更新中,ChatGPT 也在不断进化。第一次更新,提升了总体性能,增加了保存和查看历史对话记录的新功能。第二次更新,改善了回答的真实性,增加了“停止生成”新功能。之后,OpenAI还发布限于部分用户使用的付费版ChatGPT Professional。2023 年1月,ChatGPT第三次更新,在此提升了答案真实性的同时,还提升了数学能力。

  2023年的一次重大更新,OpenAI震撼推出了大型多模态模型GPT-4,不仅能够阅读文字,还能识别图像,并生成文本结果,提升了模型的复杂性、性能和功能。这意味着它在理解和生成语言方面更加复杂和先进,更多的参数通常意味着更好的理解能力和更流畅、准确的文本生成。在处理复杂的查询和多步骤问题上更为灵活和有效,能够更好地处理模糊或复杂的指令。

  ChatGPT发展路径

  技术本质:大型语言模型的应用

  Transformer、InstructGPT、AIGC、自监督学习、位置编码……

  ChatGPT横空出世后,伴随而来的是大量AI概念,各种术语让人眼花缭乱,但ChatGPT背后的技术本质,其实是大型语言模型(LLM)的应用。

  大型语言模型是由十亿或更多的参数的神经网络组成的语言模型,使用无/半监督学习对大量样本进行训练。目前,大型语言模型已经改变了许多领域,包括自然语言处理、计算机视觉等。作为一个通用的语言模型,其用途广泛,而非针对一项特定任务(例如情感分析、命名实体识别或数学推理)进行训练。

  大模型的出现是否对科学研究领域是否带来了冲击?对此,重庆大学微电子与通信工程学院的张磊教授向记者表示:“我的研究方向是做开放环境的视觉感知的一系列任务,我关心的问题是怎么让视觉模型在开放环境的感知的时候具备比较强的鲁棒性、泛化性。大模型来了之后,这个问题可能会变得更加复杂。大模型它的特点是两大要素,模型大、数据大,天然具备开放环境的优势,它会帮助我们更好解决开放环境上的任务,但同时也会带来更大的挑战。因为我本身是做适配、做泛化、做迁移的,接下来就是以大模型为基础,利用预训练的大模型去做一些下游的任务的适配。所以大模型对我来说是一种帮助,我个人是非常拥抱大模型的。”

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论