0°

AIGC玩出新花样—ChatGPT出圈

  AI可以自动写代码、修bug、甚至写小说、回答问题?近期一系列关于人工智能新应用ChatGPT的上线引发热议,究竟什么是ChatGPT,它发挥着怎样的作用,未来会如何改变我们的生活呢?接下来,让我们一探究竟!

  1 ChatGPT定义及作用?

  1.什么是ChatGPT?

  所谓ChatGPT,就是聊天GPT,以对话的方式交互,用户问问题它来回答,模仿人类说话风格的同时回答问题。通过OpenAI 的新模型生成一些语义答案,利用网页应用形式与用户对话互动,实现简单聊天、信息咨询、撰写诗词作文、修改代码等,同时具有较高质量的回答、高效获取信息的方式以及上瘾式的交互体验的特点。连世界首富马斯克也称“许多人陷入了该死的疯狂ChatGPT循环中”。甚至已经有国内投资人开始寻找ChatGPT背后的OpenAI公司,求购其股份。乍听起来,似乎也没有很新鲜,但情况是ChatGPT 的智能化远远超出了那些它的聊天AI前辈们,甚至有人提出ChatGPT可以取代传统搜索引擎。

  图片来源:知乎。

  ChatGPT偏任务型的多轮对话或问答系统,定位于“通用型AI技术助理”。相比苹果Siri 和小爱同学的“订餐、订票、订宾馆”,ChatGPT更多执行开放域任务,即问答、阅读理解、推理、头脑风暴、写作文、改错等,可以说是“AI版的知乎”。

  2.ChatGPT能做什么?

  ChatGPT上线后,越来越多网友开始尝试利用它解决一些实际问题 。比如可以问它怎么做菜?

  图片来源:知乎。

  虽然是个很简单的问题,但从ChatGPT的回答也能看出类似问题的答案准确性还是比较高的,不光是做菜,导航问题ChatGPT也是手到擒来、也可以让ChatGPT编写软件代码,甚至是撰写商业计划书和行业分析,“几乎”无所不能。

  图片来源:知乎。

  也正是ChatGPT的回答具有一定的准确性,才会让人们引发关于它是否有替代通用搜索引擎Google可能性的遐想。

  当然ChatGPT也有不少显而易见的“漏洞”。

  1)有时ChatGPT会写一些看上去合理但错误且荒谬的答案,这个在体验中较少但会出现。据官网描述,这个问题是难以解决的,因为:①在训练期间,并没有提问者目前所有的事实;②如果让模型过于谨慎,那么他能回答的问题也会拒绝回答;③有观察的训练误导了模型,因为正确的答案来源于模型的数据库而非人类知道什么。

  2)ChatGPT对输入的改变比较敏感。例如,给出一句问题,模型声称无法得知答案,但轻微地改变问题,就能正确地回答。这种特性在体验中表现的比较明显。

  3)ChatGPT有时会非常重复表达,反复使用某些句子,例如:重申自己是OpenAI训练的语言模型。这个问题在我们的体验中也经常出现,根据官网,该问题来自于训练数据的偏差,以及过度拟合问题。

  4)在理想情况下,当用户问题模糊时,模型应该会提问将问题清晰化。但目前的模型经常不去追问问题,直接猜想用户可能问的方向。

  除了官网提到的局限性外,根据实际体验,ChatGPT即使在输入的明确要求下,也难以在表达中使用数据支持,这可能是因为ChatGPT所使用的语言数据集并不包含太多关于数据的内容。

  针对外界认为ChatGPT能否取代搜索引擎的讨论,ChatGPT自己却给出了“否定”回答:ChatGPT并不是搜索引擎。它的目的不是提供信息搜索,相对于搜索引擎通过索引网页并匹配搜索词来提供信息,ChatGPT则是通过对自然语言问题的回答来帮助用户解决问题。因此,它们之间没有直接的竞争关系,并不能相互颠覆。

  2 GPT的发展历程,从GPT-1到GPT-3

  Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。

  2018年,GPT-1诞生,这一年也是NLP(自然语言处理)的预训练模型元年。性能方面,GPT-1有着一定的泛化能力,能够用于和监督任务无关的NLP任务中。其常用任务包括:①自然语言推理:判断两个句子的关系(包含、矛盾、中立);②问答与常识推理:输入文章及若干答案,输出答案的准确率;③语义相似度识别:判断两个句子语义是否相关;④分类:判断输入文本是指定的哪个类别。虽然GPT-1在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此GPT-1只能算得上一个还算不错的语言理解工具而非对话式AI。

  GPT-2也于2019年如期而至,不过,GPT-2并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,学习目标则使用无监督预训练模型做有监督任务。在性能方面,除了理解能力外,GPT-2在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后,GPT-2的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。

  之后,GPT-3出现了,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器(仅52%的正确率,与随机猜测相当),更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是GPT-3影响如此之大的主要原因

  由于GPT-3更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的GPT-2。作为目前最大的密集型神经网络,GPT-3能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说GPT-3似乎已经满足了我们对于语言专家的一切想象。

  3 ChatGPT的未来展望

  ChatGPT作为AIGC的重要应用,其出现对于文字/语音模态的 AIGC 应用具有重要意义,会对AI产业上下游产生重大影响。

  AIGC即利用人工智能技术来生成内容。与此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能构思内容的AIGC,是新一轮内容生产方式变革,而且AIGC内容在Web3.0时代也将出现指数级增长。

  从下游相关受益应用来看,包括但不限于无代码编程、小说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器翻译、芯片设计等。从上游增加需求来看,包括算力芯片、数据标注、自然语言处理(NLP)等。

  随着算法技术和算力技术的不断进步,ChatGPT也会进一步走向更先进功能更强的版本,在越来越多的领域进行应用,为人类生成更多更美好的对话和内容。

  风险提示:本文相关观点不代表任何投资建议或承诺。东海基金管理有限责任公司(以下简称“本公司”)或本公司相关机构、雇员或代理人不对任何人使用此全部或部分内容的行为或由此而引致的任何损失承担任何责任。未经本公司事先许可,任何人不得将此内容或其任何部分以任何形式进行派发、复制、转载或发布,或对本专栏内容进行任何有悖原意的删节或修改。本公司承诺以诚实信用、勤勉尽责的原则管理和运用基金财产,但不保证基金一定盈利,也不保证最低收益,投资者投资于本公司基金时应认真阅读相关基金合同、招募说明书、基金产品资料概要等文件并选择适合自身风险承受能力的投资品种进行投资。我国基金运作时间较短,不能反映所有发展阶段。相关资料仅供参考,不构成投资建议。基金有风险,投资需谨慎。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论