要问近段时间 AI 界最出圈的模型是哪个,十人中得有九个人会投 ChatGPT 一票。很多人形容它是一个真正的「六边形战士」:不仅能拿来聊天、搜索、做翻译,还能写故事、写代码、debug,甚至开发小游戏、参加美国高考…… 有人戏称,从此以后人工智能模型只有两类 —— ChatGPT 和其他。
一方面 ChatGPT 能力过于惊艳深受大众喜欢,另一方面,也是麻烦事不断,遭到不同机构的封禁。
前段时间就有 Stack Overflow 封禁 ChatGPT 的消息满天飞,原因无他,官方表示暂时封禁 ChatGPT 是因为它生成的答案正确率太低,发布由 ChatGPT 创建的答案对网站和查询正确答案的用户来说是非常有害的。
*图片源自网络
这一次风波过去没多久,顶级人工智能会议也开始禁止使用 ChatGPT 和 AI 工具撰写的学术论文。
前几天,国际机器学习会议 ICML 宣布:禁止征稿使用大型语言模型(LLM,如 ChatGPT)生成的论文,除非生成的文本是作为论文实验分析的一部分呈现。
*图片源自网络
根据 ICML 的说法,ChatGPT 等这类语言模型虽然代表了一种未来发展趋势,但随之而来的是一些意想不到的后果以及难以解决的问题。ICML 表示,ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,出了问题谁负责。
还有就是作者身份问题,是谁「写」的论文:机器还是人类?考虑到 ICML 仅禁止 AI 完全生成的文本,这一点尤为重要。会议组织者表示,他们并不禁止使用 ChatGPT 等工具编辑或润色作者撰写的文本,并指出许多作者已经使用语法校正软件 Grammarly 等半自动编辑工具来润色文章。
不过此消息一出,在社交媒体上还是引发了一次大讨论,微软研究院 ML 基础团队的负责人 Sebastian Bubeck 则称该规则是目光短浅,并在推特上写道:ChatGPT 及其变体是未来技术发展的一部分。禁止绝对不是最优的答案。
*图片源自网络
一直以来,人们对人工智能生成文本的有害影响都有不同的担忧。我们难以区分文本是由 AI「润色编辑」的,还是完全由 AI 生成的。这个问题对于论文来说就非常严重,如果作者用 AI 模型基于论文生成简洁的摘要,这算是编辑文本还是从头生成文本?
比如说,在22年12月初,美国南卡罗来纳州有一位哲学教授——Darren Hick,在12月初给他的班级布置了一篇五百字的论文。题目是:聚焦十八世纪的著名哲学家DavidHume以及他所提出的恐怖悖论假说:人们往往会从他们害怕的事物当中获得愉悦。
*图片源自网络
后来Hick发现自己的学生在提交的作业中,有明显的来自人工智能编写的痕迹!因为作业里多用的是写作论文模版、也没有知识内化、更没有个人文风、后文没有逻辑。总之就是,整合流畅但没有灵魂!
可怕的是,Hick在尝试破案中发现,这套程序永远会给出不一样的回答,它精准模拟了人在写作时的状态。12月底《华尔街日报》的一名记者亲自验证了ChatGPT的“代写”和“作弊”功能, 她全程使用ChatGPT ,竟然成功通过了AP英语考试。
*图片源自网络
几乎同一时间,ChatGPT也遭到学校的封禁。由于担心 AI 工具会破坏教育,纽约市教育部已经在其网络和设备上阻止对 ChatGPT 的访问。
该部门的发言人 Jenna Lyle 表示:此条禁令主要是担心 ChatGPT 对学生的学习产生潜在负面影响,以及对 ChatGPT 生成内容的安全性和准确性有所担忧。虽然该工具可以提供快速简单的答案,但它无法培养批判性思维和解决问题的能力,而这对于学生的学业和终身成功至关重要。
除此以外,ChatGPT 也存在其他语言模型所存在的问题。因为其训练数据来自互联网,所以它经常在答案中重复和放大性别歧视和种族偏见等。这类语言模型还倾向于编造信息,从历史日期到科学规律,但别人一般发现不了它在胡编乱造。