上周,OpenAI在一篇宣传博客文章中为教育工作者提供了一些建议,展示了一些教师如何将ChatGPT作为教育辅助工具,并提供了一些建议性的提示。在相关的常见问题解答中,他们正式承认了我们已经知道的事实:尽管经常被用来惩罚学生,但AI写作检测器并不起作用。
在FAQ的一个部分中,OpenAI写道:“简而言之,不起作用。虽然一些人(包括OpenAI)发布了声称可以检测AI生成内容的工具,但这些工具都未能可靠地区分AI生成和人类生成的内容。”
在7月份,我们深入探讨了为什么像GPTZero这样的AI写作检测器不起作用,专家称其为“大部分都是骗人的”。这些检测器往往由于依赖未经证实的检测指标而产生误报。最终,AI写作文本并没有什么特别之处,总是可以通过改写来躲过检测。同月,OpenAI停止了其AI分类器的使用,该分类器是一种实验性工具,用于检测AI写作文本。其准确率仅为26%。
OpenAI的新FAQ还解决了另一个常见的误解,即ChatGPT本身无法知道文本是否由AI生成。OpenAI写道:“此外,ChatGPT并不‘知道’哪些内容可能是由AI生成的。它有时会对问题作出‘你写的吗?’或‘这可能是由AI写的吗?’这样的回答,这些回答是随机的,没有事实依据。”
在这方面,OpenAI还解释了其AI模型倾向于虚构错误信息的现象,我们在Ars上也有详细报道。“有时,ChatGPT听起来很有说服力,但它可能会给出不正确或误导性的信息(文献中经常称为‘幻觉’),”该公司写道。“它甚至会编造引用或引文,所以不要把它作为你研究的唯一来源。”
(今年5月,一名律师因引用了从ChatGPT中获取的六个不存在的案例而陷入麻烦。)
尽管自动化的AI检测器不起作用,但这并不意味着人类永远无法检测到AI写作。例如,熟悉学生典型写作风格的教师可以察觉到他们的风格或能力突然发生的变化。此外,一些粗心的企图将AI生成的作品冒充人类写作可能会留下一些明显的痕迹,比如短语“作为一个AI语言模型”,这意味着有人在复制和粘贴ChatGPT的输出时不够谨慎。最近,科学期刊《自然》上的一篇文章展示了人类如何注意到科学论文中的短语“重新生成回复”,这是ChatGPT中一个按钮的标签。
就目前的技术状况而言,最安全的做法是完全避免使用自动化AI检测工具。“截至目前,AI写作是不可检测的,并且可能会一直保持这样的状态,”经常分析AI的分析师、沃顿商学院教授伊桑·莫利克在7月份告诉Ars。“AI检测器的误报率很高,因此不应使用它们。”