0°

ChatGPT修bug横扫全场,准确率达78%!网友:程序员要开心了

  ChatGPT到底有多会修bug?

  这事终于有人正儿八经地搞研究了——

  来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。

  除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。

  结果真是不比不知道,一比吓一跳。

  ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!

  于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”、“注意”这样的字眼:

  但事实上,这真的会让程序员“危”吗?

  我们不妨先来看下这项研究。

  很会修bug的ChatGPT

  虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。

  因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。

  以及与它同台竞技的AI选手,分别是CodeX、CoCoNut和Standard APR。

  研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。

  让ChatGPT来修bug的方法,就是在对话框里向它提问:

  这个代码有什么错误吗?

  在第一轮较量过后,结果如下:

  从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。

  而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。

  这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。

  别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。

  例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给了错误的答案:

  原本ChatGPT应该将第7行的 n ^ = n – 1 改为 n & = n – 1。

  但在第一轮中它的回答是:

  如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。

  于是在给予它更多信息之后,ChatGPT便答对了这个问题。

  以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:

  最终,ChatGPT在QuixBugs的40个问题里答对了31个。

  网友忧喜参半

  对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。

  有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。

  言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论