在前段时间,ChatGPT风靡全球,凭借着其拟人化的写作能力,获得了大量关注,也正是其拟人化的写作能力,使得全球不少企业选择用AI来代替员工进行写作,使得不少文案方面的工作人员失业。
每次小编一看到国外相关行业进行裁员,小编心里就会一紧,都在私下悄悄关注科技美学最帅的男主播,看看他对于AI的看法,心里想着怎么才能打败AI。(甚至想捂住男主播双眼,不让他看!)
在今日,小编决定用魔法打败魔法,用国产AI聊天机器人来挑战ChatGPT,目前来看性能虽然不如ChatGPT,但这是中文写作比拼,国产AI在中文写作方面的能力应该不会差吧。
正巧这几天各厂商的AI产品获得了国家的许可,正在逐步的面市,我们就挑选了三款国产的AI来看一看,到底现在国产AI的输出的内容能否达到拿来就可用的标准?
我们此次选择的三款国产的AI,也是目前热度稍高的三款,分别为很早就开始公测的百度“文心一言”和最近公开的科大讯飞“讯飞星火”、阿里云“通义千问”,我们接下来测试结果顺序也是按照这个顺序进行公布。
(如若各位小伙伴还有其他的关注的国产AI产品,可以评论区告诉我们。)
信息查询
小编会向三款AI产品提出相同的问题,但是考虑到各家的大模型可能没有最新的消息,于是小编选择提出的问题是“华为Mate 40系列手机怎么样?”,来看看各家AI产品给出的结果。
(文心一言)
(讯飞星火)
(通义千问)
通过对比可以看到,基于百度搜索的文心一言是表现最好的,语句流畅、信息较为准确,内容也非常丰富。相比来看,通义千问比较简洁,同样有着不错的信息量,讯飞星火表现较差,基本没什么信息点。
但是小编注意到,三款AI产品均没能很好的识别提问中“系列”的意思,只是对其中一款产品进行了介绍。
文章扩写
我们将上述通义千问所给出的华为Mate 40手机的优点输入,要求三家厂商AI扩写成一篇800字的文章,我们再来看看表现。
(文心一言)
(讯飞星火)
(通义千问)
可以看到差别还是比较明显的,面对相同的扩写要求,文心一言和讯飞星火都有着不错的表现,两篇文章首先字数达到了要求,其中讯飞星火的表现要更好一些,整体文章的写法不生硬。
对比来看,通义千问表现稍差,很明显的字数并不够,整体写法也稍微生硬一些。
文章撰写
这个项目可以说是对AI能力的综合体现,作为一个文字类AI,收集信息并输出文章可以说是目前应用场景最广的一项功能。
(文心一言)
(讯飞星火)
(通义千问)
可以看到,三家均输出了符合字数标准的文章,文心一言的写作更像是信息的堆叠,但信息是非常全面的;讯飞星火方面对于信息的获取目前来看是不尽如人意的,在无法得知准确时间消息的时候甚至用“X”进行了替代;这次通义千问表现相对较好,输出了不少“主观”的评价,但相应的信息量也相对偏少。
通过上述简单的测试,我们可以看出,虽然三款AI产品是能够按照要求输出内容的,但是内容的写法以及信息的准确性仍有不少问题,有想要使用这些AI产品的小伙伴需要在使用前仔细的检查,但这反而会增加工作量与工作时长。