人工智能产品的“轰炸”一波接一波,这次轮到阿里巴巴了。
上月就传阿里会推出自己的ChatGPT应用,如今传言成真。小郝拿到了这个“通义千问”的测试码,且看它实力几何。
爱搞事的小郝试了试ChatGPT、New Bing等曾犯过的“经典”错误,对比看看,AI是否改进了“智障”翻车的老毛病。
1、唐太宗和赵匡胤打仗的问题,“通义千问”明确了历史时序,没有像其它平台那样一本正经地胡说八道。
2、数学问题:766乘以1356等于多少,“通义千问”回答也没有问题。
3、在鸡兔同笼、青蛙爬井这样的数学应用题上,“通义千问”并没有比其它人工智能更智能,同样回答错误,这块恐怕还需要语义理解和CoT思维链技术的改进。
4、小郝用夹杂错误的提问,让它解读“乔治巴顿拿着苹果iPhone指挥部队”的情况,它编出了一个故事,显然,“通义千问”把iPhone当作当年摩托罗拉生产的SCR无线电话,放了进去。
5、最后,小郝问了一个土味情话,它显然还看不懂“谐音梗”的意义。看来人工智能还不能在这方面替代人。
整体看,“通义千问”有优于其它文生文AI模型的地方,对可能的错误已经有所改进,有“智能”的进化,但在数学应用题解读、财报数据爬取等方面,还和其它平台一样,有改进的空间。
按小郝几个月的AI经验,最好的Prompt(提问)方式是“3W”模式,即What、Who、Want——情况是什么?要扮演什么角色?想让它做什么?
这三点明确,就能提出好问题,AI也会回答得更精准。
总体来说,“通义千问”是让人与AI交互,又向前推进了一步。
同时,从其二级界面来看,“通义千问”更像Notion AI,包含更细分的小学生作文、提纲、写诗等细分功能,其角色定义应该是一个“AI改进工作效率的工具或助理”。