最近,由海外科技公司OpenAI研发的AI聊天机器人ChatGPT爆火“出圈”,国内不少用户也在期待着“中国版ChatGPT”的到来。就在刚刚,百度推出了“同款”AI机器人——“文心一言”。尽管还没有正式向公众开放,但就发布会现场的情况来看,作为国内第一款“类ChatGPT”产品,“文心一言”无论是问答水平还是创作能力,都还不能让人满意。
资本市场的反应也印证了这一点。就在发布会开始半小时后,港股百度集团股价跌幅从2%扩大到接近10%,报120.5港元。不少投资者直言“失望”、“确实有差距”。
“《三体》的作者是哪里人?”、“可以总结一下三体的核心内容吗?”、“于和伟和张鲁一谁更高?”……在展示“文心一言”对话问答、总结分析的能力时,百度CEO李彦宏向它抛出了这样几个几乎不存在技术难度的问题。然而,这些问题普通用户早在五、六年前通过“百度一下”网站检索也能轻易得到答案,“文心一言”所谓的“跨越式进步”体现在哪里?
再者,与ChatGPT能根据一个关键词、一组数据流畅生成高水平学术长文、分析报告的表现相比,“文心一言”在被提问“《三体》如何从哲学的角度续写?”时,仅仅笼统地给出了五个续写的方向,并未直接完成续写;其在被要求撰写一篇公司成立的600字新闻稿时,给出的内容文风一板一眼,严谨有余却少了可读性。
其他比如用二元一次方程解答“鸡兔同笼”的问题,用“洛阳纸贵”四个字创作藏头诗——有网友评价,实在显得有些“小儿科”:早在五六年甚至更早以前,就有网友自己编写代码制作出了输入词语自动生成藏头诗的工具,能力丝毫不比今天的“文心一言”差。
在记者看来,现阶段的“文心一言”与其说是一个AI工具,不如说更像是“百度一下”搜索引擎的变形,它固然有不错的内容检索、总结归纳能力,但创作水平实在不敢恭维。
那么,问题到底出在哪里?事实上,对比ChatGPT背靠的GPT-3.5训练模型,两者的参数模型规模基本持平,甚至“文心一言”在中文数据的积累上还更胜一筹。只不过,有专家指出,参数规模持平,不意味着训练水平和训练效果也持平。无论从知识图谱的搭建,还是训练模型的优化上,国内科技企业与OpenAI都存在着不小的差距。
当然,李彦宏本人也不否认这种差距。他的回应是,内测中“文心一言”并不完美,但市场有需求就要推出来。事实上,截至目前已有超过650家企业宣布接入“文心一言”,帮助百度同步推进内测,不断优化模型。
“比不过是很自然的,国产目前就是从me too到me better不断探索的阶段。像深度学习、自然语言处理的技术,也没法速成。”有专家表示,“有正确的预期,一步步来行了。”