0°

抽丝剥茧!为您揭秘ChatGPT背后的数据库

  OpenAI最近发布的AI驱动的智能聊天机器人ChatGPT在互联网上掀起了一阵风暴,热衷于尝试这一新AI成果的网民不在少数。ChatGPT针对网友广泛的问题提供了非常有针对性的回答,其不可思议的能力成为各大媒体平台的头条新闻,其应用内部的算法模型、应用领域、实现原理也被大家广泛谈论和探索,小编作为数据库从业者,自然也想探秘一番,让我们一起往下看吧。

  狂野的发文

  最初是领英上的一篇发文引起了大家的关注,北美数据库公司DataStax的开发者与Cassandra数据库开发者帕特里克在Linkedin上发文说到,这是一个非常狂野与充满想象力的消息,ChatGPT承认了自己背后使用的数据库是Cassandra!

  简要来说,帕特里克问ChatGPT能否给出一些使用Cassandra进行AI模型训练的例子,这时ChatGPT竟直接回答OpenAI就是使用这一数据库来储存训练数据和模型节点的。为了实现这一目的,OpenAI对于AI开发流程很可能还打造了自己与Cassandra交互使用的一套工具链,命名为Cassio。对于上述信息,回答中还给出了工具链的源码与文档链接,最后还生成了一段代码示例。

  这一回答让人感觉十分真实,不禁让人怀疑是否真的如ChatGPT所说,火爆全网的AI应用背后使用的数据库就是Cassandra呢?小编对于这个问题也是十分感兴趣,所以进行了一番求证,让我们往下看。

  根据网上的资源,也有人尝试对AI领域使用Cassandra相关的问题询问ChatGPT,得到了如下的回复。

  ChatGPT承认Cassandra作为分布式数据库,在实时AI储存中很有竞争力,在企业级应用中也占有大量份额,已被证实为一个实时AI应用的可靠选择。同时支持的多种数据类型,在AI应用中有广泛使用前景。但是,我们需要更加直接的证据来证明Cassandra和ChatGPT的联系!

  灵魂的拷问

  有资源的相关人士,通过正在内测的新必应,尝试问出OpenAI使用Cassandra的真相。新必应内置增强版的ChatGPT,其对于对话内容获取与问题解答的能力相较于公开版更为强大。在这里我们直接拷问新必应OpenAI是否使用了阿帕奇Cassandra数据库。

  新必应的回答先是夸赞了Cassandra一番,随后也没有直接肯定OpenAI使用了Cassandra数据库,但是也提供了一些OpenAI历史上可能应用过这一数据库的证据。同时我们看到,回答中显示有油管视频展示了如何使用GPT-3来操作这一数据库,OpenAI的高级工程师David Greenbery也曾是阿帕奇基金会下Cassandra项目的代码提交者。当然,这一回答并不能满足我们对于OpenAI是否使用了Cassandra的疑问,所以我们更加直接地追问新必应,ChatGPT是否真的使用了Cassandra数据库。

  这一次的回答提供了更多的新信息,但是还是没有直接承认ChatGPT使用Cassandra数据库。但是在夸赞Cassandra的同时,也提供了三个在AI领域具体应用的例子,例如帮助编写数据查询语句与生成相关数据图表等。这一深入的回答不禁让人想到,是否这样的应用已经存在于OpenAI内部,只是没有得到公开承认。

  同时,目前必应的ChatGPT版本尚未是最终发布版本,后续回答是否会改变我们不得而知。在新必应最终发布时,会不会使用Cassandra做业务支撑,始终还是一个未知数。不过我们可以确定的是,在这个AI应用场景下,Cassandra数据库应是不二选择。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论