据 The Verge 报道,字节跳动一直在秘密使用 OpenAI 的技术开发自己的具有竞争性的大语言模型,这违反了 OpenAI 的服务条款。目前,字节跳动的账户已被 OpenAI 暂停。
OpenAI 的服务条款规定,公司所输出的模型不能被用于「开发任何与 OpenAI 竞争的 AI 模型」。字节跳动通过微软购买了 OpenAI 的访问权限,微软也有同样的政策。
根据字节内部文件证实,该公司在几乎每个开发阶段都依赖 OpenAI API 来开发其代号为「Project Seed」的基础大语言模型,包括训练和评估模型。
据界面新闻报道,对此,字节跳动相关负责人回应称,公司在使用 OpenAI 相关服务时,强调要遵守其使用条款。我们也正与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。
字节发布其使用 OpenAI 服务相关情况的介绍:
1、今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在 4 月公司引入 GPT API 调用规范检查后,这种做法已经停止。
2、早在今年 4 月,字节大模型团队已经提出了明确的内部要求,不得将 GPT 模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用 GPT 时遵守服务条款。
3、9 月,公司内部又进行了一轮检查,采取措施进一步保证对 GPT 的 API 调用符合规范要求。例如分批次抽样检测模型训练数据与 GPT 的相似度,避免数据标注人员私自使用 GPT。
4、未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。