ChatGPT真实参数只有200亿，首次被微软曝光！网友惊：要开源了？

　　近日，一篇微软的论文泄露了ChatGPT的参数只有200亿，这一消息引起了全球大模型圈的广泛关注。该论文介绍了CODEFUSION，这是业内首个使用扩散模型进行代码生成的研究。CODEFUSION采用编码解码架构，并通过去噪和条件输入Diffusion模型来生成语法正确且多样化的代码。

　　与纯文本生成的diffusion模型相比，CODEFUSION在生成语法正确方面表现更出色。它能够产生更多符合规范要求的代码片段，为开发人员提供了更高效、准确和可靠的工具。此外，在与自动回归模型相比较时，CODEFUSION还能够生成更加多样化、创新性更强的候选代码。

　　然而，这篇论文泄露后也引发了一些阴谋论。有人认为这可能是OpenAI开源计划中一个重要步骤的前奏。“福布斯”杂志早在今年2月份就曾报道过ChatGPT仅拥有200亿参数。因此，在学术界和科技圈内对于是否会将ChatGPT等大规模预训练语言模型开源展开激烈讨论。

　　无可否认，在当今社会中，大规模预训练语言模型的发展已经引起了广泛关注。这些模型在自然语言处理、代码生成等领域具有巨大潜力，并且对于推动人工智能技术的发展起到了重要作用。然而，开源与保密之间存在着一定的平衡问题。

　　开源可以促进科学共享和合作创新，但也可能导致知识产权争议以及商业利益受损。因此，在决定是否将ChatGPT等大规模预训练语言模型开源时，需要充分考虑各种因素，并制定相应的策略和措施。

　　总之，微软论文中ChatGPT参数只有200亿这一消息引起了全球大模型圈的瞩目。CODEFUSION作为首个使用扩散模型进行代码生成研究的项目，在提高代码生成质量和多样性方面取得了显著成果。然而，该论文泄露也引发了关于OpenAI是否会开源ChatGPT等大规模预训练语言模型的阴谋论争议。在未来发展中，我们需要更加谨慎地平衡开源与保密之间的关系，并制定出适合当前环境下科学共享与商业利益保护的策略。