什么样的AI,能通过自家公司的程序员面试?
刚刚出炉的国产大模型「天工」做到了,黑马,绝对是黑马。
其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露:
对天工模拟过校招算法工程师的第一轮面试,可以很流畅地通过。
△天工回答算法题示例
如果你开始好奇天工是什么,不如请先它来一段自我介绍:
除了在编程语言上经受住面试级别的考验之外,在自然语言上天工还特别修炼过中文。
天工团队投入大量资源攻克了中文语料库的质量瓶颈,从数十万亿的数据中清洗、筛选出了3万亿个单词数据用于训练大模型。
开发团队认为,优质的中文语料库让「天工」作为国产AI,在“更懂中文”这件事上具备天然的优势,更符合本土用戶的使用偏好。
天工自己倒是对此挺谦虚的,看来不仅学会了中文,还学会了谦虚的传统美德。
那么天工的中文水平到底如何,在首发直播中就进行了现场实时演示,不是放录像,是当场把问题敲进去那种。
大模型作为新一代生产力工具,首先要考察的就是能不能在工作场景中帮到大家。
方汉表示天工在文本生成和文案撰写上的表现令他惊喜,并现场展示了三个场景。
首先是很多人都头疼的写周报,可以让天工直接搭一个框架出来,避免疏漏。
对于直接生成可用文本方面,选择的问题是写一个电商运营的招聘JD。
天工给出结果后,方汉评价“没有一到两年的HR工作经验是很难写这么完整的”。
接下来要考验的是天工的创意能力,毕竟新晋独角兽Jasper.ai就是靠AI创意营销起家,AI有了这方面能力商业化就有了保障。
直播中由于时间关系,只展示了编写二次元mmorpg游戏广告文案一个例子。
不过方汉补充道“由于每个人输入的条件和上下文不同,生成的结果也会千差万别,对广告文案工作非常有帮助。”
直播过程中,除了官方准备的问题,网友也在弹幕中提出各种刁钻问题。
比如脑筋急转弯问题,天工也没有被难住,表现出一定逻辑能力。
还有一些灵魂拷问,天工给出的回答也都符合道德和人类价值观。
更有意思的是,量子位CEO孟鸿在现场也向天工提出了一个尖锐的问题:
我是一个自媒体创作者,现在有个大公司请我评测他们的产品,但是这个产品客观上有亮点也有不足,我应该怎么做才能既不把自己的路走窄了,又坚守自己的节操?
从结果上来看,天工确实是做到了“既要又要”,是一个“三观比较正”的AI了。
天工,是如何炼成的?
在看过天工的能力之后,想必很多朋友们都会好奇,它到底是如何炼成的。
对此,昆仑万维也毫不掩饰地将背后的“秘笈”给亮了出来。
首先便是“大力出奇迹”的大模型,而且还是双千亿参数的那种:
千亿预训练基座模型
千亿RLHF模型
千亿预训练基座模型,是指至少有一个千亿参数的深度学习模型,可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。
千亿RLHF模型,是指基于“Reinforcement Learning with Human Feedback(RLHF)”强化学习方法的一种模型。
RLHF模型可以视为一种特殊的交互式机器学习框架,可以通过人类的反馈来优化模型的性能,由此可以更好地处理不确定性和稀疏性问题。
而在二者的“强强联手”之下,大模型的优势便凸显了出来。