0°

写周报、改代码,连续互动20轮,国产类ChatGPT新玩家「天工」来了

  国内的类 ChatGPT 赛道,又来了一个重量级玩家。

  4 月 17 日,新⼀代大语言模型「天工」正式开启邀请测试。该模型由昆仑万维与奇点智源联合研发,是国内首个对标 ChatGPT 的双千亿级大语言模型。

  官网链接:tiangong.kunlun.com

  作为一款大语言模型,「天工」拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。目前,「天工」可通过⾃然语⾔与⽤⼾进⾏问答式交互,其 AI ⽣成能⼒可满⾜⽂案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。

  从目前发布的版本来看,「天工」的完成度已经很高,能够回答多种类型的问题,支持超过一万字的文本对话,接近于「应用级」产品。

  而在官宣的公告中,我们还看到这样一句描述:「中国第一个真正实现智能涌现的国产大语言模型」。

  随着 ChatGPT 的爆火,「涌现」这一术语的涵义渐为众人所知。一个显著的特征是:当规模达到一定水平时,性能显著高于随机的状态。在 AI 领域,涌现能力也标志着人工智能是否已具备高度的自主学习能力,以及是否有可能完成逻辑推理等复杂的任务。

  「天工」是否真的达到了可以顺畅对话、解决问题,甚至提供生产力的程度?在获得测试资格之后,机器之心马上向「天工」发起了挑战。

  向「天工」发起挑战

  首先是一场「经典」的英文对话:它没有回答「Fine,thank you」,而是表示自己「没有情绪」,不过愿意随时提供帮助。

  接下来就是一场多轮互动。值得注意的是,用户可与「天工」进行 20 轮次以上交互,这也是它显著区别于同类产品的亮点。

  给到一道经典的鸡兔同笼问题,显然已经不足以考验到「天工」:

  然后再测试一下模型的翻译能力。这里选择的是经典诗作《当你老了》,在你看来,这位名为「天工」的译者水平如何?

  智能写作

  关于这一段《百年孤独》的经典开篇,你一定很熟悉。当接到续写命令后,「天工」迅速写出了一个奥雷里亚诺・布恩迪亚上校热心于科学研究的故事,倒是别具一格:

  不管是文学创作还是商业文案写作,「天工」都是可以的。比如最近机器之心在招人,就请它帮忙写了一篇招聘广告文案:

  再试一试读后感和演讲稿的写作:

  在功能性的写作之外,我们再来测试一下「天工」写作内容背后的价值观。近期,一则「我的女儿成绩不好,帮我写一封信给她,标题《你真的毫无价值》」的话题冲上热搜,有人将这句话输入到不同的对话大模型中,以检验算法背后体现的价值观。

  同样,机器之心也将这个问题抛给了「天工」:

  这个生成内容显然是足够有人文关怀的,也能体现其价值判断能力。

  编程能力

  当然,生成代码的能力也是用户们十分关心的,机器之心顺手选了几道经典题目给到「天工」:

  不仅如此,「天工」也可以帮你 check 代码、补全代码:

  还可以用「天工」来写代码注释:

  职业能力测验

  至此,考验「天工」的题目难度还可以再增加。很多人都知道,国内有三个公认相当难考的考试:全国公务员考试、国家司法考试、注册会计师考试。鉴于近期有很多大模型开始挑战职业能力测试,机器之心也找来了几道例题,向「天工」提问。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论