0°

ChatGPT新版本来了,引入图像和语音,更强的多模态交互能力

  9月25日,OpenAI发布了新版本的ChatGPT,允许用户通过语音、图像的方式,与ChatGPT进行互动。

  OpenAI展示了一个例子。

  用户给它发送了一张自行车照片,问它「如何调整座椅高度」,ChatGPT给出了相关的操作步骤,提到要找到对应的快拆杆,需要什么工具等等;然后用户又发送了一张自行车座椅局部的照片,问图中的零件是快拆杆吗?ChatGPT回答不是,然后告诉用户使用什么样的工具,如何操作这个零件,调整座椅高度。

  更厉害的来了,用户给ChatGPT发送了自己工具箱的照片,询问ChatGPT,工具箱里有他所需的工具吗?ChatGPT看了一眼照片回答道,用户所需的工具就在工具箱的什么什么位置。

  毫不夸张的说,这样多模态的分析、交互能力已经超越了很多AI工具,进一步扩大了ChatGPT的应用范围。

  另外在语音方面,像很多儿童陪伴机器人一样,ChatGPT可以给孩子讲睡前故事,了但不同的是,他可以根据故事内容,回答孩子提出的问题,交互能力、理解能力会更强,而且OpenAI为此请来了五名专业配音人士,提供了五种不同的声音选择。

  未来两周,这些能力会提供给ChatGPT的付费用户。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论