ChatGPT新版本来了，引入图像和语音，更强的多模态交互能力

　　9月25日，OpenAI发布了新版本的ChatGPT，允许用户通过语音、图像的方式，与ChatGPT进行互动。

　　OpenAI展示了一个例子。

　　用户给它发送了一张自行车照片，问它「如何调整座椅高度」，ChatGPT给出了相关的操作步骤，提到要找到对应的快拆杆，需要什么工具等等;然后用户又发送了一张自行车座椅局部的照片，问图中的零件是快拆杆吗?ChatGPT回答不是，然后告诉用户使用什么样的工具，如何操作这个零件，调整座椅高度。

　　更厉害的来了，用户给ChatGPT发送了自己工具箱的照片，询问ChatGPT，工具箱里有他所需的工具吗?ChatGPT看了一眼照片回答道，用户所需的工具就在工具箱的什么什么位置。

　　毫不夸张的说，这样多模态的分析、交互能力已经超越了很多AI工具，进一步扩大了ChatGPT的应用范围。

　　另外在语音方面，像很多儿童陪伴机器人一样，ChatGPT可以给孩子讲睡前故事，了但不同的是，他可以根据故事内容，回答孩子提出的问题，交互能力、理解能力会更强，而且OpenAI为此请来了五名专业配音人士，提供了五种不同的声音选择。

　　未来两周，这些能力会提供给ChatGPT的付费用户。

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！