ChatGPT新版本来了,引入图像和语音,更强的多模态交互能力

2023-09-26     科技真探社

原标题:ChatGPT新版本来了,引入图像和语音,更强的多模态交互能力

9月25日,OpenAI发布了新版本的ChatGPT,允许用户通过语音、图像的方式,与ChatGPT进行互动。

OpenAI展示了一个例子。

用户给它发送了一张自行车照片,问它“如何调整座椅高度”,ChatGPT给出了相关的操作步骤,提到要找到对应的快拆杆,需要什么工具等等;然后用户又发送了一张自行车座椅局部的照片,问图中的零件是快拆杆吗?ChatGPT回答不是,然后告诉用户使用什么样的工具,如何操作这个零件,调整座椅高度。

更厉害的来了,用户给ChatGPT发送了自己工具箱的照片,询问ChatGPT,工具箱里有他所需的工具吗?ChatGPT看了一眼照片回答道,用户所需的工具就在工具箱的什么什么位置。

毫不夸张的说,这样多模态的分析、交互能力已经超越了很多AI工具,进一步扩大了ChatGPT的应用范围。

另外在语音方面,像很多儿童陪伴机器人一样,ChatGPT可以给孩子讲睡前故事,了但不同的是,他可以根据故事内容,回答孩子提出的问题,交互能力、理解能力会更强,而且OpenAI为此请来了五名专业配音人士,提供了五种不同的声音选择。

未来两周,这些能力会提供给ChatGPT的付费用户。

文章来源: https://twgreatdaily.com/zh-hans/7bb5fa35cb027934d2adbcfb5c3e1ea2.html