ChatGPT新版本來了,引入圖像和語音,更強的多模態交互能力

2023-09-26     科技真探社

原標題:ChatGPT新版本來了,引入圖像和語音,更強的多模態交互能力

9月25日,OpenAI發布了新版本的ChatGPT,允許用戶通過語音、圖像的方式,與ChatGPT進行互動。

OpenAI展示了一個例子。

用戶給它發送了一張自行車照片,問它「如何調整座椅高度」,ChatGPT給出了相關的操作步驟,提到要找到對應的快拆杆,需要什麼工具等等;然後用戶又發送了一張自行車座椅局部的照片,問圖中的零件是快拆杆嗎?ChatGPT回答不是,然後告訴用戶使用什麼樣的工具,如何操作這個零件,調整座椅高度。

更厲害的來了,用戶給ChatGPT發送了自己工具箱的照片,詢問ChatGPT,工具箱裡有他所需的工具嗎?ChatGPT看了一眼照片回答道,用戶所需的工具就在工具箱的什麼什麼位置。

毫不誇張的說,這樣多模態的分析、交互能力已經超越了很多AI工具,進一步擴大了ChatGPT的應用範圍。

另外在語音方面,像很多兒童陪伴機器人一樣,ChatGPT可以給孩子講睡前故事,了但不同的是,他可以根據故事內容,回答孩子提出的問題,交互能力、理解能力會更強,而且OpenAI為此請來了五名專業配音人士,提供了五種不同的聲音選擇。

未來兩周,這些能力會提供給ChatGPT的付費用戶。

文章來源: https://twgreatdaily.com/zh-hk/7bb5fa35cb027934d2adbcfb5c3e1ea2.html