谷歌CEO桑達爾·皮查伊談Gemini:縱覽全局,我們才剛剛開始

2023-12-10     DeepTech深科技

原標題:谷歌CEO桑達爾·皮查伊談Gemini:縱覽全局,我們才剛剛開始

關於谷歌正在開發大型語言模型的傳聞已經流傳許久。這個傳聞終於在近日得到證實,谷歌 DeepMind官宣了自家的大模型 Gemini,而它的對手正是 OpenAI 的 GPT-4。

Gemini 是谷歌迄今為止最大的人工智慧進展之一,旨在與競爭對手 OpenAI和微軟爭奪人工智慧領域的領導地位。毫無疑問,該模型在各種功能上都被宣傳為同類模型中最佳的,一些人甚至說它是一台「萬能機器」。

(來源:GOOGLE)

谷歌及其母公司 Alphabet 的 CEO 桑達爾·皮查伊(Sundar Pichai)告訴《麻省理工技術評論》:「這個模型天生更有能力,它是一個平台。人工智慧是一個影響深遠的平台轉變,比網絡或移動曾經帶來的轉變更大。因此,它代表著我們邁出了一大步。」

從演示中判斷,它在很多方面都做得很好,但很少有我們以前沒有見過的。Gemini 是多模態的,這意味著它被訓練來處理多種輸入方式:文本、圖像和音頻。它可以將這些不同的格式結合起來,回答從家務到大學數學再到經濟的所有問題。

在發布會上給記者的演示中,谷歌展示了 Gemini 的能力,它可以拿著已有的圖表截圖,用新數據分析數百頁的研究,然後用新信息更新圖表。

在另一個例子中,Gemini 展示了在平底鍋中烹飪煎蛋卷的照片,並被用語音問到「煎蛋卷是否已經熟了」。Gemini 回答說:「它還沒做好,因為雞蛋黃還沒凝固。」

然而想要獲得完整的體驗,大多數人將不得不等待一段時間。此次推出的版本是谷歌搜索聊天機器人 Bard 的後端,該公司表示它將為 Bard 提供更高級的推理、規劃和理解能力。

Gemini 的多個版本將在未來幾個月陸續上線。新的 Gemini 增強版 Bard 最初將在 170 多個國家和地區提供英語服務,但不包括歐盟和英國。谷歌負責 Bard 的副總裁希思·蕭(Sissie Hsiao)表示,這是為了讓該公司與當地監管機構「接觸」。

Gemini 有三種尺寸:Ultra、Pro 和 Nano。Ultra 是性能最強的版本,Pro 和 Nano 是為使用有限計算資源運行的應用程式量身定製的。Nano 被設計在移動設備上運行,例如在谷歌的新款 Pixel 手機上。

從 2023 年 12 月 13 日開始,開發者和企業將可以訪問 Gemini Pro。谷歌高管在一次新聞電話會議上告訴記者,在經過「廣泛的信任和安全檢查」之後,最強大的 Gemini Ultra 將於「明年初」上線。

皮查伊告訴我們:「我認為這是 Gemini 模型的時代。這就是谷歌 DeepMind 將如何在人工智慧方面建立和取得進展。因此,它將永遠代表我們在人工智慧技術方面取得進展的前沿。」

OpenAI 最強大的模型 GPT-4 被視為行業的黃金標準。雖然谷歌生成 Gemini 的表現優於 OpenAI 的前一個模型 GPT 3.5,但公司高管迴避了該模型超過 GPT-4 的程度的問題。

但該公司特彆強調了一個基準,名為 MMLU(Massive Multitask Language Understanding,大規模多任務語言理解)基準。這些測試旨在衡量模型在涉及文本和圖像的任務中的表現,包括閱讀理解、大學數學以及物理、經濟和社會科學的選擇題測驗。

皮查伊說,在純文本任務中,Gemini 的得分為 90%,人類專家的得分約為 89%。GPT-4 在這類問題上的得分為 86%。在多模態任務中,Gemini 得分為 59%,而 GPT-4 得分為 57%。皮查伊說:「這是第一個跨過這一門檻的模型。」

美國新墨西哥州聖達菲研究所的人工智慧研究員梅勒妮·米切爾(Melanie Mitchell)說,Gemini 在基準數據集上的表現非常令人印象深刻。

米切爾說:「很明顯,Gemini 是一個非常複雜的人工智慧系統。但對我來說,Gemini 雖然比 GPT-4 強,但並不明顯。」

美國史丹福大學基礎模型研究中心主任 Percy Liang 表示,雖然該模型在基準數據集上表現很好,但由於我們不知道訓練數據中有什麼,就很難明白該如何解釋這些數字。

米切爾還指出,Gemini 在語言和代碼基準測試方面的表現比在圖像和視頻方面要好得多。她說:「多模態基礎模型要想在許多任務中都能廣泛地發揮作用,還有很長的路要走。」

利用人類測試人員的反饋,谷歌 DeepMind 可以訓練 Gemini 更準確地回答事實,在被要求時給出歸因,在面對無法回答的問題時給出反饋,而不是胡言亂語。

該公司聲稱這可以緩解幻覺的問題。但如果不對基礎技術進行徹底改革,大型語言模型將繼續胡編亂造。

華盛頓大學計算語言學教授艾米麗·本德(Emily M.Bender)說:「谷歌正在宣傳 Gemini 是一台萬能機器,一種可以以多種不同方式使用的通用模型。」

但該公司正在使用狹隘的基準來評估這些不同目的的模型。她說:「這意味著我們無法對其進行有效而徹底的評估。」

Gemini 的誕生已經花了不短的時間。2023 年 4 月,谷歌宣布將其人工智慧研究部門谷歌大腦與人工智慧研究實驗室 DeepMind 合併。

因此,谷歌幾乎花了一年的時間來開發 Gemini,用於應對 OpenAI 最先進的大型語言模型 GPT-4。該模型於 2023 年 3 月首次亮相,支撐著 ChatGPT 的 Plus 付費版本。

谷歌一直面臨著巨大的壓力,需要向投資者證明它可以在人工智慧領域與競爭對手匹敵並超越競爭對手。

儘管該公司多年來一直在開發和使用強大的人工智慧模型,但由於擔心聲譽受損和安全問題,它一直在猶豫是否向公眾推出類似的工具。

「谷歌對向公眾發布這些東西一直非常謹慎。」圖靈獎得主傑弗里·辛頓(Geoffrey Hinton)在 2023 年 4 月份從谷歌離職時告訴《麻省理工技術評論》,「可能發生的壞事太多了,谷歌不想破壞自己的聲譽。」面對看似不可信的技術,谷歌總是謹慎行事,直到風險變成了錯過。

谷歌在跌倒中明白了推出有缺陷的產品會適得其反。當該公司在 2023 年 2 月份公布其 ChatGPT 的競品 Bard 時,科學家們很快注意到該公司的聊天機器人營銷內容中存在一個事實錯誤。這一事件隨後使其股價蒸發了 1000 億美元。

2023 年 5 月,谷歌宣布將在其大部分產品中推出生成式人工智慧,從電子郵件到生產力軟體。但批評者並沒有因此打住,比如聊天機器人會提到不存在的電子郵件。

這個問題普遍存在於大型語言模型中。儘管生成式人工智慧系統非常擅長生成看起來像人類寫出來的東西,但它經常會胡編亂咋。

這並不是它們唯一的問題。它們也很容易被「越獄」,而且充滿了偏見。它們生成的內容也會造成文本污染。

Gemini 可能是這一波生成式人工智慧的頂峰。但目前尚不清楚基於大型語言模型的人工智慧下一步會走向何方。一些研究人員認為,接下來可能是會趨於平淡。

皮查伊對此不以為然。「展望未來,我們看到了很大的空間。」他說,「我認為多模態將是重大的。隨著我們教會這些模型更多地推理,將會有越來越大的突破。更深入的突破還在後頭。」「當我縱覽全局時,我真的覺得我們才剛剛開始。」

作者簡介:威爾·道格拉斯·海文(Will Douglas Heaven)是《麻省理工科技評論》人工智慧欄目的高級編輯,他在這裡報道新的研究、新興趨勢及其背後的人。此前,他是英國廣播公司(BBC)科技與地緣政治網站 Future Now 的創始編輯,也是 New Scientist 雜誌的首席技術編輯。他擁有英國倫敦帝國理工學院計算機科學博士學位,深諳與機器人合作的體驗。

作者簡介:梅麗莎·海基萊(Melissa Heikkilä)是《麻省理工科技評論》的資深記者,她著重報道人工智慧及其如何改變我們的社會。此前,她曾在 POLITICO 撰寫有關人工智慧政策和政治的文章。她還曾在《經濟學人》工作,並曾擔任新聞主播。

*馬特·霍南(Mat Honan)對本文亦有幫助。

支持:Ren

文章來源: https://twgreatdaily.com/zh-my/b326f3f772e8a98378ff5abb7959833c.html