谷歌發布多模態大模型Gemini,性能超GPT-4!

2023-12-07     芯智訊

原標題:谷歌發布多模態大模型Gemini,性能超GPT-4!

12月7日凌晨,谷歌CEO桑達爾・皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網聯名發文,宣布最新多模態大模型Gemini 1.0(雙子星)版本正式上線,其性能有望超過OpenAI GPT-4 模型。

Gemini號稱是目前最強大、最通用的模型,第一版Gemini 1.0能夠理解和操作包括文字、圖象、音頻、視頻、代碼在內不同類型信息。

Gemini原生設計成多模態模型,一開始就在不同模態上預訓練,接著通過額外的多模態數據進行微調、提升性能。目前,Gemini 1.0所受的訓練是同時識別和理解文字、圖象、音頻、視頻、代碼等不同類型信息,並可回答涉及複雜主題的問題,這也讓Gemini在解釋、推理如數學和物理這樣複雜的問題時表現出色。

不只如此,Gemini 1.0能夠理解和解釋世界上常用的程序語言如Python、Java、C++和Go,並且產生高品質的代碼。值得一提的是,Google DeepMind 2年前推出AI代碼生成系統AlphaCode,現在通過一個專門版本的Gemini,建立更進階的AlphaCode 2,不僅擅長程序設計,還能處理與數學、理論計算機科學相關的競技程序設計問題。

Google DeepMind團隊使用Google自行研發、用於加速機器學習的TPU v4和v5e(Tensor Processing Unit),有規模地訓練Gemini 1.0。依照模型大小有Ultra、Pro、Nano三種。

其中中端型號的Gemini Pro能夠擊敗GPT-3.5,可擴展多種任務;Gemini Nano用於特定任務和移動設備。

而Gemini Ultra則是規模最大、功能最強大的模型,專為高度複雜任務所設計,Gemini Nano則是處理裝置上任務最有效率的模型。

Google DeepMind團隊不斷對Gemini模型進行嚴格測試,從理解自然圖象、音頻、視頻,再到數學推理,其中發現Gemini Ultra在大型語言模型研究和開發廣泛採用的32項學術基準測試中,有30個取得領先成績。

其中Gemini Ultra以90%的高得分成為第一個在MMLU(massive multitask language understanding,大規模多任務語言理解)測試里超越人類專家的模型,而在新的MMMU基準測試里也得到59.4%領先分數,兩項測試皆超越OpenAI所開發的GPT-4模型。

截至目前Google所有AI模型中,Gemini在偏誤、數據毒性(toxicity)等方面都接受最全面的安全性評價。在網絡攻擊、說服能力、自主性等可能存在風險的領域,Google DeepMind團隊都進行最新研究,也運用Google Research的對抗測試技巧,在部署Gemini前率先找出關鍵的安全問題。

Google將在多項產品中導入Gemini,包括軟體方面的Bard、以及有關硬體Pixel 8 Pro。從12月13日起,開發者和企業客戶可以透過Google AI Studio或Google Cloud Vertex AI的Gemini API使用Gemini Pro。Android開發者也能透過AICore,在開發作業中運用Gemini Nano。

在ChatGPT推出後Google內部宣布「紅色警戒」,從那時起被認為在AI競賽急起直追。Gemini可說是Google多年來一直苦心建立的模型,也被外界視為能一舉挑戰OpenAI的關鍵利器。接下來我們將在越來越多Google產品看見Gemini身影,及其驅動的強大功能。

編輯:芯智訊-林子

文章來源: https://twgreatdaily.com/zh-mo/e7eff62413b69664860384c85b47bbe5.html