NVIDIA新推70B AI模型,實力如何?緊追OpenAI!

2024-10-17     ITBEAR科技資訊

【ITBEAR】近日,NVIDIA悄然推出了一款名為Nemotron-70B的AI模型,該模型在多個基準測試中表現出色,超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內的140多個開閉源模型,其性能僅次於OpenAI的最新模型o1。

AI社區對此反應熱烈,紛紛驚嘆新的開源王者是否已經到來。業內人士更是高度評價,認為用Llama 3.1訓出的小模型能超越GPT-4o,實屬神來之筆。

Nemotron-70B基於Llama-3.1-70B開發,它能夠在沒有專門提示和額外推理token的情況下,正確回答覆雜的推理問題,例如「草莓有幾個r」的經典難題。

業內人士指出,NVIDIA在Llama 3.1基礎上訓練出的這個相對不大的模型,能夠超越GPT-4o和Claude 3.5 Sonnet,這標誌著一次技術上的重大飛躍。

目前,Llama-3.1-Nemotron-70B-Instruct已經可以在線體驗,為用戶提供了直接感受這款強大模型的機會。

除了推出Nemotron-70B模型,英偉達還開源了用於訓練該模型的數據集HelpSteer2。該數據集包含21362個提示響應,旨在使模型更符合人類偏好,同時也更有幫助、更符合事實、更連貫。該數據集還包含20324個用於訓練的提示響應和1038個用於驗證的提示響應。

來源:http://www.itbear.com.cn/html/2024-10/546836.html

文章來源: https://twgreatdaily.com/56bdaa8c513df9eb067e6310cecddc66.html