本報記者 李靜 北京報道
近日,有外媒報道稱,位元組跳動在使用OpenAI技術開發自己的大語言模型,而OpenAI的服務條款規定,該公司所輸出的模型不能被用於「開發任何與我們的產品和服務競爭的AI模型」。位元組跳動雖然通過微軟購買了OpenAI的訪問權限,但是微軟也制定了與OpenAI同樣的政策。因此,位元組跳動違反了OpenAI服務條款,其帳戶已被OpenAI暫停。
位元組跳動發言人約迪·賽斯(Jodi Seth)對此回應稱,GPT生成的數據在「種子計劃」(位元組跳動基礎大語言模型的代號)的早期開發中用於註解模型,並且在今年年中左右的時候已從位元組跳動的訓練數據中刪除。「位元組跳動獲得了微軟的許可能夠使用GPT API。「我們使用GPT驅動非中國市場的產品和功能。但在中國境內,我們使用的是自主開發的模型驅動『豆包』(位元組跳動旗下的AI對話機器人)。而且豆包只在中國境內提供。」
對於相關具體情況,12月17日,位元組跳動相關負責人對《中國經營報》記者回應稱:「公司在使用OpenAI相關服務時,強調要遵守其使用條款。我們也正與OpenAI聯繫溝通,以澄清外部報道可能引發的誤解。」
位元組跳動方面表示,今年年初,當技術團隊剛開始進行大模型的初期探索時,有部分工程師將GPT的API服務應用於較小模型的實驗性項目研究中。該模型僅為測試,沒有計劃上線,也從未對外使用。在4月公司引入GPT API調用規範檢查後,這種做法已經停止。
位元組跳動方面還表示,早在今年4月,位元組跳動大模型團隊已經提出了明確的內部要求,包括不得將GPT模型生成的數據添加到大模型的訓練數據集、培訓工程師團隊在使用GPT時遵守服務條款等。「9月,公司內部又進行了一輪檢查,採取措施進一步保證對GPT的API 調用符合規範要求。例如分批次抽樣檢測模型訓練數據與GPT的相似度,避免數據標註人員私自使用GPT。未來幾天裡,我們會再次全面檢查,以確保嚴格遵守相關服務的使用條款。」
對於Open AI切掉位元組跳動API接口的做法,福資本創始合伙人、行行AI董事長李明順認為,這其實反映出大模型公司害怕強應用,就像Open AI很怕亞馬遜、Google、Mata推出大模型及應用。因為大模型逐漸變成明牌,大家較量的不再是技術底座,而是你有多少用戶、多少場景、有多少的錢持續去找算力。所以用戶數、場景、投資能力會成為這一波大模型競爭的核心,在此背景下,大模型本身的重要性就降低了。
就在12月16日,百度創始人、董事長兼CEO李彥宏再度發言表示:「過去一年,我看大家對於大模型的關注還在基礎模型,沒有在應用上,我有些著急。我們要去『卷』AI原生應用,把這個做出來了才有價值。為什麼大家不去認真做AI原生應用,而去關心大模型進展?這個進展對大多數人來說不是機會!百模大戰是對社會資源的極大浪費,更多資源應該放在超級應用上。」
「像位元組跳動這樣擁有巨大用戶基礎的公司,是Open AI所害怕的,因為像位元組跳動的很多產品未來會嵌入AI。」李明順說道,尤其剪映(海外版為capcut)這樣的短視頻製作工具使用AI後,未來可能會成為全球第一的短視頻工具,遠遠超過今天大家看到的pika、gemini等。「因為剪映、capcut在全球的月活已經有5億~6億人,在短視頻工具中應該無出其右,剪映和capcut掌握了大量的用戶,又有抖音、TikTok這些場景。未來如果把剪映或capcut拆分出來,有可能成為AI領域千億美元級別的短視頻AI工具。在這場競爭中,場景正在變得比技術重要。」
據了解,今年6月28日,位元組跳動曾發布「火山方舟」大模型,但「火山方舟」並非自研大模型,而是大模型服務平台,該平台主要集成智譜AI、MiniMax、百川智能等7家AI科技公司及科研院所的大模型,對外提供服務。對於自研大模型的具體進程,以及應用落地的相關情況,位元組跳動方面尚未有更多信息披露。
(編輯:張靖超 校對:顏京寧)