位元組跳動:已辭退!

2024-10-19     21世紀經濟報道

10月19日,「位元組跳動大模型訓練被實習生攻擊,涉事者已被辭退」的消息,衝上多個平台熱搜。

10月18日,多個微信群流傳一則消息:「某頭部大廠的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。」

對此,19日下午,位元組跳動發布《關於「實習生破壞大模型訓練」的事實澄清》, 稱涉事實習生惡意干擾商業化技術團隊研究項目的模型訓練任務,但並不影響商業化的正式項目及線上業務,也不涉及位元組跳動大模型等其他業務。網傳「涉及8000多卡、損失上千萬美元」嚴重誇大。

位元組跳動還稱,經核實,涉事人一直在商業化技術團隊實習,並沒有AI Lab實習經歷。其社交媒體個人簡介及部分媒體報道有誤。另外,該實習生已在8月被公司辭退。公司也將其行為同步給行業聯盟和所在學校,交由校方處理。

面臨安全管理問題

據紅星資本局此前報道,近日有消息稱,某頭部大廠的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。

傳言稱,該實習生利用了HF(huggingface)的漏洞,在公司的共享模型里寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果。

知情人士告訴紅星資本局,該大廠為位元組跳動,「注入8000多張卡」「損失上千萬美元」等描述不實,太過誇大;受影響的業務也不是豆包大模型,而是商業化技術團隊的模型訓練任務,影響了廣告部門的一些業務進展,但不影響線上業務。目前,位元組跳動已對該實習生採取了辭退處理,並將此事通報給相關行業聯盟和該實習生所在的學校。

據了解,此事發生在今年6月,起因是該實習生對團隊資源分配不滿,故使用攻擊代碼破壞團隊的模型訓練任務。

實際上,大模型在安全性方面的問題已經受到業內高度關注。今年8月,中國信通院發文稱,近年來,以大模型為核心的人工智慧技術飛速發展,成為數字經濟增長新動能。然而,作為新質生產力的大模型在安全性方面仍存在較多缺陷,這為其大規模落地應用帶來了不確定性。近期,中國信通院發布的大模型安全基準AI Safety Benchmark的測試結果顯示,大模型(尤其是開源大模型)在惡意誘導手段下的攻擊成功率均較原始輸入有明顯提升。因此,對大模型進行安全對齊防護刻不容緩。

加碼大模型應用

今年以來,作為頭部網際網路大廠,位元組跳動正在加碼大模型建設和應用。5月15日,位元組跳動豆包大模型在火山引擎原動力大會上發布。火山引擎是位元組跳動旗下雲服務平台,火山引擎總裁譚待現場介紹,豆包大模型正成為國內使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。豆包主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%。

此後,各大廠的大模型開啟大幅降價,價格戰愈演愈烈。

近期,位元組跳動還宣告進軍AI視頻生成。9月24日,位元組跳動旗下火山引擎發布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型,面向企業市場開啟邀測。據火山引擎介紹,全新設計的擴散模型訓練方法攻克了多鏡頭切換的一致性難題。據火山引擎披露,截至9月,豆包語言模型的日均tokens使用量超過1.3萬億,相比5月首次發布時猛增十倍。

10月15日,在2024火山引擎視頻雲技術大會上,火山引擎正式發布大模型訓練視頻預處理方案,該方案能夠有效解決視頻大模型訓練的成本、質量和性能等方面的技術挑戰,並已應用於豆包·視頻生成模型中。

來源丨位元組跳動、證券時報、紅星資本局

SFC

本期編輯 黎雨桐

文章來源: https://twgreatdaily.com/zh-mo/b8d8dd1945840c982014d17d101785f8.html