位元組跳動商業化團隊模型訓練被“投毒”，內部人士稱未影響豆包大模型

2024-10-20 01:31:17 9

近日，有訊息稱位元組跳動發生大模型訓練被實習生“投毒”事件。

據悉，該事件發生在位元組跳動商業化團隊，因實習生田某某對團隊資源分配不滿，利用HF（huggingface）的漏洞，透過共享模型注入破壞程式碼，導致團隊模型訓練成果受損。訊息稱此次遭到入侵的程式碼已注入8000多張卡，損失或達千萬美元。

位元組跳動知情人士向記者透露稱，近期公司確實發生過破壞模型訓練一事，但傳聞存在誇張和虛構的部分，該事件實際發生在今年6月底，田某某是在商業化技術團隊實習，因為對團隊資源分配不滿，使用攻擊程式碼破壞團隊的模型訓練任務，千萬美元損失的數字也有所誇大。

另外，該人士稱，受程式碼入侵影響的業務不是豆包大模型，而是商業化技術團隊的模型訓練任務，影響了廣告部門的部分技術工作，實習生透過共享模型進行入侵的部分也不屬於集團大模型。

此次事件暴露出位元組跳動技術訓練中存在的安全管理問題，包括許可權隔離、共用程式碼的審計等。一位行業人士對記者表示，進行許可權隔離與審計利於保護公司核心資料與智慧財產權，防止資料洩漏，提高資料與系統的安全性。比如實時監控許可權使用情況，及時發現許可權濫用和異常操作；定期審計許可權，檢查團隊成員的許可權是否符合授權策略，是否存在許可權濫用的情況等。但這件事也有難度，包括跨部門合作成本、經常性維護與更新的資源投入等。

據知情人士向記者透露，目前該實習生已被辭退，公司也將相關情況同步給行業聯盟與實習生學校。

最新的位元組跳動大模型資訊披露發生在今年10月15日，火山引擎在影片雲技術大會上釋出了大模型訓練影片預處理方案，助力解決影片大模型訓練的成本、質量和效能等方面的技術挑戰。目前，該技術方案已應用於豆包影片生成模型。

呂倩