IT之家 12 月 21 日消息,據(jù)彭博社報道,斯坦福大學近日針對開源模型訓練數(shù)據(jù)集 LAION-5B 展開研究,發(fā)現(xiàn)該數(shù)據(jù)集中存在 3000 項“可疑的兒童性虐待內(nèi)容”,之后 LAION 項目維護人員緊急下架了 LAION-5B,并聲稱已經(jīng)移除了 1008 項“確鑿的相關(guān)內(nèi)容”。
外媒表示,LAION-5B 訓練集總共擁有 58.5 億項圖片信息,Stability AI 曾利用 LAION 數(shù)據(jù)集來訓練自家 AI 模型,從而為用戶提供“文生圖服務”。
不過IT之家注意到,Stability AI 迅速向外媒回應,“Stable Diffusion 模型雖然使用 LAION-5B 進行訓練,但采用的是‘經(jīng)過篩選及微調(diào)過的’訓練集版本,因此‘并不會影響模型輸出結(jié)果’”。
斯坦福大學聲稱,從 LAION-5B 事件可以看出業(yè)界“應當還有大量數(shù)據(jù)集存在有相關(guān)不當內(nèi)容”,研究人員呼吁模型訓練方應當謹慎甄選“必要的訓練數(shù)據(jù)集”
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。