IT之家 12 月 21 日消息,據(jù)彭博社報道,斯坦福大學(xué)近日針對開源模型訓(xùn)練數(shù)據(jù)集 LAION-5B 展開研究,發(fā)現(xiàn)該數(shù)據(jù)集中存在 3000 項“可疑的兒童性虐待內(nèi)容”,之后 LAION 項目維護(hù)人員緊急下架了 LAION-5B,并聲稱已經(jīng)移除了 1008 項“確鑿的相關(guān)內(nèi)容”。
外媒表示,LAION-5B 訓(xùn)練集總共擁有 58.5 億項圖片信息,Stability AI 曾利用 LAION 數(shù)據(jù)集來訓(xùn)練自家 AI 模型,從而為用戶提供“文生圖服務(wù)”。
不過IT之家注意到,Stability AI 迅速向外媒回應(yīng),“Stable Diffusion 模型雖然使用 LAION-5B 進(jìn)行訓(xùn)練,但采用的是‘經(jīng)過篩選及微調(diào)過的’訓(xùn)練集版本,因此‘并不會影響模型輸出結(jié)果’”。
斯坦福大學(xué)聲稱,從 LAION-5B 事件可以看出業(yè)界“應(yīng)當(dāng)還有大量數(shù)據(jù)集存在有相關(guān)不當(dāng)內(nèi)容”,研究人員呼吁模型訓(xùn)練方應(yīng)當(dāng)謹(jǐn)慎甄選“必要的訓(xùn)練數(shù)據(jù)集”
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。