設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

開源訓(xùn)練集 LAION-5B 遭曝內(nèi)含“兒童性虐待內(nèi)容”,Stable AI“緊急撇清關(guān)系”

2023/12/21 15:58:11 來源:IT之家 作者:漾仔(實習(xí)) 責(zé)編:漾仔

IT之家 12 月 21 日消息,據(jù)彭博社報道,斯坦福大學(xué)近日針對開源模型訓(xùn)練數(shù)據(jù)集 LAION-5B 展開研究,發(fā)現(xiàn)該數(shù)據(jù)集中存在 3000 項“可疑的兒童性虐待內(nèi)容”,之后 LAION 項目維護(hù)人員緊急下架了 LAION-5B,并聲稱已經(jīng)移除了 1008 項“確鑿的相關(guān)內(nèi)容”

▲ 圖源 彭博社(下同)

外媒表示,LAION-5B 訓(xùn)練集總共擁有 58.5 億項圖片信息,Stability AI 曾利用 LAION 數(shù)據(jù)集來訓(xùn)練自家 AI 模型,從而為用戶提供“文生圖服務(wù)”。

不過IT之家注意到,Stability AI 迅速向外媒回應(yīng),“Stable Diffusion 模型雖然使用 LAION-5B 進(jìn)行訓(xùn)練,但采用的是‘經(jīng)過篩選及微調(diào)過的’訓(xùn)練集版本,因此‘并不會影響模型輸出結(jié)果’。

斯坦福大學(xué)聲稱,從 LAION-5B 事件可以看出業(yè)界“應(yīng)當(dāng)還有大量數(shù)據(jù)集存在有相關(guān)不當(dāng)內(nèi)容”,研究人員呼吁模型訓(xùn)練方應(yīng)當(dāng)謹(jǐn)慎甄選“必要的訓(xùn)練數(shù)據(jù)集”

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Stable Diffusion,AI 模型LAION5B

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知