開源訓練集 LAION-5B 遭曝內(nèi)含“兒童性虐待內(nèi)容”，Stable AI“緊急撇清關(guān)系”

2023/12/21 15:58:11 來源：IT之家作者：漾仔（實習） 責編：漾仔

評論：

IT之家 12 月 21 日消息，據(jù)彭博社報道，斯坦福大學近日針對開源模型訓練數(shù)據(jù)集 LAION-5B 展開研究，發(fā)現(xiàn)該數(shù)據(jù)集中存在 3000 項“可疑的兒童性虐待內(nèi)容”，之后 LAION 項目維護人員緊急下架了 LAION-5B，并聲稱已經(jīng)移除了 1008 項“確鑿的相關(guān)內(nèi)容”。

▲ 圖源彭博社（下同）

外媒表示，LAION-5B 訓練集總共擁有 58.5 億項圖片信息，Stability AI 曾利用 LAION 數(shù)據(jù)集來訓練自家 AI 模型，從而為用戶提供“文生圖服務”。

不過IT之家注意到，Stability AI 迅速向外媒回應，“Stable Diffusion 模型雖然使用 LAION-5B 進行訓練，但采用的是‘經(jīng)過篩選及微調(diào)過的’訓練集版本，因此‘并不會影響模型輸出結(jié)果’”。

開源訓練集 LAION-5B 遭曝內(nèi)含“兒童性虐待內(nèi)容”，Stable AI“緊急撇清關(guān)系”

斯坦福大學聲稱，從 LAION-5B 事件可以看出業(yè)界“應當還有大量數(shù)據(jù)集存在有相關(guān)不當內(nèi)容”，研究人員呼吁模型訓練方應當謹慎甄選“必要的訓練數(shù)據(jù)集”

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

開源訓練集 LAION-5B 遭曝內(nèi)含“兒童性虐待內(nèi)容”，Stable AI“緊急撇清關(guān)系”

相關(guān)文章

開源訓練集 LAION-5B 遭曝內(nèi)含“兒童性虐待內(nèi)容”，Stable AI“緊急撇清關(guān)系”