設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Meta 承認(rèn)使用盜版書籍來訓(xùn)練 AI,并拒絕賠償作家

2024/1/14 18:01:25 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋

IT之家 1 月 14 日消息,大型語言模型(LLM)技術(shù)近年來取得了巨大進(jìn)步,但其背后卻隱藏著版權(quán)糾紛的陰云。科技巨頭們利用海量文本數(shù)據(jù)訓(xùn)練 LLM,其中難免會涉及到受版權(quán)保護(hù)的作品,招致作者和媒體組織的強(qiáng)烈抗議。

圖源 Pexels

近日,Meta(前身為 Facebook)就因使用包含大量盜版書籍的“Books3”數(shù)據(jù)集訓(xùn)練其 LLAM 1 和 LLAM 2 模型而面臨包括喜劇演員 Sarah Silverman 和作家 Richard Kadrey 在內(nèi)的一眾作者的集體訴訟。Meta 雖承認(rèn)使用了 Books3 數(shù)據(jù)集,卻拒絕向作者支付適當(dāng)?shù)难a(bǔ)償。

Books3 是一個包含 19.5 萬本圖書、總?cè)萘拷?37GB 的文本數(shù)據(jù)集,由 AI 研究者 Shawn Presser 于 2020 年創(chuàng)建,旨在為改進(jìn)機(jī)器學(xué)習(xí)算法提供更好的數(shù)據(jù)源。Meta 也將其用于訓(xùn)練自己的 LLAM 模型,然而 Books3 中包含大量從盜版網(wǎng)站 Bibliotik 爬取的受版權(quán)保護(hù)作品,使得 Meta 的行為面臨法律風(fēng)險。

IT之家注意到,Meta 的做法并非特例。此前,《紐約時報》也因 OpenAI 和微軟使用其文章訓(xùn)練聊天機(jī)器人 ChatGPT 而對其提起訴訟。OpenAI 則辯稱,不使用受版權(quán)保護(hù)的材料來訓(xùn)練 AI 模型“幾乎不可能”,并要求法院駁回相關(guān)訴訟。Meta 同樣否認(rèn)故意侵犯版權(quán),聲稱其使用 Books3 數(shù)據(jù)集屬于合理使用范疇,無需獲得許可、署名或支付補(bǔ)償。

此外,Meta 還在對訴訟作為集體訴訟的合法性提出異議,拒絕向提起訴訟的作家或其他參與 Books3 爭議的人士提供任何形式的經(jīng)濟(jì)“補(bǔ)償”。

值得注意的是,Books3 數(shù)據(jù)集中的部分內(nèi)容來自盜版網(wǎng)站 Bibliotik,該數(shù)據(jù)集在 2023 年被丹麥反盜版組織 Rights Alliance 要求下架,目前面臨數(shù)字存檔禁令。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:MetaAI,人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知