消息稱(chēng) Meta 無(wú)視自家律師警告,使用盜版書(shū)籍訓(xùn)練 AI 模型

2023/12/13 15:07:28 來(lái)源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋

IT之家 12 月 13 日消息,據(jù)路透社報(bào)道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書(shū)籍訓(xùn)練其 AI 模型存在法律風(fēng)險(xiǎn)的情況下,仍然一意孤行。

據(jù)IT之家了解,該訴訟由喜劇演員 Sarah Silverman、普利策獎(jiǎng)得主 Michael Chabon 等著名作家于今年夏天聯(lián)合發(fā)起,他們指控 Meta 未經(jīng)許可使用其作品訓(xùn)練人工智能語(yǔ)言模型 Llama。本周一起,該案與另一起類(lèi)似訴訟合并審理。

上個(gè)月,加州一位法官駁回了 Silverman 的部分訴訟,但表示將允許作者修改訴訟內(nèi)容。新訴狀中包含了 Meta 一名研究員在 Discord 聊天服務(wù)器上討論獲取數(shù)據(jù)集的聊天記錄,這可能是 Meta 知曉使用書(shū)籍可能存在版權(quán)風(fēng)險(xiǎn)的重要證據(jù)。聊天記錄中的對(duì)話(huà)顯示,他們?cè)懻撨^(guò)使用盜版書(shū)籍訓(xùn)練 AI 模型的法律風(fēng)險(xiǎn)。其中,一位 Meta 研究員 Tim Dettmers 提到,Meta 的法律部門(mén)律師曾表示,如果使用這些書(shū)籍訓(xùn)練 AI 模型,可能會(huì)存在法律問(wèn)題。律師稱(chēng),這些數(shù)據(jù)無(wú)法使用,如果使用了的話(huà),模型也無(wú)法發(fā)布。

今年,多家科技公司都面臨著內(nèi)容創(chuàng)作者的類(lèi)似指控,他們指責(zé)這些公司在構(gòu)建生成式 AI 模型時(shí)侵犯了作品版權(quán)。

如果這些訴訟成功,可能會(huì)給生成式 AI 的發(fā)展帶來(lái)不利影響,因?yàn)檫@可能會(huì)增加構(gòu)建 AI 模型的成本,迫使 AI 公司向藝術(shù)家、作者和其他內(nèi)容創(chuàng)作者支付使用其作品的費(fèi)用。

與此同時(shí),歐盟關(guān)于人工智能的新臨時(shí)規(guī)則可能會(huì)迫使公司披露其用于訓(xùn)練模型的數(shù)據(jù),這可能會(huì)使他們面臨更大的法律風(fēng)險(xiǎn)。

Meta 于今年 2 月發(fā)布了其第一版 Llama 大型語(yǔ)言模型,并公布了用于訓(xùn)練的數(shù)據(jù)集列表,其中包括“ThePile”數(shù)據(jù)集的“Books3”部分。根據(jù)訴訟文件,該數(shù)據(jù)集的創(chuàng)建者曾表示,其中包含 196,640 本書(shū)籍。該公司沒(méi)有披露其最新版模型 Llama 2 的訓(xùn)練數(shù)據(jù),該模型于今年夏天面向商業(yè)用戶(hù)開(kāi)放。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Meta人工智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知