IT之家 2 月 21 日消息,本周 Meta 在法庭文件中聲稱,盡管其從“影子圖書館”中下載了 82TB 的盜版版權(quán)資料用于訓(xùn)練其 LLaMA 人工智能模型,但公司員工已采取措施,確保在下載過程中未對任何文件進(jìn)行“種子分享(seeding)”。在文件共享術(shù)語中,“種子分享”指在下載文件時(或下載完成后)將文件共享給其他用戶。由于文件共享是基于點(diǎn)對點(diǎn)網(wǎng)絡(luò)系統(tǒng),每個下載文件的用戶都可以將文件的一部分上傳給其他用戶。
Meta 的律師表示,目前沒有任何事實(shí)表明 Meta 在下載過程中分享了原告的書籍。這意味著 Meta 的辯護(hù)策略主要依賴于目前缺乏證據(jù)證明其在下載過程中共享了相關(guān)資料。盡管 Meta 聲稱沒有證據(jù)表明其進(jìn)行了種子分享,但 Meta 負(fù)責(zé)項(xiàng)目管理的高管邁克爾?克拉克(Michael Clark)在證詞中提到,他們所使用的配置設(shè)置經(jīng)過調(diào)整,“以盡可能減少種子分享的發(fā)生”。然而,在被問及為何要減少種子分享時,克拉克以律師-客戶特權(quán)為由拒絕回答。
克拉克的聲明表明,Meta 確實(shí)試圖減少種子分享,但尚未提供證據(jù)表明其完全阻止了版權(quán)資料的共享。此外,Meta 研究員弗蘭克?張(Frank Zhang)的一條內(nèi)部消息可能暗示公司試圖掩蓋其服務(wù)器上可能的種子分享行為,以避免“追蹤種子分享者 / 下載者的風(fēng)險(xiǎn)”回到 Facebook 服務(wù)器。
Meta 的辯護(hù)似乎主要圍繞缺乏證據(jù)證明其在下載大量數(shù)據(jù)時進(jìn)行共享這一事實(shí)展開。如果 Meta 的辯護(hù)成功,證明下載版權(quán)內(nèi)容本身并不違法,而只有分發(fā)才是違法的,這可能會對未來的版權(quán)侵權(quán)和未經(jīng)授權(quán)的版權(quán)內(nèi)容分發(fā)案件產(chǎn)生深遠(yuǎn)影響。此外,Meta 將辯護(hù)重點(diǎn)放在種子分享上,可能是為了在法律上制造混淆,進(jìn)一步模糊其涉嫌明知違法仍下載受版權(quán)材料的指控。
Meta 尚未對是否知曉其在下載過程中共享數(shù)據(jù)的指控作出回應(yīng)。版權(quán)材料的作者聲稱,Meta 是“非法點(diǎn)對點(diǎn)盜版網(wǎng)絡(luò)的知情參與者”,并指責(zé) Meta“繞過合法獲取方式,參與非法點(diǎn)對點(diǎn)盜版網(wǎng)絡(luò)”。
IT之家注意到,類似的案件并不罕見。2023 年,OpenAI 曾被小說家起訴,而《紐約時報(bào)》也因“數(shù)百萬”篇新聞文章被抄襲而起訴 OpenAI 和微軟。隨著越來越多與大型語言模型相關(guān)的訴訟不斷涌現(xiàn),Meta 的這一案件可能只是冰山一角。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。