設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

索賠 30 億,OpenAI 因版權(quán)被多方狀告,作家集體起訴,抗議 ChatGPT 訓(xùn)練侵權(quán)

新智元 2023/7/11 12:44:12 責(zé)編:夢(mèng)澤

OpenAI 深陷集體訴訟 + 作家個(gè)人起訴,版權(quán)問題究竟何解?

最近,OpenAI 又?jǐn)偵鲜铝恕?/p>

之前 Sam Altman 在國會(huì)山舌戰(zhàn)參議員,幫 OpenAI 搞定了監(jiān)管層。

但俗話說得好,閻王好見,小鬼難纏。

沒想到 OpenAI 最近卻被美國的律所和作家們給盯上了。

最近紛紛跳出來起訴 OpenAI,要求數(shù)額不菲的賠償金。

起訴理由是,訓(xùn)練數(shù)據(jù)侵權(quán)。

律所提起集體訴訟

6 月 28 號(hào),位于北加州的 Clarkson 律所對(duì) OpenAI 提起了集體訴訟。

指控 OpenAI 在訓(xùn)練大模型時(shí)從網(wǎng)上抓取的數(shù)據(jù),嚴(yán)重侵犯了 16 名原告的著作權(quán)和隱私,要求賠償 30 億美金。

克拉克森訴訟的核心主張是 OpenAI 的整個(gè)商業(yè)模式都是基于盜竊。

律所合伙人克拉克森 (Ryan Clarkson) 表示:

「律所代表那些信息被竊取,用來創(chuàng)造了這項(xiàng)強(qiáng)大技術(shù)的真實(shí)存在的普通人主張自己的合法權(quán)利?!?/p>

該訴訟特別指控該 OpenAI:

「在未經(jīng)知情同意或不知情的情況下,使用從數(shù)億互聯(lián)網(wǎng)用戶(包括各個(gè)年齡段的兒童)竊取的私人信息(包括個(gè)人身份信息)來創(chuàng)建其產(chǎn)品。」

律師主導(dǎo)的集體訴訟制度

要看懂這個(gè)事情的來龍去脈,必須稍微了解一下美國的集體訴訟制度。

簡單來說,大部分的訴訟,原告的個(gè)數(shù)是有限而且明確的,而集體訴訟,是一大群人提起的訴訟。

集體訴訟制度是因?yàn)槟硞€(gè)事件的受害人太多,而且往往單個(gè)受害人的受到的損害太小,不適合單獨(dú)起訴,所以就可以由原告組成集體,集體起訴被告。

比較典型的是環(huán)保類的案件,比如某個(gè)公司排污影響了周圍的居民,居民集體起訴公司。

或者是某個(gè)大公司的制度侵犯了很多員工的權(quán)益。

但是集體訴訟和普通訴訟有一個(gè)很大的不同之處在于,發(fā)起者往往不是原告人,而是代理律師。

因?yàn)樵诩w訴訟中,代理律師會(huì)要求很高的代理費(fèi),可能會(huì)超過賠償額的 50%,有個(gè)別夸張的案件甚至?xí)_(dá)到 80%。

而原告方,很多時(shí)候是被發(fā)起訴訟的律師主動(dòng)找上家門,簽個(gè)字同意律師代理,如果打贏了,能拿到一些賠償金。

如果官司打輸了,大部分情況下就不需要出律師費(fèi)。

律師在獲得了一大批原告的授權(quán)之后,就以「原告集體」的名義向法院提起訴訟,要求被告賠償。

因?yàn)樵鏀?shù)量比較多,如果官司打贏了,獲得的總體賠償額往往會(huì)比較多。

而律師因?yàn)樵谶@類案件中占有主導(dǎo)地位,會(huì)有很高的律師費(fèi)抽成比例,往往會(huì)比受害者獲得更多的經(jīng)濟(jì)利益。

比如蘋果公司前不久,就因?yàn)橄掳鄬?duì)員工搜包檢查的制度,最后在集體訴訟中和員工達(dá)成和解,向員工支付了 3050 萬美元,平均每個(gè)員工能獲得 1328 美元的賠償。

但是卻要向律師支付 900 萬美元左右的律師費(fèi)。

而律師或者律所本身,也會(huì)因?yàn)榧w訴訟案件廣泛的影響力,在業(yè)界獲得更高的名聲。

Clarkson 律師事務(wù)所

某種程度上,很多美國集體訴訟案件真正的「原告」,往往是能獲得更多經(jīng)濟(jì)收入的律師,而非真實(shí)的受害「原告」。

而這起針對(duì) OpenAI 的集體訴訟,代理律所 Clarkson LLP,就是一家成立于 2014 年,幾乎只從事集體訴訟業(yè)務(wù)的律所。

相較美國很多有幾十上百年歷史的律所,克拉克森可謂是一家嬰兒律所。

但是最近幾年卻打贏了不少針對(duì)食品,藥品制造商的集體訴訟案件。

這次對(duì)于 OpenAI 的起訴也是由律所的冠名合伙人 Ryan Clarkson 本人親自辦理。

現(xiàn)在他們律所網(wǎng)站,已經(jīng)把自己起訴 OpenAI 的信息置頂了。

網(wǎng)站瀏覽者隨時(shí)隨地都可以看到這條信息。

看得出來,這次他們是要「All in OpenAI」,打響「大模型侵權(quán)案件的第一槍」。

無法可依,結(jié)局難料

美國對(duì)于大模型訓(xùn)練數(shù)據(jù)的立法還沒有通過。

而在國會(huì)立法程序給出明確規(guī)定之前,法官很有可能會(huì)參考已經(jīng)有的隱私權(quán)和著作權(quán)的案例,在這個(gè)案件中做出對(duì)原告有利的認(rèn)定。

在沒有明確法律規(guī)則的背景之下,案件很有可能會(huì)朝著不利于 OpenAI 的方向發(fā)展。

只要這家律所不是無理取鬧,而 OpenAI 又急于擺脫類似的訴訟麻煩。

這個(gè)案子很有可能會(huì)像大多數(shù)的集體訴訟案件一樣,以和解結(jié)束。

原告和律師很有可能獲得一筆數(shù)額不菲的和解金。

原告律所也會(huì)因?yàn)榇磉@個(gè)可能具有劃時(shí)代意義的案件而繼續(xù)鞏固自己在業(yè)界的地位。

而后續(xù),OpenAI 和其他大模型提供商可能都會(huì)面對(duì)更多類似的法律訴訟。

直到有相關(guān)的法律出臺(tái),明確訓(xùn)練數(shù)據(jù)方面的具體規(guī)則。

更多訴訟事件

而除了上面提到的律所集體訴訟,個(gè)人因?yàn)楸磺謾?quán)而直接起訴 OpenAI 的例子也不少。

而這樣的案件,主要是由對(duì)書籍享有著作權(quán)的作家提起的。

最近,兩位曾獲過獎(jiǎng)的作者就起訴了 OpenAI,指控他們?cè)谖唇?jīng)同意的情況下使用他們出版的書籍來訓(xùn)練 ChatGPT,違反了版權(quán)法。

該訴訟于 6 月底提起,兩位作家表示,ChatGPT 的底層 LLM 直接拿來就用了原告作者 Mona Awad 和 Paul Tremblay 的受版權(quán)保護(hù)的作品。

他們認(rèn)為,ChatGPT 能夠生成其作品的詳細(xì)摘要,這就表明他們的書籍肯定已經(jīng)包含在了用于訓(xùn)練的數(shù)據(jù)集中。

美國一所大學(xué)的法學(xué)教授 Daniel Gervais 在接受 Insider 采訪時(shí)表示,作家的訴訟是全國范圍內(nèi)針對(duì)生成式 AI 的少數(shù)版權(quán)案件之一。

「這絕對(duì)不會(huì)是最后一次?!?/p>

Gervais 預(yù)計(jì),隨著這些 AI 在復(fù)制作家和藝術(shù)家風(fēng)格方面的能力不斷得到發(fā)展和改進(jìn),更多的作者將加入起訴開發(fā) LLM 和 AI 公司的行列。

他認(rèn)為,全國范圍內(nèi),針對(duì) ChatGPT 等生成式 AI 工具的一大波法律挑戰(zhàn)即將到來。

投訴中寫道,想要證明該案的作者因 OpenAI 的數(shù)據(jù)收集行為而遭受了金錢損失這一點(diǎn),可能具有一定的挑戰(zhàn)性。

Gervais 告訴 Insider,ChatGPT 也可能從作者以外的其他來源收集了 Awad 和 Tremblay 的作品。

Sussex 大學(xué) AI 和版權(quán)專家 Andres Guadamuz 也表達(dá)了這種擔(dān)憂。

他告訴 Insider,即使這些書籍在 OpenAI 的訓(xùn)練數(shù)據(jù)集里,OpenAI 其實(shí)也可以是通過合法途徑來得到這些作品的。

美國作家協(xié)會(huì)是一個(gè)支持作家工作權(quán)利的倡導(dǎo)組織,上周他們發(fā)表了一封公開信,呼吁大型科技和 AI 公司的 CEO 能去獲得「作家的許可」,再使用他們的受版權(quán)保護(hù)的作品來訓(xùn)練 LLM。

同時(shí),應(yīng)該「公平地補(bǔ)償作家」。

截止目前,這封公開信已經(jīng)獲得了超過 2000 個(gè)簽名。

目前,Awad 和 Tremblay 正在尋求損失賠償。

在訴訟中還包含了 ChatGPT 創(chuàng)作的 Awad 的小說:「看待胖女孩的 13 種方式」(13 Ways of Looking at a Fat Girl) 和「兔子」(Bunny) 的摘要,以及 Tremblay 的「世界盡頭的小屋」(The Cabin at the End of the World).

OpenAI 和 Awad、Tremblay 都沒有回應(yīng) Insider 的置評(píng)請(qǐng)求。

無獨(dú)有偶,喜劇演員兼作家 Sarah Silverman,以及作家 Christopher Golden、Richard Kadrey 也在美國地方法院上訴了,他們分別起訴的是 OpenAI 和 Meta ,同樣指控其侵犯版權(quán)。

這些訴訟稱,OpenAI 的 ChatGPT 和 Meta 的 LLaMA 都有用非法獲取的數(shù)據(jù)集進(jìn)行訓(xùn)練的行為,而這些數(shù)據(jù)集中就包含他們的作品。

他們表示,這些數(shù)據(jù)集是從 Bibliotik、Library Genesis、Z-Library 等網(wǎng)站獲取的,并指出這些書可以批量獲取。

在針對(duì) OpenAI 的訴訟中,三人提供的證據(jù)表明,當(dāng)出現(xiàn)相關(guān)的 prompt 時(shí),ChatGPT 會(huì)總結(jié)他們的書籍,他們認(rèn)為,這是對(duì)他們作品版權(quán)的侵犯。

Silverman 的「Bedwetter」是 ChatGPT 在展品中展示的第一本書,而 Golden 的書「Ararat」和 Kadrey 的「Sandman Slim」也被用作了示例。

至于針對(duì) Meta 的單獨(dú)訴訟,情況也差不多。Meta 用于訓(xùn)練 LLaMA 模型的數(shù)據(jù)集中也能訪問該作者的書籍。

而在該投訴,詳細(xì)的分步闡述了原告為何認(rèn)為這些數(shù)據(jù)集的來源是非法的 —— 在一篇有關(guān) LLaMA 的論文中,Meta 指出了其訓(xùn)練數(shù)據(jù)集的來源,其中一個(gè)名為「ThePile」。

訴狀指出,EleutherAI 的一篇論文將「ThePile」描述為由 Bibliotik 內(nèi)容的副本拼湊而成的,而 Bibliotik 本身就不合法。

在這兩項(xiàng)聲明中,參與的作者均表示,他們不同意 AI 公司使用其受版權(quán)保護(hù)的書籍作為 LLM 的訓(xùn)練內(nèi)容。

他們的訴訟均包含六項(xiàng)不同類型的侵犯版權(quán)、疏忽、不當(dāng)?shù)美筒徽?dāng)競(jìng)爭罪名。

目前,這些作者也正在尋求法定損失賠償、利潤歸還等。

除了書圈,Getty Images 還提起了一項(xiàng)訴訟,指控創(chuàng)建 Stable Diffusion 的 Stability AI 在「數(shù)百萬張受版權(quán)保護(hù)的圖像」上訓(xùn)練其模型。

相關(guān)各方均未作出回應(yīng)。

參考資料:

  • https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/

  • https://www.businessinsider.com/openai-copyright-lawsuit-authors-chatgpt-trained-on-books-2023-7

  • https://www.theverge.com/2023/7/9/23788741/sarah-silverman-openai-meta-chatgpt-llama-copyright-infringement-chatbots-artificial-intelligence-a

本文來自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,OpenAI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知