設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Copilot 要攤官司了,工作 20 年老程序員重新激活律師證,發(fā)起集體訴訟,還喊網(wǎng)友加入

量子位 2022/10/22 19:48:23 責(zé)編:遠(yuǎn)生

距離正式發(fā)布才剛 4 個(gè)月,GitHub Copilot 即將迎來一場(chǎng)集體訴訟!

發(fā)起人是一位干了 20 多年的程序員,來自美國(guó)的馬修?巴特里克(Matthew Butterick)。

他早在今年 6 月就“捶”了 Copilot 的開源許可證問題。

現(xiàn)在,馬修終于決定邁出實(shí)質(zhì)性的一步,在迅速激活自己的律師資格證后,和其他幾位律師一起合作“聲討”Copilot。

(這位老哥身兼數(shù)職,除了這倆身份還是設(shè)計(jì)師)

他在一篇專門的個(gè)人博客中細(xì)究了 Copilot 涉及的兩大法律問題,并指出 Copilot 不僅是“偷代碼”那么簡(jiǎn)單,還會(huì)對(duì)整個(gè)開源社區(qū)造成諸多不良影響:

或許你不介意它未經(jīng)許可就用了你的開源代碼,但如果它也將由此抹去你和開源社區(qū)之間的聯(lián)結(jié)呢?

(若不明白這句話具體何義,請(qǐng)接著往下看~)

目前,這篇博客已在推特上得到了不少關(guān)注和轉(zhuǎn)發(fā)。

相關(guān)消息還引爆了 Hacker News 社區(qū)。

Copilot 有哪些問題?

先給不熟悉的朋友簡(jiǎn)單介紹一下 Copilot。

它是內(nèi)嵌在 Visual Studio 等 IDE 中的一個(gè)代碼自動(dòng)補(bǔ)全工具,支持多種主流編程語言。

根據(jù)已寫的內(nèi)容,它可以給出后續(xù)代碼建議 —— 不過和我們見到的普通自動(dòng)補(bǔ)全功能不同,它可以生成諸如整個(gè)函數(shù)體這樣的大段代碼。

今年 6 月,Copilot 在經(jīng)過一年的免費(fèi)試用后正式轉(zhuǎn)為付費(fèi)工具,定價(jià)為 10 美元 / 月(人民幣約 67 元),年付則是 100 美元 / 年(人民幣約 669 元)。

它的到來,讓很多人都感嘆入門級(jí)別的程序員沒有用了。

不過問題也隨之而來。

Copilot 強(qiáng)大的編碼能力來自于一個(gè)叫做 Codex 的 AI,由 OpenAI 開發(fā)并授權(quán)給微軟。

Codex 是怎么訓(xùn)練的呢?

盡管微軟含糊其辭,表示它的訓(xùn)練源是數(shù)億行公共代碼;但 Copilot 的研究員還是道出了實(shí)情,都是出自于 Github 上的公共倉(cāng)庫。

好了,馬修要狀告 Copilot 的第一個(gè)問題,也就跟 Copilot 的訓(xùn)練過程有關(guān)。

馬修表示,微軟和 OpenAI 要想用 Github 上的開源倉(cāng)庫進(jìn)行訓(xùn)練,要么遵守它們的開源許可證協(xié)議,要么「合理使用」。

如果是前者,微軟和 OpenAI 應(yīng)該至少發(fā)布大量的 attri-bu-tion 來獲得許可,但是大家沒有看到。

他們將自己歸到了后者,如 GitHub 前 CEO Nat Fried-man 在 Copilot 的技術(shù)預(yù)覽會(huì)所說:

在公開數(shù)據(jù)上訓(xùn)練(機(jī)器學(xué)習(xí))系統(tǒng)屬于合理使用。

不過,軟件自由保護(hù)組織(Software Freedom Conservancy,SFC)不同意這一“空口無憑”的說辭,要求他們提供法律依據(jù)來支撐自己的立場(chǎng)。

但是遲遲沒有得到答案。

馬修表示,這就是因?yàn)槲④浐?OpenAI 給不出來啊。

第二個(gè)可能違法的問題,則是關(guān)于 Copilot 的使用。

馬修指出,微軟在面對(duì) Copilot 用戶時(shí)對(duì)自己進(jìn)行了免責(zé)。

微軟將 Copilot 給的代碼稱為“建議”,稱自己不從中主張任何權(quán)力,也不對(duì)它生成的代碼作任何關(guān)于正確性、安全性和產(chǎn)權(quán)相關(guān)的保證。

一旦你接受了 Copilot 給出的“建議”,如果出了問題都由你自己負(fù)責(zé)。

乍一聽還好,可是不止一人發(fā)現(xiàn) Copilot 一字不差地把原作者的代碼當(dāng)成“建議”丟給用戶,連注釋都一并奉送的那種。

這要是直接采納可就要涉及許可問題了,可是 Copilot 根本不會(huì)注明這些代碼的來源,又該讓用戶如何遵守協(xié)議呢?

以上,便是馬修要控訴的兩大問題。

除此之外,他還表達(dá)了對(duì)開源社區(qū)文化的擔(dān)憂。

他認(rèn)為,Copilot 的所作所為直接在程序員和開源社區(qū)之間砌起了一堵墻,讓程序員只管任意享用現(xiàn)成代碼,遠(yuǎn)離源代碼本身,失去與源項(xiàng)目的問題討論、bug 跟蹤等互動(dòng)和貢獻(xiàn)。

而這對(duì)開源社區(qū)將是一個(gè)永久的、痛苦的損失。

另一邊,對(duì)于“無故”奉獻(xiàn)了訓(xùn)練代碼的開源作者來說,他們儼然被當(dāng)作了資源的生產(chǎn)者。

馬修將這類人比喻成奶牛,由于 Copilot 對(duì)他們的項(xiàng)目沒有任何貢獻(xiàn),他表示這奶牛是只出奶卻不被提供食物和住所的奶牛。

因此,他也將 Copilot 的本質(zhì),比喻為寄生蟲。

此外,你可能聽聞?dòng)腥顺鲇趹嵟瓕⒆约旱拇a搬出了 GitHub。

馬修告訴大家:其實(shí)微軟通過聲稱訓(xùn)練 AI 是合理使用,正在搜索網(wǎng)上任何可以使用的公共代碼進(jìn)行訓(xùn)練。

可以說是“逃無可逃”。

于是在避免傷害變得無法彌補(bǔ)之前,馬修聲稱必須弄清 Copilot 的合法性。

他呼吁以下幾類人群加入他們的調(diào)查和訴訟隊(duì)列:

當(dāng)然在博客最后,馬修還是特別聲明:

我本身并不反對(duì) AI 輔助編程工具。

他提到,Copilot 本可以也很容易變得“友好”,比如讓作者自愿參與,或者有償征用。

質(zhì)疑聲從未停止

這次,看到有人帶頭牽起對(duì) Copilot 的集體訴訟,許多程序員以及計(jì)算機(jī)相關(guān)領(lǐng)域的大佬們紛紛表示:

“附議!”

消息出來之后,德克薩斯 A&M 大學(xué)的一位計(jì)算機(jī)科學(xué)教授,并兼任 ACM、IEEE 和 SIAM 會(huì)員的 Tim Davis 順勢(shì)發(fā)推分享了自己的“遭遇”:

Copilot 沒有拿到 LGPL 許可證(函數(shù)庫公共許可證),就擅自發(fā)出了大段我的版權(quán)代碼。

并附上了證據(jù):

 左為 Copilot 給出的代碼,右為他自己的代碼

有網(wǎng)友表示:

Copilot 的這種行為屬于是完全不尊重開源社區(qū)。

還有網(wǎng)友犀利地指出,在模型訓(xùn)練過程中,所謂的 AI“學(xué)習(xí)”,本身就是一種被勉強(qiáng)挪用過來的概念:

因?yàn)閾?jù)現(xiàn)有法律,人類閱覽受版權(quán)保護(hù)的資料用于自己學(xué)習(xí),是合法的;然后各大科技公司說,AI 也會(huì)“學(xué)習(xí)”,所以 AI 也沒有違反版權(quán)法。

但是 AI 并不像人類那樣自主(盡管很多公司稱 AI 很自主),這些模型其實(shí)都被背后的組織或公司等操控著,所以用“學(xué)習(xí)”來描述 AI 做的事并不太準(zhǔn)確。

而且真人其實(shí)也經(jīng)常出現(xiàn)會(huì)違反版權(quán)法等問題……

所以,要定義 AI 在“學(xué)習(xí)”過程中到底是否“抄襲”了,以及存在具體哪種侵權(quán)行為,是一個(gè)非常棘手的問題,還需要更多的討論和明確規(guī)定。

誠(chéng)然,Copilot 從去年的內(nèi)測(cè)階段起,其出色的編程能力確實(shí)驚艷了不少人。

而且這個(gè) AI 后來還學(xué)會(huì)了“反向輸出”:

用“人話”來講解某一段代碼有什么用,幫助屏幕前的人看懂代碼。

但另一方面,不只現(xiàn)在,其實(shí)從 Copilot 剛出來開始,一直就有眾多質(zhì)疑和反對(duì)的聲音,核心都不外乎馬修在前文舉證的那兩點(diǎn)。(即這個(gè) AI 的訓(xùn)練和使用)

也正如前文所說,除了個(gè)人,還有 SFC 等組織也在聲討 Copilot。

而在今年 6 月份,GitHub 宣布 Copilot 結(jié)束內(nèi)測(cè),開啟收費(fèi)模式后,更是將大家的不滿情緒拔到了最高點(diǎn)。

除了免費(fèi)引流再收費(fèi)的商業(yè)模式讓人反感外,大家一致認(rèn)為這的 AI 用開發(fā)者寫的代碼來訓(xùn)練,不應(yīng)該回過頭向再開發(fā)者收費(fèi):

每一個(gè)曾向 GitHub 提交過代碼的人都應(yīng)免費(fèi)使用!

于是,Copilot 正式版立刻遭到了抵制 ——

SFC 不僅自己要退出 GitHub,而且還號(hào)召其他軟件開發(fā)商同樣照做。

在 VS Code 插件市場(chǎng)上,Copilot 原本一直是 5 星好評(píng),也一下子涌入了不少一星差評(píng)。

One More Thing

本次事件還讓人把目光延伸到了 AI 繪畫領(lǐng)域,有網(wǎng)友認(rèn)為:

這種工具同樣也涉及侵權(quán)等問題。

最后,對(duì)于“大伙兒現(xiàn)在聯(lián)合把 Copilot 告上法庭”這件事,你覺得贏的勝算大嗎?

參考鏈接:

  • [1]https://githubcopilotinvestigation.com/

  • [2]https://twitter.com/DocSparse/status/1581461734665367554

  • [3]https://news.ycombinator.com/item?id=33240341

本文來自微信公眾號(hào):量子位 (ID:QbitAI),作者:豐色、Alex

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:GitHub

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知