首頁 > IT資訊>業(yè)界

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

極客公園 2024/7/6 14:42:04 責(zé)編：夢澤

評論：

蒼蠅再小也是肉，聚沙成塔。

作者 | 芯芯

編輯 | 靖宇

你知道嗎，自己的數(shù)據(jù)，現(xiàn)在已經(jīng)開始合法地被互聯(lián)網(wǎng)大廠們用作 AI 訓(xùn)練了。

在新一波的 AI 競賽中，由于訓(xùn)練模型需要大量數(shù)據(jù)，當(dāng)互聯(lián)網(wǎng)的普通數(shù)據(jù)挖掘殆盡，平臺上大量用戶個人內(nèi)容，便成了充滿誘惑的礦藏。

一些硅谷的科技公司如此渴望新數(shù)據(jù)，開始偷偷摸摸把 AI 訓(xùn)練加入到數(shù)據(jù)使用政策中，賦予自己使用人們數(shù)據(jù)的權(quán)利。

在過去一年多里，包括谷歌、Meta、Adobe、Zoom 和 X 等大公司紛紛更新其服務(wù)條款或隱私政策，允許自己利用用戶數(shù)據(jù)來訓(xùn)練生成式 AI 模型。

這些互聯(lián)網(wǎng)大廠，都偷偷在「服務(wù)條款」里塞進(jìn)了什么貨？

01、硅谷巨頭的「小動作」

隨著科技巨頭對數(shù)據(jù)的渴望越來越大，它們正在仔細(xì)重寫其條款和條件，以包含「人工智能」、「機(jī)器學(xué)習(xí)」和「生成式人工智能」等詞語。

為了避免用戶對隱私問題的反感，公司有時悄悄地進(jìn)行這些更改。在許多情況下，用戶會在未閱讀一字的情況下點(diǎn)擊同意，毫無警覺地接受協(xié)議。

下面是硅谷大廠們在用戶服務(wù)條款中各自「夾帶私貨」的細(xì)節(jié)：

谷歌

在 2022 年末，當(dāng) OpenAI 發(fā)布了 ChatGPT 并引發(fā)了全行業(yè)的追趕競賽后，谷歌的研究人員和工程師開始討論如何利用其他用戶數(shù)據(jù)。數(shù)十億字的內(nèi)容存儲在人們的 Google 文檔和其他免費(fèi) Google 應(yīng)用中，但是公司的隱私政策限制了他們?nèi)绾问褂眠@些數(shù)據(jù)。

當(dāng)時，谷歌的隱私政策規(guī)定公司只能使用公開可用信息來「幫助訓(xùn)練谷歌的語言模型和構(gòu)建像 Google 翻譯這樣的功能」。

去年 6 月，據(jù)紐約時報(bào)報(bào)道，谷歌的法律部門要求隱私團(tuán)隊(duì)起草語言，以擴(kuò)展公司可以使用消費(fèi)者數(shù)據(jù)的范圍。

去年 7 月，谷歌對其隱私政策進(jìn)行了修改，增加了公共信息可用于訓(xùn)練其 AI 聊天機(jī)器人和其他服務(wù)的內(nèi)容。

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

谷歌將 Bard 和云端 AI 加入到用戶條款中｜NYT

「我們使用公開可用的信息來幫助訓(xùn)練谷歌的 AI 模型，并構(gòu)建諸如谷歌翻譯、Bard 和云 AI 功能等產(chǎn)品和功能。」

為了安撫用戶，谷歌聲明稱，其隱私政策的變更「只是澄清了像 Bard（現(xiàn)為 Gemini）這樣的新服務(wù)也包括在內(nèi)。我們并沒有因?yàn)檫@種語言變化而開始在其他類型的數(shù)據(jù)上訓(xùn)練模型?！?/p>

谷歌的 AI 訓(xùn)練當(dāng)然也有用最私人化的數(shù)據(jù)，如給朋友和家人的信息。谷歌發(fā)言人表示，在得到一小群用戶許可的情況下，谷歌被允許在某些方面使用他們的個人電子郵件訓(xùn)練其人工智能。

X

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

X 在條款后方補(bǔ)了一句對于人工智能模型訓(xùn)練的事項(xiàng)｜NYT

馬斯克一直在構(gòu)建一個 AI 項(xiàng)目。去年 9 月，X 在其隱私政策中添加了一句話，關(guān)于機(jī)器學(xué)習(xí)和人工智能。

「我們使用收集到的信息來提供和運(yùn)營 X 產(chǎn)品和服務(wù)。我們還使用收集到的信息來改進(jìn)和個性化我們的產(chǎn)品和服務(wù)，以便您在 X 上獲得更好的體驗(yàn)，包括向您展示更相關(guān)的內(nèi)容和廣告、建議您關(guān)注的人和主題、啟用和幫助您發(fā)現(xiàn)關(guān)聯(lián)公司、第三方應(yīng)用和服務(wù)。我們可能會使用收集到的信息和公開可用的信息來幫助訓(xùn)練我們的機(jī)器學(xué)習(xí)或人工智能模型，以實(shí)現(xiàn)本政策中概述的目的?！?/p>

Snap

Snap 有些服務(wù)條款的變更只有幾個字。另一些則新增了整段內(nèi)容來解釋生成式人工智能模型的工作原理，以及它們對用戶數(shù)據(jù)的訪問類型。

例如，今年，Snap 更新了其聊天機(jī)器人 My AI 的數(shù)據(jù)收集的隱私政策。Snap 提醒用戶不要與其人工智能聊天機(jī)器人分享機(jī)密信息，因?yàn)檫@些信息將用于訓(xùn)練。

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

Snap 對于 My AI 聊天機(jī)器人的條款改動較多｜NYT

「My AI 是一個基于生成式 AI 技術(shù)構(gòu)建的聊天機(jī)器人，設(shè)計(jì)理念確保安全。生成式 AI 是一種正在開發(fā)的技術(shù)，它可能會提供有偏見、不正確、有害或誤導(dǎo)性的答案。所以，你不應(yīng)該依賴它的建議。您也不應(yīng)該分享任何機(jī)密或敏感信息 —— 如果您這樣做，My AI 會使用它?！?/p>

「當(dāng)您與 My AI 互動時，我們會使用您分享的內(nèi)容和您的位置（如果您已啟用 Snapchat 的位置共享）以改進(jìn) Snap 的產(chǎn)品，包括增強(qiáng) My AI 的安全性，并個性化您的體驗(yàn)，包括廣告?！?/p>

Zoom

Zoom 去年 7 月開始更新其服務(wù)條款，說明會將用戶數(shù)據(jù)用于訓(xùn)練 AI，但遭遇用戶和隱私提倡者的大量批評。在面臨社交媒體上的強(qiáng)烈反對聲音后，Zoom 去年 8 月又再次更新了服務(wù)條款，澄清未經(jīng)同意不會使用視頻、音頻或聊天內(nèi)容。

更新后的服務(wù)條款仍然要求用戶「在此授予 Zoom 永久性、全球性的、非獨(dú)占性的、免版稅的、可轉(zhuǎn)許可和可轉(zhuǎn)讓的許可及所有其他權(quán)利」使用客戶內(nèi)容。

這些權(quán)利包括「重新分發(fā)、發(fā)布、導(dǎo)入、訪問、使用、存儲、傳輸、審查、披露、保存、提取、修改、復(fù)制、共享、展示、復(fù)制、分發(fā)、翻譯、轉(zhuǎn)錄、創(chuàng)作衍生作品和處理」客戶內(nèi)容。

條款不再具體提及 Zoom 有權(quán)就客戶內(nèi)容進(jìn)行「AI 和 ML 訓(xùn)練」，而是更模糊地提到「服務(wù)開發(fā)、營銷、分析、質(zhì)量保證、機(jī)器學(xué)習(xí)、人工智能、培訓(xùn)、測試、服務(wù)、軟件或 Zoom 其他產(chǎn)品、服務(wù)和軟件的改進(jìn)，或以上任何組合?！?/p>

Adobe

今年 6 月初，Adobe 因在其隱私政策中加入了一句關(guān)于自動化的短語，激怒了不少創(chuàng)作者，許多用戶將其解讀為與 AI 數(shù)據(jù)抓取有關(guān)。

「我們訪問您的內(nèi)容：我們可能會通過自動和手動方法訪問、查看或聆聽您的內(nèi)容，但僅在有限的方式下，并且僅在法律允許的情況下。」

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

Adobe 公司的用戶對于數(shù)據(jù)被拿來用 AI 訓(xùn)練比較敏感｜NYT

這些條款影響了 Adobe 創(chuàng)意云套件的超過 2000 萬用戶，一些用戶認(rèn)為這允許 Adobe 訪問、查看他們的內(nèi)容，包括受保密協(xié)議保護(hù)的作品。一些人認(rèn)為 Adobe 正在監(jiān)視他們的工作，吸收用戶的藝術(shù)作品，并可能將其用于訓(xùn)練 AI 模型。

在用戶強(qiáng)烈反對后，Adobe 更新了服務(wù)條款，明確表示不會使用客戶作品訓(xùn)練 AI。

Adobe 通過博客文章澄清，這些變更是為了檢測和刪除非法內(nèi)容，例如兒童色情材料（CSAM），以及濫用內(nèi)容或行為，包括垃圾郵件和網(wǎng)絡(luò)釣魚。Adobe 不會使用存儲在 Adobe 云上的文件來訓(xùn)練其 Firefly AI。

02、提前占好「免責(zé)」的坑

不過，巨頭們的小動作，還是有監(jiān)管在看著的。

美國聯(lián)邦貿(mào)易委員會（FTC）長期以來一直盯著與公司隱私政策有關(guān)的欺騙性和不公平行為。過去曾起訴過那些以偷偷摸摸的方式更改隱私政策、破壞對消費(fèi)者的現(xiàn)有承諾的公司。

今年 2 月，美國聯(lián)邦貿(mào)易委員會警告科技公司，改變隱私政策以追溯性地抓取舊數(shù)據(jù)可能是不公平或欺騙性的，將追究「悄悄」更改隱私政策以挖掘用戶數(shù)據(jù)用于 AI 的公司。

FTC 指出，公司可能會被誘惑從其用戶群中挖掘現(xiàn)有數(shù)據(jù)以供 AI 模型使用，有「強(qiáng)大的商業(yè)動機(jī)」。FTC 稱公司潛在的困境是利益沖突?！甘袌鰠⑴c者應(yīng)注意，任何背棄其用戶隱私承諾的公司都可能觸犯法律?！?/p>

不過，就在上周，微軟 AI CEO Mustafa Suleyman 公開稱互聯(lián)網(wǎng)的公開內(nèi)容可以被免費(fèi)拿來訓(xùn)練 AI，如此直白的發(fā)言引起了強(qiáng)勢的輿論反彈。

從硅谷巨頭們在用戶使用條款中的改動可以看出，各家確實(shí)都在利用產(chǎn)品優(yōu)勢，將用戶數(shù)據(jù)用于 AI 訓(xùn)練之中。不過，具體哪些數(shù)據(jù)會拿來訓(xùn)練，哪些不能，行業(yè)內(nèi)仍未達(dá)成一個共識 —— 一項(xiàng)技術(shù)出現(xiàn)的早期，肯定會出現(xiàn)這種規(guī)則缺乏的「狂野西部」的階段。

而上述被動作手腳的使用條款，無疑是巨頭們?yōu)橹竺庳?zé)提前占的坑。不出意外的話，國內(nèi)一種大廠和 AI 公司，應(yīng)該也已經(jīng)在用戶條款中修改、添加了 AI 訓(xùn)練的內(nèi)容。

對于普通用戶而言，對于長達(dá)數(shù)十頁的用戶使用條款，99% 都會直接無視。但是，如果這個產(chǎn)品，能通過有限的數(shù)據(jù)復(fù)制出一個「你」的時候，用戶是不是該更謹(jǐn)慎一些？

本文來自微信公眾號：極客公園（ID：geekpark），作者：芯芯

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

01、硅谷巨頭的「小動作」

谷歌

Meta

X

Snap

Zoom

Adobe

02、提前占好「免責(zé)」的坑

相關(guān)文章

互聯(lián)網(wǎng)巨頭，如何合法地「偷」你的數(shù)據(jù)訓(xùn)練 AI

01、硅谷巨頭的「小動作」

02、提前占好「免責(zé)」的坑