蒼蠅再小也是肉,聚沙成塔。
作者 | 芯芯
編輯 | 靖宇
你知道嗎,自己的數(shù)據(jù),現(xiàn)在已經(jīng)開始合法地被互聯(lián)網(wǎng)大廠們用作 AI 訓(xùn)練了。
在新一波的 AI 競賽中,由于訓(xùn)練模型需要大量數(shù)據(jù),當(dāng)互聯(lián)網(wǎng)的普通數(shù)據(jù)挖掘殆盡,平臺上大量用戶個人內(nèi)容,便成了充滿誘惑的礦藏。
一些硅谷的科技公司如此渴望新數(shù)據(jù),開始偷偷摸摸把 AI 訓(xùn)練加入到數(shù)據(jù)使用政策中,賦予自己使用人們數(shù)據(jù)的權(quán)利。
在過去一年多里,包括谷歌、Meta、Adobe、Zoom 和 X 等大公司紛紛更新其服務(wù)條款或隱私政策,允許自己利用用戶數(shù)據(jù)來訓(xùn)練生成式 AI 模型。
這些互聯(lián)網(wǎng)大廠,都偷偷在「服務(wù)條款」里塞進(jìn)了什么貨?
01、硅谷巨頭的「小動作」
隨著科技巨頭對數(shù)據(jù)的渴望越來越大,它們正在仔細(xì)重寫其條款和條件,以包含「人工智能」、「機(jī)器學(xué)習(xí)」和「生成式人工智能」等詞語。
為了避免用戶對隱私問題的反感,公司有時悄悄地進(jìn)行這些更改。在許多情況下,用戶會在未閱讀一字的情況下點(diǎn)擊同意,毫無警覺地接受協(xié)議。
下面是硅谷大廠們在用戶服務(wù)條款中各自「夾帶私貨」的細(xì)節(jié):
谷歌
在 2022 年末,當(dāng) OpenAI 發(fā)布了 ChatGPT 并引發(fā)了全行業(yè)的追趕競賽后,谷歌的研究人員和工程師開始討論如何利用其他用戶數(shù)據(jù)。數(shù)十億字的內(nèi)容存儲在人們的 Google 文檔和其他免費(fèi) Google 應(yīng)用中,但是公司的隱私政策限制了他們?nèi)绾问褂眠@些數(shù)據(jù)。
當(dāng)時,谷歌的隱私政策規(guī)定公司只能使用公開可用信息來「幫助訓(xùn)練谷歌的語言模型和構(gòu)建像 Google 翻譯這樣的功能」。
去年 6 月,據(jù)紐約時報(bào)報(bào)道,谷歌的法律部門要求隱私團(tuán)隊(duì)起草語言,以擴(kuò)展公司可以使用消費(fèi)者數(shù)據(jù)的范圍。
去年 7 月,谷歌對其隱私政策進(jìn)行了修改,增加了公共信息可用于訓(xùn)練其 AI 聊天機(jī)器人和其他服務(wù)的內(nèi)容。
「我們使用公開可用的信息來幫助訓(xùn)練谷歌的 AI 模型,并構(gòu)建諸如谷歌翻譯、Bard 和云 AI 功能等產(chǎn)品和功能。」
為了安撫用戶,谷歌聲明稱,其隱私政策的變更「只是澄清了像 Bard(現(xiàn)為 Gemini)這樣的新服務(wù)也包括在內(nèi)。我們并沒有因?yàn)檫@種語言變化而開始在其他類型的數(shù)據(jù)上訓(xùn)練模型?!?/p>
谷歌的 AI 訓(xùn)練當(dāng)然也有用最私人化的數(shù)據(jù),如給朋友和家人的信息。谷歌發(fā)言人表示,在得到一小群用戶許可的情況下,谷歌被允許在某些方面使用他們的個人電子郵件訓(xùn)練其人工智能。
Meta
去年 Meta 就更新了相關(guān)隱私政策,用戶「在我們的產(chǎn)品和服務(wù)上提供的活動和信息」將被用來訓(xùn)練其 AI,包括在使用像其 AI 工具時所寫或所說的一切。
Meta 表示,其 AI 不會讀取用戶在 Messenger 和 WhatsApp 等應(yīng)用上與朋友和家人之間發(fā)送的消息,除非用戶在消息中 @ 了其 AI 聊天機(jī)器人。Meta 將與 AI 互動的責(zé)任推給用戶,表示人們應(yīng)該「注意」他們在提示中所說的話,比如不要包括任何個人信息,如家庭地址或電話號碼。
Meta 聲明表示:「我發(fā)送給生成式 AI 功能的信息會發(fā)生什么?AI 可能會保留并使用您在聊天中分享的信息,以提供更個性化的響應(yīng)或相關(guān)信息,我們可能會與可信賴的合作伙伴(如搜索提供商)共享您提出的某些問題,以提供更相關(guān)、準(zhǔn)確和最新的響應(yīng)?!?/p>
「使用公開可用的信息訓(xùn)練人工智能模型是整個行業(yè)的慣例,并非我們服務(wù)獨(dú)有?!筂eta 發(fā)言人在聲明中說。
X
馬斯克一直在構(gòu)建一個 AI 項(xiàng)目。去年 9 月,X 在其隱私政策中添加了一句話,關(guān)于機(jī)器學(xué)習(xí)和人工智能。
「我們使用收集到的信息來提供和運(yùn)營 X 產(chǎn)品和服務(wù)。我們還使用收集到的信息來改進(jìn)和個性化我們的產(chǎn)品和服務(wù),以便您在 X 上獲得更好的體驗(yàn),包括向您展示更相關(guān)的內(nèi)容和廣告、建議您關(guān)注的人和主題、啟用和幫助您發(fā)現(xiàn)關(guān)聯(lián)公司、第三方應(yīng)用和服務(wù)。我們可能會使用收集到的信息和公開可用的信息來幫助訓(xùn)練我們的機(jī)器學(xué)習(xí)或人工智能模型,以實(shí)現(xiàn)本政策中概述的目的?!?/p>
Snap
Snap 有些服務(wù)條款的變更只有幾個字。另一些則新增了整段內(nèi)容來解釋生成式人工智能模型的工作原理,以及它們對用戶數(shù)據(jù)的訪問類型。
例如,今年,Snap 更新了其聊天機(jī)器人 My AI 的數(shù)據(jù)收集的隱私政策。Snap 提醒用戶不要與其人工智能聊天機(jī)器人分享機(jī)密信息,因?yàn)檫@些信息將用于訓(xùn)練。
「My AI 是一個基于生成式 AI 技術(shù)構(gòu)建的聊天機(jī)器人,設(shè)計(jì)理念確保安全。生成式 AI 是一種正在開發(fā)的技術(shù),它可能會提供有偏見、不正確、有害或誤導(dǎo)性的答案。所以,你不應(yīng)該依賴它的建議。您也不應(yīng)該分享任何機(jī)密或敏感信息 —— 如果您這樣做,My AI 會使用它?!?/p>
「當(dāng)您與 My AI 互動時,我們會使用您分享的內(nèi)容和您的位置(如果您已啟用 Snapchat 的位置共享)以改進(jìn) Snap 的產(chǎn)品,包括增強(qiáng) My AI 的安全性,并個性化您的體驗(yàn),包括廣告?!?/p>
Zoom
Zoom 去年 7 月開始更新其服務(wù)條款,說明會將用戶數(shù)據(jù)用于訓(xùn)練 AI,但遭遇用戶和隱私提倡者的大量批評。在面臨社交媒體上的強(qiáng)烈反對聲音后,Zoom 去年 8 月又再次更新了服務(wù)條款,澄清未經(jīng)同意不會使用視頻、音頻或聊天內(nèi)容。
更新后的服務(wù)條款仍然要求用戶「在此授予 Zoom 永久性、全球性的、非獨(dú)占性的、免版稅的、可轉(zhuǎn)許可和可轉(zhuǎn)讓的許可及所有其他權(quán)利」使用客戶內(nèi)容。
這些權(quán)利包括「重新分發(fā)、發(fā)布、導(dǎo)入、訪問、使用、存儲、傳輸、審查、披露、保存、提取、修改、復(fù)制、共享、展示、復(fù)制、分發(fā)、翻譯、轉(zhuǎn)錄、創(chuàng)作衍生作品和處理」客戶內(nèi)容。
條款不再具體提及 Zoom 有權(quán)就客戶內(nèi)容進(jìn)行「AI 和 ML 訓(xùn)練」,而是更模糊地提到「服務(wù)開發(fā)、營銷、分析、質(zhì)量保證、機(jī)器學(xué)習(xí)、人工智能、培訓(xùn)、測試、服務(wù)、軟件或 Zoom 其他產(chǎn)品、服務(wù)和軟件的改進(jìn),或以上任何組合?!?/p>
Adobe
今年 6 月初,Adobe 因在其隱私政策中加入了一句關(guān)于自動化的短語,激怒了不少創(chuàng)作者,許多用戶將其解讀為與 AI 數(shù)據(jù)抓取有關(guān)。
「我們訪問您的內(nèi)容:我們可能會通過自動和手動方法訪問、查看或聆聽您的內(nèi)容,但僅在有限的方式下,并且僅在法律允許的情況下。」
這些條款影響了 Adobe 創(chuàng)意云套件的超過 2000 萬用戶,一些用戶認(rèn)為這允許 Adobe 訪問、查看他們的內(nèi)容,包括受保密協(xié)議保護(hù)的作品。一些人認(rèn)為 Adobe 正在監(jiān)視他們的工作,吸收用戶的藝術(shù)作品,并可能將其用于訓(xùn)練 AI 模型。
在用戶強(qiáng)烈反對后,Adobe 更新了服務(wù)條款,明確表示不會使用客戶作品訓(xùn)練 AI。
Adobe 通過博客文章澄清,這些變更是為了檢測和刪除非法內(nèi)容,例如兒童色情材料(CSAM),以及濫用內(nèi)容或行為,包括垃圾郵件和網(wǎng)絡(luò)釣魚。Adobe 不會使用存儲在 Adobe 云上的文件來訓(xùn)練其 Firefly AI。
02、提前占好「免責(zé)」的坑
不過,巨頭們的小動作,還是有監(jiān)管在看著的。
美國聯(lián)邦貿(mào)易委員會(FTC)長期以來一直盯著與公司隱私政策有關(guān)的欺騙性和不公平行為。過去曾起訴過那些以偷偷摸摸的方式更改隱私政策、破壞對消費(fèi)者的現(xiàn)有承諾的公司。
今年 2 月,美國聯(lián)邦貿(mào)易委員會警告科技公司,改變隱私政策以追溯性地抓取舊數(shù)據(jù)可能是不公平或欺騙性的,將追究「悄悄」更改隱私政策以挖掘用戶數(shù)據(jù)用于 AI 的公司。
FTC 指出,公司可能會被誘惑從其用戶群中挖掘現(xiàn)有數(shù)據(jù)以供 AI 模型使用,有「強(qiáng)大的商業(yè)動機(jī)」。FTC 稱公司潛在的困境是利益沖突?!甘袌鰠⑴c者應(yīng)注意,任何背棄其用戶隱私承諾的公司都可能觸犯法律?!?/p>
不過,就在上周,微軟 AI CEO Mustafa Suleyman 公開稱互聯(lián)網(wǎng)的公開內(nèi)容可以被免費(fèi)拿來訓(xùn)練 AI,如此直白的發(fā)言引起了強(qiáng)勢的輿論反彈。
從硅谷巨頭們在用戶使用條款中的改動可以看出,各家確實(shí)都在利用產(chǎn)品優(yōu)勢,將用戶數(shù)據(jù)用于 AI 訓(xùn)練之中。不過,具體哪些數(shù)據(jù)會拿來訓(xùn)練,哪些不能,行業(yè)內(nèi)仍未達(dá)成一個共識 —— 一項(xiàng)技術(shù)出現(xiàn)的早期,肯定會出現(xiàn)這種規(guī)則缺乏的「狂野西部」的階段。
而上述被動作手腳的使用條款,無疑是巨頭們?yōu)橹竺庳?zé)提前占的坑。不出意外的話,國內(nèi)一種大廠和 AI 公司,應(yīng)該也已經(jīng)在用戶條款中修改、添加了 AI 訓(xùn)練的內(nèi)容。
對于普通用戶而言,對于長達(dá)數(shù)十頁的用戶使用條款,99% 都會直接無視。但是,如果這個產(chǎn)品,能通過有限的數(shù)據(jù)復(fù)制出一個「你」的時候,用戶是不是該更謹(jǐn)慎一些?
本文來自微信公眾號:極客公園(ID:geekpark),作者:芯芯
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。