IT之家 3 月 1 日消息,近日外媒 404 Media 稱,博客平臺 WordPress、Tumblr 運營方 Automattic 計劃向多家 AI 公司出售用戶數(shù)據(jù)。Automattic 官方就此澄清,表示其默認屏蔽 AI 爬蟲且不會分享非公開數(shù)據(jù)。
404 Media 指出,根據(jù)其掌握的內(nèi)部文檔,Tumblr 產(chǎn)品經(jīng)理表示 Automattic 正為 OpenAI 和 Midjourney 準備數(shù)據(jù)集。
而在這一包含 Tumblr 近十年所有公開帖子內(nèi)容的數(shù)據(jù)集里,混入了大量不該向外部提供的部分,包括但不限于:
公共博客上的私人帖子
已刪除 / 停用博客上發(fā)布的帖子
私信回復
合作伙伴擁有版權(quán)的付費推廣內(nèi)容
在 404 Media 的報道后,Automattic 發(fā)布了一份關于在快速發(fā)展的 AI 世界中“保護用戶選擇”的聲明,表示其正在密切關注 AI 技術的最新進展,并努力在尊重用戶隱私和數(shù)據(jù)控制的前提下研究如何與 AI 公司合作。
Automattic 稱其目前默認阻止 AI 平臺爬蟲。WordPress 和 Tumblr 用戶可通過設置阻止 AI 公司的數(shù)據(jù)抓取。IT之家注意到,Automattic 表示如果用戶之前禁用了搜索引擎的爬取,則默認情況下新阻止選項會打開。
此外,Automatic 承認目前還沒有法律強制 AI 爬蟲遵守這種不抓取偏好。不過由于歐盟相關立法即將落地,這種情況可能很快就會改變。
該公司還證實,它正在直接與特定 AI 公司合作,僅提供 WordPress 和 Tumblr 上公開且用戶未禁止向第三方公司分享的內(nèi)容。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。