流行短視頻應用 TikTok(抖音海外版)吸引了全球數(shù)億用戶持續(xù)沉迷其上,這在很大程度上要歸功于算法。該公司高管近日披露了有關這種 “殺手級”算法的工作原理,包括如何利用機器學習最大限度地提高用戶參與度,以及如何打破 “信息繭房”的桎梏。
TikTok 的算法可為用戶推薦下一段要看的視頻,它幫助該應用獲得大量人氣以及數(shù)百億美元估值。迫于美國壓力,字節(jié)跳動準備出售 TikTok 美國業(yè)務,而算法成為潛在交易的焦點之一。TikTok 高管在與記者舉行的電話會議上表示,他們正在披露有關算法和數(shù)據(jù)操作的細節(jié),以消除有關該公司的各種謠言和誤解。
TikTok 負責美國公共政策的副總裁邁克爾 · 貝克曼 (Michael Beckerman)說:“盡管我們剛剛成立兩年,但卻有著長遠目標。我們沒有機會在互聯(lián)網(wǎng)的黃金年代成長,當時科技公司不會做錯任何事。我們成長在科技狂潮的時代,人們對平臺、它們?nèi)绾螌徍藘?nèi)容以及它們的算法如何工作都持懷疑態(tài)度。”
TikTok 高管為記者提供了一次虛擬之旅,參觀其位于洛杉磯的新 “透明中心”。該中心將為人們提供演示計算機模塊的區(qū)域,這些模塊展示 TikTok 的算法和數(shù)據(jù)操作是如何工作的。
TikTok 的算法使用機器學習來確定用戶最有可能參與的內(nèi)容,并為他們提供更多內(nèi)容,方法是找到相似的視頻,或者有相似用戶偏好的人喜歡的視頻。當用戶首次打開 TikTok 時,他們會看到 8 個熱門視頻,內(nèi)容包括不同的趨勢、音樂和主題。在此之后,算法將繼續(xù)根據(jù)用戶觀看或參與的視頻以及用戶在做的事情,為用戶提供 8 個更新的視頻。
該算法根據(jù)視頻信息 (可能包括字幕、標簽或聲音等細節(jié))識別與用戶觀看的視頻相似的視頻。它還考慮到用戶設備和帳戶設置,其中包括語言首選項、國家 / 地區(qū)設置和設備類型等數(shù)據(jù)。
當 TikTok 收集了足夠多的用戶數(shù)據(jù),該應用就能夠根據(jù)相似用戶的喜好來繪制用戶的偏好,并將他們分組到 “集群”中。同時,它還根據(jù)類似的主題將視頻分組,比如 “籃球”或 “兔子”等。
使用機器學習,TikTok 的算法可以根據(jù)用戶與其他用戶集群、他們所喜歡內(nèi)容的接近程度向用戶提供視頻。TikTok 的邏輯旨在避免可能會讓用戶感到厭煩的冗余內(nèi)容,比如看到具有相同音樂的多個視頻或來自同一創(chuàng)建者的多個視頻。
TikTok 承認,之所以能夠如此有效地鎖定用戶的偏好,意味著其算法可以產(chǎn)生 “信息繭房”,強化用戶現(xiàn)有的偏好,而不是向他們顯示更多樣化的內(nèi)容,拓寬他們的視野,或者向他們提供不感興趣的內(nèi)容。
TikTok 表示,他們正在研究 “信息繭房”,包括它們能持續(xù)多長時間,以及用戶如何遇到它們,以便在必要時更好地打破它們。由于 “信息繭房”會強化陰謀論、惡作劇和其他錯誤信息,TikTok 的產(chǎn)品和政策團隊研究哪些賬戶和視頻信息(主題、標簽、字幕等)可能與錯誤信息有關。
鏈接到錯誤信息的視頻或創(chuàng)作者會被發(fā)送到公司的全球內(nèi)容審查員那里,這樣 TikTok 就可以在上述內(nèi)容在推薦頁面上分發(fā)給用戶之前對其進行管理。
TikTok 還介紹了該公司在數(shù)據(jù)、隱私和安全方面的最新舉措。該公司表示,它試圖在事件發(fā)生之前對其平臺上的事件進行分類和預防,方法是在問題蔓延之前檢測問題的模式。
TikTok 首席安全官羅蘭 · 克勞蒂埃 (Roland Cloutier)表示,計劃在年底前在美國招聘 100 多名數(shù)據(jù)、安全和隱私專家。他還表示,該公司將在華盛頓特區(qū)建立一個監(jiān)測、反應和調查反應中心,以積極檢測和實時反應危急事件。
貝克曼表示,TikTok 的透明度努力是為了將公司定位為硅谷的領導者。他說:“我們希望占據(jù)領導地位,更多地展示這款應用的工作原理。對我們來說,我們是新來者,我們想要這樣做,因為我們沒有什么可隱瞞的。我們與立法者交談和會面的次數(shù)越多,他們對我們的產(chǎn)品就越了解,感覺越滿意?!?/p>
廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。