IT之家 3 月 4 日消息,自 2022 年底 ChatGPT 推出以來,關(guān)于人工智能語言模型將如何廣泛影響世界的討論一直存在。如今,隨著一項由斯坦福大學牽頭的新研究的發(fā)布,這一圖景逐漸清晰。研究發(fā)現(xiàn),AI 語言模型目前已在多個行業(yè)中協(xié)助處理高達四分之一的專業(yè)溝通任務(wù),尤其是在美國教育水平較低的地區(qū),其影響尤為顯著。
研究人員在報告中指出:“我們的研究揭示了一個新的現(xiàn)實,即企業(yè)、消費者乃至國際組織在溝通中已大量依賴生成式 AI?!痹撗芯孔粉櫫藦?2022 年 1 月到 2024 年 9 月期間,不同行業(yè)中大型語言模型(LLM)的采用情況。研究數(shù)據(jù)集涵蓋了美國消費者金融保護局(CFPB)收到的 687,241 份消費者投訴、537,413 份企業(yè)新聞稿、3.043 億份工作招聘啟事以及 15,919 份聯(lián)合國新聞稿。
通過使用統(tǒng)計檢測系統(tǒng)追蹤詞匯使用模式,研究人員發(fā)現(xiàn),在此期間,約 18% 的金融消費者投訴(其中阿肯色州的所有投訴中有 30%)顯示出 AI 協(xié)助的跡象;企業(yè)新聞稿中有 24%、工作招聘啟事中有 15% 以及聯(lián)合國新聞稿中有 14% 的內(nèi)容也顯示出 AI 的參與。
研究還發(fā)現(xiàn),盡管城市地區(qū)的 AI 采用率總體較高(18.2%),但教育水平較低的地區(qū)使用 AI 寫作工具的頻率更高(19.9%),高于教育水平較高的地區(qū)(17.4%)。這一現(xiàn)象與通常的技術(shù)采用模式相悖,通常情況下,受教育程度較高的人群會更快地采用新技術(shù)。
“在消費者投訴領(lǐng)域,LLM 采用的地理和人口統(tǒng)計模式呈現(xiàn)出與歷史技術(shù)擴散趨勢截然不同的特點。以往,技術(shù)采用通常集中在城市地區(qū)、高收入群體和受教育程度較高的人群中?!毖芯咳藛T指出。
研究人員指出,AI 寫作工具可能為那些教育經(jīng)驗較少的人群提供了一種“助力”。他們寫道:“盡管城鄉(xiāng)數(shù)字鴻溝似乎仍然存在,但我們發(fā)現(xiàn)教育水平較低的地區(qū)在消費者投訴中顯示出略高的 LLM 采用率,這表明這些工具可能成為消費者維權(quán)中的‘平等化工具’?!?/p>
此前,AI 寫作檢測服務(wù)的可靠性一直備受質(zhì)疑,而這項研究也證實了這一觀點。在單個文檔層面,AI 檢測器并不可靠,但在分析數(shù)百萬份文檔的整體數(shù)據(jù)時,一些特征性模式開始浮現(xiàn),這些模式暗示了 AI 語言模型對文本的影響。
研究人員基于之前發(fā)布的統(tǒng)計框架開發(fā)了一種方法,分析 ChatGPT 發(fā)布前后詞匯頻率和語言模式的變化。通過比較 ChatGPT 發(fā)布前后的大量文本,研究人員估算出人口層面上 AI 輔助內(nèi)容的比例。其假設(shè)是,大型語言模型傾向于選擇某些特定的詞匯、句式結(jié)構(gòu)和語言模式,這些模式與典型的人類寫作存在細微差異。
為了驗證這種方法的可靠性,研究人員創(chuàng)建了已知 AI 內(nèi)容比例(從 0% 到 25%)的測試集,并發(fā)現(xiàn)其方法預(yù)測這些比例的誤差率低于 3.3%。這種統(tǒng)計驗證使他們對自己的人口層面估算充滿信心。
IT之家注意到,盡管研究人員特別指出,他們的估算可能僅代表 AI 使用的最低水平,但實際的 AI 參與程度可能要高得多。由于難以檢測經(jīng)過大量編輯或由越來越復(fù)雜的 AI 生成的內(nèi)容,研究人員表示,他們報告的采用率可能大幅低估了生成式 AI 的真實使用水平。
根據(jù)研究人員的說法,他們分析的所有領(lǐng)域(消費者投訴、企業(yè)溝通、工作招聘啟事)都顯示出類似的采用模式:在 ChatGPT 于 2022 年 11 月推出后的三到四個月開始,采用率急劇上升,隨后在 2023 年底趨于穩(wěn)定。
研究人員承認,由于研究主要關(guān)注英語內(nèi)容,分析存在一定局限性。此外,如前所述,他們發(fā)現(xiàn)無法可靠地檢測經(jīng)過人工編輯的 AI 生成文本或由更新模型生成的模仿人類寫作風格的文本。因此,研究人員認為他們的研究結(jié)果僅代表實際 AI 寫作工具采用率的下限。
研究人員指出,2024 年 AI 寫作采用率的停滯可能反映了市場飽和或越來越復(fù)雜的 LLM 生成的文本能夠逃避檢測方法。他們總結(jié)道,如今我們生活在一個人類寫作與 AI 寫作越來越難以區(qū)分的世界,這對社會溝通產(chǎn)生了深遠影響。
“對 AI 生成內(nèi)容的日益依賴可能會給溝通帶來挑戰(zhàn)?!毖芯咳藛T寫道,“在敏感領(lǐng)域,過度依賴 AI 可能導(dǎo)致信息無法解決實際問題,或在對外發(fā)布時降低信息的可信度。過度依賴 AI 還可能引發(fā)公眾對企業(yè)信息真實性的不信任?!?/p>
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。