斯坦福大學研究：教育水平較低地區(qū)的 AI 寫作工具使用率更高

2025/3/4 17:39:18 來源：IT之家作者：遠洋責編：遠洋

評論：

IT之家 3 月 4 日消息，自 2022 年底 ChatGPT 推出以來，關(guān)于人工智能語言模型將如何廣泛影響世界的討論一直存在。如今，隨著一項由斯坦福大學牽頭的新研究的發(fā)布，這一圖景逐漸清晰。研究發(fā)現(xiàn)，AI 語言模型目前已在多個行業(yè)中協(xié)助處理高達四分之一的專業(yè)溝通任務(wù)，尤其是在美國教育水平較低的地區(qū)，其影響尤為顯著。

研究人員在報告中指出：“我們的研究揭示了一個新的現(xiàn)實，即企業(yè)、消費者乃至國際組織在溝通中已大量依賴生成式 AI?！痹撗芯孔粉櫫藦?2022 年 1 月到 2024 年 9 月期間，不同行業(yè)中大型語言模型（LLM）的采用情況。研究數(shù)據(jù)集涵蓋了美國消費者金融保護局（CFPB）收到的 687,241 份消費者投訴、537,413 份企業(yè)新聞稿、3.043 億份工作招聘啟事以及 15,919 份聯(lián)合國新聞稿。

通過使用統(tǒng)計檢測系統(tǒng)追蹤詞匯使用模式，研究人員發(fā)現(xiàn)，在此期間，約 18% 的金融消費者投訴（其中阿肯色州的所有投訴中有 30%）顯示出 AI 協(xié)助的跡象；企業(yè)新聞稿中有 24%、工作招聘啟事中有 15% 以及聯(lián)合國新聞稿中有 14% 的內(nèi)容也顯示出 AI 的參與。

研究還發(fā)現(xiàn)，盡管城市地區(qū)的 AI 采用率總體較高（18.2%），但教育水平較低的地區(qū)使用 AI 寫作工具的頻率更高（19.9%），高于教育水平較高的地區(qū)（17.4%）。這一現(xiàn)象與通常的技術(shù)采用模式相悖，通常情況下，受教育程度較高的人群會更快地采用新技術(shù)。

“在消費者投訴領(lǐng)域，LLM 采用的地理和人口統(tǒng)計模式呈現(xiàn)出與歷史技術(shù)擴散趨勢截然不同的特點。以往，技術(shù)采用通常集中在城市地區(qū)、高收入群體和受教育程度較高的人群中?！毖芯咳藛T指出。

研究人員指出，AI 寫作工具可能為那些教育經(jīng)驗較少的人群提供了一種“助力”。他們寫道：“盡管城鄉(xiāng)數(shù)字鴻溝似乎仍然存在，但我們發(fā)現(xiàn)教育水平較低的地區(qū)在消費者投訴中顯示出略高的 LLM 采用率，這表明這些工具可能成為消費者維權(quán)中的‘平等化工具’?！?/p>

此前，AI 寫作檢測服務(wù)的可靠性一直備受質(zhì)疑，而這項研究也證實了這一觀點。在單個文檔層面，AI 檢測器并不可靠，但在分析數(shù)百萬份文檔的整體數(shù)據(jù)時，一些特征性模式開始浮現(xiàn)，這些模式暗示了 AI 語言模型對文本的影響。

研究人員基于之前發(fā)布的統(tǒng)計框架開發(fā)了一種方法，分析 ChatGPT 發(fā)布前后詞匯頻率和語言模式的變化。通過比較 ChatGPT 發(fā)布前后的大量文本，研究人員估算出人口層面上 AI 輔助內(nèi)容的比例。其假設(shè)是，大型語言模型傾向于選擇某些特定的詞匯、句式結(jié)構(gòu)和語言模式，這些模式與典型的人類寫作存在細微差異。

為了驗證這種方法的可靠性，研究人員創(chuàng)建了已知 AI 內(nèi)容比例（從 0% 到 25%）的測試集，并發(fā)現(xiàn)其方法預(yù)測這些比例的誤差率低于 3.3%。這種統(tǒng)計驗證使他們對自己的人口層面估算充滿信心。

IT之家注意到，盡管研究人員特別指出，他們的估算可能僅代表 AI 使用的最低水平，但實際的 AI 參與程度可能要高得多。由于難以檢測經(jīng)過大量編輯或由越來越復(fù)雜的 AI 生成的內(nèi)容，研究人員表示，他們報告的采用率可能大幅低估了生成式 AI 的真實使用水平。

根據(jù)研究人員的說法，他們分析的所有領(lǐng)域（消費者投訴、企業(yè)溝通、工作招聘啟事）都顯示出類似的采用模式：在 ChatGPT 于 2022 年 11 月推出后的三到四個月開始，采用率急劇上升，隨后在 2023 年底趨于穩(wěn)定。

研究人員承認，由于研究主要關(guān)注英語內(nèi)容，分析存在一定局限性。此外，如前所述，他們發(fā)現(xiàn)無法可靠地檢測經(jīng)過人工編輯的 AI 生成文本或由更新模型生成的模仿人類寫作風格的文本。因此，研究人員認為他們的研究結(jié)果僅代表實際 AI 寫作工具采用率的下限。

研究人員指出，2024 年 AI 寫作采用率的停滯可能反映了市場飽和或越來越復(fù)雜的 LLM 生成的文本能夠逃避檢測方法。他們總結(jié)道，如今我們生活在一個人類寫作與 AI 寫作越來越難以區(qū)分的世界，這對社會溝通產(chǎn)生了深遠影響。

“對 AI 生成內(nèi)容的日益依賴可能會給溝通帶來挑戰(zhàn)?！毖芯咳藛T寫道，“在敏感領(lǐng)域，過度依賴 AI 可能導(dǎo)致信息無法解決實際問題，或在對外發(fā)布時降低信息的可信度。過度依賴 AI 還可能引發(fā)公眾對企業(yè)信息真實性的不信任?！?/p>

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

斯坦福大學研究：教育水平較低地區(qū)的 AI 寫作工具使用率更高

相關(guān)文章