距離上次分享剛剛過去三天時(shí)間,我們又在第一時(shí)間拿到了清華大學(xué)沈陽(yáng)團(tuán)隊(duì)的新 DeepSeek 攻略,趕緊來(lái)給大家分享。
不知道家友們?cè)谑褂?DeepSeek 等大語(yǔ)言模型的時(shí)候,有沒有遇到過“一本正經(jīng)的胡說(shuō)八道”的情況?
這次的第五部新寶典,討論的便是 AI 幻覺的問題。
而我們作為普通用戶,怎樣應(yīng)對(duì) AI 幻覺,甚至利用 AI 幻覺,看完這篇后便會(huì)得到答案。
對(duì)了,這次給大家分享的 PDF 下載,是原汁原味的原版哦,網(wǎng)上有太多賣課者魔改的內(nèi)置其廣告版本。
一、什么是 AI 幻覺
AI 幻覺,指得其實(shí)就是模型生成與事實(shí)不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計(jì)概率驅(qū)動(dòng)的“合理猜測(cè)”。
換句話講,我們遇到的那些“一本正經(jīng)地胡說(shuō)八道”的情況,其實(shí)就是 AI 幻覺。
其主要分為兩種:
事實(shí)性幻覺:模型生成的內(nèi)容與可驗(yàn)證的現(xiàn)實(shí)世界事實(shí)不一致
忠實(shí)性幻覺:模型生成的內(nèi)容與用戶的指令或上下文不一致
二、 為什么會(huì)產(chǎn)生幻覺
至于 AI 為什么會(huì)產(chǎn)生幻覺,不外乎以下幾種原因:
數(shù)據(jù)偏差:訓(xùn)練數(shù)據(jù)中的錯(cuò)誤或片面性被模型放大(如醫(yī)學(xué)領(lǐng)域過時(shí)論文導(dǎo)致錯(cuò)誤結(jié)論)
泛化困境:模型難以處理訓(xùn)練集外的復(fù)雜場(chǎng)景(如南極冰層融化對(duì)非洲農(nóng)業(yè)的影響預(yù)測(cè))
知識(shí)固化:模型過度依賴參數(shù)化記憶,缺乏動(dòng)態(tài)更新能力(如 2023 年后的事件完全虛構(gòu))
意圖誤解:用戶提問模糊時(shí),模型易“自由發(fā)揮”(如“介紹深度學(xué)習(xí)”可能偏離實(shí)際需求)
比如,我們可以通過虛構(gòu)事件的方式,來(lái)測(cè)試一下各大 LLM 的事實(shí)性幻覺情況。
三、如何減緩 AI 幻覺
我們作為不了解相關(guān)技術(shù)細(xì)節(jié)的普通用戶,該怎樣減緩 AI 幻覺的影響呢?
首先是開啟聯(lián)網(wǎng)搜索功能,讓 AI 對(duì)齊一下信息的顆粒度,“胡說(shuō)八道”的幾率自然也就少了。
在編寫提示詞的時(shí)候,我們也可以提前做好知識(shí)邊界的限定,降低 LLM 虛構(gòu)的可能性。
此外,我們還可以使用多款 AI 模型,對(duì)生成的結(jié)果進(jìn)行交叉驗(yàn)證,讓 DeepSeek 和千問自己“卷”起來(lái)。
在現(xiàn)階段,AI 幻覺仍然是無(wú)法杜絕的問題,我們?cè)谑褂么笳Z(yǔ)言模型輔助我們的工作時(shí),也不能把他們當(dāng)做“萬(wàn)能神藥”,而是要有自己的判斷。
四、AI 幻覺的創(chuàng)造力價(jià)值
當(dāng)我們需要確定性的結(jié)果時(shí),AI 幻覺是一件不好的事情。
然而,對(duì)于需要“創(chuàng)造力”的領(lǐng)域,幻覺可能反而是我們所需要的。
當(dāng)然,我們還需要逐步建立方法論,經(jīng)過合理的驗(yàn)證過程,才能讓 AI 幻覺的“想象力”為我們所用。
怎么樣,看到這里,是不是對(duì)“AI 幻覺”這個(gè)近期熱門的詞匯,有了一些基礎(chǔ)的了解?
IT之家微信公眾號(hào)回復(fù):AI
即可獲取清華大學(xué)原版秘籍,點(diǎn)此 或掃描 / 長(zhǎng)按下方二維碼皆可進(jìn)入公眾號(hào),關(guān)注后發(fā)消息即可。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。