首頁

設(shè)置

日夜間

隨系統(tǒng)

淺色

深色
主題色
黑色

訂閱

軟媒應(yīng)用

App客戶端
要知App
軟媒魔方

當(dāng)前標(biāo)簽：

AIGuardian

AI 打敗 AI：谷歌研究團(tuán)隊利用 GPT-4 擊敗 AI-Guardian 審核系統(tǒng)

谷歌 Deep Mind 的研究人員 Nicholas Carlini在一篇題為“AI-Guardian 的 LLM 輔助開發(fā)”的論文中，探討了使用GPT-4“設(shè)計攻擊方法、撰寫攻擊原理”的方案，并將這些方案用于欺騙 AI 審核系統(tǒng) AI-Guardian 的防御機(jī)制。據(jù)悉，GPT-4會發(fā)出一系列錯誤的腳本和解釋來欺騙 AI-Guardian ，論文中提到，GOT-4 可以讓AI-Guardian認(rèn)為某人拿著槍的照片是某人拿著無害蘋果的照片。不過AI-Guardian 的開發(fā)者也同時指出，谷歌研究團(tuán)隊的這種攻擊方法將在未來的 AI-Guardian 版本中不再可用，考慮到別的模型也會隨之跟進(jìn)，因此當(dāng)下谷歌的這套攻擊方案更多在日后只能用于參考性質(zhì)。

Tags：GPT4，AIGuardian

2023年08月02日

軟媒產(chǎn)品
常用資源

軟媒旗下網(wǎng)站： IT之家最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件： 軟媒手機(jī)APP應(yīng)用魔方最會買要知