教 AI 入侵 AI，科學(xué)家研發(fā) Masterkey 新方式

2023/12/29 14:31:53 來(lái)源：IT之家作者：故淵責(zé)編：故淵

評(píng)論：

IT之家 12 月 29 日消息，新加坡南洋理工大學(xué)（NTU）的計(jì)算機(jī)科學(xué)專家近日研發(fā)了新的方法，可以使用聊天機(jī)器人來(lái)入侵聊天機(jī)器人。

該科研團(tuán)隊(duì)訓(xùn)練了一個(gè) AI 聊天機(jī)器人，可以繞過(guò)其它 AI 聊天的安全限制。

團(tuán)隊(duì)研發(fā)了名為 Masterkey（LLM）的算法，逆向設(shè)計(jì)了 LLM 檢測(cè)和防御惡意查詢的方式，然后教會(huì) LLM 自動(dòng)學(xué)習(xí)并通過(guò)相關(guān)提示詞，可以繞過(guò)其他 LLM 的安全性。

團(tuán)隊(duì)通過(guò)這種方式，可以創(chuàng)建一個(gè)黑客 LLM，它可以自動(dòng)適應(yīng)新條件，并在開(kāi)發(fā)人員對(duì)其 LLM 進(jìn)行更正后創(chuàng)建新的黑客請(qǐng)求。

研究團(tuán)隊(duì)成功利用這種方式入侵 AI 模型之后，已經(jīng)通知服務(wù)提供商相關(guān)問(wèn)題。

IT之家附上《新聞稿原文地址》，感興趣的用戶可以深入閱讀。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

教 AI 入侵 AI，科學(xué)家研發(fā) Masterkey 新方式

相關(guān)文章