IT之家 12 月 29 日消息,新加坡南洋理工大學(xué)(NTU)的計算機科學(xué)專家近日研發(fā)了新的方法,可以使用聊天機器人來入侵聊天機器人。
該科研團隊訓(xùn)練了一個 AI 聊天機器人,可以繞過其它 AI 聊天的安全限制。
團隊研發(fā)了名為 Masterkey(LLM)的算法,逆向設(shè)計了 LLM 檢測和防御惡意查詢的方式,然后教會 LLM 自動學(xué)習(xí)并通過相關(guān)提示詞,可以繞過其他 LLM 的安全性。
團隊通過這種方式,可以創(chuàng)建一個黑客 LLM,它可以自動適應(yīng)新條件,并在開發(fā)人員對其 LLM 進行更正后創(chuàng)建新的黑客請求。
研究團隊成功利用這種方式入侵 AI 模型之后,已經(jīng)通知服務(wù)提供商相關(guān)問題。
IT之家附上《新聞稿原文地址》,感興趣的用戶可以深入閱讀。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。