IT之家 3 月 11 日消息,谷歌近日公開了一項(xiàng)名為“社會(huì)學(xué)習(xí)(Social Learning)”的 AI 框架,該框架允許 AI 語言模型能夠通過自然語言互相學(xué)習(xí),由于不需要直接交換敏感關(guān)鍵信息,因此訓(xùn)練出的 AI 模型更具隱私保護(hù)性。
據(jù)介紹,在這款“社會(huì)學(xué)習(xí)框架”中,“學(xué)生模型”會(huì)向多個(gè)已知特定任務(wù)解法的“教師模型”學(xué)習(xí)各種問題的解決方案,研究人員設(shè)計(jì)了“垃圾短信檢測”、“解決小學(xué)數(shù)學(xué)問題”、“根據(jù)特定文字回答問題”等多項(xiàng)測試,來評估相關(guān)“社會(huì)學(xué)習(xí)”框架的成效。
研究人員表示,部分 AI 模型只經(jīng)過短暫的“社會(huì)學(xué)習(xí)”框架訓(xùn)練,便能夠能獲得良好的任務(wù)解決能力。在研究人員的“垃圾短信檢測任務(wù)”中,教師模型首先從用戶所標(biāo)記的數(shù)據(jù)學(xué)習(xí),而在教師獲得檢測垃圾信息知識后,便可以教會(huì)學(xué)生模型區(qū)分垃圾和非垃圾信息。
IT之家注意到,相關(guān)教師模型可以依據(jù)實(shí)際數(shù)據(jù)集,合成出新的范例與學(xué)生模型共享,合成數(shù)據(jù)集與原始數(shù)據(jù)完全不同,因此能在保證起到相同教育作用的同時(shí),降低原始數(shù)據(jù)中隱私內(nèi)容泄露的可能性。
研究人員還嘗試了合成指令的方式,讓教師模型針對特定任務(wù)生成一系列指令,學(xué)生模型依據(jù)教師模型指令學(xué)習(xí)執(zhí)行任務(wù)的方式,有點(diǎn)類似“人類遵循他人口頭指令做事,并在執(zhí)行任務(wù)中掌握如何做事”。
而實(shí)驗(yàn)證明,相關(guān)教師模型生成的指令能夠提高學(xué)生模型執(zhí)行任務(wù)的效率,相比于零樣本學(xué)習(xí),研究人員認(rèn)為,這顯示出 AI 模型在遵循指令方面的強(qiáng)大能力。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。