設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

27 億參數(shù),微軟發(fā)布 Phi-2 模型:某些性能指標優(yōu)于 Llama-2-7B

2023/11/17 11:38:32 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 11 月 17 日消息,微軟 Ignite 2023 大會已拉開帷幕,微軟在本次活動中發(fā)布了旗下最小的語言模型 Phi-2,共有 27 億參數(shù),相比較此前版本有明顯提升。

IT之家注:微軟于今年 6 月發(fā)布 Phi-1,只有 13 億參數(shù),適用于 QA 問答、聊天格式和代碼等等場景。該模型完全基于高質(zhì)量數(shù)據(jù)進行訓(xùn)練,在基準測試中的表現(xiàn)比同類模型高出 10 倍。

微軟今年 9 月更新發(fā)布了 Phi-1.5 版本,同樣為 13 億參數(shù),可以寫詩、寫電子郵件和故事,以及總結(jié)文本。在常識、語言理解和推理的基準測試中,該模型在某些領(lǐng)域能夠跟上多達 100 億個參數(shù)的模型。

微軟現(xiàn)在更新發(fā)布的 Phi-2 擁有 27 億參數(shù),規(guī)模雖然比此前版本翻番,但相比較其它主流語言模型,依然小很多。

微軟表示 Phi-2 在邏輯推理和安全性方面顯示出顯著的改進。通過正確的微調(diào)和定制,小型語言模型是云和邊緣應(yīng)用程序的強大工具。

Microsoft Research 機器學(xué)習(xí)基礎(chǔ)小組負責(zé)人 Sebastien Bubeck 在 Twitter 上發(fā)布了“MT-Bench”基準測試的屏幕截圖,該基準測試了具有強大語言模型(例如 GPT-4)的大型和小型語言模型的實際功能。

根據(jù)結(jié)果,Phi-2 在某些方面優(yōu)于 Meta 的 Llama-2-7B 模型。Phi-2 的聊天版本也在醞釀中,可能會解決該模型在這些領(lǐng)域的一些現(xiàn)有痛點。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:微軟AI,模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知