27 億參數(shù)，微軟發(fā)布 Phi-2 模型：某些性能指標(biāo)優(yōu)于 Llama-2-7B

2023/11/17 11:38:32 來(lái)源：IT之家作者：故淵責(zé)編：故淵

評(píng)論：

IT之家 11 月 17 日消息，微軟 Ignite 2023 大會(huì)已拉開帷幕，微軟在本次活動(dòng)中發(fā)布了旗下最小的語(yǔ)言模型 Phi-2，共有 27 億參數(shù)，相比較此前版本有明顯提升。

IT之家注：微軟于今年 6 月發(fā)布 Phi-1，只有 13 億參數(shù)，適用于 QA 問答、聊天格式和代碼等等場(chǎng)景。該模型完全基于高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練，在基準(zhǔn)測(cè)試中的表現(xiàn)比同類模型高出 10 倍。

微軟今年 9 月更新發(fā)布了 Phi-1.5 版本，同樣為 13 億參數(shù)，可以寫詩(shī)、寫電子郵件和故事，以及總結(jié)文本。在常識(shí)、語(yǔ)言理解和推理的基準(zhǔn)測(cè)試中，該模型在某些領(lǐng)域能夠跟上多達(dá) 100 億個(gè)參數(shù)的模型。

微軟現(xiàn)在更新發(fā)布的 Phi-2 擁有 27 億參數(shù)，規(guī)模雖然比此前版本翻番，但相比較其它主流語(yǔ)言模型，依然小很多。

微軟表示 Phi-2 在邏輯推理和安全性方面顯示出顯著的改進(jìn)。通過(guò)正確的微調(diào)和定制，小型語(yǔ)言模型是云和邊緣應(yīng)用程序的強(qiáng)大工具。

Microsoft Research 機(jī)器學(xué)習(xí)基礎(chǔ)小組負(fù)責(zé)人 Sebastien Bubeck 在 Twitter 上發(fā)布了“MT-Bench”基準(zhǔn)測(cè)試的屏幕截圖，該基準(zhǔn)測(cè)試了具有強(qiáng)大語(yǔ)言模型（例如 GPT-4）的大型和小型語(yǔ)言模型的實(shí)際功能。

27 億參數(shù)，微軟發(fā)布 Phi-2 模型：某些性能指標(biāo)優(yōu)于 Llama-2-7B

根據(jù)結(jié)果，Phi-2 在某些方面優(yōu)于 Meta 的 Llama-2-7B 模型。Phi-2 的聊天版本也在醞釀中，可能會(huì)解決該模型在這些領(lǐng)域的一些現(xiàn)有痛點(diǎn)。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

27 億參數(shù)，微軟發(fā)布 Phi-2 模型：某些性能指標(biāo)優(yōu)于 Llama-2-7B

相關(guān)文章

27 億參數(shù)，微軟發(fā)布 Phi-2 模型：某些性能指標(biāo)優(yōu)于 Llama-2-7B