設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

iPhone 上本地每秒生成 12 個 tokens,微軟發(fā)布 phi-3-mini 模型:38 億參數(shù)

2024/4/23 13:53:17 來源:IT之家 作者:故淵 責編:故淵

IT之家 4 月 23 日消息,微軟研究院近日發(fā)布技術(shù)報告,公布了 Phi-3 系列 AI 模型,共有 mini(38 億參數(shù))、small(70 億參數(shù))和 medium(140 億參數(shù))三個版本。

微軟表示擁有 38 億參數(shù)的 phi-3-mini 通過 3.3 萬億個 tokens 上訓(xùn)練,其基準跑分性能超出 Mixtral 8x7B 和 GPT-3.5。

微軟表示 phi-3-mini 模型可以部署在手機等設(shè)備上,在 27 億參數(shù)的 Phi-2 模型上,進一步整合了嚴格過濾的網(wǎng)絡(luò)數(shù)據(jù)和合成數(shù)據(jù)。

微軟也坦言 phi-3-mini 模型雖然通過優(yōu)質(zhì)數(shù)據(jù)在語言理解和推理能力上媲美更大參數(shù)的 AI 模型,但在 TriviaQA 等某些任務(wù)上依然受到模型規(guī)模的限制。

微軟還表示 phi-3-small 和 phi-3-medium 兩個模型在 MMLU 上的得分分別為 75.3 和 78.2。

IT之家附上參考

相關(guān)閱讀:

微軟發(fā)文:27 億參數(shù)的 Phi-2 AI 模型性能優(yōu)于谷歌 32 億參數(shù)的 Gemini Nano-2

27 億參數(shù),微軟發(fā)布 Phi-2 模型:某些性能指標優(yōu)于 Llama-2-7B

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:iPhone,AI,微軟

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知