Snowflake 開源 Arctic embed，號稱全球最實用的檢索文本嵌入 AI 模型

2024/4/17 10:15:20 來源：IT之家作者：故淵責(zé)編：故淵

評論：

IT之家 4 月 17 日消息，Snowflake 公司近日發(fā)布新聞稿，宣布在 Apache 2.0 許可下，推出開源 Arctic embed 系列模型。

根據(jù) MTEB（衡量文本嵌入模型的評估指標(biāo)合集）的檢索（Retrieval）排行榜，Arctic embed 系列最大模型參數(shù)只有 3.34 億個，是唯一一個平均檢索性能超過 55.9 的模型。

Snowflake 開源 Arctic embed，號稱全球最實用的檢索文本嵌入 AI 模型

感興趣的用戶目前可以訪問 Hugging Face 使用 Arctic embed 系列模型，后續(xù)也可以訪問 Snowflake 的 Cortex 嵌入功能（目前處于私人預(yù)覽階段）中使用。

Arctic embed 系列模型的主要亮點(diǎn)

同類最佳檢索：由五個 Arctic 嵌入模型組成的套件可在各種規(guī)模的數(shù)據(jù)中提供最先進(jìn)的檢索結(jié)果，在 MTEB 檢索基準(zhǔn)上的表現(xiàn)優(yōu)于其他開源模型。
性能和效率：Snowflake 的大型 (l) 型號比封閉源型號的參數(shù)高出 4 倍，以更小的占地面積提供更卓越的性能。
長文檔支持：中型（m）模式包括一個長文本版本，可無縫處理擴(kuò)展文檔（最多 8192 個標(biāo)記）。
為企業(yè)優(yōu)化：與同類產(chǎn)品相比，Arctic 嵌入式機(jī)型具有更低的延遲和更低的總擁有成本（TCO）。

IT之家附上參考地址

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

Snowflake 開源 Arctic embed，號稱全球最實用的檢索文本嵌入 AI 模型