IT之家 4 月 17 日消息,Snowflake 公司近日發(fā)布新聞稿,宣布在 Apache 2.0 許可下,推出開源 Arctic embed 系列模型。
根據(jù) MTEB(衡量文本嵌入模型的評估指標(biāo)合集)的檢索(Retrieval)排行榜,Arctic embed 系列最大模型參數(shù)只有 3.34 億個,是唯一一個平均檢索性能超過 55.9 的模型。
感興趣的用戶目前可以訪問 Hugging Face 使用 Arctic embed 系列模型,后續(xù)也可以訪問 Snowflake 的 Cortex 嵌入功能(目前處于私人預(yù)覽階段)中使用。
Arctic embed 系列模型的主要亮點(diǎn)
同類最佳檢索:由五個 Arctic 嵌入模型組成的套件可在各種規(guī)模的數(shù)據(jù)中提供最先進(jìn)的檢索結(jié)果,在 MTEB 檢索基準(zhǔn)上的表現(xiàn)優(yōu)于其他開源模型。
性能和效率:Snowflake 的大型 (l) 型號比封閉源型號的參數(shù)高出 4 倍,以更小的占地面積提供更卓越的性能。
長文檔支持:中型(m)模式包括一個長文本版本,可無縫處理擴(kuò)展文檔(最多 8192 個標(biāo)記)。
為企業(yè)優(yōu)化:與同類產(chǎn)品相比,Arctic 嵌入式機(jī)型具有更低的延遲和更低的總擁有成本(TCO)。
IT之家附上參考地址
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。