IT之家 3 月 10 日消息,谷歌公司于 3 月 7 日發(fā)布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本處理模型,現(xiàn)已集成至 Gemini API。
該模型在 Massive Text Embedding Benchmark(MTEB)中拔得頭籌,超越了 Mistral、Cohere 和 Qwen 等競爭對(duì)手,成為當(dāng)前性能最強(qiáng)的文本嵌入模型。
Gemini Embedding 將文本轉(zhuǎn)換為數(shù)值表示(向量),從而支持語義搜索、推薦系統(tǒng)和文檔檢索等功能。它在 MTEB 基準(zhǔn)測試中表現(xiàn)出色,平均任務(wù)得分為 68.32,顯著高于 Linq-Embed-Mistral 和 gte-Qwen2-7B-instruct 等模型,達(dá)到 State-of-the-art。
State-of-the-art(SOTA)AI 模型是指在特定任務(wù)或領(lǐng)域中,當(dāng)前表現(xiàn)最優(yōu)的模型或方法。這些模型通常通過在各種基準(zhǔn)測試中取得最高分來證明其優(yōu)越性,并且往往在準(zhǔn)確性、效率或能力上超越了之前的模型,甚至在某些任務(wù)中達(dá)到了人類水平的表現(xiàn)。
該模型在配對(duì)分類上得分為 85.13;在檢索上得分 67.71,在重排序得分為 65.58,表明 Gemini Embedding 在 AI 搜索引擎、文檔分析和聊天機(jī)器人優(yōu)化等實(shí)際應(yīng)用中具有顯著優(yōu)勢。
MTEB 由 Hugging Face 創(chuàng)建,通過 50 多個(gè)數(shù)據(jù)集評(píng)估 AI 模型在文本數(shù)據(jù)排名、分類和檢索方面的能力。作為行業(yè)標(biāo)準(zhǔn),MTEB 排行榜為企業(yè)在選擇 AI 模型時(shí)提供了重要參考。Gemini Embedding 的優(yōu)異表現(xiàn)不僅鞏固了谷歌在 AI 領(lǐng)域的領(lǐng)導(dǎo)地位,也為其在商業(yè)應(yīng)用中的推廣奠定了基礎(chǔ)。
Gemini Embedding 的高性能使其在以下領(lǐng)域具有廣泛的應(yīng)用前景:
搜索引擎:提升搜索結(jié)果的相關(guān)性,支持谷歌正在測試的純 AI 驅(qū)動(dòng)搜索模式。
多語言應(yīng)用:增強(qiáng)跨語言翻譯、客戶服務(wù)自動(dòng)化和內(nèi)容排名能力。
企業(yè)服務(wù):優(yōu)化基于 Google Cloud 的 AI 分析、語義搜索和自動(dòng)化數(shù)據(jù)檢索功能。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。