超越 Mistral 和 Qwen：谷歌 Gemini Embedding 登頂 MTEB，問鼎最強(qiáng)文本嵌入 AI 模型

2025/3/10 9:30:27 來源：IT之家作者：故淵責(zé)編：故淵

評(píng)論：

IT之家 3 月 10 日消息，谷歌公司于 3 月 7 日發(fā)布博文，宣布推出 Gemini Embedding，是一款基于 AI 的文本處理模型，現(xiàn)已集成至 Gemini API。

該模型在 Massive Text Embedding Benchmark（MTEB）中拔得頭籌，超越了 Mistral、Cohere 和 Qwen 等競爭對(duì)手，成為當(dāng)前性能最強(qiáng)的文本嵌入模型。

Gemini Embedding 將文本轉(zhuǎn)換為數(shù)值表示（向量），從而支持語義搜索、推薦系統(tǒng)和文檔檢索等功能。它在 MTEB 基準(zhǔn)測試中表現(xiàn)出色，平均任務(wù)得分為 68.32，顯著高于 Linq-Embed-Mistral 和 gte-Qwen2-7B-instruct 等模型，達(dá)到 State-of-the-art。

超越 Mistral 和 Qwen：谷歌 Gemini Embedding 登頂 MTEB，問鼎最強(qiáng)文本嵌入 AI 模型

State-of-the-art（SOTA）AI 模型是指在特定任務(wù)或領(lǐng)域中，當(dāng)前表現(xiàn)最優(yōu)的模型或方法。這些模型通常通過在各種基準(zhǔn)測試中取得最高分來證明其優(yōu)越性，并且往往在準(zhǔn)確性、效率或能力上超越了之前的模型，甚至在某些任務(wù)中達(dá)到了人類水平的表現(xiàn)。

該模型在配對(duì)分類上得分為 85.13；在檢索上得分 67.71，在重排序得分為 65.58，表明 Gemini Embedding 在 AI 搜索引擎、文檔分析和聊天機(jī)器人優(yōu)化等實(shí)際應(yīng)用中具有顯著優(yōu)勢。

MTEB 由 Hugging Face 創(chuàng)建，通過 50 多個(gè)數(shù)據(jù)集評(píng)估 AI 模型在文本數(shù)據(jù)排名、分類和檢索方面的能力。作為行業(yè)標(biāo)準(zhǔn)，MTEB 排行榜為企業(yè)在選擇 AI 模型時(shí)提供了重要參考。Gemini Embedding 的優(yōu)異表現(xiàn)不僅鞏固了谷歌在 AI 領(lǐng)域的領(lǐng)導(dǎo)地位，也為其在商業(yè)應(yīng)用中的推廣奠定了基礎(chǔ)。

Gemini Embedding 的高性能使其在以下領(lǐng)域具有廣泛的應(yīng)用前景：

搜索引擎：提升搜索結(jié)果的相關(guān)性，支持谷歌正在測試的純 AI 驅(qū)動(dòng)搜索模式。
多語言應(yīng)用：增強(qiáng)跨語言翻譯、客戶服務(wù)自動(dòng)化和內(nèi)容排名能力。
企業(yè)服務(wù)：優(yōu)化基于 Google Cloud 的 AI 分析、語義搜索和自動(dòng)化數(shù)據(jù)檢索功能。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

超越 Mistral 和 Qwen：谷歌 Gemini Embedding 登頂 MTEB，問鼎最強(qiáng)文本嵌入 AI 模型

相關(guān)文章

超越 Mistral 和 Qwen：谷歌 Gemini Embedding 登頂 MTEB，問鼎最強(qiáng)文本嵌入 AI 模型