Jina AI 推出全球首個開源 8K 文本嵌入模型，號稱“超越 OpenAI”

2023/10/26 15:08:12 來源：IT之家作者：漾仔（實習(xí)） 責(zé)編：漾仔

評論：

IT之家 10 月 26 日消息，Jina AI 在其官網(wǎng)發(fā)布新聞稿，宣布推出 jina-embeddings-v2 模型，號稱是目前是唯一支持 8K（8192 個 token）上下文長度的開源產(chǎn)品，在功能和性能上與 OpenAI 的 text-embedding-ada-002 類似。

在大規(guī)模文本嵌入基準(zhǔn) (MTEB) 排行榜方面，IT之家發(fā)現(xiàn)，官方進(jìn)行如下解釋：

與 OpenAI 的 8K 模型 text-embedding-ada-002 進(jìn)行比較，jina-embedding-v2 在分類平均值、重排平均值、檢索平均值和摘要平均值方面均優(yōu)于 OpenAI 的 text-embedding-ada-002。

Jina AI 推出全球首個開源 8K 文本嵌入模型，號稱“超越 OpenAI”

▲ 圖源 Jina AI 官網(wǎng)

Jina AI 推出全球首個開源 8K 文本嵌入模型，號稱“超越 OpenAI”

▲ 圖源 Jina AI 官網(wǎng)

官方表示，jina-embeddings-v2 模型，是從頭開始構(gòu)建的。在過去的三個月里，Jina AI 團(tuán)隊進(jìn)行了密集研發(fā)、數(shù)據(jù)收集和調(diào)整。

Jina AI 同時聲稱， jina-embeddings-v2 8K 的上下文長度有利于以下應(yīng)用場景：

法律文件分析：確保對大量法律文本中的每一個細(xì)節(jié)進(jìn)行捕捉和分析。
醫(yī)學(xué)研究：為了進(jìn)行高級分析和發(fā)現(xiàn)，全面地嵌入科學(xué)論文。
文學(xué)分析：深入研究長篇內(nèi)容，捕捉微妙的主題元素。
財務(wù)預(yù)測：通過詳細(xì)的財務(wù)報告獲得卓越的洞察力。
會話式 AI：提升聊天機(jī)器人對復(fù)雜用戶查詢的響應(yīng)能力。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

Jina AI 推出全球首個開源 8K 文本嵌入模型，號稱“超越 OpenAI”

相關(guān)文章

Jina AI 推出全球首個開源 8K 文本嵌入模型，號稱“超越 OpenAI”