IT之家 10 月 26 日消息,Jina AI 在其官網(wǎng)發(fā)布新聞稿,宣布推出 jina-embeddings-v2 模型,號稱是目前是唯一支持 8K(8192 個 token)上下文長度的開源產(chǎn)品,在功能和性能上與 OpenAI 的 text-embedding-ada-002 類似。
在大規(guī)模文本嵌入基準(zhǔn) (MTEB) 排行榜方面,IT之家發(fā)現(xiàn),官方進(jìn)行如下解釋:
與 OpenAI 的 8K 模型 text-embedding-ada-002 進(jìn)行比較,jina-embedding-v2 在分類平均值、重排平均值、檢索平均值和摘要平均值方面均優(yōu)于 OpenAI 的 text-embedding-ada-002。
官方表示,jina-embeddings-v2 模型,是從頭開始構(gòu)建的。在過去的三個月里,Jina AI 團(tuán)隊進(jìn)行了密集研發(fā)、數(shù)據(jù)收集和調(diào)整。
Jina AI 同時聲稱, jina-embeddings-v2 8K 的上下文長度有利于以下應(yīng)用場景:
法律文件分析:確保對大量法律文本中的每一個細(xì)節(jié)進(jìn)行捕捉和分析。
醫(yī)學(xué)研究:為了進(jìn)行高級分析和發(fā)現(xiàn),全面地嵌入科學(xué)論文。
文學(xué)分析:深入研究長篇內(nèi)容,捕捉微妙的主題元素。
財務(wù)預(yù)測:通過詳細(xì)的財務(wù)報告獲得卓越的洞察力。
會話式 AI:提升聊天機(jī)器人對復(fù)雜用戶查詢的響應(yīng)能力。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。