GPT-4o 系列 AI 模型加持,微軟 LlamaParse 文檔解析能力全面升級(jí)

2024/11/28 13:42:33 來(lái)源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 11 月 28 日消息,微軟于 11 月 26 日發(fā)布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端點(diǎn),利用 GPT-4o 系列模型,增強(qiáng)提取非結(jié)構(gòu)化數(shù)據(jù)和解析多模態(tài)文檔,并無(wú)縫銜接 Azure AI Search 向量數(shù)據(jù)庫(kù),構(gòu)建完整的檢索增強(qiáng)生成(RAG)工作流程。

LlamaParse 簡(jiǎn)介

微軟 LlamaParse 是一個(gè)專(zhuān)為生成式人工智能(GenAI)設(shè)計(jì)的文檔解析器,其主要目標(biāo)是解析和清理各種文檔數(shù)據(jù),在傳遞給下游大型語(yǔ)言模型 (LLM) 之前,確保數(shù)據(jù)質(zhì)量。

新增 Azure OpenAI 端點(diǎn)(endpoints)

微軟 LlamaParse 在本次集成后,可以讓用戶(hù)調(diào)用 Azure OpenAI 的 GPT-4o 系列模型,提取非結(jié)構(gòu)化數(shù)據(jù)和文檔轉(zhuǎn)換。此次集成充分發(fā)揮了雙方優(yōu)勢(shì),LlamaParse 負(fù)責(zé)高效解析,Azure OpenAI 則提供強(qiáng)大的語(yǔ)言模型能力,最終實(shí)現(xiàn)更精準(zhǔn)、更智能的文檔處理。

IT之家援引該媒體報(bào)道,附上本次更新內(nèi)容如下:

  • 直接連接到 Azure OpenAI 的 GPT-4o 和 GPT-4o-mini 等模型

  • LlamaParse 中的多模態(tài)文檔解析,通過(guò) Azure OpenAI 的多模態(tài)支持

  • LLM 優(yōu)化的輸出,用于增強(qiáng)檢索和語(yǔ)義搜索

  • 通過(guò) LlamaIndex 無(wú)縫攝取到 Azure AI Search 的向量存儲(chǔ)庫(kù)中

  • 企業(yè)級(jí)安全性和合規(guī)性,適用于敏感工作負(fù)載

用戶(hù)可以利用 LlamaCloud、Azure AI Search 和 Azure OpenAI 構(gòu)建一個(gè)完整的 RAG 工作流程,具體步驟包括:

  • 解析與豐富: 使用 LlamaParse Premium 和 Azure OpenAI 進(jìn)行高級(jí)文檔提取,生成 Markdown、LaTeX 和 Mermaid 圖表等多種格式的 LLM 優(yōu)化輸出。

  • 分塊和嵌入: 使用 Azure AI Search 作為向量存儲(chǔ),并利用 Azure AI 模型目錄中的嵌入模型,對(duì)解析后的內(nèi)容進(jìn)行分塊、嵌入和索引。

  • 搜索與生成: 利用 Azure AI Search 的查詢(xún)重寫(xiě)和語(yǔ)義重新排序功能,提升檢索質(zhì)量。最終,通過(guò) Llamaindex 編排 Azure AI Search 和 Azure OpenAI,構(gòu)建生成式 AI 應(yīng)用。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:微軟,LlamaParse

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知