經(jīng)過(guò)了 LLM、RAG、多模態(tài)等多輪技術(shù)風(fēng)口的洗禮后,AI 智能體的應(yīng)用現(xiàn)狀究竟如何?Langbase 公司最近發(fā)布的調(diào)查報(bào)告通過(guò) 11 個(gè)關(guān)鍵問(wèn)題,為我們提供了一份有價(jià)值的現(xiàn)狀切面。
2024 年,AI 智能體技術(shù)無(wú)疑是科技界的焦點(diǎn)。
通過(guò)對(duì)來(lái)自 100 多個(gè)國(guó)家的 3400 名開(kāi)發(fā)者進(jìn)行深入調(diào)查,Langbase 公司近日發(fā)布的一項(xiàng)報(bào)告揭示了智能體開(kāi)發(fā)中的關(guān)鍵問(wèn)題。這項(xiàng)調(diào)查的受訪者中,有 46% 是企業(yè)領(lǐng)導(dǎo)層,26% 是工程師。
Langbase 專注于提供無(wú)服務(wù)器的 AI 云開(kāi)發(fā)體驗(yàn)。作為一個(gè)提供可組合基礎(chǔ)設(shè)施的 AI 平臺(tái),他們?cè)?2024 年一共處理了來(lái)自 3.6 萬(wàn)開(kāi)發(fā)人員的 1840 億個(gè) token 和 7.86 億個(gè) API 請(qǐng)求。
提起 Langbase 這個(gè)名字,你也許不太熟悉。事實(shí)上,這家公司非常年輕,2023 年剛剛成立。
根據(jù) Crunchbase 披露的數(shù)據(jù),他們剛剛才在 9 月份進(jìn)行了 pre-seed 輪融資,但已經(jīng)得到了谷歌、蘋(píng)果、OpenAI、微軟等大廠高管們的資金支持。
下面就讓我們一起來(lái)看看這家年輕有為的 Langbase 發(fā)布的這份圖文并茂的報(bào)告中究竟提到了哪些內(nèi)容。
問(wèn)題 1:開(kāi)發(fā)者在使用哪些基座大模型
在這場(chǎng) AI 智能體的競(jìng)賽中,OpenAI 的大模型服務(wù)占據(jù)了主導(dǎo)地位,但谷歌正迅速崛起,成為其強(qiáng)勁的競(jìng)爭(zhēng)對(duì)手,Anthropic 緊隨其后。
其中,Meta 的 Llama、Mistral 和 Cohere 雖然影響力較小,但增長(zhǎng)勢(shì)頭不容忽視,顯示出基座大模型市場(chǎng)的激烈競(jìng)爭(zhēng)。
問(wèn)題 2:不同大模型對(duì)應(yīng)的具體用途
OpenAI 在翻譯任務(wù)中被廣泛應(yīng)用,Anthropic 在技術(shù)任務(wù)中備受青睞,而谷歌的模型在健康和翻譯領(lǐng)域占據(jù)主導(dǎo)地位。
此外,Meta 在科技和科學(xué)應(yīng)用中得到了廣泛使用,Cohere 也在多個(gè)領(lǐng)域得到重視,包括科學(xué)和營(yíng)銷(xiāo)。
問(wèn)題 3:哪些因素阻礙了你對(duì)大模型技術(shù)的應(yīng)用
在模型的擴(kuò)展和部署中,數(shù)據(jù)隱私和安全合規(guī)性成為主要關(guān)注點(diǎn),「缺乏監(jiān)控工具」和「高基礎(chǔ)設(shè)施成本」這兩項(xiàng)因素也阻礙了技術(shù)的落地應(yīng)用。
對(duì) AI 驅(qū)動(dòng)解決方案的抵制或懷疑反映了使用者們的長(zhǎng)期顧慮,這表明,模型和技術(shù)的提供商們需要更加透明和用戶友好的 AI 平臺(tái)。
問(wèn)題 4:哪些因素影響大模型的選擇
在選擇大型語(yǔ)言模型(LLM)時(shí),準(zhǔn)確性是最重要的因素,其次是安全性和可定制性,成本的影響相對(duì)較小。
問(wèn)題 5:在部署大模型時(shí),你遇到的最大挑戰(zhàn)是什么
在生產(chǎn)環(huán)境中部署大模型和智能體面臨著種種關(guān)鍵挑戰(zhàn),包括定制困難、質(zhì)量保證評(píng)估方法有限,以及缺乏可重用的基礎(chǔ)設(shè)施。
此外,工具碎片化、集成問(wèn)題和可擴(kuò)展性等方面的顧慮進(jìn)一步復(fù)雜化了這個(gè)過(guò)程。
問(wèn)題 6:采用大模型技術(shù)時(shí),你的主要目標(biāo)是什么
「自動(dòng)化」和「簡(jiǎn)化」是 AI 應(yīng)用的首要任務(wù),使公司在效率和流程簡(jiǎn)化方面受益;此外,定制解決方案和提升合作流程等方面的目標(biāo),反映了大模型日益增長(zhǎng)的靈活性,以及消費(fèi)者對(duì)系統(tǒng)共享訪問(wèn)的興趣。
問(wèn)題 7:您的公司如何使用大模型智能體
LLM 在軟件開(kāi)發(fā)中得到廣泛應(yīng)用,尤其在市場(chǎng)營(yíng)銷(xiāo)、IT 運(yùn)營(yíng)和文本摘要等方面,客服、人力資源和法律領(lǐng)域的使用興趣也在日益增長(zhǎng)。
問(wèn)題 8:哪些平臺(tái)特征對(duì)你至關(guān)重要
大多數(shù)受訪者都需要多智能體檢索增強(qiáng)生成(RAG)功能以提高上下文信息處理,同時(shí),評(píng)估工具對(duì)于確保人工智能系統(tǒng)按預(yù)期工作也很重要。
問(wèn)題 9,在編排 AI 流水線時(shí),開(kāi)發(fā)者偏好哪種工具
大多數(shù)受訪者更喜歡能提供靈活、基礎(chǔ)原語(yǔ)的開(kāi)發(fā)工具以設(shè)計(jì)定制 AI 流水線(pipeline)。預(yù)構(gòu)建的、針對(duì)特定問(wèn)題的解決方案雖然可以直接解決具體問(wèn)題,但它們的可定制性較低。
問(wèn)題 10:什么因素影響大模型智能體開(kāi)發(fā)工具的選擇
開(kāi)發(fā)者將 AI 智能體的版本控制視為開(kāi)發(fā)平臺(tái)最重要的功能。強(qiáng)大的 SDK 或庫(kù)生態(tài)系統(tǒng)以及本地開(kāi)發(fā)環(huán)境也受到重視。
問(wèn)題 11:大模型在公司中的應(yīng)用程度
大多數(shù)開(kāi)發(fā)者將 AI 用于實(shí)驗(yàn)和生產(chǎn)。相比之下,實(shí)驗(yàn)用途的比例遠(yuǎn)遠(yuǎn)大于生產(chǎn)用途,但后者的比例仍在穩(wěn)步前進(jìn)的過(guò)程中。
隨著 AI 智能體基礎(chǔ)設(shè)施的成熟,越來(lái)越多的企業(yè)會(huì)嘗試開(kāi)發(fā)智能體,而隨著多模態(tài)及大模型操作計(jì)算環(huán)境(例如 Claude 通過(guò)接口在線互動(dòng))的發(fā)展,智能體在 2025 年的應(yīng)用將更加廣泛,甚至不僅僅局限于報(bào)告中提到的軟件開(kāi)發(fā)、市場(chǎng)營(yíng)銷(xiāo)、IT 運(yùn)營(yíng)和文本摘要等領(lǐng)域。
然而,該調(diào)查中揭示的開(kāi)發(fā)者關(guān)注的問(wèn)題,例如更看重準(zhǔn)確性、安全性和可定制性,而成本因素影響較小,以及偏好靈活、可定制的 AI 流水線開(kāi)發(fā)工具,并重視 AI 智能體版本控制功能。
無(wú)論技術(shù)怎么進(jìn)步,這份調(diào)查結(jié)果都會(huì)對(duì)智能體平臺(tái)及開(kāi)發(fā)者有參考價(jià)值。
參考資料:
https://langbase.com/state-of-ai-agents?genai
https://x.com/MrAhmadAwais/status/1866483416981786821
本文來(lái)自微信公眾號(hào):新智元(ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。