最近 OpenAI 和谷歌放出的多智能體招聘信息,這可能預(yù)示著 AI 開(kāi)發(fā)的下一個(gè)階段。兩年前,OpenAI 發(fā)布的 ChatGPT 將人工智能中的 LLM 一舉推到公眾面前,引起了世界矚目。
隨后各大科技公司紛紛在次年推出了自己的 LLM,相關(guān)初創(chuàng)公司更是如雨后春筍般層出不窮。但從去年 3 月 GPT-4 橫空出世后,LLM 的發(fā)展似乎就開(kāi)始陷入了停滯。
萬(wàn)眾期待的、將具有顛覆性和革命性的 GPT-5 遲遲不出,與此同時(shí),開(kāi)源與閉源模型的性能差距迅速減小。
AGI 這個(gè)曾經(jīng)在 GPT-4 發(fā)布時(shí),似乎馬上就能達(dá)到的目標(biāo),在這兩年里 LLM 不斷出現(xiàn)的幻覺(jué)、推理邏輯掉鏈子以及模型性能衰退等一系列陰影中再次變得遙遠(yuǎn)起來(lái)。
那么,現(xiàn)階段人工智能發(fā)展的下一步是什么?
或許今年 9 月下旬時(shí),谷歌和 OpenAI 發(fā)布的招聘已向我們揭示:多智能體系統(tǒng)(Multi-Agent Systems,MAS)將會(huì)是 AI 發(fā)展的下一步。
多智能體研究團(tuán)隊(duì)招募進(jìn)行中
9 月 20 日,OpenAI 的研究員 Noam Brown 在 X 上宣布,他們正在為新的多智能體研究團(tuán)隊(duì)招聘機(jī)器學(xué)習(xí)工程師,候選人最好擁有豐富的 LLM 工程經(jīng)驗(yàn)。
AI 智能體的發(fā)展符合 OpenAI 最近提出的衡量通用人工智能(AGI)進(jìn)展的五級(jí)標(biāo)準(zhǔn)中的第三級(jí)。
目前,OpenAI 認(rèn)為自己正處于第二階段的門檻,即被稱為「推理者」的階段。而最近 OpenAI 推出 o1 模型,就是這一階段的代表。
據(jù)《The Information》報(bào)道,OpenAI 一直在開(kāi)發(fā)兩種類型的 AI 智能體,用于自動(dòng)化復(fù)雜任務(wù)。其中一種類型旨在控制設(shè)備以便在文檔之間傳輸數(shù)據(jù)或完成報(bào)銷報(bào)告,另一種則專注于基于網(wǎng)絡(luò)的任務(wù),例如收集公共數(shù)據(jù)或預(yù)訂航班。
無(wú)獨(dú)有偶,9 月 23 日,谷歌也發(fā)布了有關(guān)多智能體的招聘信息。
但早在今年五月,谷歌 DeepMind 的 CEO Demis Hassabis 在接受彭博社采訪時(shí),就表示 AI 發(fā)展的下一步是開(kāi)發(fā)自主人工智能代理。這些代理將能夠回答問(wèn)題,也能夠獨(dú)立計(jì)劃和行動(dòng)。而此類系統(tǒng)會(huì)在未來(lái)一到兩年內(nèi)投入使用。
多智能體系統(tǒng)
多智能體系統(tǒng)是當(dāng)代人工智能研究的核心領(lǐng)域。它由多個(gè)相互交互的智能體組成,這些智能體是能夠感知環(huán)境、學(xué)習(xí)模型、作出決策并采取行動(dòng)的自主實(shí)體。
在多智能體系統(tǒng)中,智能體可以是軟件程序、機(jī)器人、無(wú)人機(jī)、傳感器、人類或它們的組合。
此外,多智能體系統(tǒng)中的每個(gè)智能體具備特定的專長(zhǎng)和目標(biāo)。例如,可以開(kāi)發(fā)一個(gè)包含獨(dú)立智能體的系統(tǒng),這些智能體分別專注于總結(jié)、翻譯、內(nèi)容生成等任務(wù)。然后,這些智能體可以共同工作,共享信息,并以靈活可定制的方式分工合作。
與像 GPT 這樣的單體大語(yǔ)言模型(LLM)相比,多智能體系統(tǒng)的一些關(guān)鍵潛在優(yōu)勢(shì)包括:
專門化:智能體可以針對(duì)特定任務(wù)進(jìn)行優(yōu)化,而不是試圖在單一模型中包含所有能力。這使得在處理特定任務(wù)時(shí)效率更高且更具針對(duì)性,性能也更佳。
定制化:用戶可以根據(jù)需求靈活組合不同的智能體。智能體團(tuán)隊(duì)的組合可以根據(jù)不同的使用場(chǎng)景進(jìn)行調(diào)整。
可擴(kuò)展性:單個(gè)智能體可以獨(dú)立更新或替換,而無(wú)需從零重新訓(xùn)練整個(gè)模型。這使得多智能體系統(tǒng)的迭代和改進(jìn)更加可行。
可解釋性:使用多個(gè)智能體時(shí),更容易理解和分析不同組件如何對(duì)系統(tǒng)的整體行為做出貢獻(xiàn)。而單體模型通常是一個(gè)「黑箱模型」。
在實(shí)際應(yīng)用中,多智能體系統(tǒng)的優(yōu)勢(shì)就更加顯著:
靈活性與擴(kuò)展能力:多智能體系統(tǒng)可以通過(guò)增加、移除和修改智能體來(lái)靈活地適應(yīng)變化的環(huán)境,這使得它們?cè)诮鉀Q復(fù)雜問(wèn)題時(shí)表現(xiàn)出極高的擴(kuò)展能力。
魯棒性與可靠性:控制的去中心化使得即使某些組件失效,系統(tǒng)也能繼續(xù)運(yùn)行,從而具有更高的魯棒性和容錯(cuò)能力。
自組織與協(xié)調(diào):智能體可以基于「涌現(xiàn)行為規(guī)則」自組織,從而實(shí)現(xiàn)分工、協(xié)調(diào)決策和沖突解決;「涌現(xiàn)行為規(guī)則」是指通過(guò)個(gè)體間的簡(jiǎn)單互動(dòng)產(chǎn)生復(fù)雜的整體行為。
實(shí)時(shí)操作:無(wú)需人為監(jiān)管即可立即對(duì)環(huán)境變化作出響應(yīng),支持災(zāi)害救援、交通優(yōu)化等實(shí)時(shí)響應(yīng)應(yīng)用場(chǎng)景。
多智能體系統(tǒng)在從前的發(fā)展中往往受到智能體復(fù)雜性、不安全的通信和協(xié)調(diào)困難的限制。
然而,隨著現(xiàn)代人工智能解鎖出更智能、自適應(yīng)且可擴(kuò)展的實(shí)現(xiàn)方式,這些系統(tǒng)在構(gòu)建響應(yīng)迅速且具有彈性的系統(tǒng)中能夠發(fā)揮越來(lái)越重要的作用。
未來(lái)多智能體系統(tǒng)的應(yīng)用場(chǎng)景涵蓋了通過(guò)集成交通打造更智能的城市、通過(guò)分布式發(fā)電和存儲(chǔ)實(shí)現(xiàn)更清潔的能源,以及利用患者數(shù)據(jù)進(jìn)行精準(zhǔn)醫(yī)療。
AI 多智能體系統(tǒng)提供了將這些構(gòu)想變?yōu)閺V泛實(shí)際應(yīng)用的計(jì)算基礎(chǔ),并為解決各行業(yè)中復(fù)雜的現(xiàn)實(shí)問(wèn)題提供了新的解決方案。
而隨著分布式智能模仿生態(tài)系統(tǒng)等自然現(xiàn)象,AI 多智能體系統(tǒng)將會(huì)成為打造更高效、響應(yīng)更迅速且更具彈性的未來(lái)世界不可或缺的方法。
參考資料:
https://the-decoder.com/what-comes-after-o1-openai-builds-multi-agent-research-team/
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。