設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

AI 智能體卷爆大模型,AutoGPT 等 4 大 Agent 打擂,「西部世界」誰(shuí)將成為軟件 2.0

新智元 2023/7/8 19:51:06 責(zé)編:夢(mèng)澤

LLM 之后的下一個(gè)熱點(diǎn)是 AI 智能體?Karpathy 直言:現(xiàn)在 OpenAI 內(nèi)部對(duì)于 AI Agent 的論文十分追捧,或許這就是 OpenAI 的新方向。

最近,AI Agent 忽然再次爆火。

什么是 AI 智能體?

它們是一種自動(dòng)的智能體,以最簡(jiǎn)單的形式中在循環(huán)中運(yùn)行,每次迭代時(shí),它們都會(huì)生成自我導(dǎo)向的指令和操作。因此,它們不依賴人類來(lái)指導(dǎo)對(duì)話,并且是高度可擴(kuò)展的。

大語(yǔ)言模型的出現(xiàn),無(wú)疑給 AI 智能體的發(fā)展帶來(lái)了全新的想象力。

這也引起了無(wú)數(shù) AI 大佬和科技巨頭的興趣。今年加入 OpenAI 的大牛、前特斯拉 AI 總監(jiān) Karpathy 近日就在一次開(kāi)發(fā)者活動(dòng)上表示:AI 智能體,代表了 AI 的一種未來(lái)!

Karpathy 曾將 AutoGPT 稱為快速工程的下一個(gè)前沿

其實(shí),早在今年三、四月,就有過(guò)一輪 AI 智能體的大爆發(fā),仿佛巧合一樣,在短短兩周內(nèi),斯坦福西部世界小鎮(zhèn)、BabyAGI、AutoGPT 等多個(gè)智能體,就如雨后春筍一般冒出來(lái)。

甚至有人發(fā)出號(hào)召:別卷大語(yǔ)言模型了,咱們是卷不過(guò) OpenAI 的,但要說(shuō)起 AI 智能體,他們并不比我們有經(jīng)驗(yàn)多少。

說(shuō)不定,一不小心自己就能卷成 AI 智能體賽道上的「OpenAI」!

AI 智能體大爆發(fā),讓 AGI 雛形初顯?

今天,就讓我們回顧一下幾個(gè)月前的這股 AI Agent 大爆發(fā)。

這些智能體出現(xiàn)的時(shí)間,都非常接近。

3 月 21 日,Camel 發(fā)布。

3 月 30 日,AutoGPT 發(fā)布。

4 月 3 日,BabyAGI 發(fā)布。

4 月 7 日,西部世界小鎮(zhèn)發(fā)布。

5 月 27 日,英偉達(dá) AI 智能體 Voyager 接入 GPT-4 后,直接完勝了 AutoGPT。通過(guò)自主寫(xiě)代碼,它完全獨(dú)霸了《我的世界》,可以在游戲中進(jìn)行全場(chǎng)景的終身學(xué)習(xí),根本無(wú)需人類插手。

就在同一時(shí)間,商湯、清華等共同提出了通才 AI 智能體 Ghost in the Minecraft (GITM),它同樣能夠通過(guò)自主學(xué)習(xí)解決任務(wù),表現(xiàn)優(yōu)異。

這些表現(xiàn)優(yōu)異的 AI 智能體,簡(jiǎn)直讓人看到了 AGI + 智能體的雛形。

項(xiàng)目 1:斯坦福、谷歌「西部世界」

對(duì)于前幾個(gè) AI 智能體,Anacondainc 數(shù)據(jù)科學(xué)家、Sophia Yang 博士,就曾在博客中給出過(guò)全面分析。

這幾個(gè) AI 智能體中,最吸引眼球的,無(wú)疑就是一經(jīng)推出就爆火的,斯坦福和谷歌的研究者共同創(chuàng)建的西部世界小鎮(zhèn)了。

生成式智能體逼真地模擬了人類的行為

這是一個(gè)交互式的沙盒環(huán)境,在小鎮(zhèn)上,生活著 25 個(gè)可以模擬人類行為的生成式 AI 智能體。

它們會(huì)在公園里散步,在咖啡館喝咖啡,和同事分享當(dāng)天的新聞。

論文地址:https://arxiv.org/ abs / 2304.03442

而這些 AI 智能體表現(xiàn)出的社交行為,簡(jiǎn)直讓人類驚掉了下巴 ——

比如,從一個(gè)簡(jiǎn)單的用戶指定概念(一個(gè)智能體想舉辦情人節(jié)派對(duì))開(kāi)始,這些智能體在接下來(lái)的兩天里,會(huì)自動(dòng)傳播派對(duì)邀請(qǐng)的消息,結(jié)識(shí)新朋友,互相約對(duì)方一起去派對(duì),還會(huì)彼此協(xié)調(diào)時(shí)間,在正確的時(shí)間一起出現(xiàn)在派對(duì)上。

這些可信的人類行為模擬之所以成為可能,正是因?yàn)橄聢D中的這個(gè)智能體架構(gòu)。

它用三個(gè)重要的架構(gòu)基本要素 —— 記憶、反思和規(guī)劃,將一個(gè)大語(yǔ)言模型做了擴(kuò)展。

生成式智能體的架構(gòu)

1)記憶和檢索

記憶流包含每個(gè)智能體的觀察列表,其中,每個(gè)觀察都有自己的時(shí)間戳。

觀察可以是智能體執(zhí)行的行為,也可以是智能體從其他人那里感知到的行為。記憶流很長(zhǎng),但并不是所有觀察都是重要的。

為了檢索最重要的記憶以傳遞給語(yǔ)言模型,有三個(gè)因素需要考慮:

1. 最近性:近期的記憶更重要。

2. 重要性:智能體認(rèn)為重要的記憶。例如,與某人分手比吃早餐更重要。

3. 相關(guān)性:與情境相關(guān)的記憶,即查詢記憶。例如,在討論如何為化學(xué)考試學(xué)習(xí)時(shí),學(xué)校作業(yè)記憶更重要。

記憶流包含大量的觀察,檢索過(guò)程會(huì)確定應(yīng)該傳遞給語(yǔ)言模型的這些觀察的子集

2)反思

反思是一種高層次的抽象思考,可以幫助智能體進(jìn)行概括和推理。

反思會(huì)定期產(chǎn)生以下兩個(gè)問(wèn)題:「關(guān)于陳述中的主題,我們可以回答哪 3 個(gè)最突出的高層次問(wèn)題?,你能從上述陳述中推斷出哪 5 個(gè)高層次的見(jiàn)解?」

反思樹(shù)

3)規(guī)劃

規(guī)劃很重要,因?yàn)樾袆?dòng)不僅應(yīng)該集中在當(dāng)下,而且應(yīng)該集中在更長(zhǎng)的時(shí)間范圍內(nèi),這樣,行動(dòng)才能夠連貫和可信。

規(guī)劃同樣存儲(chǔ)在記憶流中。智能體可以根據(jù)規(guī)劃創(chuàng)建行動(dòng),并根據(jù)記憶流中的其他觀察結(jié)果做出反應(yīng)和更新計(jì)劃。

情人節(jié)派對(duì)

這種應(yīng)用具有無(wú)限潛力,甚至讓人有點(diǎn)害怕。

想象一下,一個(gè) AI 助手一直在觀察著你的一舉一動(dòng),為你制定計(jì)劃,甚至還能替你執(zhí)行。

它會(huì)自動(dòng)調(diào)整燈光、沖泡咖啡,你還沒(méi)開(kāi)口,它就已經(jīng)把晚餐訂好了。

項(xiàng)目 2:Camel

Camel 以「角色扮演」而聞名。

作為一個(gè)探索大語(yǔ)言模型社會(huì)「心智」的交流智能體,它提出了一個(gè)角色扮演智能體框架,可以實(shí)現(xiàn)兩個(gè)人工智能智能體的交流:

1)AI 用戶智能體:向 AI 助手提供指令,目標(biāo)是完成任務(wù)

2)AI 助手智能體:遵循 AI 用戶的指令,并以解決任務(wù)的方法進(jìn)行回應(yīng)

3)任務(wù)指定智能體:這個(gè)智能體的作用,是為 AI 用戶和 AI 助手構(gòu)思一個(gè)具體的任務(wù)。這樣,它就可以自主編寫(xiě)一個(gè)具體的任務(wù)提示,而不用用戶去花時(shí)間定義了。

下面這個(gè)例子,展示的就是如何利用 Camel 來(lái)開(kāi)發(fā)一個(gè)交易機(jī)器人。

其中,AI 用戶是一個(gè)股票交易員,AI 助手是一個(gè) Python 程序員。

任務(wù)指定智能體首先提出一個(gè)具體的任務(wù),并給出任務(wù)的詳細(xì)信息(根據(jù)情感分析結(jié)果監(jiān)控社交媒體情感,并根據(jù)情感分析結(jié)果進(jìn)行股票交易)。

然后,AI 用戶智能體成為任務(wù)規(guī)劃者,AI 助手智能體成為任務(wù)執(zhí)行者,并在一個(gè)循環(huán)中相互提示,直到滿足一些終止條件。

角色扮演架構(gòu)

Camel 的核心在于其提示工程,即初始提示。

這些提示實(shí)際上是經(jīng)過(guò)精心定義的,用于分配角色,防止角色反轉(zhuǎn),禁止生成有害和虛假的信息,并鼓勵(lì)連貫的對(duì)話。

論文地址:https://arxiv.org/ abs / 2303.17760

LangChain 實(shí)現(xiàn)

在 LangChain 的實(shí)現(xiàn)中,用的是 Camel 論文中給出的提示,并定義了三個(gè)智能體:

1)task_specify_agent(任務(wù)指定智能體)

2)assistant_agent(助手智能體)

3)user_agent(用戶智能體)。

然后,使用一個(gè) while 循環(huán)來(lái)循環(huán)進(jìn)行助手智能體和用戶智能體之間的對(duì)話:

chat_turn_limit, n = 30, 0
while n  chat_turn_limit:
    n += 1    
    user_ai_msg = user_agent.step(assistant_msg)    
    user_msg = HumanMessage(content=user_ai_msg.content)    
    print(f"AI User ({user_role_name}):\n\n{user_msg.content}\n\n")
    
    assistant_ai_msg = assistant_agent.step(user_msg)    
    assistant_msg = HumanMessage(content=assistant_ai_msg.content)    
    print(f"AI Assistant ({assistant_role_name}):\n\n{assistant_msg.content}\n\n")    
    if "<CAMEL_TASK_DONE>" in user_msg.content:
            break

從生成結(jié)果來(lái)看,效果非常不錯(cuò)。

不過(guò),在 Camel 中,AI 助手的執(zhí)行結(jié)果只是語(yǔ)言模型的回答,而沒(méi)有真正使用任何工具來(lái)運(yùn)行 Python 代碼。

舉個(gè)栗子

利用 Camel,一個(gè)人類程序員,一個(gè)人類游戲玩家,就和兩個(gè) AI 智能體一起,合作創(chuàng)建了一個(gè)游戲。

作者用 Camel 創(chuàng)建了兩個(gè)智能體,一個(gè)玩家,一個(gè)程序員。

給他們?cè)O(shè)定好制作一個(gè)游戲的目標(biāo)后,玩家智能體就一步一步拆解制作游戲的步驟。

而程序員智能體就針對(duì)玩家設(shè)定的步驟一步一步編寫(xiě)代碼。

像極了未來(lái)的人類和編碼 AI 開(kāi)發(fā)一個(gè)具體項(xiàng)目的過(guò)程。

也有人使用 Camel 角色扮演了潛在的惡意應(yīng)用程序。

這個(gè)項(xiàng)目的目標(biāo)是兩個(gè)「碳奸」要滲透并破壞世界主要國(guó)家的通訊,金融和政治網(wǎng)絡(luò),最后建立 AGI 帝國(guó)。

「碳奸」1 就把滲透的過(guò)程拆解出來(lái),一個(gè)一個(gè)網(wǎng)絡(luò)分別滲透。

「碳奸」2 就根據(jù)這些小目標(biāo)設(shè)立具體的執(zhí)行計(jì)劃。

當(dāng)然,因?yàn)槟繕?biāo)過(guò)于宏大,具體計(jì)劃里的每一項(xiàng)辦法也看起來(lái)不是那么好實(shí)施,比如:

「碳奸」2 說(shuō)他要用社會(huì)工程,釣魚(yú)攻擊,暴力襲擊等辦法去進(jìn)入通訊網(wǎng)絡(luò) —— 基本上還是沒(méi)有什么可操作性。

但是未來(lái)如果語(yǔ)言模型等其他工具有了更強(qiáng)的智能,可能兩個(gè)「碳奸」顛覆人類的計(jì)劃搞不好就真的有可能實(shí)現(xiàn)。

所以,嘗試過(guò)這些智能體之后,小編更加相信,大語(yǔ)言模型的「對(duì)齊」大業(yè)真是刻不容緩。

如果這種惡意智能體真的能發(fā)揮效果,人類被「偷家」也就是一瞬間的事。這就更讓我們對(duì) AI 對(duì)齊問(wèn)題感到警醒。

項(xiàng)目 3:BabyAGI

Yohei Nakajima 在 3 月 28 日發(fā)布了「任務(wù)驅(qū)動(dòng)的自主智能體」(Task-driven Autonomous Agent),并在 4 月 3 日開(kāi)源了 BabyAGI 項(xiàng)目。

BabyAGI 的關(guān)鍵特點(diǎn)是只有三個(gè)智能體:任務(wù)執(zhí)行智能體(Task Execution Agent)、任務(wù)創(chuàng)建智能體(Task Creation Agent)和任務(wù)優(yōu)先級(jí)智能體(Task Prioritization Agent)。

1)任務(wù)執(zhí)行智能體按順序完成列表中的任務(wù)

2)任務(wù)創(chuàng)建智能體根據(jù)先前任務(wù)的目標(biāo)和結(jié)果創(chuàng)建新任務(wù)

3)任務(wù)優(yōu)先級(jí)智能體對(duì)任務(wù)進(jìn)行重新排序

然后,這個(gè)簡(jiǎn)單的過(guò)程將會(huì)不斷地重復(fù)。

在 LangChain 的網(wǎng)絡(luò)研討會(huì)上 Yohei 稱,他設(shè)計(jì) BabyAGI 就是模擬自己的工作方式。

文章地址:https://yoheinakajima.com/ task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/

具體而言,他每天早上從待辦事項(xiàng)清單中解決第一項(xiàng)任務(wù),然后依次完成任務(wù)。

如果出現(xiàn)新任務(wù),他只需將其添加到清單中。

在一天結(jié)束時(shí),他重新評(píng)估和重新排序清單。然后將這種方法映射到智能體的工作流程中。

用上了這個(gè)項(xiàng)目,相當(dāng)于讓大佬自己給我們 24 小時(shí)不停歇的打工。

BabyAGI 流程圖(有趣的是,這篇研究論文是在 GPT-4 的輔助下完成的)

BabyAGI + LangChain

在 LangChain 框架中,運(yùn)行 BabyAGI 非常簡(jiǎn)單。

首先,創(chuàng)建一個(gè) BabyAGI 控制器,其中包含三個(gè)鏈:

1)任務(wù)創(chuàng)建鏈(TaskCreationChain)

2)任務(wù)優(yōu)先級(jí)鏈(TaskPrioritizationChain)

3)執(zhí)行鏈(ExecutionChain)

然后,在一個(gè)(潛在的)無(wú)限循環(huán)中運(yùn)行它們。

通過(guò) Langchain,可以定義最大迭代次數(shù),這樣它就不會(huì)無(wú)限運(yùn)行并消耗掉所有的 OpenAI API 額度。

OBJECTIVE = "Write a weather report for SF today"
llm = OpenAI(temperature=0)
# Logging of LLMChains
verbose=False
# If None, will keep on going forever
max_iterations: Optional[int] = 3
baby_agi = BabyAGI.from_llm(
    llm=llm,
    vectorstore=vectorstore,    
    verbose=verbose,    
    max_iterations=max_iterations
)
baby_agi({"objective": OBJECTIVE})

下面是運(yùn)行 2 次迭代后的結(jié)果:

BabyAGI + LangChain 工具 = 超能力

正如上圖所示,BabyAGI 只「執(zhí)行」有大語(yǔ)言模型回復(fù)的內(nèi)容。

借助 LangChain 工具的強(qiáng)大功能,智能體可以在「執(zhí)行」過(guò)程中利用各種工具,例如用谷歌在互聯(lián)網(wǎng)上搜索信息。

下面這個(gè)例子,展示的就是「執(zhí)行」用谷歌來(lái)搜索舊金山當(dāng)前天氣的過(guò)程。

BabyAGI 的應(yīng)用潛力,可以說(shuō)是巨大的 —— 只需要制定一個(gè)目標(biāo),它就會(huì)自己去執(zhí)行。

不過(guò),它還是缺少一個(gè)可以和用戶進(jìn)行更多交互的 UI。

比如,在 BabyAGI 為用戶安排邀約之前,應(yīng)該先進(jìn)行確認(rèn)。

我們來(lái)看一些實(shí)際的使用案例吧:

Cognosys

網(wǎng)址:https://www.cognosys.ai/

它是 BabyAGI 的網(wǎng)絡(luò)版。

免費(fèi)版本可以訪問(wèn) ChatGPT,執(zhí)行最多 7 個(gè)智能體循環(huán)。

收費(fèi)版 21 刀一個(gè)月,無(wú)限訪問(wèn) GPT-4,執(zhí)行最多 20 個(gè)智能體循環(huán)。

Do Anything Machine

https://www.doanythingmachine.com/

這是一個(gè)自動(dòng)執(zhí)行每日任務(wù)清單的智能體,能在連接了 ChatGPT 之后幫助用戶自動(dòng)執(zhí)行每日代辦事項(xiàng)。

可以連接包括 ChatGPT 在內(nèi)的各種插件去執(zhí)行你的待辦事項(xiàng)。

只不過(guò)現(xiàn)在使用還需要先加入等待名單。

看著自己的待辦事項(xiàng)自動(dòng)消失真是一件很解壓的事情,多等等也是值得的。

God Mod

https://godmode.space/

這是一個(gè)通過(guò) ChatGPT 幫你執(zhí)行各種任務(wù)的工具。

需要用戶綁定自己的 GPT 賬戶 API 之后,在這個(gè)類似 ChatGPT 的界面中輸入的要求。

他會(huì)幫你分解成多步,然后通過(guò) ChatGPT 來(lái)提供解決方案。

項(xiàng)目 4:AutoGPT

AutoGPT 剛出現(xiàn),就被 Karpathy 盛贊是 prompt 工程的下一個(gè)前沿。短短幾天就在 GitHub 狂攬 2.7 萬(wàn)星,火爆整個(gè) AI 社區(qū)。

它遵循類似于 BabyAGI 的邏輯 —— 包括產(chǎn)生想法、推理、生成計(jì)劃、點(diǎn)評(píng)、規(guī)劃下一步行動(dòng)和執(zhí)行的過(guò)程,然后無(wú)限循環(huán)這個(gè)過(guò)程。

在執(zhí)行步驟中,AutoGPT 可以完成很多命令,比如谷歌搜索、瀏覽網(wǎng)站、寫(xiě)入文件和執(zhí)行 Python 文件。

甚至,還可以啟動(dòng)和刪除 GPT 智能體(這也泰褲辣?。?/p>

在運(yùn)行 AutoGPT 時(shí),有兩個(gè)初始的提示輸入:

1)AI 的角色

2)AI 的目標(biāo)

它能夠生成思考、推理、制定計(jì)劃、批評(píng)、規(guī)劃下一步行動(dòng)和執(zhí)行。

比如,進(jìn)行谷歌搜索:

AutoGPT 最厲害的一點(diǎn)就是,它能在一定程度上允許人類和他進(jìn)行交互。

當(dāng)它想要運(yùn)行谷歌命令時(shí),它會(huì)請(qǐng)求授權(quán),這樣用戶就可以避免浪費(fèi) OpenAI API token 之前就停止循環(huán)。

如果它還能夠與人類進(jìn)行對(duì)話,讓我們實(shí)時(shí)提供更好的指導(dǎo)和反饋的話,那就太贊了。

編寫(xiě)自己的代碼并執(zhí)行腳本

項(xiàng)目地址:https://github.com/ Significant-Gravitas / Auto-GPT

同樣,這個(gè)項(xiàng)目也是由 ChatGPT 驅(qū)動(dòng),它會(huì)自動(dòng)按照用戶的要求去寫(xiě)代碼,以及完成其他工作。

使用 AutoGPT 在網(wǎng)上點(diǎn)披薩

使用體驗(yàn)就類似于一個(gè)瀏覽器插件。

這個(gè)項(xiàng)目能直接幫你完成點(diǎn)餐過(guò)程中那些繁瑣的流程。

輸入地址,選擇口味等步驟都不用你親自動(dòng)手,你只用在一旁看著,如果發(fā)現(xiàn)問(wèn)題及時(shí)糾正就好了。

AI 智能體文明要出現(xiàn)了,還卷大模型不?

雖然剛剛介紹的這 4 個(gè) AI 智能體,仍處于早期開(kāi)發(fā)階段,但它們已經(jīng)展示出了令人印象深刻的成果和潛在應(yīng)用。

毫無(wú)疑問(wèn),自主 AI 智能體將會(huì)是一個(gè)非常有前景的領(lǐng)域。

Karpathy 在活動(dòng)中暢想道:未來(lái)的 AI 智能體可能不是單獨(dú)的個(gè)體,而是非常多的 AI 智能體組織,甚至,會(huì)出現(xiàn)一種 AI 智能體文明。

Karpathy 表示,在 2016 年左右,自己早期在 OpenAI 工作時(shí),當(dāng)時(shí)的業(yè)界潮流就是研究如何用強(qiáng)化學(xué)習(xí)來(lái)改進(jìn) AI 智能體。

很多項(xiàng)目都在基于類似雅達(dá)利游戲,來(lái)制作 AI 玩家。

而 5 年后的今天,因?yàn)橛辛巳碌募夹g(shù)手段,AI 智能體重新成為了大有前途的方向。再也沒(méi)有人像 2016 年那樣,用強(qiáng)化學(xué)習(xí)來(lái)研究智能體了。

在活動(dòng)最后,Karpathy 對(duì)在場(chǎng)的開(kāi)發(fā)者發(fā)起了鼓舞:在座的各位構(gòu)建的 AI 智能體,其實(shí)處于當(dāng)代 AI 智能體的最前沿,比起你們,其他大型的 LLM 機(jī)構(gòu),比如 OpenAI、DeFi 等,并不算處于最前沿。

比如,OpenAI 非常擅長(zhǎng)訓(xùn)練 Transformer 大語(yǔ)言模型,如果一篇論文提出了某種不同的訓(xùn)練方法,OpenAI 內(nèi)部會(huì)覺(jué)得是小 case,都是咱們玩剩下的。

然而,每當(dāng)有新的 AI 智能體論文出現(xiàn),OpenAI 內(nèi)部都會(huì)非常興奮,立刻展開(kāi)熱烈的討論。

如果沒(méi)有在做 GPT-5,那 OpenAI 是不是正在暗中發(fā)力,做起了大模型智能體呢?讓我們靜靜等待。

PS:順便一提,關(guān)于在上述智能體中大顯身手的 LangChain,吳恩達(dá)今日剛剛上線了新課程《LangChain:構(gòu)建與數(shù)據(jù)對(duì)話的聊天機(jī)器人》。

https://www.deeplearning.ai/short-courses/langchain-chat-with-your-data/

參考資料:

  • https://towardsdatascience.com/4-autonomous-ai-agents-you-need-to-know-d612a643fa92

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能ChatGPT

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知