這壁壘…… 一夜走紅的 Manus,現(xiàn)在已經(jīng)有了開源復(fù)刻版!
5 個人 3 個小時,一個完全免費、無需排隊等待的 OpenManus 就做好了。
至于復(fù)現(xiàn)程度,還是直接看 Manus 官方和開源團(tuán)隊提供的 demo 對比。
作為全球首款通用智能體,官方提供的 case 如下:
而 OpenManus 團(tuán)隊三小時復(fù)刻的成果是醬嬸兒的:
效果大家自己感受一下。
對于動手能力強(qiáng)的小伙伴兒,也期待大家自行體驗后留言反饋。
從開源反推 Manus 的實現(xiàn)路徑
與此同時,通過深扒 OpenManus,我們其實還可以看出一條實現(xiàn) Manus 的合理路徑。
(當(dāng)前 Manus 使用了哪家模型、Agent 框架等具體細(xì)節(jié)處于保密狀態(tài))
概括而言,OpenManus 的背后有三大關(guān)鍵:
擁有模塊化 Agent 系統(tǒng);
具備實時反饋機(jī)制;
配備了一整套強(qiáng)大的工具鏈;
展開來說,其核心設(shè)計就在這種模塊化 Agent 系統(tǒng)。開發(fā)者可以根據(jù)需要自由組合不同的功能模塊,從而創(chuàng)造出獨特的 AI 助手。
在 OpenManus 中,擁有不同分工的 Agent 會協(xié)作完成需求理解、規(guī)劃、行動等任務(wù)。
比如 Manus 主代理就像項目經(jīng)理,負(fù)責(zé)理解用戶需求并完成分工;PlanningAgent 作為規(guī)劃員,負(fù)責(zé)將復(fù)雜任務(wù)進(jìn)一步拆解成可執(zhí)行的步驟;而 ToolCallAgent 則是技術(shù)專家,負(fù)責(zé)掌管各類工具使用。
以上這一套都是靠開源團(tuán)隊曾經(jīng)提出的 MetaGPT(一個多智能體框架)實現(xiàn),開發(fā)者可以自由集成多個合適的大語言模型。
此外,OpenManus 的另一關(guān)鍵在于其思維過程是公開透明的。
正如開頭提到的例子,拿到任務(wù)后,OpenManus 如何思考問題,如何規(guī)劃執(zhí)行…… 全都能實時反饋。
這為人類在合適時間進(jìn)行干預(yù)提供了“窗口”,有助于更高質(zhì)量完成任務(wù)。
最后不得不提到 Agent 對工具的使用。
為了完成復(fù)雜任務(wù),OpenManus 也配備了一系列“外援”:
瀏覽器自動化:像人類一樣操作瀏覽器,自動分析網(wǎng)絡(luò)信息并交互;
各種代碼執(zhí)行器:能夠?qū)崟r生成和執(zhí)行代碼;
文件處理:自動生成和管理各類文檔;
……
需要注意的是,各類工具都不是單獨的模塊,而是需要協(xié)同設(shè)計。
將以上組合在一起,這類多智能體系統(tǒng)的一般架構(gòu)為:底層由各類大語言模型構(gòu)成,中間層通過多智能體協(xié)作拆解任務(wù),執(zhí)行層調(diào)用各類 API 接口完成具體操作。
總之,按照 OpenManus 作者的總結(jié),這一開源成果結(jié)合了 computer-use、基本的 Agents 以及融合了規(guī)劃能力。
正如 OpenManus 團(tuán)隊在項目致謝中提到的,Claude 廠商 Anthropic 去年上線的 computer-use,以及 YC 投資的項目 browser-use,都給 OpenManus 提供了基礎(chǔ)支持。
顧名思義,這兩個項目分別被用來操作電腦和瀏覽器,而在沙盒環(huán)境中操縱正是 Manus 工作的一大核心特征。
5 人開發(fā)團(tuán)隊,3 小時完成復(fù)刻
OpenManus 團(tuán)隊只用了 1 個小時就完成了核心系統(tǒng),整體也只用了 3 個小時。
核心作者梁新兵介紹,OpenManus 的火速上線,來源于 MetaGPT 積累下的技術(shù)沉淀。
(注:MetaGPT 是一個多智能體框架,為了處理復(fù)雜任務(wù),將不同的角色分配給 GPT 模型,形成一個協(xié)作性“軟件公司”。)
我們只是把瀏覽器工具鏈嫁接到過去代碼上,配合沉淀的 Agent 工具包。
幾位研發(fā)成員,也都是來自 MetaGPT 團(tuán)隊。
“開源版 Devin”—— 數(shù)據(jù)解釋器(Data Interpreter),也是出自 MetaGPT 團(tuán)隊之手。
OpenManus 核心作者梁新兵,畢業(yè)于華東師大,還在讀時就參與了 Data Interpreter 的工作。
另一名核心作者向勁宇,本科就讀于西南交通大學(xué)應(yīng)用物理系。
去年,讀大四的他和隊友一起使用 GPT-4 與 Claude 3 組成多智能體的方案,讓 AI 分飾多個角色、相互驗證來完成答題步驟,獲得了阿里巴巴數(shù)學(xué)競賽 AI 賽道全球第二名。
在 MetaGPT 社區(qū),向勁宇還和其他成員一起,讓智能體成功在“我的世界”當(dāng)中采集到了鉆石。
甚至他還曾經(jīng)讓智能體假扮知乎大 V,回答了 100 多個問題,獲得 3 萬余次閱讀,還有贊同、反駁甚至私信關(guān)注,結(jié)果直到他主動停止,AI 的身份都未被發(fā)現(xiàn)。
張佳釔,去年本科畢業(yè)于中國人民大學(xué)高瓴人工智能學(xué)院,現(xiàn)在是港科大(廣州)在讀博士,被 ICLR 2025 接收的智能體框架 AFlow,他和向勁宇是共同一作。
于兆洋,張佳釔在人大的同級同學(xué);洪思睿,MetaGPT 和 Data Interpreter 兩篇論文的共同一作,DeepWisdom 高級研究員,香港科技大學(xué)碩士,本科畢業(yè)于暨南大學(xué)。
AFlow 的作者當(dāng)中,也有于兆洋和洪思睿的名字。
今年,以張佳釔和向勁宇為共同一作,五個人的名字共同出現(xiàn)在了一個名為 SPO 的項目當(dāng)中,該項目能夠讓提示詞自我進(jìn)化,讓人們擺脫研究提示詞工程的繁瑣過程。
并且綜合五名作者的經(jīng)歷和署名信息可以推斷,除了 15 年取得碩士學(xué)位的洪思睿年齡稍長之外,其余 4 位作者,幾乎都是本科畢業(yè)不久,當(dāng)中有人選擇繼續(xù)深造,也有人加入了 DeepWisdom。
重新看 Manus“套殼風(fēng)波”
除此之外,OpenManus 的出現(xiàn),或許也給 Manus 的“套殼風(fēng)波”提供了新的視角。
先簡單回顧一下這場風(fēng)波。
Manus 被質(zhì)疑“套殼”主要源于兩點:
一是有前車之鑒。Manus 背后團(tuán)隊曾打造出另一款產(chǎn)品 ——Monica,而作為一款集成各類大語言模型的插件,Monica 也曾一度陷入套殼爭議。
所以對于一家公司出品的東西,大家很容易產(chǎn)生聯(lián)想。
在此基礎(chǔ)之上,由于產(chǎn)品被懷疑是套殼縫合而成,因此大家很容易形成 Manus 技術(shù)含量不高的印象。
然而,之所以說 OpenManus 是一個新視角,是因為從其復(fù)現(xiàn)路徑來看,許多模塊都是基于已有開源項目實現(xiàn)。
實現(xiàn)不同模塊的統(tǒng)籌、調(diào)度,形成新的功能,絕非人人都有能力實現(xiàn)。
而且開源社區(qū)的一大意義,本就是讓后來的開發(fā)者,能夠直接站在巨人的肩膀上。
即使不談開源,各大模型廠商提供 API 給開發(fā)者的目的,同樣是讓他們能夠開發(fā)新的應(yīng)用。
說得再夸張一些,引用 Perplexity 創(chuàng)始人的說法,“OpenAI 就是英偉達(dá)套殼,英偉達(dá)就是臺積電套殼,臺積電就是沙子套殼……”。
所以是否“套殼”,不是問題的核心,關(guān)鍵是它能不能產(chǎn)生實質(zhì)性的生產(chǎn)力提升。
但從我們昨天的實測感受來看,Manus 距離這一目標(biāo),還有相當(dāng)長的距離。
所以,把產(chǎn)品的能力打磨好,可能才是比糾結(jié)套殼更要緊的事。
你對 Manus 的感受如何?歡迎評論區(qū)留言討論。
開源地址:
https://github.com/mannaandpoem/OpenManus
參考鏈接:
[1]https://x.com/didiforx/status/1897675038972883408
[2]https://www.sohu.com/a/827134153_121798711
[3]https://modelscope.cn/studios/AI-ModelScope/SPO
本文來自微信公眾號:量子位(ID:QbitAI),作者:克雷西、一水,原標(biāo)題《5 個人三小時復(fù)刻開源版 Manus,邀請碼也不需要了》
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。