DeepMind 推出 LATM 框架，可令 GPT-4 自己生成軟件工具處理任務(wù)

2023/5/31 14:16:06 來(lái)源：IT之家作者：漾仔（實(shí)習(xí)） 責(zé)編：汪淼

評(píng)論：

IT之家 5 月 31 日消息，DeepMind、普林斯頓大學(xué)和斯坦福大學(xué)的研究人員近日提出了一項(xiàng)名為 LATM（LLMs As Tool Makers）的創(chuàng)新框架，該框架可以將像 GPT-4 這樣的大型語(yǔ)言模型轉(zhuǎn)變?yōu)楣ぞ咧圃煺撸↖T之家注：即讓模型自己生成軟件工具來(lái)處理新任務(wù)）。

▲ 圖源 Arxiv

LATM 的創(chuàng)新之處在于它為語(yǔ)言模型引入了工具制造和使用的概念，使得模型能夠自主創(chuàng)建適用于不同任務(wù)的工具。這一框架不僅能夠提高模型的靈活性和適應(yīng)性，還能夠?yàn)樯墒?AI 提供更加高效和經(jīng)濟(jì)的解決方案。該框架主要包含以下兩個(gè)關(guān)鍵部分：

工具制造：作為工具制造者，LLM 專(zhuān)門(mén)為特定任務(wù)設(shè)計(jì)軟件工具，這些工具以 Python 函數(shù)的形式實(shí)現(xiàn)。
工具使用：另一個(gè) LLM 作為工具使用者，可以調(diào)用這些軟件工具來(lái)處理新的請(qǐng)求。

這種設(shè)計(jì)可以讓 LATM 能夠?qū)⑷蝿?wù)分配給最適合的 LLM，將需要具備高強(qiáng)度算力才能實(shí)現(xiàn)的工具制造過(guò)程可以分配給功能強(qiáng)大、資源密集型的模型，例如 GPT-4；而將相對(duì)簡(jiǎn)單的使用工具過(guò)程分配給輕量級(jí)、經(jīng)濟(jì)高效的模型，例如 GPT-3.5 Turbo。這種方法不僅增強(qiáng)了 LLM 解決問(wèn)題的能力，而且可以顯著降低處理一系列任務(wù)的平均計(jì)算成本，以最大程度提升框架效率。

DeepMind 推出 LATM 框架，可令 GPT-4 自己生成軟件工具處理任務(wù)

▲ 圖源 Arxiv

實(shí)驗(yàn)結(jié)果驗(yàn)證了 LATM 在復(fù)雜推理任務(wù)上的有效性。研究人員發(fā)現(xiàn)，LATM 能夠達(dá)到與資源密集型模型相當(dāng)?shù)男阅?，并具有更高的成本效益。這一大型語(yǔ)言模型方法仿照了人類(lèi)創(chuàng)造和使用工具的進(jìn)化過(guò)程，可促進(jìn)大型語(yǔ)言模型生成工具的發(fā)展。

研究人員認(rèn)為，LATM 將為自然語(yǔ)言處理領(lǐng)域帶來(lái)重大的突破，并在實(shí)際應(yīng)用中發(fā)揮重要作用，這一創(chuàng)新可高效提升生成式 AI 的效率，以加速促進(jìn)自然語(yǔ)言處理和人工智能領(lǐng)域的發(fā)展。

IT之家的小伙伴們可以在這里找到論文信息。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

DeepMind 推出 LATM 框架，可令 GPT-4 自己生成軟件工具處理任務(wù)

相關(guān)文章

DeepMind 推出 LATM 框架，可令 GPT-4 自己生成軟件工具處理任務(wù)