AI 智能體實(shí)火!谷歌被曝出 DeepMind 核心技術(shù)大佬離職,連 Gemini 項(xiàng)目的主要開(kāi)發(fā)者也留不住了。
谷歌又被曝出有核心員工離職了!這次跑路的竟是 DeepMind 的核心技術(shù)大佬,Gemini 項(xiàng)目的四位主創(chuàng)之一,Ioannis Antonoglou。
上圖左半部分列出了 Gemini 項(xiàng)目的 36 位領(lǐng)導(dǎo)者,自去年九月以來(lái),包括 Ioannis Antonoglou 在內(nèi),已有四位主要成員離開(kāi)。
在 OpenAI 以及背后微軟的擠壓之下,谷歌的日子貌似不太好過(guò)。去年裁員 12000 多人,光遣散費(fèi)就花了幾十億美元,劈柴還宣布今年要持續(xù)裁員一整年。
而一邊的 OpenAI 也在花心思挖角谷歌的高級(jí)人才。另一方面,AI 行業(yè)的大佬們?cè)诖竽P蛶?lái)的變革中發(fā)現(xiàn)了新的風(fēng)口,—— 比如 AI 智能體(Agent)。
越來(lái)越多的初創(chuàng)公司試圖在這個(gè)領(lǐng)域嶄露頭角,Antonoglou 這次離職的目標(biāo)就是創(chuàng)辦自己的人工智能公司,并瞄準(zhǔn) Agent 這個(gè)市場(chǎng)。
Antonoglou 目前的兩位合伙人,Sherjil Ozair 和 Misha Laskin,也是之前一起參與 Gemini 項(xiàng)目的同事。據(jù)一位知情人士透露,他們已經(jīng)開(kāi)始為自己的初創(chuàng)企業(yè)籌集資金。
—— 谷歌的科技帝國(guó)開(kāi)枝散葉...... 也未嘗不是一件好事?當(dāng)然,如果這家新公司決定涉足智能體領(lǐng)域,也將面臨眾多競(jìng)爭(zhēng)對(duì)手。
近期的初創(chuàng)公司,包括獲得 General Catalyst 支持的 Adept(已籌集 4.3 億美元)和獲得 Nvidia 支持的 Imbue(已籌集超過(guò) 2 億美元),都在從事智能體的研發(fā)。
其他的初創(chuàng)公司還包括 HyperWrite 和 Lindy,而大公司沒(méi)準(zhǔn)也會(huì)來(lái)插一腳。
Antonoglou 于 2012 年加入 DeepMind。2013 年,Antonoglou 作為七位作者之一,發(fā)表了一篇關(guān)于深度強(qiáng)化學(xué)習(xí)的論文,能夠在無(wú)需人類(lèi)干預(yù)的情況下學(xué)習(xí),并掌握 Atari 視頻游戲。
這篇工作在 NIPS 2013 的 Deep Learning Workshop 中展示,而這一突破也引起了谷歌和 Facebook 領(lǐng)導(dǎo)層的注意,他們認(rèn)識(shí)到這可以用于增強(qiáng)自己的廣告業(yè)務(wù)。
2014 年,谷歌以超過(guò) 5 億美元的價(jià)格收購(gòu)了只有約有 75 名員工的 DeepMind。之后 Antonoglou 參與開(kāi)發(fā)了擊敗圍棋頂尖人類(lèi)選手的 AI。
有趣的是,OpenAI 的團(tuán)隊(duì)也受此影響,采用類(lèi)似技術(shù)開(kāi)發(fā)了一個(gè)能玩 Dota 2 的 AI 系統(tǒng)。
還有上面提到的 Antonoglou 的合伙人 Sherjil Ozair 也是業(yè)內(nèi)的大佬。
Ozair 去年夏天離開(kāi) DeepMind 加入 Tesla,他之前也同 Antonoglou 合作發(fā)表過(guò)一些文章,比如下面這篇來(lái)自 PMLR'2021。
而他更加有名的一篇工作是我們大部人都非常熟悉的「GAN」(生成對(duì)抗網(wǎng)絡(luò))。
這篇開(kāi)創(chuàng)性的工作為后續(xù)生成式 AI 模型的發(fā)展奠定了基礎(chǔ)。
「開(kāi)枝散葉」
除了上面介紹的大佬,在過(guò)去兩年里,DeepMind 和 Google Brain 的一些員工紛紛離職,開(kāi)創(chuàng)了自己的新公司。
包括開(kāi)發(fā)開(kāi)源 AI 模型的 Mistral AI,以及同樣致力于生成式 AI 模型的 Sakana AI 和 Reka AI。
最近,又有三位在谷歌負(fù)責(zé)圖像和音樂(lè)方向的 AI 研究人員離職,據(jù)知情人士透露,他們成立了自己的 AI 初創(chuàng)公司 Uncharted Labs。
這也揭示了谷歌內(nèi)部可能存在的結(jié)構(gòu)性問(wèn)題,推出的 AI 產(chǎn)品錯(cuò)失良機(jī),而頂尖的研究人員則決定抓住外部機(jī)遇,抓住風(fēng)險(xiǎn)投資者對(duì) AI 領(lǐng)域新公司的熱情。
文件顯示,這三位創(chuàng)始人已經(jīng)籌集了 850 萬(wàn)美元,最近幾個(gè)月,他們還會(huì)見(jiàn)了包括 Andreessen Horowitz 在內(nèi)的潛在投資者。
三人團(tuán)隊(duì)的總裁是 David Ding,他此前是 Google DeepMind 的技術(shù)負(fù)責(zé)人。
而另外兩位 Charlie Nash 和 Yaroslav Ganin,是 Ding 之前在 DeepMind 的團(tuán)隊(duì)成員。Ding 和 Ganin 在谷歌工作了五年以上。
Ding 之前的團(tuán)隊(duì)還有一名成員 Conor Durkan 也在去年離職了。在 DeepMind,這四個(gè)人參與了一個(gè)項(xiàng)目,使 AI 能夠根據(jù)用戶的簡(jiǎn)單描述創(chuàng)造出原創(chuàng)的圖像和音樂(lè)。
去年 11 月,DeepMind 公開(kāi)了音樂(lè)生成模型 Lyria,能夠從頭開(kāi)始創(chuàng)作歌曲,包括利用 Charlie Puth 和 John Legend 等藝術(shù)家的人聲。
這幾個(gè)人還參與了 Imagen 2 的開(kāi)發(fā),作為 Midjourney 和 DALL?E 3(OpenAI )的競(jìng)品。
面對(duì)這不容樂(lè)觀的水土流失,谷歌被逼無(wú)奈,只好咬牙提高頂尖 AI 研究人才的待遇,使用特別的股票獎(jiǎng)勵(lì)措施。
然而,對(duì)于那些致力于生成式 AI 的初創(chuàng)公司來(lái)說(shuō),輕松獲得風(fēng)險(xiǎn)投資的吸引力極大。
根據(jù) PitchBook 和 National Venture Capital Association 的數(shù)據(jù)顯示,2023 年在美國(guó),超過(guò)三分之一的風(fēng)險(xiǎn)投資涌向了 AI 領(lǐng)域。
AI 智能體未達(dá)預(yù)期
AI 智能體的概念隨著生成式 AI 大模型的發(fā)展而開(kāi)始流行,Agent 可以自動(dòng)幫助人類(lèi)處理線上購(gòu)物、訂票、會(huì)議等。
比如 AutoGPT 和 BabyAGI,承諾能做到從預(yù)訂機(jī)票到回復(fù)短信等一切自動(dòng)化操作。然而,它們很快就暴露出了技術(shù)上的限制。
包括 OpenAI 推出的相關(guān)產(chǎn)品,目前也沒(méi)有什么實(shí)質(zhì)性的進(jìn)展。
現(xiàn)有的 Agent 執(zhí)行任務(wù)的能力參差不齊,還容易重復(fù)相同的行為模式,研究人員正也嘗試新的方法解決這些問(wèn)題,比如開(kāi)發(fā)更適合智能體任務(wù)的專用軟件,而不是依賴現(xiàn)成的模型。
HyperWrite 的聯(lián)合創(chuàng)始人兼 CEO Matt Shumer 表示,AI 智能體之所以未能如預(yù)期般發(fā)展,有幾個(gè)原因。
目前的智能體雖然能夠規(guī)劃并將目標(biāo)分解成子任務(wù)(比如將競(jìng)爭(zhēng)對(duì)手研究,分解為評(píng)估管理層、預(yù)測(cè)銷(xiāo)售額和成本計(jì)算),但是在執(zhí)行這些子任務(wù)時(shí)往往遇到困難。
同自動(dòng)駕駛一樣,智能體經(jīng)常會(huì)被從未遇到過(guò)的「邊緣情況」所困擾,這種失敗可能會(huì)削弱消費(fèi)者的信任。
另外,這個(gè)行業(yè)似乎面臨著與大型語(yǔ)言模型開(kāi)發(fā)商同樣的問(wèn)題:他們正試圖用風(fēng)險(xiǎn)資本解決一個(gè)長(zhǎng)期的研究問(wèn)題,而投資者卻希望盡早看到成品和投資回報(bào)。
解決方案
傳統(tǒng)的 AI 智能體通常由三部分構(gòu)成:
一是像 GPT-4 這樣的大語(yǔ)言模型,負(fù)責(zé)規(guī)劃完成目標(biāo)所需的任務(wù);二是向量數(shù)據(jù)庫(kù),幫助智能體記住以往的行動(dòng)和目標(biāo)相關(guān)的重要背景信息;三是 LangChain 等工具,負(fù)責(zé)將這些組件連接起來(lái)。
而 HyperWrite 正在嘗試一種截然不同的結(jié)構(gòu)。根據(jù)請(qǐng)求的復(fù)雜程度,HyperWrite 能將客戶的請(qǐng)求分配給不同的模型處理。
Shumer 表示,GPT 等傳統(tǒng)大語(yǔ)言模型僅能處理簡(jiǎn)單的網(wǎng)絡(luò)搜索,而 HyperWrite 的定制模型則更擅長(zhǎng)分析網(wǎng)頁(yè)內(nèi)容并與之交互,如點(diǎn)擊不同的按鈕。HyperWrite 目前已有數(shù)千名付費(fèi)用戶。
與此類(lèi)似,Imbue 也在開(kāi)發(fā)多種模型,包括大語(yǔ)言模型和多模態(tài)模型,以幫助 AI 智能體解決軟件編碼等問(wèn)題。
為此,Imbue 團(tuán)隊(duì)特別標(biāo)注訓(xùn)練數(shù)據(jù),使模型能夠理解博客文章或軟件代碼背后的邏輯。
Imbue 的開(kāi)發(fā)者會(huì)對(duì)模型訓(xùn)練數(shù)據(jù)中的代碼行進(jìn)行注釋,說(shuō)明它們是如何為更大的軟件項(xiàng)目貢獻(xiàn)的。這樣一來(lái),模型便能學(xué)會(huì)單行代碼如何協(xié)同工作,共同實(shí)現(xiàn)一個(gè)更廣泛的目標(biāo)。
另一種智能體的發(fā)展方向是專注于特定的任務(wù)。
比如,Imbue 使用了多個(gè)專門(mén)解決特定問(wèn)題的智能體,從修正代碼格式錯(cuò)誤到分析 AI 政策趨勢(shì)。這種專注于特定領(lǐng)域的方法減少了智能體遇到的問(wèn)題邊緣情況。
Shumer 認(rèn)為,隨著時(shí)間的推移,通用型模型將最終超越專用于特定任務(wù)的模型,但 CRV 的 Vivian Cheng 認(rèn)為,由于技術(shù)還處于初期階段,短期到中期內(nèi)很難開(kāi)發(fā)出一個(gè)可靠的通用型智能體。
—— 也許「通用」和「專用」會(huì)在未來(lái)的某個(gè)時(shí)間點(diǎn)相遇吧,讓我們拭目以待。
參考資料:
https://www.theinformation.com/articles/google-deepmind-veteran-departs-to-launch-ai-agent-startup?rc=epv9gi
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。