設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

GPT-5 不會(huì)真正突破,24 年 AGI 不會(huì)實(shí)現(xiàn)!全網(wǎng) AI 大佬 24 年最全預(yù)測(cè)

新智元 2024/1/1 21:35:51 責(zé)編:遠(yuǎn)洋

  新智元報(bào)道  

編輯:Aeneas 桃子

【新智元導(dǎo)讀】經(jīng)過(guò) 23 年的生成式 AI 之年,24 年 AI 會(huì)有哪些新突破?大佬預(yù)測(cè),即使 GPT-5 發(fā)布,LLM 在本質(zhì)上仍然有限,在 24 年,基本的 AGI 也不足以實(shí)現(xiàn)。

23 年是當(dāng)之無(wú)愧的「生成式 AI 之年」。

24 年,AI 技術(shù)會(huì)有哪些突破?

英偉達(dá)高級(jí)科學(xué)家 Jim Fan 稱,2024 年將是視頻年。盡管機(jī)器人和具身智能體才剛剛起步,但我認(rèn)為視頻 AI 將在未來(lái) 12 個(gè)月內(nèi)迎來(lái)突破性進(jìn)展的時(shí)刻。

OpenAI 聯(lián)創(chuàng) Greg Brockman 則預(yù)測(cè):2024 年,AI 的能力、安全性、潛在影響的積極性上,都會(huì)是突破性的一年。

當(dāng)然,從更長(zhǎng)遠(yuǎn)的角度看,這只是又一個(gè)指數(shù)級(jí)的一年,讓每個(gè)人的生活都比今天更好。

新的一年,人工智能還會(huì)像 2023 年一樣,大放異彩嗎?

AI 大佬 2024 預(yù)測(cè)

Meta 的研究員 Martin Signoux 對(duì) 2024 年 AI 做出了 8 大預(yù)測(cè),就連 LeCun 大佬表示深度贊同。

首先,人工智能智能眼鏡蔚然成風(fēng)。隨著多模態(tài)技術(shù)的興起,領(lǐng)先的人工智能公司將加倍努力開發(fā)人工智能可穿戴設(shè)備。還有什么比眼鏡外形更適合承載人工智能助手呢?

ChatGPT 之于人工智能助手,就像谷歌之于搜索一樣。2023 年,ChatGPT 開始大放異彩,Bard、Claude、Llama、Mistral 和數(shù)以千計(jì)的衍生產(chǎn)品相繼問(wèn)世。

隨著產(chǎn)品化的繼續(xù)推進(jìn),ChatGPT 將不再是這個(gè)領(lǐng)域的唯一參考標(biāo)準(zhǔn),其估值也將面臨修正。

大模型模型再見,多模態(tài)模型你好。LMM 將不斷涌現(xiàn),并在多模態(tài)評(píng)估、多模態(tài)安全、多模態(tài)這個(gè)、多模態(tài)那個(gè)的爭(zhēng)論中取代 LLM。此外,LMM 是邁向真正通用人工智能助手的墊腳石。

沒(méi)有重大突破,但各方面都有改進(jìn)。新模型不會(huì)帶來(lái)真正的突破(GPT-5),LLM 在本質(zhì)上仍然有限,而且容易產(chǎn)生幻覺。我們不會(huì)看到任何飛躍,使它們?cè)?2024 年可靠到足以「解決基本的 AGI」。

在 RAG、數(shù)據(jù)整理、更好的微調(diào)、量化等方面的改進(jìn),將使 LLM 在許多用例中變得足夠強(qiáng)大 / 有用,從而推動(dòng)各行業(yè)各種服務(wù)的采用。

小模型(SLM)已經(jīng)出現(xiàn),但成本效益和可持續(xù)發(fā)展的考慮將加速這一趨勢(shì)。量化技術(shù)也將大大提高,從而推動(dòng)消費(fèi)服務(wù)的設(shè)備集成浪潮。

開源模型擊敗 GPT-4,開源與封閉之爭(zhēng)逐漸平息?;仡欉^(guò)去 12 個(gè)月開源社區(qū)的活力和進(jìn)步,很明顯,開源模型將很快縮小性能差距。

基準(zhǔn)仍然是一個(gè)難題。沒(méi)有一套基準(zhǔn)、排行榜或評(píng)估工具能夠成為模型評(píng)估的一站式服務(wù)。相反,我們將看到一系列改進(jìn)(如 HELM)和新舉措(如 GAIA),尤其是在多模態(tài)方面。

與現(xiàn)有風(fēng)險(xiǎn)相比,存在的風(fēng)險(xiǎn)不會(huì)引起太多討論。雖然 X 風(fēng)險(xiǎn)成為 2023 年的頭條新聞,但公眾討論將更多地關(guān)注與偏見、假新聞、用戶安全、選舉誠(chéng)信等相關(guān)的現(xiàn)有風(fēng)險(xiǎn)和爭(zhēng)議。

Lightning AI 的創(chuàng)始人 William Falcon 對(duì) 2024 年的預(yù)測(cè)是:

- 1B 模型性能將優(yōu)于 70B。

- 在 CPU 上部署模型幾乎是免費(fèi)的,而不是 API 服務(wù)。

- 數(shù)據(jù)質(zhì)量將使性能提升 10 倍。

- 開源模型的組合將擊敗最好的私有模型。

- 編譯器將使模型(訓(xùn)練和推理)的速度至少提高 80%。

- 立法將支持內(nèi)容創(chuàng)建者,而非模型開發(fā)者。

開源工具平臺(tái) LlamaIndex 的創(chuàng)始人 Jerry Liu 表示,

- RAG 將繼續(xù)成為一個(gè)大焦點(diǎn)

- 每個(gè) AI 工程師仍然需要強(qiáng)大的軟件工程基礎(chǔ)。

- 向量數(shù)據(jù)庫(kù)開始開發(fā)類 SQL 接口并支持多模態(tài)

- 多模態(tài)模型在文檔處理中得到更多使用(但首先,計(jì)算成本 / 延遲需要降低)

- 類似 GPT-4 的全部能力成為開源,并且更快 / 更便宜。

- 如果是這種情況,智能體的開發(fā)會(huì)重新蓬勃發(fā)展。

- 提示和以前一樣重要,但提示工程的重要性會(huì)下降

2023 年,ChatGPT 訪問(wèn)量全球居首

過(guò)去一年里,AI 無(wú)處不在,甚至重新定義了整個(gè)行業(yè)。

在線內(nèi)容寫作公司 Writerbuddy AI 使用 SEO 行業(yè)著名的工具 SEMrush,通過(guò)抓取 AI 工具數(shù)據(jù),研究了 3000 + 種 AI 工具。

結(jié)果發(fā)現(xiàn),從 2022 年 9 月-2023 年 8 月,排名前 50 的 AI 工具,產(chǎn)生了超過(guò) 240 億次的驚人訪問(wèn)量,平均每月增長(zhǎng) 2.363 億次。

其中,ChatGPT 獨(dú)占了 140 億流量,占分析流量的 60%。

以下是報(bào)告中的關(guān)鍵發(fā)現(xiàn):

- AI 行業(yè)平均每月增長(zhǎng) 2.363 億次訪問(wèn)量。分析的 50 個(gè)人工智能工具經(jīng)歷了 10.7 倍的增長(zhǎng)率,平均每月訪問(wèn)量增加 2.363 億次。

- 過(guò)去 12 個(gè)月中,AI 應(yīng)用每月平均訪問(wèn)量達(dá)到 20 億次。過(guò)去 6 個(gè)月,每月平均訪問(wèn)量激增至 33 億次。

- ChatGPT、Character AI 和 Google Bard 的訪問(wèn)量分別凈增長(zhǎng)了 18 億次、4.634 億次和 6800 萬(wàn)次。

- 訪問(wèn)量最高 AI 聊天機(jī)器人:ChatGPT 處于絕對(duì)領(lǐng)先地位,占 AI 聊天機(jī)器人類別總訪問(wèn)量的 76.31%。緊隨其后的是 Character AI,以 19.86% 的訪問(wèn)量位居第二。

- Craiyon、Midjourney 和 Quillbot 面臨最大的流量下降。

- 美國(guó)貢獻(xiàn)了 55 億人次訪問(wèn)量,占總訪問(wèn)量的 22.62%,而歐洲國(guó)家合計(jì)貢獻(xiàn)了 39 億人次訪問(wèn)量。

- AI 聊天機(jī)器人工具最受歡迎,訪問(wèn)量達(dá)到 191 億次。

- 超過(guò) 63% 的 AI 工具用戶通過(guò)移動(dòng)設(shè)備訪問(wèn)。存在性別差異,69.5% 為男性用戶,30.5% 為女性用戶

除了風(fēng)靡全球的 ChatGPT,23 年的這些技術(shù)也很驚艷

23 年過(guò)去了,這一年的關(guān)鍵詞,無(wú)疑就是「生成式 AI」。

22 年底 ChatGPT 的推出,以及 23 年 3 月發(fā)布的 GPT-4,讓全世界見識(shí)到了大語(yǔ)言模型的廣泛可用性,讓 23 年變成了屬于文本、音頻和視頻生成式 AI 的一年。

除了今年的「寵兒」ChatGPT 之外,其他公司的鋒芒也不應(yīng)被忽視,比如放出了第一個(gè)開源語(yǔ)言模型的公司,和幾家新的 AI 初創(chuàng)公司,包括在年底發(fā)布了目前可用的最佳開源語(yǔ)言模型 Mixtral 8x7B 的 Mistral。

除此之外,還有以下這些讓人印象深刻的技術(shù)。

斯坦福小鎮(zhèn)和機(jī)器貓

「斯坦福小鎮(zhèn)」,展示了令人印象深刻的文本和編碼任務(wù)的應(yīng)用。

團(tuán)隊(duì)創(chuàng)建了一個(gè)受模擬人生啟發(fā)的沙盒環(huán)境,其中的 25 名 AI 智能體,每個(gè)都有屬于自己的職業(yè)和個(gè)性,可以自主互動(dòng)。

這些智能體表現(xiàn)出了可信的個(gè)人和緊急社交行為,包括做計(jì)劃、參加情人節(jié)派對(duì)。這項(xiàng)工作展示了基于 LLM 的智能體如何相互交互,并產(chǎn)生了有趣的結(jié)果。

這一想法已被其他研究和開源項(xiàng)目所采用,例如 Auto-GPT 和 BabyAGI,而 OpenAI 則通過(guò) Assistant API,將其大大簡(jiǎn)化。

GPT-4 等基礎(chǔ)模型,也已用于機(jī)器人技術(shù),取得了一些進(jìn)展,比如谷歌的機(jī)器人 RT-2 和 RoboCat。

RT-2 是一種用于機(jī)器人控制的 AI 模型,可以從機(jī)器人和網(wǎng)絡(luò)數(shù)據(jù)中學(xué)習(xí)。該模型可以處理文本和圖像輸入,并利用其廣泛的網(wǎng)絡(luò)知識(shí)來(lái)執(zhí)行尚未經(jīng)過(guò)明確訓(xùn)練的任務(wù)。

在 6000 多次機(jī)器人測(cè)試中,RT-2 在未經(jīng)訓(xùn)練的任務(wù)中的成功率,幾乎是其前身的兩倍。

另一方面,RoboCat 是一種 AI,可以生成訓(xùn)練數(shù)據(jù),以改善機(jī)器人的控制。

其他公司的技術(shù),如英偉達(dá)的多模態(tài) VIMA 模型,也在機(jī)器人技術(shù)中使用了基礎(chǔ)模型。

DreamerV3 和 FunSearch

在強(qiáng)化學(xué)習(xí)領(lǐng)域,研究者們也取得了不少重要成果。

一個(gè)例子是 DreamerV3,它可以處理完全不同的問(wèn)題,而無(wú)需任何調(diào)整。

在沒(méi)有人類模型的情況下,DreamerV3 就會(huì)學(xué)習(xí)如何在 Minecraft 中開采鉆石。

今年早些時(shí)候,DeepMind 還展示了 AdA(Adaptive Agent),這是 DeepMind 的一個(gè)基礎(chǔ)強(qiáng)化學(xué)習(xí)模型。

AdA 遵循基礎(chǔ)模型的經(jīng)典配方,在具有大量數(shù)據(jù)的任務(wù)上進(jìn)行了訓(xùn)練。AdA 之所以意義重大,是因?yàn)樗砻髁?,?qiáng)化學(xué)習(xí)中的擴(kuò)展可以使模型在其他任務(wù)上表現(xiàn)更好。

在各個(gè)科學(xué)領(lǐng)域,深度學(xué)習(xí)展現(xiàn)出越來(lái)越多的作用。

DeepMind 開發(fā)了 AlphaTensor,一種用于快速矩陣乘法的新算法。

同時(shí),DeepMind 最新版本的 AlphaFold 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)系統(tǒng),克服了之前版本的許多弱點(diǎn),為計(jì)算結(jié)構(gòu)預(yù)測(cè)開辟了新的可能性。

此外,Google DeepMind 還展示了 FunSearch,這是首次使用代碼生成語(yǔ)言模型與進(jìn)化搜索算法相結(jié)合,為數(shù)學(xué)問(wèn)題找到以前未知的解決方案。

OthelloGPT、Q-Star 和 AI 法案

2023 年,也是 AI 監(jiān)管的一年,和對(duì) AI 存在主義風(fēng)險(xiǎn)發(fā)出警告的一年。

這種趨勢(shì)無(wú)疑也會(huì)刺激業(yè)界研究,好讓人類更好地理解 LLM 的內(nèi)部工作原理。

這期間有一些有趣的論文,比如 OthelloGPT,微軟的 GPT-4 體現(xiàn)了 AGI 火花,以及谷歌關(guān)于大模型「頓悟」的論文。

提示工程領(lǐng)域提供了對(duì) LLM 的見解。

Fran?ois Chollet 將提示工程解釋為尋找正確的向量程序和 Promptbreeder,這表明,提示在未來(lái)可能會(huì)變得更加自動(dòng)化。

在年末,傳起了關(guān)于 Q-Star 的謠言,伴隨著人們的 AI 的恐懼、AGI 的炒作、以及短短幾天多次反轉(zhuǎn)的 OpenAI 宮斗鬧劇。

在 2024 年,或許我們會(huì)看到猜測(cè)變少,談判變多。

AI 訓(xùn)練使用的數(shù)據(jù),在哪些范疇內(nèi)是合理的?最近紐約時(shí)報(bào)對(duì) OpenAI 發(fā)起的訴訟,引起了全社會(huì)范圍內(nèi)的廣泛探討。

類似的辯論,也將在歐盟上演,在今年年底前,歐盟各國(guó)就《歐盟人工智能法案》達(dá)成一致。這一法案的細(xì)節(jié)將在明年決定,并且對(duì)歐洲的人工智能市場(chǎng)產(chǎn)生重大影響。

2024 AI 展望

在經(jīng)歷了爆炸性的 2023 年之后,2024 年的人工智能領(lǐng)域又將會(huì)有哪些進(jìn)展?

毋庸置疑,在這個(gè)新的一年里,我們?nèi)詫⒖吹筋I(lǐng)先的 AI 在許多新的創(chuàng)造性方式中應(yīng)用,推動(dòng)整個(gè)行業(yè)的進(jìn)步。

Copilot AI 登臺(tái):智能體時(shí)代來(lái)臨

OpenAI 在首屆開發(fā)者大會(huì)上發(fā)布的 GPTs、Assitants 等工具,微軟產(chǎn)品全線更名 Copilot 等等,智能體在今年迎來(lái)了大爆發(fā)。

這些工具已經(jīng)開始在一個(gè)又一個(gè)行業(yè)產(chǎn)生影響,但我們迄今所看到的與即將到來(lái)的相比微不足道。

今年早些時(shí)候,來(lái)自普林斯頓、谷歌團(tuán)隊(duì)發(fā)表的 ReAct 論文展示了大模型如何有效地學(xué)習(xí)如何使用工具,并推動(dòng)了這方面的大量研究。

OpenAI、Anthropic 在內(nèi)的公司已經(jīng)花了一年的時(shí)間來(lái)調(diào)整自家模型,以便更好地使用這種技術(shù)。

比如,OpenAI 的函數(shù)調(diào)用,以及 Anthropic 的 Claude XML 支持。

項(xiàng)目地址:https://react-lm.github.io/

還有一些研究機(jī)構(gòu)專門訓(xùn)練了專門的大模型,比如伯克利的 Gorilla LLM。

另外,開源代碼庫(kù) Langchain、Rivet 等都讓智能體變得容易得多。

看得見,AI 智能體比以往任何時(shí)候都更容易開發(fā),成本也更低。它們?cè)诎l(fā)揮人類聰明才智的同時(shí),還能深入連接對(duì)用戶和公司最重要的數(shù)據(jù)。

2024 年,我們將看到「智能體時(shí)代」的到來(lái),這是通過(guò)軟件滿足需求和與技術(shù)互動(dòng)的一個(gè)全新方向的開端。

多模態(tài)大模型突破視覺障礙

ChatGPT 能夠理解和表達(dá)人類自然語(yǔ)言,這是吸引用戶和開發(fā)者的突破性功能。

但是,2024 年將看到 AI 視覺可能會(huì)更加重要,影響更加深遠(yuǎn)。

文字固然強(qiáng)大,但圖像、視頻、音頻能以更集中的方式傳遞信息和情感。思想的空間表達(dá)是一種非常強(qiáng)大的工具,可以簡(jiǎn)單地傳達(dá)復(fù)雜的概念。

LLM 不僅能對(duì)文本數(shù)據(jù)進(jìn)行訓(xùn)練,還能對(duì)視覺數(shù)據(jù)進(jìn)行訓(xùn)練,多模態(tài)能力更加明顯。

我們已經(jīng)看到,Ai Pin、Apple Vision 等可穿戴設(shè)備的發(fā)展,它們有望為我們的日常生活提供幫助。

例如,它們可以提供與交流的人的背景信息、與工作相關(guān)的視覺提示,或完成任務(wù)的實(shí)時(shí)建議。

創(chuàng)新將走向何方?速度有多快?現(xiàn)在還很難說(shuō),但能夠解讀圖像和視頻并對(duì)環(huán)境中的物理變化做出即時(shí)反應(yīng),為智能人工智能只能以如何幫助人類增添了一個(gè)極其重要的維度。

AI 操控達(dá)到危險(xiǎn)級(jí)別

AI 爆發(fā)為各個(gè)領(lǐng)域帶來(lái)翻天,覆地的變化的同時(shí),也讓我們看到 AI 生成虛假信息給生活帶來(lái)了困擾。

在人類歷史上,大規(guī)模影響和操縱 AI 從未如此強(qiáng)大,也從未如此普及。

人工智能已經(jīng)讓人們幾乎無(wú)法辨別「真實(shí)」的社交互動(dòng)與內(nèi)容,因?yàn)閳D像,甚至視頻都可以很輕而易舉地生成。

未來(lái)一年,人工智能操縱可能會(huì)大行其道,從自動(dòng)勒索和欺詐到陰謀論的傳播。

總而言之,2024 年,人工智能將給世界帶來(lái)許多令人難以置信的東西,但它也將以新的方式挑戰(zhàn)我們。

知友預(yù)測(cè)

關(guān)于此話題的暢想,也上了知乎熱榜。

知友「引線小白」預(yù)測(cè),在 24 年,模型效果會(huì)進(jìn)一步突破,可能只要 7B 的模型推理資源,就能與現(xiàn)在的 GPT-4 持平。

隨著部署成本大幅下降,24 年可能就會(huì)成為 AI Agent 元年,出現(xiàn)一個(gè)爆款。

多模態(tài)進(jìn)多模態(tài)出一統(tǒng)江湖的模型,有可能出現(xiàn)。

第一部 AI 電影,也有望在 24 年出現(xiàn)。

清華自動(dòng)化系在讀博士認(rèn)為,「多模態(tài)大模型取得進(jìn)一步突破,圖片和視頻生成能力進(jìn)一步提升。更多的人力工作,特別是需要部分創(chuàng)造力的工作被取代。部分領(lǐng)域大模型的涌現(xiàn)能力進(jìn)一步凸顯,表現(xiàn)出一些更加具有創(chuàng)造性的行為。」

AI 架構(gòu)師「春陽(yáng) CYang」預(yù)估,2024 年應(yīng)該是 AI 大模型應(yīng)用落地的元年。

2023 一整年,雖然大模型火爆,但真正能夠落地的產(chǎn)品還很少,只集中在改寫文案等淺層的應(yīng)用上。

但現(xiàn)在,有很多大模型領(lǐng)域的創(chuàng)意產(chǎn)品在落地了,可以期待一波。

程序員 @小五哥預(yù)測(cè)道 ——

大語(yǔ)言模型將在手機(jī)端運(yùn)算推理;Agent 將代替人做一些更實(shí)用的事情;最令人開心的是,人形機(jī)器人很可能幫我們洗衣、拖地、做飯、收拾房間了!

參考資料:

  • https://writerbuddy.ai/blog/ai-industry-analysis

  • https://x.com/gdb/status/1741529664856764556?s=20

  • 2023/https://www.zhihu.com/question/635190738

  • https://www.zhihu.com/question/635190738/answer/3327969527

  • https://www.zhihu.com/question/635190738/answer/3334551780

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知