首頁 > 智能時代>人工智能

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

新智元 2024/8/5 13:30:22 責編：汪淼

評論：

Llama 3.1 剛發(fā)布不久，Llama 4 已完全投入訓練中。

這幾天，小扎在二季度財報會上稱，Meta 將用 Llama 3 的十倍計算量，訓練下一代多模態(tài) Llama 4，預計在 2025 年發(fā)布。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

這筆賬單，老黃又成為最大贏家

十倍計算量，是什么概念？

要知道，Llama 3 是在兩個擁有 24,000 塊 GPU 集群完成訓練。也就是說，Llama 4 訓練要用 24 萬塊 GPU。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

那么，Meta 存貨還夠不夠？

還記得小扎曾在年初宣布，計劃到年底要部署 35 萬塊英偉達 H100。

他還透露了更多的細節(jié)，Meta 內(nèi)部將為訓練 LLM 打造兩個單集群，一個配備 22,000 塊 H100，另一個集群配備 24,000 塊。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

有網(wǎng)友曾回顧了 Llama 模型迭代過程中，GPU 的用量如何增長的：

Llama 1：2048 塊 GPU
Llama 2：4096 塊 GPU
Llama 3.1：16384 塊 GPU

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

或斥資 400 億美金，小扎不愿為時已晚

可見，訓練大模型是一項代價高昂的業(yè)務。

財報顯示，Meta 第二季度在服務器、數(shù)據(jù)中心和網(wǎng)絡(luò)基礎(chǔ)設(shè)施上，資本支出增長了近 33%。從去年同期 64 億美元，增至 85 億美元。

現(xiàn)在，預計年度支出將達到 370 億-400 億美元，高于之前預估的 350 億-400 億美元。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

Information 一份報告稱，OpenAI 在訓練模型上花費了 30 億美元，另外還花費了 40 億美元以折扣價從微軟那里租用服務器。

可見，訓練大模型算力花費，是多么地諷刺。

不過意義在于，Llama 3.1 的開源將成為 AI 行業(yè)的一個重要轉(zhuǎn)折點，開源人工智能開始像 Linux 一樣成為行業(yè)標準。

Meta 正在規(guī)劃未來幾年的計算集群和數(shù)據(jù)中心，以支持未來幾代 AI 模型。

小扎承認，很難去預測未來 AI 技術(shù)的發(fā)展路徑，但基建不是速成的。盡管存在不確定性，他愿意冒險提前建立，也不愿意因準備不足而落后于競爭對手。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

小扎這種先見之明，曾帶領(lǐng)公司在元宇宙浪潮中，堅挺而出。

在 2022 年公司股價遭遇重創(chuàng)之際，小扎還是鋌而走險，購買了大批 H100。

當年第三季度財報顯示，Meta 資本支出高達 320 億-330 億美元。其中一部分大多流向數(shù)據(jù)中心、服務器和網(wǎng)絡(luò)基礎(chǔ)設(shè)施構(gòu)建，以及在元宇宙上的巨額投入。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

在采訪中，小扎解釋道，「當時 Meta 正大力發(fā)展短視頻工具 Reels，因此需要更多的 GPU 來訓模型」。

因為模型推理對 Meta 來說，是至關(guān)重要的一件大事，需要為 Facebook、Ins 等自家應用的用戶提供服務。

用小扎的原話來說就是：

我們所需的推理計算與訓練的比率，可能遠高于其他從事這一領(lǐng)域的公司，這是因為我們所服務的社區(qū)用戶量非常龐大。

人手一個 AI 智能體

前段時間 Meta AI 科學家 Thomas Scialom 在一次博客采訪中，同樣提到了，6 月份已經(jīng)開始訓練的 Llama 4。

他表示，新模型可能重點在智能體技術(shù)上，并且已經(jīng)在 Toolformer 等 agent 工具上進行了一些研究。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

小扎相信，AI 智能體很快將成為在線企業(yè)的「標配」。

「隨著時間的推移，我認為，就像每個企業(yè)都有網(wǎng)站、社交媒體賬號和電子郵件地址一樣，未來每個企業(yè)也都會有一個 AI 智能體，讓客戶可以與之互動」。

Meta 的目標是，讓使每個小企業(yè)，最終甚至每個大企業(yè)，都能輕松地將自身的內(nèi)容和產(chǎn)品整合到 AI 智能體中。當這項技術(shù)大規(guī)模投入到現(xiàn)實應用中，這將大大加速商業(yè)信息收入。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

盡管投資者對 Meta 在 AI 和元宇宙上的高額支出提出批評，但小扎仍舊堅持自己的戰(zhàn)略。

雖然在 Meta 最近幾個季度，虛擬現(xiàn)實似乎已經(jīng)退居次要地位，但扎克伯格確實提到，Quest 3 的銷量超出了公司的預期。二季度數(shù)顯示，這一領(lǐng)域的收入增長 22% 至 391 億美元，利潤增加 73% 至 135 億美元。

對于第三季度，Meta 預計收入在 385-410 億美元之間。

消息人士表示，該公司將在 9 月份的 Connect 大會上宣布推出一款更便宜的耳機。

此外，AI 助手 Meta AI 越來越受歡迎，小扎表示，它有望在年底前成為使用最廣泛的 AI 助手。

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

參考資料：

https://the-decoder.com/meta-plans-to-use-10-times-more-compute-power-to-train-its-next-generation-lama-4-ai-model/
https://www.theverge.com/2024/7/31/24210786/meta-earnings-q2-2024-ai-llama-zuckerberg

本文來自微信公眾號：微信公眾號（ID：null），作者：新智元，原標題《小扎自曝砸重金訓 Llama 4，24 萬塊 GPU 齊發(fā)力！預計 2025 年發(fā)布》

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

或斥資 400 億美金，小扎不愿為時已晚

人手一個 AI 智能體

相關(guān)文章

小扎自曝砸重金訓 Meta Llama 4 模型：24 萬塊 GPU 齊發(fā)力，預計 2025 年發(fā)布

或斥資 400 億美金，小扎不愿為時已晚