IT之家 2 月 18 日消息,北京時間今日中午 12 時,馬斯克旗下人工智能公司 xAI 發(fā)布了其最新一代大模型 Grok 3。馬斯克稱,Grok 3 能力較前代產(chǎn)品 Grok 2 提升了“一個數(shù)量級”,并且是一款“追求極致真實”的 AI,即使這種真實有時會與“政治正確”相悖。
在數(shù)學(xué)推理、科學(xué)邏輯推理和代碼寫作等能力表現(xiàn)方面,Grok-3 在多項 benchmark 測試中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更優(yōu)的成績。馬斯克更是毫不吝嗇地稱贊 Grok 3 為“地球上最聰明的人工智能”。
xAI 聲稱,Grok 3 在多個基準(zhǔn)測試中超越了 GPT-4o,包括 AIME(評估模型在數(shù)學(xué)問題上的表現(xiàn))和 GPQA(測試模型在博士級別物理、生物和化學(xué)問題上的表現(xiàn))。此外,Grok 3 的早期版本還在 Chatbot Arena 中表現(xiàn)出色,這是一個讓不同 AI 模型相互競爭、由用戶投票選擇更優(yōu)回答的眾包測試平臺。
IT之家注意到,Grok 3 并非單一模型,而是一個模型家族。其中,較小版本的 Grok 3 mini 能夠在犧牲一定準(zhǔn)確性的情況下更快地回答問題。目前并非所有模型版本都已上線。
據(jù)介紹,Grok 3 開發(fā)周期大幅縮短,這得益于其強大的 Colossus 超級計算機。據(jù)報道,Colossus 超級計算機僅用了八個月時間完成建設(shè),為 Grok 3 的開發(fā)提供了強大支持。Grok 3 使用了 10 萬個英偉達 H100 GPU(后擴展到 20 萬),累計訓(xùn)練時長達到 2 億 GPU 小時,這一規(guī)模是前代產(chǎn)品 Grok 2 的十倍。如此大規(guī)模的計算能力部署,使得 Grok 3 能夠在更短時間內(nèi)處理海量數(shù)據(jù)集,同時顯著提升了模型的準(zhǔn)確性。
xAI 團隊不僅在硬件上進行了升級,還在軟件層面進行了優(yōu)化。Grok 3 通過改進訓(xùn)練流程,引入合成數(shù)據(jù)集、自我糾錯以及強化學(xué)習(xí)等技術(shù),進一步提升了模型的性能。這些技術(shù)的綜合應(yīng)用,使得 Grok 3 在處理復(fù)雜任務(wù)時表現(xiàn)得更為出色。
Grok 3 的兩個變體版本 ——Grok 3 Reasoning(推理)和 Grok 3 mini Reasoning,能夠像 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等“推理”模型一樣,仔細“思考”問題。推理模型會在給出結(jié)果前進行徹底的事實核查,從而避免一些通常會困擾模型的錯誤。
xAI 還聲稱,Grok 3 Reasoning 在多個流行基準(zhǔn)測試中超越了 o3-mini 的最佳版本 o3-mini high,包括一個名為 AIME 2025 的新型數(shù)學(xué)基準(zhǔn)測試。用戶可以通過 Grok 應(yīng)用訪問推理模型,并在遇到較難問題時使用“Big Brain”模式進行更深入、更謹慎地推理。xAI 表示,這些模式最適合用于數(shù)學(xué)、科學(xué)和編程相關(guān)的問題。
不過,xAI 也指出,Grok 3 的推理模型目前仍處于測試階段(Beta 版),并且仍在訓(xùn)練中。此外,Grok 3 還引入了一項名為“DeepSearch”的新功能,該公司將其描述為一種新型搜索引擎,DeepSearch 能夠掃描互聯(lián)網(wǎng)和 X 平臺上的信息,并以摘要的形式回應(yīng)用戶查詢。
馬斯克此前發(fā)布了一段視頻,闡述了 xAI 和 Grok 的使命 —— 理解宇宙的本質(zhì)。然而,原計劃在此次發(fā)布中推出的語音模式并未如期上線。馬斯克在 X 平臺上確認了這一情況,并解釋稱:“語音模式目前還存在一些問題,預(yù)計將在大約一周后推出,但它非常出色?!?/p>
X 平臺的 Premium + 訂閱用戶將率先體驗到 Grok 3,而其他功能則被整合到 xAI 推出的名為 SuperGrok 的訂閱服務(wù)中。SuperGrok 的訂閱價格為每月 30 美元或每年 300 美元,用戶可獲得額外的推理和 DeepSearch 查詢權(quán)限,以及無限量的圖像生成功能。
馬斯克還透露,Grok 將在未來一周內(nèi)推出“語音模式”,并在幾周后將 Grok 3 模型和 DeepSearch 功能整合到 xAI 的企業(yè) API 中。
此外,xAI 計劃幾個月后開源 Grok 2。馬斯克表示:“我們的總體策略是,在下一個版本完全推出后,開源上一個版本。當(dāng) Grok 3 成熟穩(wěn)定后,大概在未來幾個月內(nèi),我們將開源 Grok 2?!?/p>
此次 Grok 3 的發(fā)布正值馬斯克與 OpenAI 之間的競爭不斷升級。雙方的矛盾不僅包括法律訴訟和口水戰(zhàn),最近更是出現(xiàn)了馬斯克對 OpenAI 發(fā)起的無邀約 974 億美元收購提案。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。