IT之家 4 月 15 日消息,OpenAI 公司今天(4 月 15 日)發(fā)布博文,宣布以 API 的形式發(fā)布 GPT-4.1 系列模型,涵蓋 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。
這些模型在編程、指令遵循和長(zhǎng)文本理解方面全面超越前代 GPT-4o 及 GPT-4o mini,上下文窗口最高支持 100 萬(wàn) tokens,知識(shí)更新至 2024 年 6 月。
需要注意的是,該系列模型現(xiàn)階段專為開發(fā)者打造,目前僅通過(guò)開發(fā)者 API 方式提供,普通用戶暫時(shí)無(wú)法通過(guò) ChatGPT 頁(yè)面體驗(yàn)該模型。
OpenAI 表示在編程方面,相比較 GPT-4o 模型,GPT-4.1 模型的代碼生成速度飆升 40%,且用戶輸入查詢的成本降低了 80%。
新模型性能
OpenAI 在官方博文中表示,GPT-4.1 系列模型在編程、指令遵循和長(zhǎng)文本處理上表現(xiàn)優(yōu)異,全面超越 GPT-4o 及 GPT-4o mini。
GPT-4.1 在編程測(cè)試 SWE-bench Verified 中得分 54.6%,較 GPT-4o 提升 21.4 個(gè)百分點(diǎn),在指令遵循測(cè)試 MultiChallenge 中提升 10.5 個(gè)百分點(diǎn),在多模態(tài)長(zhǎng)文本測(cè)試 Video-MME 中創(chuàng)下 72.0% 的新紀(jì)錄。
GPT-4.1 mini 和 nano 展現(xiàn)了小型模型的巨大潛力。GPT-4.1 mini 在多項(xiàng)基準(zhǔn)測(cè)試中媲美甚至超越 GPT-4o,延遲降低近一半,成本減少 83%。
GPT-4.1 nano 作為最快、最經(jīng)濟(jì)的選擇,擁有 100 萬(wàn)個(gè) token 的上下文窗口,在 MMLU 測(cè)試中得分 80.1%,適合分類和自動(dòng)補(bǔ)全任務(wù)。
這些模型通過(guò)優(yōu)化推理?xiàng):吞崾揪彺婕夹g(shù),顯著降低了首次響應(yīng)時(shí)間,為開發(fā)者提供高效低成本的解決方案。
GPT-4.1 系列模型在實(shí)際應(yīng)用中表現(xiàn)突出,特別適合構(gòu)建智能代理,處理復(fù)雜任務(wù)。例如,Windsurf 測(cè)試顯示,GPT-4.1 在編程效率上提升 30%,減少 50% 不必要編輯;Thomson Reuters 的法律 AI 助手 CoCounsel 使用 GPT-4.1 后,多文檔審查準(zhǔn)確率提升 17%。
命名混亂引發(fā)關(guān)注
GPT-4.1 的發(fā)布加劇了 OpenAI 產(chǎn)品命名的復(fù)雜性。
ChatGPT 目前已包含 GPT-4o、GPT-4o mini、o1-pro 等多種模型選項(xiàng)。OpenAI 首席執(zhí)行官山姆?奧爾特曼(Sam Altman)早在 2024 年 2 月就承認(rèn)命名問(wèn)題。
他在 X 平臺(tái)表示,產(chǎn)品線過(guò)于繁雜,計(jì)劃通過(guò)未來(lái)的 GPT-5 整合品牌,OpenAI 計(jì)劃在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型,從而緩解命名混亂。
這一臨時(shí)模型于 2025 年 2 月推出,曾被批評(píng)為“失敗品”,開發(fā)者需在 2025 年 7 月前遷移到其他模型,不過(guò),GPT-4.5 在 ChatGPT 中暫時(shí)保留,未受影響。
費(fèi)用
API 價(jià)格方面,OpenAI GPT-4.1 模型每 100 萬(wàn) tokens 輸入費(fèi)用為 2 美元(IT之家注:現(xiàn)匯率約合 14.6 元人民幣),每 100 萬(wàn) tokens 輸出費(fèi)用為 8 美元(現(xiàn)匯率約合 58.3 元人民幣)。在中等查詢中,相比較 GPT-4o,GPT-4.1 不僅能提供更強(qiáng)悍的性能,而且便宜 26%。
此外,OpenAI GPT-4.1 nano 是 OpenAI 最便宜、最快的模型:
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。