IT之家 2 月 25 日消息,今日人工智能公司 Anthropic 宣布推出其首款“混合推理模型”——Claude 3.7 Sonnet。該模型可以解決更復(fù)雜的問題,并在數(shù)學(xué)和編碼等領(lǐng)域中性能超過了以前的模型。
Anthropic 公司表示,這是其有史以來“最智能”的 AI 模型,稱這種“混合型”模型同時具備“推理模式”(停下來思考復(fù)雜答案)與傳統(tǒng)模式(實時生成答案)的能力,并表示該模型是市面上唯一的此類“混合”模型。
IT之家注意到,除了新模型外,Anthropic 還發(fā)布了其“自主性”編程工具 Claude Code 的“有限研究預(yù)覽版”。盡管 Anthropic 已經(jīng)為如 Cursor 等人工智能編程工具提供支持,但此次推出的 Claude Code 被定位為一個“積極的合作伙伴”,它能夠搜索和閱讀代碼、編輯文件、編寫和運行測試、將代碼提交到 GitHub,并使用命令行工具。
從本周一開始,用戶可以在 Claude 應(yīng)用程序中使用 Claude 3.7 Sonnet,開發(fā)者也可以通過 Anthropic 的 API、亞馬遜 Bedrock 和谷歌云的 Vertix AI 獲取該模型。其運行成本與前代產(chǎn)品 3.5 Sonnet 相同,輸入每百萬 token 收費 3 美元,輸出每百萬 token 收費 15 美元。
目前,OpenAI 等公司提供獨立的推理模型,但 Anthropic 產(chǎn)品研究主管 Dianne Penn 表示,公司希望簡化使用模型的體驗。她指出:“我們從根本上認(rèn)為,推理是人工智能的一個特征,而不是一個完全獨立的事物?!彼€提到,Claude 在回答簡單問題如“現(xiàn)在幾點了?”和應(yīng)對更復(fù)雜的提示,例如“規(guī)劃一個為期兩周的意大利之旅,并考慮 3 月下旬的天氣”時,回應(yīng)速度差異不大。
Dianne Penn 稱,Claude 3.7 Sonnet 在“自主性編程”、金融和法律任務(wù)上的表現(xiàn)明顯優(yōu)于前代產(chǎn)品。盡管該模型仍不具備實時網(wǎng)絡(luò)搜索功能,但其知識截止日期為 2024 年 10 月,比其他模型更新。此外,Anthropic 還允許開發(fā)者通過其“草稿紙”功能指導(dǎo)模型的“思考”方式,甚至可以精確控制模型的響應(yīng)時間。Anthropic 產(chǎn)品副總裁 Michael Gerstenhaber 表示:“有時開發(fā)者只需要明確指出,回答這個問題不應(yīng)超過 200 毫秒。”他認(rèn)為這是產(chǎn)品決策的一部分。
在 Anthropic 內(nèi)部,員工已利用 Claude 3.7 Sonnet 完成前端網(wǎng)站設(shè)計、交互式游戲開發(fā)等任務(wù)。Penn 透露,該模型甚至能通過反復(fù)構(gòu)建和編輯測試用例,支持長達 45 分鐘的編碼工作。她還提到,公司通過將模型的 API 映射到游戲控制器方案,測試模型在一款經(jīng)典《寶可夢》電子游戲中的表現(xiàn)。結(jié)果顯示,前代 Claude 3.5 Sonnet 無法走出游戲初期的帕雷特鎮(zhèn),而 3.7 版本成功擊敗了多個道館館主。
目前,Anthropic 憑借 Claude 3.7 Sonnet 的性能提升再次處于領(lǐng)先地位。該模型的發(fā)布也表明,行業(yè)正朝著一個模型能夠完成所有任務(wù)的未來邁進,而非提供獨立的推理模型。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。