設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

“力壓 GPT-4o 和 Gemini 1.5 Pro”,Anthropic 推出 Claude 3.5 Sonnet AI 模型

2024/6/21 9:28:39 來(lái)源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 6 月 21 日消息,Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,這是 Claude 3.5 系列的首個(gè)模型版本,在各項(xiàng)評(píng)估中優(yōu)于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。

Claude 3.5 Sonnet 在前代的基礎(chǔ)上迭代升級(jí),性能更快,編碼、視覺(jué)和自然語(yǔ)言理解能力更強(qiáng)。

Claude 3.5 Sonnet 屬于中等尺寸模型,介于小型 Haiku 和高端 Opus 之間,但 Anthropic 聲稱,根據(jù)內(nèi)部基準(zhǔn)測(cè)試,Sonnet 的性能甚至超過(guò)了頂級(jí) Opus。

據(jù) Anthropic 稱,Claude 3.5 Sonnet 處理輸入的速度是 Opus 的兩倍。該公司稱,在編碼挑戰(zhàn)方面,Sonnet 超越了之前的 Opus 模型,修復(fù)了 64% 的代碼錯(cuò)誤,而 Opus 只有 38%。

基準(zhǔn)測(cè)試結(jié)果還顯示,Sonnet 在 9 個(gè)總體類別中的 7 個(gè)類別、5 個(gè)視覺(jué)任務(wù)中的 4 個(gè)任務(wù)上擊敗了競(jìng)爭(zhēng)對(duì)手。

IT之家翻譯官方新聞稿如下:

Claude 3.5 Sonnet 是我們迄今為止最強(qiáng)大的視覺(jué)模型,在標(biāo)準(zhǔn)視覺(jué)基準(zhǔn)測(cè)試中超過(guò)了 Claude 3 Opus,在解讀圖表等需要視覺(jué)推理的任務(wù)中,這些階躍式的改進(jìn)最為明顯。

Claude 3.5 Sonnet 還能從不完美的圖像中準(zhǔn)確地轉(zhuǎn)錄文本,這是零售、物流和金融服務(wù)的核心能力,在這些領(lǐng)域,人工智能可能會(huì)從圖像、圖形或插圖中獲得比單純從文本中獲得更多的洞察力。

為確保安全,Anthropic 將 Sonnet 提交給英國(guó)和美國(guó)人工智能安全研究所進(jìn)行外部評(píng)估。他們發(fā)現(xiàn),經(jīng)過(guò)改進(jìn)后,該模型仍處于 ASL 2 級(jí)水平。Anthropic 還利用兒童安全專業(yè)知識(shí)對(duì)助手進(jìn)行了更新,以更好地預(yù)防潛在傷害。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Claude,AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知