IT之家 6 月 21 日消息,Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,這是 Claude 3.5 系列的首個(gè)模型版本,在各項(xiàng)評(píng)估中優(yōu)于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。
Claude 3.5 Sonnet 在前代的基礎(chǔ)上迭代升級(jí),性能更快,編碼、視覺(jué)和自然語(yǔ)言理解能力更強(qiáng)。
Claude 3.5 Sonnet 屬于中等尺寸模型,介于小型 Haiku 和高端 Opus 之間,但 Anthropic 聲稱,根據(jù)內(nèi)部基準(zhǔn)測(cè)試,Sonnet 的性能甚至超過(guò)了頂級(jí) Opus。
據(jù) Anthropic 稱,Claude 3.5 Sonnet 處理輸入的速度是 Opus 的兩倍。該公司稱,在編碼挑戰(zhàn)方面,Sonnet 超越了之前的 Opus 模型,修復(fù)了 64% 的代碼錯(cuò)誤,而 Opus 只有 38%。
基準(zhǔn)測(cè)試結(jié)果還顯示,Sonnet 在 9 個(gè)總體類別中的 7 個(gè)類別、5 個(gè)視覺(jué)任務(wù)中的 4 個(gè)任務(wù)上擊敗了競(jìng)爭(zhēng)對(duì)手。
IT之家翻譯官方新聞稿如下:
Claude 3.5 Sonnet 是我們迄今為止最強(qiáng)大的視覺(jué)模型,在標(biāo)準(zhǔn)視覺(jué)基準(zhǔn)測(cè)試中超過(guò)了 Claude 3 Opus,在解讀圖表等需要視覺(jué)推理的任務(wù)中,這些階躍式的改進(jìn)最為明顯。
Claude 3.5 Sonnet 還能從不完美的圖像中準(zhǔn)確地轉(zhuǎn)錄文本,這是零售、物流和金融服務(wù)的核心能力,在這些領(lǐng)域,人工智能可能會(huì)從圖像、圖形或插圖中獲得比單純從文本中獲得更多的洞察力。
為確保安全,Anthropic 將 Sonnet 提交給英國(guó)和美國(guó)人工智能安全研究所進(jìn)行外部評(píng)估。他們發(fā)現(xiàn),經(jīng)過(guò)改進(jìn)后,該模型仍處于 ASL 2 級(jí)水平。Anthropic 還利用兒童安全專業(yè)知識(shí)對(duì)助手進(jìn)行了更新,以更好地預(yù)防潛在傷害。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。