谷歌 Gemini 2.0 正式發(fā)布，關鍵基準測試性能約為 1.5 Pro 兩倍

2024/12/11 23:55:14 來源：IT之家作者：問舟責編：問舟

評論：

感謝IT之家網友風見暉一的線索投遞！

IT之家 12 月 11 日消息，谷歌正式發(fā)布 Gemini 2.0，號稱是谷歌迄今為止功能最強的 AI 模型，帶來了更強的性能、更多的多模態(tài)表現(xiàn)（如原生圖像和音頻輸出）和新的原生工具應用。

如圖所示， Gemini 2.0 在關鍵基準測試中相對于 Gemini 1.5 Pro 實現(xiàn)了大幅性能提升而且延遲更低，谷歌官方的表述是“關鍵基準測試中超越了 1.5 Pro，速度是其兩倍”。

據(jù)介紹，Gemini 2.0 還帶來了多種新功能。除了支持圖像、視頻和音頻等多模態(tài)輸入外，現(xiàn)在還支持多模態(tài)輸出，例如與文本混合的原生文生圖、可自定義的文本轉語音 (TTS) 多語言音頻內容。此外，它還支持原生調用工具，如 Google 搜索、代碼執(zhí)行以及第三方用戶定義函數(shù)等等。

谷歌 Gemini 2.0 正式發(fā)布，關鍵基準測試性能約為 1.5 Pro 兩倍

谷歌 Gemini 2.0 Flash 對原生用戶界面操作實現(xiàn)了多方面的改進，例如多模態(tài)推理、長上下文理解、復雜指令遵循和規(guī)劃、組合函數(shù)調用、原生工具使用等，并進一步優(yōu)化了延遲問題。

谷歌表示：AI 智能體的實際應用是一個激動人心、充滿可能性的研究領域。我們正在通過一系列原型探索這個新領域，這些原型可以幫助人們完成任務并把事情做好，其中包括對 Project Astra 的更新，Project Astra 是我們探索通用人工智能（AGI）未來功能的研究原型；新的 Project Mariner 則將從你的瀏覽器開始探索人機交互的未來；以及 Jules，這是一個可以幫助開發(fā)人員的 AI 代碼智能體。

即日起，開發(fā)人員便可在 AI Studio 和 Vertex AI 中對 Gemini 2.0 Flash 實驗版本進行試用（文本轉語音和原生圖像生成僅供早期訪問合作伙伴使用，但所有開發(fā)者均可使用多模態(tài)輸入和文本輸出，預計將于 1 月廣泛開放），而且該版本也已經在網頁版中為 Gemini Advanced 開放試用，移動版后續(xù)推出。

谷歌 Gemini 2.0 正式發(fā)布，關鍵基準測試性能約為 1.5 Pro 兩倍

為了幫助開發(fā)人員開發(fā)動態(tài)和交互式應用，谷歌還發(fā)布了新的多模態(tài)實時 API，它具有實時音頻、視頻輸入能力，而且能夠使用多個組合工具。

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：谷歌，Gemini

谷歌 Gemini 2.0 正式發(fā)布，關鍵基準測試性能約為 1.5 Pro 兩倍

相關文章

谷歌 Gemini 2.0 正式發(fā)布，關鍵基準測試性能約為 1.5 Pro 兩倍