IT之家 8 月 9 日消息,阿里通義千問 Qwen2 開源家族迎來新成員 Qwen2-Math,共有 15 億參數(shù)、70 億參數(shù)和 720 億參數(shù)三個版本,是基于 Qwen2 LLM 構(gòu)建、專門用于數(shù)學解題的語言模型。
簡介
Qwen2-Math 是一系列基于 Qwen2 LLM 構(gòu)建的專門用于數(shù)學解題的語言模型,其數(shù)學能力顯著超越了開源模型,甚至超過了閉源模型(如 GPT-4o),官方希望為科學界解決需要復雜多步邏輯推理的高級數(shù)學問題做出貢獻。
性能
團隊在一系列數(shù)學基準評測上評估了我們的數(shù)學專用模型 Qwen2-Math。在 Math 上的評測結(jié)果表明,其最大的數(shù)學專用模型 Qwen2-Math-72B-Instruct 超越了最先進的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。
正開發(fā)多語言模型
IT之家從報道中獲悉,新模型系列 Qwen2-Math 專注于數(shù)學能力,目前僅支持英文,團隊計劃推出支持英文和中文的雙語模型,并且開發(fā)多語言模型。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。