1230 億參數(shù)，Mistral 發(fā)布 Large 2 旗艦 AI 模型：支持 80 多種編程語(yǔ)言，增強(qiáng)代碼生成、數(shù)學(xué)和推理能力

2024/7/25 6:53:16 來(lái)源：IT之家作者：故淵責(zé)編：故淵

評(píng)論：

IT之家 7 月 25 日消息，AI 競(jìng)賽日益激烈，Meta 公司昨日推出開源 Llama 3.1 模型之后，法國(guó)人工智能初創(chuàng)公司 Mistral 也加入了競(jìng)爭(zhēng)行列，推出了新一代旗艦?zāi)Ｐ?Mistral Large 2。

模型簡(jiǎn)介

該模型共有 1230 億個(gè)參數(shù)，在代碼生成、數(shù)學(xué)和推理方面比其前身功能更強(qiáng)大，并提供更強(qiáng)大的多語(yǔ)言支持和高級(jí)函數(shù)調(diào)用功能。

Mistral Large 2 擁有 128k 的上下文窗口，支持包括中文在內(nèi)的數(shù)十種語(yǔ)言以及 80 多種編碼語(yǔ)言。該模型在 MMLU 上的準(zhǔn)確度達(dá)到了 84.0%，并在代碼生成、推理和多語(yǔ)言支持方面有非常明顯的改進(jìn)。

Mistral 公司表示，訓(xùn)練的重點(diǎn)之一是盡量減少模型的幻覺問題。該公司稱，Large 2 接受的訓(xùn)練讓它的反應(yīng)更具辨別力，當(dāng)它不知道某些事情時(shí)，它會(huì)承認(rèn)自己不知道，而不是編造一些看似合理的事情。

開放方式

IT之家援引官方新聞稿，該 AI 模型的關(guān)注點(diǎn)之一，在于“授權(quán)開放”非商業(yè)研究用途，包括開放權(quán)重、支持第三方根據(jù)其喜好進(jìn)行微調(diào)（fine-tune）等等。

1230 億參數(shù)，Mistral 發(fā)布 Large 2 旗艦 AI 模型：支持 80 多種編程語(yǔ)言，增強(qiáng)代碼生成、數(shù)學(xué)和推理能力

如果商業(yè) / 企業(yè)想要使用 Mistral Large 2，需要從 Mistral 公司購(gòu)買單獨(dú)的許可和使用協(xié)議。

性能

與 Llama 3.1 的 4050 億個(gè)參數(shù)（即指導(dǎo)其性能的內(nèi)部模型設(shè)置）相比，它的參數(shù)數(shù)量較少，但性能仍接近前者。

Mistral Large 2 可在公司的主平臺(tái)上使用，也可通過云合作伙伴使用，它建立在原有 Large 模型的基礎(chǔ)上，帶來(lái)了先進(jìn)的多語(yǔ)言功能，并提高了推理、代碼生成和數(shù)學(xué)方面的性能。

官方稱其為 GPT-4 級(jí)模型，在多項(xiàng)基準(zhǔn)測(cè)試中的性能非常接近 GPT-4o、Llama 3.1-405 和 Anthropic 的 Claude 3.5 Sonnet。

1230 億參數(shù)，Mistral 發(fā)布 Large 2 旗艦 AI 模型：支持 80 多種編程語(yǔ)言，增強(qiáng)代碼生成、數(shù)學(xué)和推理能力

Mistral 指出，該產(chǎn)品將繼續(xù)“推動(dòng)成本效益、速度和性能的發(fā)展”，同時(shí)為用戶提供新的功能，包括高級(jí)函數(shù)調(diào)用和檢索，以構(gòu)建高性能的人工智能應(yīng)用。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

1230 億參數(shù)，Mistral 發(fā)布 Large 2 旗艦 AI 模型：支持 80 多種編程語(yǔ)言，增強(qiáng)代碼生成、數(shù)學(xué)和推理能力

模型簡(jiǎn)介

開放方式

性能

相關(guān)文章

1230 億參數(shù)，Mistral 發(fā)布 Large 2 旗艦 AI 模型：支持 80 多種編程語(yǔ)言，增強(qiáng)代碼生成、數(shù)學(xué)和推理能力