IT之家 4 月 10 日消息,谷歌公司近日發(fā)布了 CodeGemma 先進大語言模型(LLMs),專門用于生成代碼、理解和追蹤指令等,開發(fā)目的是讓全球開發(fā)人員更容易獲得高質量的代碼輔助工具。
CodeGemma 作為 Gemma 模型的開放訪問系列推出,針對代碼開發(fā)場景進行優(yōu)化、微調(fine-tuned)。該套件包括三種不同的模型:
20 億參數(shù)的基礎模型:優(yōu)化補全和生成代碼,在注重延遲和隱私的情況下主要為代碼提供快速高效的解決方案。
70 億參數(shù)基礎模型:整合代碼補全和自然語言處理,增強了其在完成代碼和理解語言生成任務時的實用性。
用于指導追蹤的 70 億參數(shù)模型:用戶參與有關代碼、編程和數(shù)學推理的對話,是開發(fā)人員尋求指導或注釋的寶貴資源。
CodeGemma 的上述 3 個模型利用了預先訓練的 Gemma 檢查點,此外還訓練了英語、數(shù)學和各種編碼語言的另外 5000 億個詞塊,在邏輯和數(shù)學推理方面的超凡能力,為代碼生成和完成樹立了新的標桿。
70 億參數(shù)模型在 Python、Java、JavaScript 和 C++ 等各種編程語言中均表現(xiàn)出色。在 HumanEval 和 MultiPL-E 基準測試中取得的優(yōu)異成績充分證明了這一能力。此外,該模型在 GSM8K 評估中名列前茅,也證明了它的多功能性和有效性。
IT之家附上參考地址
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。