北京智源發(fā)布悟道 3.0 大模型系列

2023/6/10 20:28:15 來源：IT之家作者：澤瀧（實習） 責編：澤瀧

評論：

IT之家 6 月 10 日消息，在“2023 北京智源大會”上，北京智源人工智能研究院發(fā)布悟道 3.0 大模型系列，包含悟道?天鷹（Aquila）語言大模型系列、“天秤（FlagEval）”大語言評測體系及開放平臺以及悟道?視界視覺大模型系列。

IT之家附詳細內容：

悟道?天鷹 Aquila 語言大模型是第一個中英文雙語大模型，支持商用、符合數(shù)據(jù)合規(guī)要求，在中英高質量合規(guī)的語料數(shù)據(jù)庫基礎上從零開始訓練。這次發(fā)布了該系列模型中的 7B、33B 和 AquilaChat 對話模型，即 70 億參數(shù)、330 億參數(shù)的基礎模型，AquilaCode 文本代碼生成模型。

北京智源發(fā)布悟道 3.0 大模型系列

7B、33B 在技術上繼承了 GPT-3、LLaMA 等的架構設計優(yōu)點，替換了一批更高效的底層算子實現(xiàn)、重新設計實現(xiàn)了中英雙語的 tokenizer，升級了 BMTrain 并行訓練方法，在 Aquila 的訓練過程中實現(xiàn)了比 Magtron+DeepSpeed ZeRO-2 將近８倍的訓練效率。

AquilaCode-7B 代碼模型，是基于 Aquila-7B 基礎模式的代碼模型，它也是 7B（70 億參數(shù)），用小數(shù)據(jù)集、小參數(shù)量實現(xiàn)了高性能，支持中英雙語。

大語言模型評測體系“天秤”在能力、任務、指標三個維度上建立了全方位的評測體系，包括 30 多種能力，加上 5 種任務，再乘以 4 大類的指標，總共差不多 600 維的評測體系。目前天秤開源大模型評測體系已經面向公眾開放注冊申請。在硬件方面支持英偉達、華為的昇騰、寒武紀、昆侖芯等多種芯片架構，以及 PyTorch 等多種深度學習框架。

北京智源發(fā)布悟道 3.0 大模型系列

視覺大模型方面，智源大會公布了在多模態(tài)序列中補全一切的多模態(tài)大模型 Emu、最強十億級視覺基礎模型 EVA、性能最強開源 CLIP 模型 EVA-CLIP、首創(chuàng)了上下文圖像學習技術路徑的通用視覺模型 Painter、分割一切的視界通用分割模型、以及首個零樣本視頻編輯方法 vid2vid-zero 等成果。

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：北京智源，悟道3.0大模型

北京智源發(fā)布悟道 3.0 大模型系列

相關文章