30 億參數(shù)“從 0 到 1”，摩爾線程 / 無(wú)問(wèn)芯穹“千卡集群”行業(yè)內(nèi)首次實(shí)現(xiàn)國(guó)產(chǎn) GPU 端到端 AI 大模型實(shí)訓(xùn)

2024/5/27 11:10:51 來(lái)源：IT之家作者：漾仔責(zé)編：漾仔

評(píng)論：

IT之家 5 月 27 日消息，摩爾線程、無(wú)問(wèn)芯穹今天聯(lián)合宣布，雙方已經(jīng)正式完成基于國(guó)產(chǎn)全功能 GPU 千卡集群的 3B 規(guī)模大模型“MT-infini-3B”實(shí)訓(xùn)，該模型基于摩爾線程國(guó)產(chǎn)全功能 GPU MTT S4000 組成的千卡集群，以及無(wú)問(wèn)芯穹的 AIStudio PaaS 平臺(tái)打造。

據(jù)悉，這次的 MT-infini-3B 模型訓(xùn)練總共用時(shí) 13.2 天，全程穩(wěn)定無(wú)中斷，集群訓(xùn)練穩(wěn)定性達(dá)到 100％，千卡訓(xùn)練和單機(jī)相比擴(kuò)展效率超過(guò) 90％，號(hào)稱“充分驗(yàn)證了夸娥千卡智算集群在大模型訓(xùn)練場(chǎng)景下的可靠性，同時(shí)也在行業(yè)內(nèi)率先開(kāi)啟了國(guó)產(chǎn)大語(yǔ)言模型與國(guó)產(chǎn) GPU 千卡智算集群深度合作的新范式”。

IT之家獲悉，實(shí)訓(xùn)出來(lái)的 MT-infini-3B 性能在同規(guī)模模型中躋身前列，相比在國(guó)際主流硬件上訓(xùn)練而成的其他模型，在 C-Eval、MMLU、CMMLU 等 3 個(gè)測(cè)試集上均實(shí)現(xiàn)性能領(lǐng)先。

無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼 CEO 夏立雪表示，當(dāng)前無(wú)問(wèn)芯穹正在打造“M 種模型”和“N 種芯片”之間的“M x N”中間層產(chǎn)品，實(shí)現(xiàn)多種大模型算法在多元芯片上的高效、統(tǒng)一部署，已與摩爾線程達(dá)成深度戰(zhàn)略合作，而目前“MT-infini-3B”這一訓(xùn)練成果是行業(yè)內(nèi)首次實(shí)現(xiàn)基于國(guó)產(chǎn) GPU 芯片從 0 到 1 的端到端大模型實(shí)訓(xùn)案例。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

30 億參數(shù)“從 0 到 1”，摩爾線程 / 無(wú)問(wèn)芯穹“千卡集群”行業(yè)內(nèi)首次實(shí)現(xiàn)國(guó)產(chǎn) GPU 端到端 AI 大模型實(shí)訓(xùn)

相關(guān)文章

30 億參數(shù)“從 0 到 1”，摩爾線程 / 無(wú)問(wèn)芯穹“千卡集群”行業(yè)內(nèi)首次實(shí)現(xiàn)國(guó)產(chǎn) GPU 端到端 AI 大模型實(shí)訓(xùn)