IT之家 5 月 27 日消息,摩爾線程、無(wú)問(wèn)芯穹今天聯(lián)合宣布,雙方已經(jīng)正式完成基于國(guó)產(chǎn)全功能 GPU 千卡集群的 3B 規(guī)模大模型“MT-infini-3B”實(shí)訓(xùn),該模型基于摩爾線程國(guó)產(chǎn)全功能 GPU MTT S4000 組成的千卡集群,以及無(wú)問(wèn)芯穹的 AIStudio PaaS 平臺(tái)打造。
據(jù)悉,這次的 MT-infini-3B 模型訓(xùn)練總共用時(shí) 13.2 天,全程穩(wěn)定無(wú)中斷,集群訓(xùn)練穩(wěn)定性達(dá)到 100%,千卡訓(xùn)練和單機(jī)相比擴(kuò)展效率超過(guò) 90%,號(hào)稱“充分驗(yàn)證了夸娥千卡智算集群在大模型訓(xùn)練場(chǎng)景下的可靠性,同時(shí)也在行業(yè)內(nèi)率先開(kāi)啟了國(guó)產(chǎn)大語(yǔ)言模型與國(guó)產(chǎn) GPU 千卡智算集群深度合作的新范式”。
IT之家獲悉,實(shí)訓(xùn)出來(lái)的 MT-infini-3B 性能在同規(guī)模模型中躋身前列,相比在國(guó)際主流硬件上訓(xùn)練而成的其他模型,在 C-Eval、MMLU、CMMLU 等 3 個(gè)測(cè)試集上均實(shí)現(xiàn)性能領(lǐng)先。
無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼 CEO 夏立雪表示,當(dāng)前無(wú)問(wèn)芯穹正在打造“M 種模型”和“N 種芯片”之間的“M x N”中間層產(chǎn)品,實(shí)現(xiàn)多種大模型算法在多元芯片上的高效、統(tǒng)一部署,已與摩爾線程達(dá)成深度戰(zhàn)略合作,而目前“MT-infini-3B”這一訓(xùn)練成果是行業(yè)內(nèi)首次實(shí)現(xiàn)基于國(guó)產(chǎn) GPU 芯片從 0 到 1 的端到端大模型實(shí)訓(xùn)案例。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。