IT之家 11 月 12 日消息,摩爾線程宣布開源高性能線性代數(shù)模板庫 MUTLASS,以便開發(fā)者能夠更高效針對摩爾線程全功能 GPU 的 MUSA Core 及 Tensor Core 等單元進行編程,加速基于國產 GPU 的算子開發(fā)以及算法創(chuàng)新。
作為摩爾線程專為 MUSA 架構優(yōu)化的高性能計算庫,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于開源模板庫 CUTLASS 進行的 MUSA 適配和定制化開發(fā)、優(yōu)化。
針對矩陣乘法及相關變種,MUTLASS 提供了一系列高性能的 C++ 模板組件,并采用了與 muDNN 庫類似的分層分解及數(shù)據搬運策略,以確保性能的充分發(fā)揮。
在本次開源的版本中,摩爾線程適配了 CuTe 后端庫,為其增加了第三代 MUSA 架構的 MMA 計算原語,支持 TF32 / FP16 / BF16 / INT8 等多種數(shù)據精度,并以此為基礎,初步實現(xiàn)了矩陣乘法、默認實例庫、性能測試器及相關工具包的支持。
IT之家附 MUTLASS 開源地址:https://github.com/MooreThreads/mutlass
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。