IT之家 12 月 4 日消息,亞馬遜 AWS 今日宣布,基于其內(nèi)部團隊所開發(fā) AI 訓練芯片 Trainium2 的 Trn2 實例廣泛可用,并推出了 Trn2 UltraServer 大型 AI 訓練系統(tǒng),同時還發(fā)布了下代更先進的 3nm 制程 Trainium3 芯片。
單個 Trn2 實例包含 16 顆 Trainium2 芯片,各芯片間采用超高速高帶寬低延遲 NeuronLink 互聯(lián),可提供 20.8 petaflops 的峰值算力,適合數(shù) B 參數(shù)大小模型的訓練和部署。
亞馬遜宣稱 Trn2 實例與當前一代基于 GPU 的 EC2 P5e 和 P5en 實例相比性價比提高了 30-40%。
而更大規(guī)模的 Trn2 UltraServer 則用 NeuronLink 聚合了 4 臺 Trn2 服務器,總共包含 64 顆 Trainium2 芯片,算力峰值進一步線性擴展到 83.2 petaflops,能滿足目前世界上最大規(guī)模模型的訓練和部署需求。
亞馬遜還正與其投資的 AI 模型企業(yè) Anthropic 合作,共同構建一個名為 Project Rainier 的 EC2 UltraCluster 巨型計算集群,該集群包含大量 Trn2 UltraServer,總共擁有數(shù)十萬顆 Trainium2 芯片。
IT之家獲悉,該集群完成后有望成為迄今為止公開的最大 AI 計算集群,整體算力達 Anthropic 目前用于訓練最先進 Claude 模型所需量的 5 倍以上。
亞馬遜 AWS 還公布了下代 Trainium3 AI 訓練芯片,這也是 AWS 首款采用 3nm 制程的芯片產(chǎn)品。亞馬遜表示基于 Trainium3 的 UltraServer 性能可達 Trn2 UltraServer 的 4 倍,而首批基于 Trainium3 的實例預計將于 2025 年底推出。
廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。