不止 CPU,蘋(píng)果 M1 Mac 現(xiàn)已支持在 PyTorch 訓(xùn)練中用 GPU 加速

量子位 2022/5/19 13:05:02 責(zé)編:長(zhǎng)河
感謝IT之家網(wǎng)友 末6_ 的線(xiàn)索投遞!

一直以來(lái),Pytorch 在 Mac 上僅支持使用 CPU 進(jìn)行訓(xùn)練。就在剛剛,Pytorch 官方宣布,其最新版 v1.12 可以支持 GPU 加速了。只要是搭載了 M1 系列芯片的 Mac 都行。

這也就意味著在 Mac 本機(jī)用 Pytorch“煉丹”會(huì)更方便了!

訓(xùn)練速度可提升約 7 倍

此功能由 Pytorch 與 Apple 的 Metal 工程團(tuán)隊(duì)合作推出。它使用 Apple 的 Metal Performance Shaders (MPS) 作為 PyTorch 的后端來(lái)啟用 GPU 加速訓(xùn)練。

為了優(yōu)化計(jì)算性能,MPS 還針對(duì) Metal GPU 系列的獨(dú)特特性對(duì)每個(gè)內(nèi)核進(jìn)行了微調(diào)。

Metal 是一個(gè)類(lèi)似 OpenGL 的框架,只不過(guò) OpenGL 適用于各平臺(tái)的移動(dòng)端 GPU 渲染和計(jì)算,Metal 專(zhuān)用于 iOS / MacOS 平臺(tái),不過(guò)也兼顧了性能和易用性

MPS 就是一套基于 Metal 框架的庫(kù),直接調(diào)用即可使用 GPU 的高性能進(jìn)行圖形處理、構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)等工作。

蘋(píng)果官方在搭載了 M1 Ultra、20 核 CPU、64 核 GPU、128GB RAM 和 2TB SSD 的 Mac Studio 上進(jìn)行了測(cè)試。(這陣容差不多能算是豪華配置了)。

他們分別訓(xùn)練了 batch size 為 128 的 ResNet50、batch size 為 64 的 HuggingFace BERT,以及 batch size=64 的 VGG16。

從下圖中我們可以發(fā)現(xiàn),相比使用 CPU 加速,使用 GPU 可將模型訓(xùn)練速度提高約 7 倍,評(píng)估(evaluation)速度則最高能提約 20 倍。

看到這兒,有網(wǎng)友開(kāi)始好奇它與搭載了 Nvidia GPU 的 laptop 相比性能如何。

有人表示,雖說(shuō)目前 M1 的原始計(jì)算性能比不上英偉達(dá)的產(chǎn)品,但功耗方面還不錯(cuò)。未來(lái)蘋(píng)果很有可能慢慢追上性能。總的來(lái)說(shuō),Mac Studio 現(xiàn)在看起來(lái)實(shí)在太香了。

他進(jìn)一步解釋道:“畢竟它是你花 4800 美元就能買(mǎi)到的最便宜、包含 128GB GPU 內(nèi)存的機(jī)器。現(xiàn)在有了基于 GPU 加速的 PyTorch 支持,完全可以用來(lái)訓(xùn)練大模型、配置大的 batch size。對(duì)于我所做的那種 DL 工作,數(shù)據(jù)加載比實(shí)際的原始計(jì)算能力更容易成為瓶頸。”

你心動(dòng)了嗎?現(xiàn)在就試試?

需保證你的 macOS 操作系統(tǒng)在 12.3 版本及以上,且安裝了 arm64 原生 Python,然后去官網(wǎng)下載最新的 Pytorch 預(yù)覽版就可以了。

地址:

https://pytorch.org/blog/introducing-accelerated-pytorch-training-on-mac/

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:蘋(píng)果,Mac,PyTorch

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知