IT之家 11 月 10 日消息,蘋(píng)果公司近日發(fā)布了將近半小時(shí)的開(kāi)發(fā)者視頻,詳細(xì)介紹了蘋(píng)果 M3 系列芯片和 A17 Pro 芯片中的諸多技術(shù)細(xì)節(jié),并通過(guò)基礎(chǔ)術(shù)語(yǔ)解釋了改進(jìn)原理等。
視頻中表示開(kāi)發(fā)者使用 Metal API 構(gòu)建應(yīng)用程序過(guò)程中,不需要更改現(xiàn)有應(yīng)用程序代碼,就能看到 M3 和 A17 Pro 的性能提升。這些芯片組利用動(dòng)態(tài)緩存(Dynamic Caching)、硬件加速光線(xiàn)追蹤和硬件加速網(wǎng)格映射等,大幅提高了 GPU 表現(xiàn)。IT之家在此附上視頻如下:
動(dòng)態(tài)緩存
蘋(píng)果在 M3 和 A17 Pro 中引入了下一代著色器核心,應(yīng)用調(diào)用 GPU 核心時(shí),這些著色器可以更加高效運(yùn)行,大大提高輸出性能。
通常,GPU 只能根據(jù)執(zhí)行操作期間執(zhí)行操作中的最高帶寬進(jìn)程分配寄存器內(nèi)存。因此,如果操作的某一部分需要比其他部分多得多的寄存器內(nèi)存,則該操作將為給定進(jìn)程使用更多的寄存器內(nèi)存。
動(dòng)態(tài)緩存允許 GPU 為其執(zhí)行的每個(gè)操作分配恰到好處的寄存器內(nèi)存量,釋放以前不可用的寄存器內(nèi)存,允許并行執(zhí)行更多著色器任務(wù)。
靈活的片上存儲(chǔ)器
以前,片上存儲(chǔ)器(on-chip memory)會(huì)為寄存器、線(xiàn)程組和帶有緩沖區(qū)緩存的切片存儲(chǔ)器分配固定的內(nèi)存。這意味著,如果一個(gè)操作使用一種類(lèi)型的內(nèi)存比另一種類(lèi)型的內(nèi)存更多,那么大部分內(nèi)存就會(huì)被閑置。
蘋(píng)果調(diào)整讓所有片上存儲(chǔ)器都可以用于存儲(chǔ)器類(lèi)型的緩存。嚴(yán)重依賴(lài)線(xiàn)程組內(nèi)存的操作可以利用片上內(nèi)存的整個(gè)跨度,甚至可以將操作溢出到主內(nèi)存中。
著色器內(nèi)核可動(dòng)態(tài)調(diào)整片上內(nèi)存占用率,以最大限度地提高性能,這意味著減少開(kāi)發(fā)者的應(yīng)用優(yōu)化時(shí)間。
著色器核心的高性能 ALU 管線(xiàn)
蘋(píng)果建議開(kāi)發(fā)人員在其程序中執(zhí)行 FP16 數(shù)學(xué)運(yùn)算,但高性能 ALU 并行執(zhí)行整數(shù)、FP32 和 FP16 的不同組合。
指令在并行執(zhí)行的不同操作中執(zhí)行,這意味著 ALU 利用率會(huì)隨著占用率的提高而提高。
如果不同的操作包含相同的 FP32 或 FP16 指令,這些指令將在不同的時(shí)間點(diǎn)執(zhí)行,則可以重疊執(zhí)行以增加并行性。
硬件加速圖形管道
硬件加速大幅加快光線(xiàn)追蹤過(guò)程,重要的交叉計(jì)算從 GPU 功能中移除。由于硬件負(fù)責(zé)部分計(jì)算,因此允許并行展開(kāi)更多操作,從而加快硬件組件的光線(xiàn)追蹤速度。
硬件加速網(wǎng)格著色使用類(lèi)似的方法。它采用幾何計(jì)算管道的中間,并將其傳遞給專(zhuān)用單元,從而允許更多并行操作。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。