設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

英偉達(dá):美團(tuán)機(jī)器學(xué)習(xí)平臺使用 NVIDIA T4 GPU,相比同成本 CPU 性能提升 10 倍

2021/12/25 16:08:38 來源:IT之家 作者:孤城 責(zé)編:孤城

IT之家 12 月 25 日消息,據(jù)英偉達(dá)官方消息,美團(tuán)機(jī)器學(xué)習(xí)平臺使用 NVIDIA GPU,通過算子融合、計算圖等價替換等一系列優(yōu)化 ,相較于 CPU 在相同成本約束下,NVIDIA T4 GPU 大幅加速美團(tuán) CTR(Click-Through-Rate)模型預(yù)測性能,神經(jīng)網(wǎng)絡(luò)模型吞吐能力提升了 10 倍;同時在搜索精排場景中,端到端整體吞吐能力提升了一倍以上。

英偉達(dá)

英偉達(dá)表示,美團(tuán)的 CTR 模型過去一直在使用 CPU 推理的方式,但隨著用戶訪問量的提升和深度神經(jīng)網(wǎng)絡(luò)的引入,CTR 模型結(jié)構(gòu)趨于復(fù)雜,吞吐和計算量也越來越大,CPU 開始不能滿足模型對于算力的需求,而僅僅通過 CPU 服務(wù)器的堆疊帶來的性能提升性價比相較偏低。而 GPU 擁有數(shù)以千計的計算核心,可以在單機(jī)內(nèi)提供密集的并行計算能力,特別適合深度學(xué)習(xí)場景,在行業(yè)內(nèi)已經(jīng)在 CV、NLP 等領(lǐng)域展示了強(qiáng)大的能力。通過 CUDA 及相關(guān) API,NVIDIA 建立了完整的 GPU 生態(tài)系統(tǒng)。基于此,美團(tuán)基礎(chǔ)研發(fā)平臺將 CTR 模型部署到 GPU 上,并通過一系列針對 CPU 與 GPU 的異構(gòu)系統(tǒng)并行計算設(shè)計、數(shù)據(jù)存儲方式和傳輸方式上的特定優(yōu)化。

IT之家了解到,NVIDIA Tesla T4 GPU 是一款推理加速器,搭載 NVIDIA Turing Tensor Core。官方稱,NVIDIA Tesla T4 GPU 具備人工智能推理的多精度計算性能,從 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的性能比 CPU 高出 40 倍,實(shí)現(xiàn)性能的重大突破。

英偉達(dá)

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知