設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

高通發(fā)布 Cloud AI 100 Ultra 云推理卡,150W 單卡可運(yùn)行千億參數(shù)大模型

2023/11/15 13:12:05 來源:IT之家 作者:問舟 責(zé)編:問舟
感謝IT之家網(wǎng)友 軟媒新友1933769、溯波 的線索投遞!

IT之家 11 月 15 日消息,高通發(fā)布了 Cloud AI 100 Ultra,屬于云 AI 推理加速卡,專為生成式 AI 和大型語言模型而設(shè)計(jì)。

這款產(chǎn)品可提供相當(dāng)于上一代產(chǎn)品四倍的性能,可以在單張 150W 的卡上部署 100B 參數(shù)模型,在兩張卡上部署 175B 參數(shù),甚至還可以通過高通 AI 堆棧和云 AI SDK 的多 個(gè) Cloud  AI 100 Ultra 支持更大的模型。

據(jù)介紹,高通 Cloud AI 100 Ultra 是一個(gè)可編程的 AI 加速器,可以支持最新的 AI 技術(shù)和數(shù)據(jù)格式。

它利用高通 AI 堆棧,可以使客戶能夠“在任何地方訓(xùn)練并在高通 Cloud  AI 100 Ultra 上進(jìn)行推理”,從而支持模型的移植和優(yōu)化。

正如其名,這是一款云加速卡,它背后依賴的是慧與科技專為加速器優(yōu)化的生成式 AI 工作負(fù)載(IT之家注:包括自然語言處理 NLP)設(shè)計(jì)的 HPE ProLiant DL380a Gen 11 服務(wù)器。

根據(jù)高通官方的說法,Cloud AI 100 平臺(tái)在最新基準(zhǔn)測試結(jié)果的所有加速卡中均處于領(lǐng)先地位,但不清楚最新 Cloud AI 100 Ultra 的具體結(jié)果。

高通表示,在云和企業(yè)用例中,與競爭對(duì)手相比,高通 Cloud AI 100 Ultra 在生成式 AI(包括 LLMs、NLP 和計(jì)算機(jī)視覺工作負(fù)載)方面每 TCO 美元提供兩到五倍的性能。

他們認(rèn)為,這種性能、定價(jià)、功率、效率、可擴(kuò)展性和安全性的結(jié)合,使其成為希望采用尖端 AI 并轉(zhuǎn)變其運(yùn)營的組織的理想選擇,同時(shí)支持可持續(xù)發(fā)展目標(biāo)。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,高通,推理卡

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知