IT之家 5 月 14 日消息,據(jù) tom'sHardware 報(bào)道,Tachyum 創(chuàng)造了世界上最強(qiáng)大的處理器之一:Prodigy T16128 通用處理器。Prodigy T16128 擁有 128 個(gè) 64 位 CPU 內(nèi)核,運(yùn)行頻率高達(dá) 5.7GHz,還有 16 個(gè) DDR5 內(nèi)存控制器和 64 個(gè) PCIe 5.0 通道,可以處理通用計(jì)算、高性能計(jì)算 (HPC) 和 AI 工作負(fù)載 —— 所有這些都使用單個(gè)芯片。
Tachyum 將 Prodigy 稱為世界上第一個(gè)“通用處理器”,并表示從一開始就被設(shè)計(jì)為能夠運(yùn)行眾多世界上最密集的計(jì)算應(yīng)用程序的多用途 CPU。Prodigy 不僅在單個(gè)芯片上處理所有這些不同的任務(wù),而且功耗預(yù)算比傳統(tǒng)硬件降低到 10 分之一,成本只有三分之一。
Tachyum 大膽宣稱 Prodigy 超級計(jì)算機(jī)芯片的性能是市場上英特爾最快的 Xeon 芯片的四倍,在高性能計(jì)算應(yīng)用中的原始性能是 Nvidia H100 的三倍。同時(shí),能效提高了 10 倍。
Tachyum 表示,為了在單核架構(gòu)中創(chuàng)造如此令人印象深刻的性能,它從頭開始構(gòu)建了具有矩陣和矢量處理能力的 Prodigy,而不是后面才考慮它們。Prodigy 支持一系列數(shù)據(jù)類型,包括 FP64、FP32、TF32、BF16、Int8、FP8 和 TAI,所有這些都來自各個(gè) CPU 內(nèi)核本身。
Prodigy 處理器在 2023 年問世時(shí)可能會改變游戲規(guī)則。AMD、英特爾和 Nvidia 的最新服務(wù)器硬件都依賴于單個(gè)硬件 —— 即使在單個(gè) CPU 或 GPU 中 —— 來執(zhí)行這些不同的工作負(fù)載。這方面的一個(gè)例子是 Nvidia 的 RTX 系列 GPU,它需要專用的機(jī)器學(xué)習(xí) Tensor 內(nèi)核才能使 AI 工作,而專用的 RT 內(nèi)核則需要用于光線追蹤應(yīng)用程序。
另一方面,Prodigy 將能夠在單個(gè)內(nèi)核上運(yùn)行光線追蹤和 AI 應(yīng)用程序,并且不需要將數(shù)據(jù)轉(zhuǎn)移到微處理器內(nèi)部的另一個(gè)芯片上。
在單個(gè)芯片內(nèi)運(yùn)行所有這些不同的 HPC 工作負(fù)載可能會極大地改變服務(wù)器格局:公司將能夠?qū)⒏嘈酒虬椒?wù)器場中,同時(shí)降低功耗和冷卻。
Prodigy T16128 采用未知來源的 5nm 工藝技術(shù)運(yùn)行,并在非常小的(就其提供的功率而言)64 mm x 84mm FCLGA 封裝內(nèi)運(yùn)行。Tachyum 表示,在 HPC 工作負(fù)載方面,該芯片能夠執(zhí)行 12 AI PetaFLOPS 和 90 TeraFLOPS。Prodigy 芯片還可以運(yùn)行適用于 x86、ARM、RISC-V 等指令集架構(gòu)的二進(jìn)制文件。從某種角度來看,單個(gè) Nvidia A100 只能實(shí)現(xiàn) 5 AI PetaFLOPS。
每個(gè)內(nèi)核特別能夠執(zhí)行 2 個(gè) 1024 位向量單元、4096 位矩陣運(yùn)算和每個(gè)時(shí)鐘 4 個(gè)亂序指令。還支持虛擬化和高級 RAS。該芯片還包括超過 128MB 的具有糾錯(cuò)功能的 L2+L3 高速緩存。為了滿足其所有內(nèi)核的需求,該芯片配備了 16 個(gè) DDR5 內(nèi)存控制器,額定速度高達(dá) 7200MT / s,每個(gè)插槽的最大容量為 8TB。
T16128 是 Tachyum Prodigy 系列中的旗艦型號,產(chǎn)品堆棧中的中端和入門級插槽分別有 64 核 T864 和 32 核 T832。芯片生產(chǎn)將于 2023 年開始,因此我們應(yīng)該會在明年某個(gè)時(shí)候看到這些芯片的實(shí)際基準(zhǔn)測試性能。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。