設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

黃仁勛數(shù)字人亮相 GTC,英偉達秀“元宇宙”肌肉:看這巴掌大 AI 超算和虛擬化身平臺

芯東西 2021/11/9 23:19:11 責編:問舟

黃仁勛“手辦”對答如流,英偉達強勢拉開元宇宙序幕,幫企業(yè)開發(fā)大模型。

11 月 9 日報道,今日,人工智能及高性能計算頂級技術盛會 NVIDIA GTC 大會如約而至。

這個市值已高達 7700 億美元的 AI 頂級玩家,剛剛推出全球最小、功能最強大、能效最高的下一代 AI 超級計算機 NVIDIA Jetson AGX Orin,其算力達到 200TOPS,可與內置 GPU 的服務器媲美。

在下午的虛擬主題演講中,NVIDIA 創(chuàng)始人兼 CEO 黃仁勛穿著熟悉的皮衣,公布了一系列最新 AI 技術和產(chǎn)品,并推出承載著其“元宇宙”愿景的全新虛擬化身平臺。

由這個平臺生成的“迷你玩具版黃仁勛”Toy-Me,能與人自然地問答交流。

在幫助企業(yè)降低 AI 開發(fā)部署門檻方面,NVIDIA 可以說是做到了極致,比如提供方便企業(yè)構建 AI 大模型的框架,以及定制專屬聲音的虛擬助手。

黃仁勛說,NVIDIA 開發(fā)者數(shù)量已接近 300 萬,CUDA 過去 15 年下載量達 3000 萬次,一年下載量達到 700 萬。

此外,NVIDIA 繼續(xù)表露對醫(yī)療健康領域的熱情,推出搭載新一代 Orin 芯片、無縫連接醫(yī)療設備和邊緣服務器的 AI 計算平臺 Clara Holoscan。

黃仁勛還宣布,NVIDIA 將構建一個數(shù)字孿生模型來模擬和預測氣候變化,新的超級計算機將名為 E-2,即 Earth Two,地球的數(shù)字孿生,能夠在虛擬世界模擬引擎 Omniverse 中以 Million-X 百萬倍的速度運行。

Jetson AGX Orin:手掌大小,算力堪比服務器

自 2014 年推出 Jetson TK1 至今,NVIDIA Jetson 系列已經(jīng)積累了 85 萬名開發(fā)者。

今日,NVIDIA 推出全球最小、功能強大、能效最高的新一代 AI 超級計算機 NVIDIA Jetson AGX Orin,用于機器人、自主機器、醫(yī)療器械和其他形式的邊緣嵌入式計算。

Jetson AGX Orin 保持了與前代機型 Jetson AGX Xavier 相同的外形尺寸和引腳兼容性,處理能力提升 6 倍,每秒算力達 200TOPS,可與內置 GPU 的服務器相媲美,而尺寸只有手掌那么大。

它采用 NVIDIA Ampere 架構 GPU、Arm Cortex-A78AE CPU 以及新一代深度學習和視覺加速器。高速接口、更快的存儲帶寬和對多模態(tài)傳感器的支持,為多個并行 AI 應用流水線輸送數(shù)據(jù)。

與歷代 Jetson 計算機一樣,使用 Jetson AGX Orin 的客戶可以運用 NVIDIA CUDA-X 加速計算棧、NVIDIA JetPack SDK 和最新 NVIDIA 工具進行應用開發(fā)和優(yōu)化,包括云原生開發(fā)工作流程。

來自 NVIDIA NGC 目錄的預訓練模型已經(jīng)過優(yōu)化,并可以使用 NVIDIA TAO 工具套件和客戶數(shù)據(jù)集進行微調。這減少了生產(chǎn)級 AI 的部署時間和成本,而云原生技術實現(xiàn)了產(chǎn)品整個生命周期內的無縫更新。

DRIVE AGX Orin 同樣由 Jetson AGX Orin 等 NVIDIA Ampere 架構提供支持,它是新發(fā)布的 NVIDIA DRIVE Concierge 和 DRIVE Chauffeur 背后的先進處理器,這兩個 AI 平臺分別為安全的自動駕駛提供動力。

針對特定用例的軟件框架包括用于機器人技術的 NVIDIA Isaac Sim,用于自動駕駛的 NVIDIA DRIVE,用于智慧城市的 NVIDIA Metropolis。最新的 Isaac 版本包括對機器人操作系統(tǒng)(ROS)開發(fā)人員社區(qū)的重要支持。

NVIDIA 還發(fā)布了用于 Isaac Sim 的全新 NVIDIA Omniverse Replicator,用于為機器人生成合成訓練數(shù)據(jù)。這些硬件加速軟件包使 ROS 開發(fā)者更容易在 Jetson 平臺上構建高性能 AI 機器人。

NVIDIA Jetson AGX Orin 模塊和開發(fā)者工具包將于 2022 年第一季度上市。

黃仁勛還在演講中談道:“到 2024 年,絕大多數(shù)新款電動汽車將具備強大的自動駕駛能力。”

他展示了一個新自動駕駛平臺 DRIVE Hyperion 8 GA,這是 2024 年模型的架構。其傳感器套件包含 12 個攝像頭、9 個毫米波雷達、12 個超聲波雷達和 1 個前向激光雷達,所有這些都由 2 顆 NVIDIA DRIVE Orin 芯片來進行處理。

據(jù)他透露,目前,英偉達已經(jīng)在全球各地收集到了 PB 級的道路數(shù)據(jù),并擁有大約 3000 名訓練有素的標記員,創(chuàng)建訓練數(shù)據(jù)。盡管如此,合成數(shù)據(jù)仍是 NVIDIA 數(shù)據(jù)策略的基石。

NeMo Megatron:讓企業(yè)開發(fā)自己的大模型

為了方便企業(yè)開發(fā)部署大型語言模型,NVIDIA 推出了為訓練具有數(shù)萬億參數(shù)的語言模型而優(yōu)化的加速框架 NeMo Megatron。

NVIDIA NeMo Megatron 是 Megatron 的基礎上發(fā)展起來的。Megatron 是由 NVIDIA 研究人員主導的開源項目,研究大型 Transformer 語言模型的高效訓練。Megatron 530B 是全球最大的可定制語言模型。

利用先進的數(shù)據(jù)、張量和管道并行化技術,它能使大型語言模型的訓練有效地分布在成千上萬的 GPU 上。

企業(yè)可以通過 NeMo Megatron 框架,進一步訓練它以服務新的領域和語言。經(jīng)優(yōu)化,該框架可以在 NVIDIA DGX SuperPOD 的大規(guī)模加速計算基礎設施上進行擴展。

除了 NeMo Megatron 外,NVIDIA 還推出了一個開發(fā) Physics-ML 模型的框架 NVIDIA Modulus。

它使用物理原理及源自原理型物理和觀測結果的數(shù)據(jù)訓練 Physics-ML 模型,支持多 GPU 多節(jié)點訓練,由此生成的模型,其物理仿真速度比模擬快 1000-100,000 倍。

科學家可借助 Modulus 創(chuàng)建數(shù)字孿生模型,來解決預測氣候變化等重要科學問題。

例如研究人員利用歐洲中期天氣預報中心的 ERA5 大氣數(shù)據(jù)訓練 Physics-ML 模型,該模型在 128 個 A100 GPU 上訓練需要 4 小時,訓練后的模型能以 30 公里的空間分辨率預測颶風嚴重程度和路徑。

原本需要 7 天才能完成的預測,現(xiàn)在在一個 GPU 上只需 0.25 秒,比模擬快了 10 萬倍。

為了幫助企業(yè)加快 AI 之旅,NVIDIA 宣布在全球范圍內擴展其 LaunchPad 計劃,它允許用戶即時訪問在加速基礎設施上運行的 NVIDIA AI 軟件。企業(yè)可使用 NVIDIA LaunchPad 免費體驗開發(fā)和部署大型語言模型。

LaunchPad 計劃由 Equinix 服務支持,包括數(shù)據(jù)中心、連接和裸金屬產(chǎn)品,獲得 LaunchPad 體驗后,企業(yè)可以在全球 Equinix 地點運行其 NVIDIA 加速的人工智能工作負載。

Riva 定制語音:快速創(chuàng)建定制版品牌聲音

NVIDIA 的 Riva 語音 AI 軟件同樣有了新進展,黃仁勛宣布了該軟件一個新功能 ——Riva 定制語音。

Riva 可識別英語、西班牙語、德語、法語、日語、普通話和俄語等 7 種語言,可以生成隱藏字幕、翻譯、摘要、回答問題并理解意圖。

只需訓練 30 分鐘的音頻數(shù)據(jù),企業(yè)即可構建屬于自己品牌大使的聲音,獲得類似人類的表現(xiàn)力。

也就是說,用戶根據(jù)特定的領域或行業(yè)術語,可以量身定制擁有獨特聲音的虛擬助理。

不到三年間,NVIDIA 的對話 AI 軟件已被下載超過 25 萬次,并被廣泛采用到各個行業(yè)。

對于小規(guī)模研發(fā),NVIDIA NGC 容器注冊表免費提供 NVIDIA Riva,開發(fā)者可加入 Riva 開放測試版程序來試用該軟件。

對于擁有大規(guī)模部署并尋求 NVIDIA 專家技術支持的客戶,NVIDIA 宣布了 NVIDIA Riva Enterprise 計劃,該計劃預計將于明年初推出。

Omniverse Avatar:構建生動的智能虛擬化身

虛擬助手的下一步,是擁有常識、推理能力和生動的視覺形象。

在 GTC 大會上,黃仁勛宣布推出一個全方位的虛擬化身平臺 ——Omniverse Avatar。

它是 NVIDIA 一系列先進 AI 技術的集大成者,將 Metropolis 的感知能力、Riva 的語音識別能力、Merlin 的推薦能力、Omniverse 的動畫渲染能力等交匯于一體。

這使得開發(fā)者能構建出一個完全交互式的虛擬化身,它足夠生動,能對語音和面部提示做出反應,能理解多種語言,能給出智能的建議。

黃仁勛展示了一些例子。

比如,其玩偶復制品可以跟人對答如流。

Metropolis 工程師用 Maxine 創(chuàng)建了 Tokkio 智能操作臺應用程序,讓操作臺具有高度交互性,可快速做出對話響應。

在餐廳,兩名顧客點餐時,一個客戶服務虛擬化身可以跟他們交談和理解他們的需求。

這些演示由 NVIDIA AI 軟件和 Megatron 530B 提供支持,Megatron 530B 是目前世界上最大的可定制語言模型。

在 DRIVE Concierge AI 平臺的演示中,中央儀表板屏幕上的數(shù)字助理,可幫助司機選擇最佳駕駛模式,使其按時到達目的地,然后在汽車續(xù)航里程下降到 100 英里以下時,按他的請求設置提醒。

Maxine 項目更強調多種語言的實時翻譯和轉錄。

借助 Maxine,這個人的話不僅被轉錄,還能以相同的聲音和語調被實時轉換成德語、法語等多種語言。

Maxine 使用計算機視覺來追蹤人的面部,并識別其表情,3D 動畫可為其制作虛擬而逼真的頭像。

可以想象,在企業(yè)和開發(fā)人員中,每個行業(yè)都需要某種形式的虛擬化身。

使用 Omniverse Avatar 平臺,你可以為視頻會議和協(xié)作平臺、客戶支持平臺、內容創(chuàng)建、應用收益和數(shù)字孿生、機器人應用等等構建定制的 AI 助理。

NVIDIA 的虛擬世界模擬 Omniverse 是打造虛擬世界的關鍵平臺。從機器人、自動駕駛車隊、倉庫、工業(yè)廠房到整個城市,都能在 Omniverse 數(shù)字孿生中完成創(chuàng)建、訓練和運行。

黃仁勛說,Omniverse 面向數(shù)據(jù)中心規(guī)模設計,有朝一日有望能達到全球數(shù)據(jù)規(guī)模。

愛立信正構建整個城市的數(shù)字孿生環(huán)境,幫助確定如何放置和配置每個站點以獲得最佳覆蓋范圍和網(wǎng)絡性能,可對整個 5G 網(wǎng)絡執(zhí)行逼真遠程仿真。

AI 推理:Triton 推理,服務器助力實時大模型推理

目前微軟、三星、Snap 等 25000 多家客戶都在使用 NVIDIA 的 AI 推理平臺。

今日,NVIDIA 推出多節(jié)點分布式推理功能的 NVIDIA Triton 推理服務器,以及 NVIDIA A2 Tensor Core GPU 加速器。

NVIDIA A2 GPU 是一個入門級、低功耗的緊湊型加速器,適用于邊緣服務器中的推理和邊緣 AI,推理性能比 CPU 高出 20 倍。

NVIDIA AI 推理平臺此次更新包括開源 NVIDIA Triton 推理服務器軟件的新功能,和對 NVIDIA TensorRT 的更新。

最新 NVIDIA Triton 推理服務器中的多 GPU、多節(jié)點特性,使大型語言模型推理工作負載能夠實時在多個 GPU 和節(jié)點上擴展。

借助 Triton 推理服務器,Megatron 530B 能在兩個 NVIDIA DGX 系統(tǒng)上運行,將處理時間從 CPU 服務器上的 1 分鐘以上縮短到 0.5 秒,令實時部署部署大型語言模型成為可能。

在軟件優(yōu)化上,Triton 推理服務器的模型分析器,新工具可以自動化地從數(shù)百種組合中為 AI 模型選擇最佳配置,以實現(xiàn)最優(yōu)性能,同時確保應用程序所需的服務質量。

RAPIDS FIL 是針對隨機森林和梯度提升決策樹模型 GPU 或 CPU 推理的新后端,為開發(fā)者使用 Triton 進行深度學習和傳統(tǒng)機器學習提供了一個統(tǒng)一的部署引擎。

Triton 與 AWS、阿里云等平臺集成,并支持在各代 GPU、x86 CPU 和 Arm CPU 上優(yōu)化 AI 推理工作負載。NVIDIA AI Enterprise 也集成了 Triton。

NVIDIA AI Enterprise 是一款經(jīng) NVIDIA 優(yōu)化、認證和支持的用于開發(fā)和部署 AI 的端到端軟件套件,客戶可利用它在本地數(shù)據(jù)中心和私有云的主流服務器上運行 AI 工作負載。

NVIDIA 旗艦 TensorRT 推理引擎亦進行了更新,已原生集成到 TensorFlow 和 PyTorch 中,只需 1 行代碼,就能提供比框架內推理快 3 倍的性能。

NVIDIA TensorRT 8.2 是 SDK 的最新版本,可實時運行數(shù)十億個參數(shù)的語言模型。

NVIDIA 還宣布微軟會議軟件 Teams 采用 NVIDIA AI 和 Azure 認知服務。

微軟 Azure 認知服務為高品質 AI 模型提供基于云的 API,以創(chuàng)建智能應用程序。他們在用 Triton 運行語音轉文本模型,為微軟 Teams 用戶提供準確的實時字幕和轉錄。

微軟 Teams 每月有近 2.5 億活躍用戶,微軟 Azure 認知服務上的 NVIDIA GPU 和 Triton 推理服務器使用 28 種語言和方言,結合 AI 模型幫助提升實時字幕和轉錄功能的成本效益。

Mavenir 宣布由 NVIDIA Metropolis AI-on-5G 平臺提供支持的 MAVedge-AI 智能視頻分析,以加速企業(yè)人工智能,該方案預計 2022 年初提供給客戶。

數(shù)據(jù)中心:全新網(wǎng)絡安全功能

面向數(shù)據(jù)中心,黃仁勛宣布推出 BlueField DOCA 1.2 來支持全新網(wǎng)絡安全功能,希望使 BlueField 成為業(yè)界構建零信任安全平臺的理想之選。

目前有 1400 名開發(fā)者正在 BlueField 上進行開發(fā),現(xiàn)在采用 BlueField 的網(wǎng)絡安全公司已可提供零信任安全即服務。

NVIDIA 還發(fā)明了一個深度學習網(wǎng)絡安全平臺 Morpheus 來監(jiān)控分析網(wǎng)絡行為。

它構建于 NVIDIA RAPIDS 和 NVIDIA AI 之上,其工作流會為每種應用和用戶的組合創(chuàng)建 AI 模型和數(shù)字指紋,并學習其日常的模式和尋找異常操作。這些異常操作將觸發(fā)安全警告,并提醒分析員作出響應。

Bluefield、DOCA 和 Morpheus 都是數(shù)據(jù)中心的全堆棧加速 AI 解決方案的一部分。NVIDIA 將為其網(wǎng)絡安全合作伙伴提供一個零信任的安全平臺,從而提高安全性和應用程序性能。

Bluefield 坐在網(wǎng)絡上,向 Morpheus AI 平臺提供數(shù)據(jù)中心發(fā)生的所有活動。Morpheus 是一個深度學習網(wǎng)絡安全平臺,可以監(jiān)控和分析來自每個用戶、機器和服務的所有信息。

NVIDIA 今日也宣布了 Morpheus 早期訪問 2 版本。

Morpheus 創(chuàng)建了預訓練的用戶活動指紋模型。當這些指紋發(fā)生變化時,它能夠實時識別出異常交易正在發(fā)生,創(chuàng)建一個可疑行為正在發(fā)生的安全警報,并隔離活動和加以提醒。

醫(yī)療健康:合作癌癥中心,推新機器人平臺

在醫(yī)療健康領域,NVIDIA 宣布與多家先進癌癥中心合作,將 AI 的力量帶到癌癥治療。這些癌癥中心將采用 NVIDIA DGX 來加速開發(fā) AI 模型。

許多醫(yī)療設備公司正在將 AI 和機器人技術融入其中,在機器人手術、移動 CT 掃描、支氣管鏡檢中使用 NVIDIA 加速計算平臺。

為加速 AI 醫(yī)療設備的應用,NVIDIA 推出一個面向醫(yī)療健康行業(yè)的新計算平臺 NVIDIA Clara Holoscan。

Holoscan 是繼 Isaac 和 Drive 后,NVIDIA 的第三個機器人平臺,能為可擴展、軟件定義、端到端流媒體數(shù)據(jù)處理的醫(yī)療設備提供所需的計算基礎設施。

該平臺集成了 NVIDIA AGX Orin 和 ConnectX-7,F(xiàn)P32 算力達 5.2TFLOPS,AI 算力達 250TOPS,740Gbps 高速 IO 用于連接傳感器。

添加 RTX A6000 Ampere GPU 后,可獲得另外 39TFLOPS(FP32)和超過 600TOPS 的 AI 推理性能。

Clara Holoscan 是一個醫(yī)療設備與邊緣服務器無縫連接的端到端平臺,能助力開發(fā)者創(chuàng)建 AI 微服務,用以在設備上運行低延遲串流應用,同時將更復雜的任務傳至數(shù)據(jù)中心資源。

借助 Clara Holoscan,開發(fā)者可以自定義應用,按需在其醫(yī)療設備中充分添加或減少計算和輸入/輸出功能,從而平衡延遲、成本、空間、性能和帶寬的需求。

Clara Holoscan SDK 通過加速庫、AI 模型和超聲波、數(shù)字病理學、內窺鏡檢查等參考應用支持此項工作,以幫助開發(fā)者利用嵌入式和可擴展的混合云計算。

在藥物發(fā)現(xiàn)方面,加拿大 AI 制藥創(chuàng)企 Entos 發(fā)明了一種深度學習架構 OrbNet,用物理機器學習方法訓練圖神經(jīng)網(wǎng)絡,取代分子模擬中昂貴的原子間作用力,將分子模擬速度提高 1000 倍。

Quantum-2:史上最先進端到端網(wǎng)絡平臺

此次 GTC 期間,NVIDIA 還宣布了下一代 NVIDIA Quantum-2 平臺,可進行云原生超級計算。

該網(wǎng)絡平臺由 NVIDIA Quantum-2 交換機、ConnectX-7 網(wǎng)絡適配器、BlueField-3 數(shù)據(jù)處理單元(DPU)和支持新架構的所有軟件組成。ConnectX-7 將于明年 1 月問世。

其中,Quantum-2 InfiniBand 交換機基于新的 Quantum-2 ASIC,采用臺積電 7N 節(jié)點,包含 570 個晶體管,超過有 540 億晶體管的 A100。

Quantum-2 InfiniBand 擁有 400Gbps,網(wǎng)絡速度翻倍,交換機吞吐量增加了 2 倍,集群可擴展性增為原來的 6.5 倍,同時降低了數(shù)據(jù)中心的功耗。

其多租戶性能隔離利用先進的基于遙測的擁塞控制系統(tǒng),確??煽康耐掏铝?,無論用戶激增或工作量需求激增,都能確??煽康耐掏铝?,從而防止一個租戶的活動干擾其他租戶的活動。

相比上一代,第三代 SHARPv3TM 網(wǎng)絡計算技術的交換機計算能力比原來高 32 倍,用于加速 AI 訓練。

新加速庫:優(yōu)化路線規(guī)劃,加速量子模擬

最后,我們來看看 NVIDIA 推出的 3 個新加速庫。

首先是 NVIDIA ReOpt,這是一款針對運籌優(yōu)化問題的加速求解器,可實現(xiàn)實時路線規(guī)劃優(yōu)化。

以與 NVIDIA 合作的達美樂披薩為例,配送 14 個披薩的路徑有 870 億種,這意味達美樂要在 30 分鐘內將披薩送達絕非易事。

運籌優(yōu)化對“最后一英里”配送是必需的,路線規(guī)劃是個極為棘手的物流問題,如果應用到行業(yè)中,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元。

黃仁勛展示了一個用 NVIDIA Omniverse 虛擬倉庫來展示優(yōu)化路線在自動訂單揀選場景中的影響,優(yōu)化后的規(guī)劃能使訂單揀選節(jié)省一半的時間和路程。

當前路線優(yōu)化求解器收到新訂單后,需要數(shù)小時來重新運行和響應,而 ReOpt 能持續(xù)運行并實時動態(tài)地進行重新優(yōu)化,在短短幾秒鐘內響應并擴展至數(shù)千個位置。

第二個是 cuQuantum DGX 設備,配備有針對量子計算工作流的加速庫,可用態(tài)矢量和張量網(wǎng)絡的方法來加速量子電路模擬。

谷歌 Cirq 將成第一個得到加速的量子模擬器。

借助該設備,曾經(jīng)需要耗費幾個月的模擬,現(xiàn)在幾天就能完成。

NVIDIA 研究部門在量子算法模擬方面取得了重要里程碑,用 1688 個量子位為 3375 個頂點集求解 MaxCut 問題。

這是有史以來最大的精確量子電路模擬,比以往模擬的量子位多 8 倍。

cuQuantum DGX 設備將在第一季度推出。

第三個加速庫是在 PyData 和 NumPy 生態(tài)系統(tǒng)的大規(guī)模加速計算 cuNumeric,它允許用戶用 Python 代碼在超級計算機上透明加速和擴展 NumPy 工作流,并無需更改代碼。

它屬于 NVIDIA RAPIDS 開源 Python 數(shù)據(jù)科學套件,RAPIDS 今年的下載量超過 50 萬次,比去年增長了 4 倍多。NumPy 在過去 5 年下載量達到了 1.22 億次,別用于 GitHub 上近 80 萬個項目。

在著名的 CFD Python 教學代碼中,cuNumeric 能擴展至 1000 個 GPU,而擴展效率僅比線性擴展效率損失了 20%。

結語

乘著 AI、高性能計算和元宇宙的東風,NVIDIA 今年過得可謂風生水起,市值一路扶搖直上,突破 7700 億美元。其 Omniverse 平臺更是被分析機構視作 NVIDIA 一項重要的平臺擴張戰(zhàn)略。

在這表面風光的背后,NVIDIA 的遠見和前瞻性不容小覷。無論是如火如荼的 AI,還是方興未艾的虛擬世界,NVIDIA 能成為科技熱潮的直接受益者,都離不開過去多年對其軟硬件產(chǎn)品的打磨。

此次 NVIDIA GTC 大會期間,我們還將看到更多覆蓋深度學習、數(shù)據(jù)科學、高性能計算、機器人等領域的最新進展,而始于 NVIDIA CUDA 的加速計算正在這些領域催化效率提升,推動現(xiàn)代科技快速進化、走向未來。

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知