NVIDIA推出DGX H100系統 領跑企業級AI基礎設施
NVIDIA今日宣布推出第四代NVIDIA DGX系統,這是全球首個基于全新NVIDIA H100 Tensor Core GPU的AI平臺。
NVIDIA DGX H100 Systems
DGX H100系統能夠滿足大型語言模型、推薦系統、醫療健康研究和氣候科學的大規模計算需求。每個DGX H100系統配備八塊NVIDIA H100 GPU,并由 NVIDIA NVLink連接,能夠在新的FP8精度下達到32 Petaflop的AI性能,比上一代系統性能高6倍。
DGX H100系統是新一代NVIDIA DGX POD和NVIDIA DGX SuperPOD AI基礎設施平臺的構建模塊。新的DGX SuperPOD架構采用了一個全新的NVIDIA NVLink Switch系統,通過這一系統最多可連接32個節點,總計256塊H100 GPU。
新一代DGX SuperPOD提供1 Exaflops的FP8 AI性能,比上一代產品性能高6倍,能夠運行具有數萬億參數的龐大LLM工作負載,從而推動AI的前沿發展。
NVIDIA創始人兼首席執行官黃仁勛表示:“AI已經從根本上改變了軟件的功能和產出方式。利用AI來革新自身所處行業的公司也意識到了自身AI基礎設施的重要性。NVIDIA全新DGX H100系統將賦能企業AI工廠,助力其從數據中提煉出我們最具價值的資源,即‘智能’。"
全球運行速度最快的AI超級計算機——NVIDIA Eos
NVIDIA將率先使用突破性的新型AI架構來構建DGX SuperPOD,賦能NVIDIA研究人員的研究工作,推動氣候科學、數字生物學和AI未來的發展。
“Eos”超級計算機將于今年晚些時候開始運行,共配備576臺DGX H100系統,共計 4608塊DGX H100 GPU,有望成為全球運行速度最快的AI系統。
NVIDIA Eos預計將提供18.4 Exaflops的AI計算性能,比日本的Fugaku超級計算機快4倍,后者是目前運行速度最快的系統。在傳統的科學計算方面,Eos預計將提供275 Petaflop 的性能。
對于NVIDIA及其OEM和云計算合作伙伴,Eos將成為其先進AI基礎設施的藍圖。
借助DGX H100系統、DGX POD和DGX SuperPOD,輕松擴展企業級AI
在企業從初始項目發展到廣泛部署的過程中,DGX H100系統能夠實現輕松擴展,滿足企業的AI需求。
除了八塊H100 GPU以及總計6400億個晶體管之外,每個DGX H100系統還包含兩個NVIDIA BlueField-3 DPU,以用于卸載、加速和隔離高級網絡、存儲及安全服務。
八個NVIDIA ConnectX-7 Quantum-2 InfiniBand網卡能夠提供400 GB/s的吞吐量,可用于連接計算和存儲,這一速度比上一代系統提升了一倍。第四代NVLink與NVSwitch相結合,能夠在每個DGX H100系統中的各個GPU之間實現900 GB/s的連接速度,是上一代系統的1.5倍。
DGX H100系統使用雙x86 CPU,能夠與NVIDIA網絡和NVIDIA合作伙伴提供的存儲設備相結合,使DGX POD能夠靈活用于各種規模的AI計算。
借助 DGX H100 系統,DGX SuperPOD可成為具有可擴展性的卓越的企業級AI中心。DGX SuperPOD中的DGX H100節點和H100 GPU由NVLink Switch系統和NVIDIA Quantum-2 InfiniBand連接,帶寬速度可達70 TB/s,比上一代產品高11倍。NVIDIA合作伙伴提供的存儲設備將經過測試和認證,以滿足DGX SuperPOD AI計算的需求。
多個DGX SuperPOD單元可組合使用,為汽車、醫療健康、制造、通信、零售等行業提供開發大型模型所需的AI性能。
NVIDIA DGX Foundry托管的開發解決方案正在全球擴展,使DGX SuperPOD客戶能夠在他們的系統安裝期間,立即獲取先進的計算基礎設施。北美、歐洲和亞洲的新增地點支持遠程訪問DGX SuperPOD(或其中部分)。
DGX Foundry中包含NVIDIA Base Command軟件,后者能夠使客戶基于DGX SuperPOD基礎設施,輕松管理端到端AI開發生命周期。
通過在全球各地的Equinix IBX(International Business Exchange)數據中心托管的NVIDIA LaunchPad實驗室,符合資格的企業可以免費體驗NVIDIA Base Command和DGX系統。
企業級AI軟件MLOps助力客戶提高AI采用率
為支持正在進行AI開發的DGX客戶,NVIDIA DGX-Ready軟件合作伙伴(包括Domino Data Lab、Run:ai和Weights&Biases等)提供的MLOps解決方案將加入“NVIDIA AI加速”計劃。
參與活動的合作伙伴提供的MLOps應用程序將經過驗證,為DGX客戶提供企業級工作流以及集群管理、調度與編排解決方案。
此外,NVIDIA DGX系統現在包含NVIDIA AI Enterprise軟件套件,該套件新增了對裸金屬基礎設施的支持。DGX客戶可使用軟件套件中包含的預訓練NVIDIA AI平臺模型、工具包和框架(例如NVIDIA RAPIDS、NVIDIA TAO工具套件、NVIDIA Triton推理服務器等)來加快工作速度。
DGX-Ready托管服務計劃能夠簡化AI部署
隨著企業AI采用率不斷提高,客戶正在尋求更多選擇,以便添加實現業務轉型所需的基礎設施。NVIDIA推出新的DGX-Ready托管服務計劃,能夠為希望與服務提供商開展合作來監督其基礎設施的客戶提供支持。
德勤是率先與NVIDIA合作開展此計劃的全球提供商,并將經過認證,可與區域供應商(CGit、ePlus、Insight Enterprises和PTC System)一起,為歐洲、北美和亞洲的客戶提供支持。
德勤咨詢首席合伙人兼AI與數據運營服務負責人Jim Rowan表示:“只有企業能夠將技術集成到運營中時,AI才可能助推業務實現突破。借助新的DGX-Ready托管服務計劃,客戶可以輕松采用先進的AI技術以及由德勤全球專家管理的NVIDIA DGX系統和軟件。”
DGX-Ready生命周期管理計劃助力實現輕松升級
現在,客戶可以通過新的DGX-Ready生命周期管理計劃,借助新的NVIDIA DGX平臺升級其現有DGX系統。
參加DGX-Ready生命周期管理計劃的NVIDIA渠道合作伙伴將可以更新上一代DGX系統,以供新客戶進行購買,并擴展用于AI基礎設施的全球通用系統的獲取途徑。
供貨信息
從第三季度起,NVIDIA的全球合作伙伴將開始供應NVIDIA DGX H100系統、DGX POD 和DGX SuperPOD。
客戶還可以選擇在由Cyxtera、Digital Realty和Equinix IBX數據中心等NVIDIA DGX-Ready數據中心合作伙伴運營的托管設施中部署DGX系統。
七彩虹iGame GeForce RTX 3060 Ti Ultra W OC LHR
進入購買
微星(MSI)萬圖師 GeForce RTX 3060 Ti VENTUS 3X 8G OC LHR 超頻版 三風扇 次旗艦 電競游戲設計電腦顯卡
進入購買
麗臺Quadro P1000
進入購買
2022-03-23 10:57:46
2022-03-23 09:39:01
2022-03-23 09:35:07
2022-03-23 09:32:46
2022-03-23 09:32:28
2022-03-23 09:32:11
2022-03-23 09:31:19
2022-03-23 09:31:00
2022-03-23 09:26:20
2022-03-23 09:02:47
2022-03-23 08:49:06
2022-03-23 08:37:00
2022-03-23 08:20:11
相關新聞