NVIDIA今日宣布推出 NVIDIA® Spectrum-XGS 以太網(wǎng)。這項跨區(qū)域擴展(scale-across)技術(shù)可將多個分布式數(shù)據(jù)中心組合成一個十億瓦級 AI 超級工廠。
隨著AI需求的激增,單個設(shè)施內(nèi)的數(shù)據(jù)中心功率和容量已達(dá)到極限。為了實現(xiàn)數(shù)據(jù)中心的擴展,必須打破建筑物的限制,而現(xiàn)有的商用以太網(wǎng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施因高延遲、高抖動及性能的不可預(yù)測而無法滿足需求。
Spectrum-XGS 以太網(wǎng)是 NVIDIA Spectrum-X? 以太網(wǎng)平臺新增的一項突破性產(chǎn)品,它通過引入跨區(qū)域擴展(scale-across)基礎(chǔ)設(shè)施打破了上述限制??鐓^(qū)域擴展(scale-across)成為了繼縱向擴展(scale-up)和橫向擴展(scale-out)之后的 AI 計算“第三大支柱”,能夠?qū)?Spectrum-X 以太網(wǎng)的極致性能和規(guī)模擴展至多個分布式數(shù)據(jù)中心,將它們組成具有十億瓦級的智能巨型 AI 超級工廠。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI 工業(yè)革命已經(jīng)到來,而巨型 AI 工廠是這場變革的核心基礎(chǔ)設(shè)施。繼縱向擴展(scale-up)和橫向擴展(scale-out)技術(shù)后,我們又通過推出 NVIDIA Spectrum-XGS 以太網(wǎng)提供跨區(qū)域擴展(scale-across)技術(shù),將不同城市、國家乃至大洲的數(shù)據(jù)中心組合成龐大的十億瓦級的 AI 超級工廠?!?/span>
Spectrum-XGS 以太網(wǎng)完全集成于 Spectrum-X 平臺,通過算法實現(xiàn)了網(wǎng)絡(luò)和數(shù)據(jù)中心設(shè)施間距離動態(tài)適配。
憑借先進(jìn)的、自動調(diào)節(jié)的遠(yuǎn)距離擁塞控制、精準(zhǔn)延遲管理及端到端遙測技術(shù),Spectrum-XGS 以太網(wǎng)將 NVIDIA 集合通信庫性能提升了近一倍,加速了多 GPU 和多節(jié)點的通信性能,實現(xiàn)了可預(yù)測異地 AI 集群的性能。這樣就可以將多個數(shù)據(jù)中心組合成一個統(tǒng)一的 AI 超級工廠運行,全面優(yōu)化了長距離連接性能。
領(lǐng)先的超大規(guī)模云提供商已開始部署這種新基礎(chǔ)設(shè)施,其中包括 CoreWeave。該公司將成為首批使用 Spectrum-XGS 以太網(wǎng)連接它的數(shù)據(jù)中心的企業(yè)。
CoreWeave 聯(lián)合創(chuàng)始人兼首席技術(shù)官 Peter Salanki 表示:“CoreWeave 的使命是為全球創(chuàng)新者提供性能卓越的 AI 基礎(chǔ)設(shè)施。通過 NVIDIA Spectrum-XGS,我們可將多個數(shù)據(jù)中心組合成一臺統(tǒng)一的超級計算機,為客戶提供十億瓦級 AI 系統(tǒng),這將推動各個行業(yè)的突破?!?
Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺為多租戶、超大規(guī)模 AI 工廠(包括全球最大的 AI 超級計算機)提供的帶寬密度較傳統(tǒng)以太網(wǎng)高出 1.6 倍。該平臺由 NVIDIA Spectrum-X 交換機和 NVIDIA ConnectX-8® SuperNIC 組成,幫助構(gòu)建未來 AI 平臺的企業(yè)實現(xiàn)無縫擴展、超低延遲和空前性能。
今日的發(fā)布是 NVIDIA 一系列網(wǎng)絡(luò)創(chuàng)新技術(shù)發(fā)布的延續(xù),如 NVIDIA Spectrum-X 和 NVIDIA Quantum-X CPO 網(wǎng)絡(luò)交換機等,這些技術(shù)一起能夠?qū)⑽挥诓煌攸c的數(shù)百萬顆 GPU 組合成 AI 工廠,同時降低能耗和運營成本。
供貨情況
NVIDIA Spectrum-XGS 以太網(wǎng)現(xiàn)是 NVIDIA Spectrum-X 以太網(wǎng)平臺的一部分,現(xiàn)已可以供貨。