用戶名: 密碼: 驗(yàn)證碼:

報(bào)告解讀 | 光I/O+OCS引領(lǐng)智算中心Scale-Up網(wǎng)絡(luò)架構(gòu)新變革

摘要:凌云光光纖器件與儀器事業(yè)部CTO 張華博士于OptiNet China 2025“智算中心光網(wǎng)絡(luò)論壇”發(fā)表《面向智算中心Scale-Up網(wǎng)絡(luò)光互聯(lián)探討》專題報(bào)告,深度解析光I/O與OCS協(xié)同構(gòu)建可重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò)(RDCN)的關(guān)鍵趨勢(shì)與技術(shù)方案,并分享了基于DBS技術(shù)的高可靠性O(shè)CS方案的最新進(jìn)展。

  ICC訊 在AI大模型加速演進(jìn)的時(shí)代,智算中心光互聯(lián)正經(jīng)歷從“橫向擴(kuò)展”(Scale-Out)向“縱向擴(kuò)展”(Scale-Up)拓展的大變革。面對(duì)日益嚴(yán)苛的帶寬、功耗與時(shí)延等挑戰(zhàn),6月5日,凌云光光纖器件與儀器事業(yè)部CTO 張華博士于OptiNet China 2025“智算中心光網(wǎng)絡(luò)論壇”發(fā)表《面向智算中心Scale-Up網(wǎng)絡(luò)光互聯(lián)探討》專題報(bào)告,深度解析光I/O與OCS協(xié)同構(gòu)建可重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò)(RDCN)的關(guān)鍵趨勢(shì)與技術(shù)方案,并分享了基于DBS技術(shù)的高可靠性O(shè)CS方案的最新進(jìn)展。

  AI時(shí)代光互聯(lián)需求瓶頸,“四重挑戰(zhàn)”呼喚架構(gòu)革新

  隨著大模型參數(shù)規(guī)模呈指數(shù)級(jí)增長(zhǎng),智算中心正面臨前所未有的網(wǎng)絡(luò)瓶頸。張華博士指出,以ChatGPT為例,其參數(shù)量預(yù)計(jì)達(dá)到17萬(wàn)億。與此同時(shí),GPU算力每?jī)赡暝鲩L(zhǎng)約3.3倍,而網(wǎng)絡(luò)互聯(lián)與存儲(chǔ)帶寬的增幅僅為1.4倍,形成明顯“剪刀差”。這一不平衡的發(fā)展使得網(wǎng)絡(luò)架構(gòu)正成為AI算力釋放的關(guān)鍵制約因素,也預(yù)示著未來(lái)在底層互聯(lián)技術(shù)上存在巨大的優(yōu)化空間,而智算中心網(wǎng)絡(luò)正面臨著“兩高兩低”的核心挑戰(zhàn):① 高帶寬:大模型訓(xùn)練涉及大量GPU間的數(shù)據(jù)交互和周期性存儲(chǔ),單卡互聯(lián)帶寬需求可達(dá)14.4Tbps。② 高可靠:訓(xùn)練周期通常以周甚至月為單位,網(wǎng)絡(luò)系統(tǒng)需保持持續(xù)穩(wěn)定運(yùn)行,任何中斷都可能導(dǎo)致訓(xùn)練失敗或算力資源浪費(fèi)。③ 低功耗:光模塊功耗占設(shè)備整體功耗已高達(dá)1/3,隨著接口速率與數(shù)量增長(zhǎng),控制互聯(lián)系統(tǒng)能耗成為系統(tǒng)設(shè)計(jì)的重要挑戰(zhàn)。④ 低時(shí)延:多GPU協(xié)同計(jì)算對(duì)時(shí)延極為敏感,任何微小延遲都會(huì)引發(fā)等待與算力浪費(fèi)。研究顯示,每增加10μs時(shí)延,GPU利用率將下降1%至3%。

  從實(shí)際應(yīng)用層級(jí)看,當(dāng)前光互聯(lián)技術(shù)主要可分為三類核心場(chǎng)景:短距互聯(lián):應(yīng)用于數(shù)據(jù)中心內(nèi)部的Scale-Out與Scale-Up架構(gòu)之間,如光I/O、CPO、800G/1.6T可插拔模塊、LRO等。中長(zhǎng)距互聯(lián):如數(shù)據(jù)中心之間的DCI互聯(lián),采用ZR/ZR+等相干光模塊。超長(zhǎng)距傳輸:如跨區(qū)域骨干網(wǎng)及海底光纜系統(tǒng),保障全球算力網(wǎng)絡(luò)的高效協(xié)同。

  面對(duì)上述挑戰(zhàn),傳統(tǒng)以銅纜電互聯(lián)和電交換架構(gòu)為主的短距互聯(lián)也已逐漸力不從心,智算中心光互聯(lián)正在呈現(xiàn)Scale-Out與Scale-Up雙向發(fā)展的架構(gòu)趨勢(shì),光互聯(lián)正成為突破算力互聯(lián)瓶頸、構(gòu)建高效智算中心網(wǎng)絡(luò)的關(guān)鍵路徑。光互聯(lián)從Scale-Out向Scale-Up拓展打造智算中心“超級(jí)節(jié)點(diǎn)”

  當(dāng)前主流智算中心多采用Scale-Out架構(gòu),通過(guò)網(wǎng)卡與交換機(jī)連接多個(gè)計(jì)算節(jié)點(diǎn),適用于數(shù)據(jù)并行/流水線并行的相對(duì)低帶寬和時(shí)延不敏感的集合通信。但隨著訓(xùn)練/推理任務(wù)規(guī)模擴(kuò)大,張量并行和專家并行這些對(duì)高帶寬和低時(shí)延要求更高的集合通信,只有Scale-Up網(wǎng)絡(luò)能夠滿足,但要求Scale-Up網(wǎng)絡(luò)規(guī)模從8卡向百卡乃至千卡擴(kuò)展,電互聯(lián)架構(gòu)已嚴(yán)重制約卡間協(xié)同效率,日益成為性能瓶頸。

  張華博士指出,Scale-Up架構(gòu)強(qiáng)調(diào)在物理層面將多塊GPU/XPU進(jìn)行高密度直連,更好地匹配大模型對(duì)強(qiáng)耦合計(jì)算的需求。在此趨勢(shì)下,光I/O技術(shù)的引入突破了傳統(tǒng)電互聯(lián)在帶寬、時(shí)延與傳輸距離方面的限制,成為支撐Scale-Up架構(gòu)的關(guān)鍵技術(shù)。相比銅纜,光I/O具備更大的帶寬密度和更低的能耗,很容易實(shí)現(xiàn)跨機(jī)柜的GPU穩(wěn)定互聯(lián)。具體來(lái)看,光I/O賦能的Scale-Up網(wǎng)絡(luò)有以下顯著優(yōu)勢(shì):超大規(guī)模:GPU卡間傳輸距離可達(dá)上百米,支持Scale-Up網(wǎng)絡(luò)擴(kuò)展至百卡乃至千卡級(jí)超節(jié)點(diǎn)。超高帶寬:?jiǎn)蜧PU節(jié)點(diǎn)可實(shí)現(xiàn)高達(dá)256Tbps的雙向互聯(lián)帶寬,是傳統(tǒng)電互聯(lián)架構(gòu)的數(shù)十倍。超低時(shí)延:端到端傳輸時(shí)延可壓縮至百納秒級(jí),顯著提升GPU協(xié)同計(jì)算效率。

  此外,OCS(全光交換)技術(shù)的引入,為Scale-Up架構(gòu)提供了物理層的拓?fù)渲貥?gòu)能力。通過(guò)光層級(jí)聯(lián)、動(dòng)態(tài)切換與信號(hào)透明傳輸,OCS與光I/O的協(xié)同組合構(gòu)建出可重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò)(RDCN),為未來(lái)AI集群提供更高性能、更低能耗與更強(qiáng)彈性的新一代互聯(lián)底座。光I/O技術(shù)突破銅纜瓶頸加速走向規(guī)模部署

  在支撐AI大模型訓(xùn)練的算力架構(gòu)演進(jìn)中,光I/O作為高密度、低功耗、低時(shí)延的關(guān)鍵互聯(lián)技術(shù),正逐步替代傳統(tǒng)電互聯(lián),成為構(gòu)建Scale-Up網(wǎng)絡(luò)“超級(jí)節(jié)點(diǎn)”的核心方案。尤其在銅纜在帶寬、能耗與傳輸距離上的局限日益凸顯的背景下,光I/O的技術(shù)落地與產(chǎn)業(yè)化進(jìn)展,正在推動(dòng)AI基礎(chǔ)設(shè)施完成從“銅”到“光”的關(guān)鍵跨越。報(bào)告中介紹了多家領(lǐng)先廠商在光I/O技術(shù)上取得突破性進(jìn)展:Ayar Labs推出業(yè)界首款符合UCIe規(guī)范的光子互聯(lián)芯粒TeraPHY,采用微環(huán)調(diào)制技術(shù),可實(shí)現(xiàn)高達(dá)8.192Tbps的雙向帶寬,并已在富士通 A64FX 處理器上實(shí)現(xiàn)原生光口部署。Lightmatter在OFC 2025發(fā)布Passage L200光引擎,采用波分與空分復(fù)用架構(gòu),單芯片帶寬高達(dá)56Tbps,具備3D封裝與堆疊能力,定位于大規(guī)模AI集群的高密度部署。Avicena則以microLED技術(shù)實(shí)現(xiàn)6.4Tbps級(jí)光連接,具備低功耗、高可靠、耐高溫等優(yōu)勢(shì),且兼容CMOS工藝,展現(xiàn)出極強(qiáng)的工程化潛力。這些技術(shù)路線的并行推進(jìn),標(biāo)志著光I/O從實(shí)驗(yàn)室走向量產(chǎn)部署的關(guān)鍵拐點(diǎn)已至。

  全光交換OCS技術(shù)賦能靈活拓?fù)渑c系統(tǒng)彈性

  在傳統(tǒng)數(shù)據(jù)中心中,網(wǎng)絡(luò)拓?fù)渫ǔ殪o態(tài)結(jié)構(gòu),適配穩(wěn)定的流量模式。然而,AI訓(xùn)練任務(wù)具有突發(fā)性強(qiáng)、流量分布時(shí)空不均等特點(diǎn),尤其在大模型并行計(jì)算中,不同階段對(duì)帶寬和拓?fù)湫枨蟛町愶@著。這就要求底層網(wǎng)絡(luò)具備快速重構(gòu)能力,以適應(yīng)多任務(wù)切換與資源調(diào)度的靈活性。張華博士在報(bào)告中指出,全光交換(OCS,Optical Circuit Switch)技術(shù),正是應(yīng)對(duì)這一挑戰(zhàn)的關(guān)鍵手段。相比傳統(tǒng)電交換,OCS通過(guò)純光信號(hào)直接切換物理鏈路,無(wú)需進(jìn)行電光轉(zhuǎn)換,具備高帶寬、低時(shí)延、低功耗與協(xié)議無(wú)關(guān)等優(yōu)勢(shì),可在毫秒級(jí)完成拓?fù)湔{(diào)整或故障切換,顯著提升網(wǎng)絡(luò)穩(wěn)定性與彈性。在AI訓(xùn)練集群中,OCS可根據(jù)模型結(jié)構(gòu)與計(jì)算負(fù)載動(dòng)態(tài)調(diào)整互聯(lián)結(jié)構(gòu),從而實(shí)現(xiàn)算力資源的最優(yōu)利用。

  報(bào)告指出,OCS在當(dāng)前智算中心中的應(yīng)用正逐步走向成熟,典型代表如Google谷歌23年發(fā)表論文提到的TPU v4集群已全面落地基于OCS+光模塊的3D Torus網(wǎng)絡(luò)架構(gòu)。該系統(tǒng)采用136×136端口OCS配合800G可插拔光模塊,實(shí)現(xiàn)4096張TPU的靈活互聯(lián),并在以下維度上實(shí)現(xiàn)顯著突破:性能提升:可靈活重構(gòu)物理拓?fù)洌ヅ洳煌P屯ㄐ拍J?,整體訓(xùn)練性能最高提升 3.3倍;系統(tǒng)可靠性增強(qiáng):在主機(jī)可靠性僅99%的條件下,系統(tǒng)仍能保持75%的算力吞吐能力。


  此外,Google谷歌在2025年Cloud Next大會(huì)上,宣布了最新智算集群Ironwood進(jìn)展,已實(shí)現(xiàn)支撐9216張TPU卡間互聯(lián),同樣基于OCS+800G光模塊方案,相比TPUv2,計(jì)算性能提升3600倍,展現(xiàn)出OCS在AI集群架構(gòu)中的廣闊前景??芍貥?gòu)數(shù)據(jù)中心網(wǎng)絡(luò)(RDCN)光互聯(lián)光I/O + OCS協(xié)同構(gòu)建“光速核心”

  面對(duì)AI大模型訓(xùn)練對(duì)帶寬密度、資源調(diào)度與系統(tǒng)彈性的極致要求,報(bào)告提出以光I/O與OCS技術(shù)為核心,構(gòu)建可重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò)(RDCN)架構(gòu),實(shí)現(xiàn)物理層的靈活互聯(lián)與資源解耦。RDCN架構(gòu)融合了橫向擴(kuò)展的Scale-Out網(wǎng)絡(luò)與縱向擴(kuò)展的Scale-Up網(wǎng)絡(luò),通過(guò)OCS核心交換節(jié)點(diǎn)與GPU光I/O直連,實(shí)現(xiàn)從芯片到系統(tǒng)的全光互聯(lián)。以哥倫比亞大學(xué)提出的SiPAM硅光互連架構(gòu)為例,OCS+OIO組合在訓(xùn)練效率上相較傳統(tǒng)Nvlink平臺(tái)提升高達(dá)7.5倍,充分驗(yàn)證了全光互聯(lián)在AI集群中的性能潛力。

  凌云光高可靠性O(shè)CS方案賦能RDCN落地部署

  在RDCN架構(gòu)所需的大規(guī)模光交換領(lǐng)域,凌云光與HUBER+SUHNER POLATIS合作,提出基于DBS(DirectLight Beam Steering)技術(shù)的高可靠OCS方案展現(xiàn)出顯著優(yōu)勢(shì)。相比傳統(tǒng)MEMS架構(gòu),DBS方案采用壓電陶瓷驅(qū)動(dòng)準(zhǔn)直器旋轉(zhuǎn),實(shí)現(xiàn)空間直耦精確對(duì)準(zhǔn),具備更高可靠性、更優(yōu)回波損耗、更低插損等特點(diǎn),相比與高驅(qū)動(dòng)電壓的MEMS方案,DBS平臺(tái)OCS在大端口數(shù)和長(zhǎng)期工作穩(wěn)定可靠性方面更具擴(kuò)展?jié)摿ΑkS著OCS端口規(guī)模持續(xù)擴(kuò)大,系統(tǒng)對(duì)交換模塊的損耗及可靠性提出更高要求。正如Google谷歌在其論文《Mission Apollo: Landing Optical CircuitSwitching at Datacenter Scale》中指出,“相較于MEMS架構(gòu),基于壓電陶瓷的光交換技術(shù)在插入和回波損耗方面具備天然優(yōu)勢(shì),當(dāng)MEMS方案在良率和可靠性上不易管理時(shí),技術(shù)路線的選擇也可能隨之轉(zhuǎn)變?!边@一趨勢(shì)也為DBS架構(gòu)在下一代OCS系統(tǒng)中的廣泛應(yīng)用提供了有力印證。

  凌云光OCS產(chǎn)品目前已支持最大576×576端口規(guī)模,典型插損僅2.7dB,回波損耗優(yōu)于–50dB,并可靈活配置8×8起的多種矩陣規(guī)格。產(chǎn)品還具備暗光配置與雙向通道(Bidi)等特性,可顯著提升端口利用率和系統(tǒng)架構(gòu)自由度,并且已通過(guò)Telcordia GR-63民用級(jí)、及MIL-STD-810G等嚴(yán)苛抗震與極端環(huán)境測(cè)試,該產(chǎn)品累計(jì)運(yùn)行超 188億端口小時(shí),穩(wěn)定性與工程化水平均處于業(yè)內(nèi)領(lǐng)先。

  聚焦光子集成與全光網(wǎng)絡(luò)持續(xù)推動(dòng)AI網(wǎng)絡(luò)架構(gòu)演進(jìn)

  隨著大模型與智能算力持續(xù)縱深發(fā)展,傳統(tǒng)電互聯(lián)架構(gòu)已難以滿足智算中心復(fù)雜的互聯(lián)需求。以硅基光電子集成為代表的光I/O技術(shù),可支撐百卡乃至千卡Scale-Up網(wǎng)絡(luò)規(guī)模,成為下一代智算中心縱向擴(kuò)展的熱點(diǎn)方案;光I/O+OCS全光交換實(shí)現(xiàn)物理拓?fù)涞撵`活重構(gòu),故障快速恢復(fù)、速率平滑升級(jí),將成為RDCN(可重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò))不可或缺的底層支撐技術(shù)。正如Google谷歌工程副總裁在OFC 2025上所言:“我們正在見(jiàn)證新網(wǎng)絡(luò)架構(gòu)的文藝復(fù)興(What we are seeing is a new renaissance for new architectures!)”。凌云光以光I/O和OCS為突破口,深耕光子集成與全光網(wǎng)絡(luò)領(lǐng)域,推動(dòng)AI智算中心底層互聯(lián)架構(gòu)重塑。未來(lái),凌云光將繼續(xù)攜手合作伙伴,圍繞高密度、低功耗、智能調(diào)度等方向持續(xù)突破,加速邁向“光速核心”的智能互聯(lián)新時(shí)代。

內(nèi)容來(lái)自:訊石光通訊網(wǎng)
本文地址:http://www.kctar.com//Site/CN/News/2025/06/10/20250610015019148149.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:報(bào)告解讀 | 光I/O+OCS引領(lǐng)智算中心Scale-Up網(wǎng)絡(luò)架構(gòu)新變革
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right

相關(guān)新聞

暫無(wú)相關(guān)新聞