AI算力爆發(fā)催生互聯(lián)革命:銅纜到光模塊的進(jìn)階之路

訊石光通訊網(wǎng) 2025/7/28 9:35:58

  ICC  (本文作者Kishore Atreya系Marvell公司云平臺營銷高級總監(jiān))人工智能正在徹底改造各行業(yè)的同時,其永無止境的算力需求正從底層重塑數(shù)據(jù)中心架構(gòu)。AI工作負(fù)載——尤其是大規(guī)模訓(xùn)練和推理——不斷挑戰(zhàn)GPU和加速器的極限,對連接計算、存儲和內(nèi)存的互聯(lián)技術(shù)提出了前所未有的要求。這些光纖與銅纜組成的"神經(jīng)網(wǎng)絡(luò)",如今已變得與它們連接的處理器同等重要。

  在全球最先進(jìn)的數(shù)據(jù)中心內(nèi)部,AI基礎(chǔ)設(shè)施已不再是獨立服務(wù)器的簡單組合,而是需要將大規(guī)模計算集群緊密耦合為統(tǒng)一系統(tǒng)。這種從孤立處理到互聯(lián)智能的轉(zhuǎn)變,將下一代AI互聯(lián)技術(shù)推向了舞臺中央。

  機架內(nèi)的光進(jìn)銅退

  光學(xué)技術(shù)正在提供關(guān)鍵解決方案。線性可插拔光學(xué)器件(LPO)等新技術(shù)在保持銅纜能效優(yōu)勢的同時,實現(xiàn)了機架內(nèi)帶寬擴展。通過將信號處理任務(wù)轉(zhuǎn)移至主機芯片,并對電氣與光學(xué)元件進(jìn)行協(xié)同設(shè)計,LPO能以更低功耗和延遲直接替代傳統(tǒng)光模塊。

  更激進(jìn)的集成方案——近封裝光學(xué)(NPO)和共封裝光學(xué)(CPO)——則將光學(xué)器件直接放置在加速器封裝內(nèi)部或相鄰位置。這些技術(shù)幾乎消除了XPU與光引擎間的電氣走線,既降低功耗又提升帶寬密度。特別是CPO技術(shù),有望將計算集群規(guī)模從數(shù)十個XPU擴展至數(shù)百甚至數(shù)千個,同時保持可預(yù)測的性能和更低的系統(tǒng)總功耗。

  集群擴展的光學(xué)架構(gòu)

  當(dāng)AI集群從單個機架擴展到多排機柜乃至整個模塊時,橫向擴展互聯(lián)構(gòu)成了編織整個系統(tǒng)的"光學(xué)織物"。這些通常基于PAM4光學(xué)DSP的鏈路,必須支持?jǐn)?shù)十至數(shù)百米距離內(nèi)的大帶寬、低延遲和高可靠性。

  當(dāng)前最先進(jìn)的PAM4 DSP支撐著全球頂級以太網(wǎng)和InfiniBand網(wǎng)絡(luò),使AI工作負(fù)載能跨交換機和節(jié)點無縫傳輸數(shù)據(jù)。面對每兩年翻倍的帶寬需求,DSP技術(shù)正通過3nm制程和單通道200Gbps信號速率持續(xù)進(jìn)化,推動1.6Tbps及以上模塊的發(fā)展。

  針對分布式AI園區(qū),精簡相干(coherent-lite)技術(shù)正在興起。相比PAM4具有更長傳輸距離(2-20公里),相比傳統(tǒng)相干系統(tǒng)則具備更低成本和功耗,這種工作在O波段的DSP技術(shù)可連接數(shù)據(jù)中心園區(qū)內(nèi)不同建筑,幫助運營商突破單設(shè)施的電力與空間限制。

  跨園區(qū)互聯(lián)的終極方案

  當(dāng)AI集群突破園區(qū)范圍時,數(shù)據(jù)中心互聯(lián)(DCI)技術(shù)開始承擔(dān)重任,連接分布在不同城市乃至大洲的計算集群。800G ZR/ZR+模塊等相干ZR光學(xué)方案占據(jù)主導(dǎo)地位,支持最遠(yuǎn)2500公里的多太比特級連接。

  這些相干鏈路通過密集波分復(fù)用(DWDM)和先進(jìn)調(diào)制技術(shù)最大化光纖利用率,對于跨設(shè)施擴展AI工作負(fù)載同時保持實時性能和冗余至關(guān)重要。據(jù)Marvell和Serve The Home 2025年2月數(shù)據(jù)顯示,800G ZR/ZR+模塊在滿帶寬下分別支持1000公里和2500公里傳輸。

  多元化技術(shù)共筑未來

  AI時代沒有任何單一互聯(lián)技術(shù)能滿足所有需求。從銅纜、LPO、CPO到PAM4、精簡相干和相干ZR,多樣化的技術(shù)方案正針對不同層級的挑戰(zhàn)進(jìn)行精準(zhǔn)適配。這些技術(shù)被共同目標(biāo)緊密聯(lián)結(jié):構(gòu)建可擴展、高效能的高性能AI基礎(chǔ)設(shè)施。

  光學(xué)化轉(zhuǎn)型正在各層級加速推進(jìn),不僅為了帶寬提升,更因其在功耗、散熱和密度方面的關(guān)鍵優(yōu)勢。供應(yīng)商、開發(fā)者和云運營商必須深化合作,將互聯(lián)技術(shù)從事后考量轉(zhuǎn)變?yōu)橄到y(tǒng)架構(gòu)的核心支柱。

  隨著AI持續(xù)爆發(fā)式增長,其未來顯然不僅取決于更快的芯片,更在于更優(yōu)質(zhì)的連接。在這場競賽中,真正的贏家將是那些超越硅基思維,真正理解并駕馭光纖與系統(tǒng)架構(gòu)融合之道的創(chuàng)新者。

  原文:AI Interconnects: The infrastructure behind intelligence | Lightwave | https://www.lightwaveonline.com/home/article/55305907/ai-interconnects-the-infrastructure-behind-intelligence

新聞來源:訊石光通訊網(wǎng)

相關(guān)文章