邁向光纖到芯片技術(shù)的飛躍——釋放光電共封裝(CPO)和玻璃波導(dǎo)基板的潛力

訊石光通訊網(wǎng) 2025/7/18 11:39:40


  數(shù)據(jù)中心網(wǎng)絡(luò)正在快速發(fā)展,而隨著AI的興起與AI集群的大規(guī)模部署,這一發(fā)展勢(shì)頭進(jìn)一步加速。近期,該領(lǐng)域進(jìn)展顯著,英偉達(dá)DGX SuperPOD架構(gòu)與谷歌TPU集群的部署尤為引人注目。這種轉(zhuǎn)變?cè)从趯?duì)支持AI訓(xùn)練和推理任務(wù)的高性能計(jì)算的需求。預(yù)計(jì)在未來(lái)五年內(nèi),僅英偉達(dá)一家公司每年就將出貨數(shù)百萬(wàn)臺(tái)專為AI優(yōu)化的GPU單元,到2028年將形成極大的規(guī)模。

  構(gòu)建這些網(wǎng)絡(luò)所需的收發(fā)器單元數(shù)量將達(dá)到每年數(shù)千萬(wàn)臺(tái)量級(jí),且這些設(shè)備需要運(yùn)行在1.6Tbps、3.2Tbps等最高速率水平。根據(jù)行業(yè)分析師的預(yù)測(cè),未來(lái)每個(gè)加速器(GPU)將配備10個(gè)以上的收發(fā)器,這意味著相較于當(dāng)前部署水平,光纖連接需求將增加約10倍。

  在典型的數(shù)據(jù)中心中,一個(gè)標(biāo)準(zhǔn)的可插拔以太網(wǎng)收發(fā)器消耗約20瓦電力。預(yù)計(jì)下一代收發(fā)器的能耗將幾乎翻倍。根據(jù)目前的出貨量估算,2024年用于驅(qū)動(dòng)收發(fā)器的電力部署約為200兆瓦(MW)。根據(jù)收發(fā)器的發(fā)展軌跡以及預(yù)期將增長(zhǎng)10倍的光連接需求,收發(fā)器的電力部署預(yù)計(jì)將增至每年2吉瓦(GW),相當(dāng)于一坐大型核電站的發(fā)電量。這其中不包括驅(qū)動(dòng)主機(jī)端電子設(shè)備、電重定時(shí)器所需的電力,用于將數(shù)據(jù)從集成電路傳輸?shù)皆O(shè)備前端的收發(fā)器。

  以一座配備一百萬(wàn)塊GPU的AI數(shù)據(jù)中心為例,引入CPO技術(shù)可為該數(shù)據(jù)中心節(jié)省約150兆瓦的發(fā)電容量需求。除了減少建設(shè)相應(yīng)發(fā)電設(shè)施所需的投資成本外,這項(xiàng)技術(shù)還能顯著降低運(yùn)營(yíng)成本——根據(jù)地區(qū)能源價(jià)格差異,每年節(jié)省的電費(fèi)開支有望輕松突破1億歐元。而在中國(guó),隨著‘東數(shù)西算’工程推進(jìn),超算中心(如無(wú)錫神威·太湖之光)、智算中心(如北京、深圳AI算力集群)對(duì)高帶寬、低功耗光互連的需求激增,CPO技術(shù)有望成為國(guó)產(chǎn)GPU降耗增效的關(guān)鍵。面對(duì)這種不可持續(xù)的能耗發(fā)展趨勢(shì),創(chuàng)新變得至關(guān)重要。

  CPO技術(shù)的引入

  CPO是短期內(nèi)最有可能突破上述能耗瓶頸的技術(shù)。這項(xiàng)技術(shù)將電光轉(zhuǎn)換模塊的位置從前面板的收發(fā)器轉(zhuǎn)移到設(shè)備內(nèi)部,最理想的情況下直接集成到CPU或GPU的封裝基板上。這樣可以最大限度地降低銅通道上的電力損耗,從而形成更高能效的鏈路,與可插拔收發(fā)器相比,功耗可降低50%以上,在某些情況下甚至高達(dá)75%。其節(jié)能優(yōu)勢(shì)不僅體現(xiàn)在減少高損耗銅通道的使用,還通過(guò)簡(jiǎn)化甚至省去用于補(bǔ)償電信號(hào)傳輸損耗的數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)。這項(xiàng)技術(shù)帶來(lái)的次級(jí)效應(yīng)是改善延遲情況,因?yàn)橥ㄟ^(guò)CPO模塊傳輸?shù)男盘?hào)實(shí)現(xiàn)無(wú)誤通信所需的預(yù)處理和后處理步驟大大減少。總地來(lái)說(shuō),CPO技術(shù)能提供高速、低功耗和低延遲的光連接。這些特性正是先進(jìn)AI網(wǎng)絡(luò)的關(guān)鍵所在。

  另一種值得關(guān)注的節(jié)能替代方案是線性驅(qū)動(dòng)可插拔光模塊(LPO),它通過(guò)去除DSP芯片,在保持前面板可插拔收發(fā)器形態(tài)與生態(tài)系統(tǒng)的同時(shí),降低了功耗和延遲。雖然CPO能夠提供更好的信號(hào)完整性和更低的延遲,但LPO方案更具性價(jià)比,尤其適合短距離應(yīng)用場(chǎng)景。LPO的高性價(jià)比和低功耗優(yōu)勢(shì),加之快速上市準(zhǔn)備能力,可能會(huì)延緩CPO技術(shù)的大規(guī)模普及。不過(guò),當(dāng)鏈路速率提升至200G或更高水平時(shí),LPO相較CPO會(huì)消耗更多電力,且在確保高信號(hào)質(zhì)量方面的管理難度顯著增加,預(yù)計(jì)隨著技術(shù)的不斷進(jìn)步,CPO將成為未來(lái)的首選解決方案。

  玻璃為CPO技術(shù)賦能

  玻璃有望在下一代CPO技術(shù)中發(fā)揮重要作用。為了使電光轉(zhuǎn)換器(主要是硅光芯片)盡可能靠近實(shí)際使用的硅處理器(CPU和GPU),我們還需要一種新型封裝技術(shù),這種技術(shù)不僅支持較大的基板尺寸,還要能夠與硅光芯片實(shí)現(xiàn)光連接。

  按照傳統(tǒng),半導(dǎo)體封裝主要采用有機(jī)基板。這類材料的熱膨脹系數(shù)高于硅,因而限制了半導(dǎo)體封裝的最大尺寸。隨著業(yè)界不斷推動(dòng)在現(xiàn)有有機(jī)技術(shù)平臺(tái)上采用更大尺寸的封裝基板,可靠性問(wèn)題(如焊點(diǎn)完整性問(wèn)題、分層風(fēng)險(xiǎn)加劇)以及制造端難題(如高質(zhì)量細(xì)間距互連結(jié)構(gòu)和高密度布線)日益突出,導(dǎo)致封裝和測(cè)試成本持續(xù)攀升,而通過(guò)優(yōu)化設(shè)計(jì),玻璃可以實(shí)現(xiàn)與硅芯片更為匹配的熱膨脹系數(shù),相比之下優(yōu)于傳統(tǒng)的有機(jī)基板。這種經(jīng)特殊加工的玻璃基板因此展現(xiàn)出卓越的熱穩(wěn)定性,在溫度波動(dòng)時(shí)能夠降低機(jī)械應(yīng)力和損壞風(fēng)險(xiǎn)。其優(yōu)異的機(jī)械強(qiáng)度和平整度為芯片封裝可靠性提供了堅(jiān)實(shí)保障。此外,玻璃基板能夠支持更高的互連密度和更細(xì)間距的互連,從而提升電氣性能并減少寄生效應(yīng)。這些特性使得玻璃成為先進(jìn)半導(dǎo)體封裝領(lǐng)域高度可靠且精準(zhǔn)的選擇。因此,半導(dǎo)體封裝行業(yè)正在大力發(fā)展先進(jìn)玻璃基板技術(shù),將其打造為下一代基板技術(shù)。

  玻璃波導(dǎo)基板

  除了優(yōu)異的熱學(xué)性質(zhì)和機(jī)械性能外,玻璃還能通過(guò)特殊處理實(shí)現(xiàn)光波導(dǎo)功能。玻璃中的光波導(dǎo)通常通過(guò)名為離子交換的工藝來(lái)實(shí)現(xiàn):使用鹽溶液中的不同離子替換玻璃中的離子,由此改變玻璃的折射率。通過(guò)將光限制在折射率更高的區(qū)域內(nèi),改性區(qū)域可對(duì)光進(jìn)行引導(dǎo)。這項(xiàng)技術(shù)能夠精確調(diào)節(jié)波導(dǎo)特性,使其適用于多種光學(xué)應(yīng)用場(chǎng)景。因此,在類似光纖結(jié)構(gòu)的光波導(dǎo)中,光可以沿著集成玻璃波導(dǎo)傳播,并高效耦合進(jìn)入光纖或硅光子芯片。這使得玻璃成為先進(jìn)CPO應(yīng)用中極具吸引力的材料選擇。

  在同一基板上集成電氣與光學(xué)互連,還有助于解決企業(yè)在構(gòu)建大型AI集群時(shí)遇到的互連密度難題。目前,光通道數(shù)量受到光纖幾何構(gòu)造的限制——常規(guī)光纖包層直徑為127微米,約人類發(fā)絲粗細(xì)。而玻璃波導(dǎo)機(jī)構(gòu)能夠?qū)崿F(xiàn)更密集排布,相較直接光纖到芯片的連接方式,這種波導(dǎo)技術(shù)可以顯著提升輸入/輸出(I/O)密度。

  電氣和光學(xué)互連的集成不僅解決了密度問(wèn)題,還提升了AI集群的整體性能和可擴(kuò)展性。借助玻璃波導(dǎo)的緊湊特性,可以在相同的物理空間內(nèi)容納更多的光通道,進(jìn)而增強(qiáng)系統(tǒng)的數(shù)據(jù)傳輸容量與效率。這項(xiàng)進(jìn)步對(duì)于推動(dòng)下一代AI基礎(chǔ)設(shè)施建設(shè)至關(guān)重要——在AI系統(tǒng)需要處理海量數(shù)據(jù)的應(yīng)用場(chǎng)景下,高密度互連技術(shù)是實(shí)現(xiàn)高效管理的關(guān)鍵。

  通過(guò)集成玻璃波導(dǎo),可以在同一基板上構(gòu)建完整的光學(xué)系統(tǒng),使光子集成電路能夠直接通過(guò)光波導(dǎo)進(jìn)行通信。這一過(guò)程無(wú)需借助光纖互連,可顯著提升芯片間通信帶寬和覆蓋范圍。在具有眾多互連組件的高密度系統(tǒng)中,相較于離散光纖,使用玻璃光波導(dǎo)可以實(shí)現(xiàn)更低的信號(hào)損耗、更高的帶寬密度以及更高的耐用性。這些優(yōu)勢(shì)使得玻璃波導(dǎo)成為高性能光學(xué)互連系統(tǒng)的理想選擇。

  在下一代數(shù)據(jù)中心和AI超級(jí)計(jì)算機(jī)網(wǎng)絡(luò)中應(yīng)用CPO技術(shù),可提升芯片逃逸帶寬,為實(shí)現(xiàn)102T及以上高速、高基數(shù)交換機(jī)開辟更多可能。網(wǎng)絡(luò)架構(gòu)師們正迎來(lái)重新構(gòu)思與設(shè)計(jì)網(wǎng)絡(luò)架構(gòu)的獨(dú)特機(jī)遇。得益于帶寬的增加和網(wǎng)絡(luò)架構(gòu)的簡(jiǎn)化,他們將能夠?qū)崿F(xiàn)更優(yōu)的網(wǎng)絡(luò)性能表現(xiàn),從而推動(dòng)運(yùn)營(yíng)效率提升與流程優(yōu)化。

  寫在最后

  CPO技術(shù)有望從多個(gè)層面徹底改變AI的互連架構(gòu)。它能夠顯著降低能耗并提升可持續(xù)性,使AI系統(tǒng)更加環(huán)保且更具成本效益。此外,CPO可提升AI系統(tǒng)效率和可擴(kuò)展性,使系統(tǒng)能夠輕松處理規(guī)模更大、復(fù)雜度更高的任務(wù)。通過(guò)解決密度問(wèn)題,CPO可提升數(shù)據(jù)傳輸速率,確保AI組件間實(shí)現(xiàn)更快、更可靠的通信。這也有助于減少未來(lái)AI系統(tǒng)中出現(xiàn)的瓶頸問(wèn)題,確保更順暢、更高效的系統(tǒng)運(yùn)行。

  未來(lái)的AI互連有望引入直接光鏈路技術(shù),從而省去計(jì)算交換機(jī)環(huán)節(jié)。這項(xiàng)創(chuàng)新將拓寬AI任務(wù)的帶寬,提升大型數(shù)據(jù)集的處理速度和效率。玻璃因其卓越的數(shù)據(jù)傳輸能力和可擴(kuò)展性,成為實(shí)現(xiàn)這些技術(shù)進(jìn)步的理想材料?;诓AУ墓怄溌穼⒊蔀橄乱淮鶤I系統(tǒng)的關(guān)鍵支撐,為高性能計(jì)算和先進(jìn)AI應(yīng)用構(gòu)建不可或缺的基礎(chǔ)設(shè)施體系。


  作者:Andreas Matiss 康寧光通信光學(xué)元件與集成高級(jí)經(jīng)理


新聞來(lái)源:訊石光通訊網(wǎng)

相關(guān)文章