2025 年影響資料中心和電信基礎設施硬體創新的關鍵技術趨勢

日期 : 2025-02-09

新聞內容

作者 : Semtech
出處 : https://blog.semtech.com/key-technology-trends-shaping-data-center-and-telecom-infrastructure-hardware-innovation-in-2025
2025 年影響資料中心和電信基礎設施硬體創新的關鍵技術趨勢

進入 2025 年,在人工智慧(AI)和對頻寬和運算能力不斷增長的需求的推動下,資料中心技術格局繼續快速發展。人工智慧應用的激增,特別是大型語言模型 (LLM),正在重塑基礎設施需求,並推動整個數位生態系統(從海量雲端資料中心到邊緣運算設施)的硬體投資增加。以下是我們看到的未來​​一年將會發生演變和擴展的一些關鍵資料中心網路硬體趨勢。

人工智慧驅動的資料中心發展 

人工智慧的爆炸性成長正在從根本上重塑資料中心的架構和要求。這種轉變是由人工智慧縮放定律所驅動的——模型效能和運算資源之間的直接關聯。隨著各大企業致力於創建功能更強大的 AI 系統,對更大的圖形處理單元 (GPU) 叢集和更複雜、更高容量的互連解決方案的需求持續加速成長。 

雖然當今最大的 AI 裝置使用大約 100,000 個 GPU 並行工作,但行業預測表明,到 2026 年,我們可能會看到多達 100 萬個 GPU 的集群。 

超大規模資料中心1.6T光模組部署

2025年將是1.6T光收發模組在超大規模資料中心的初步部署,主要由AI應用推動。這些模組以每通道 200G 的速度運行,代表著頻寬能力的重大飛躍。然而,以這些數據速率運行面臨幾個關鍵挑戰: 

  • 每通道 200G 時訊號完整性變得越來越複雜,需要增強硬體系統各方面的效能。要實現這一目標需要更高的頻寬、更少的雜訊成分、先進的訊號調節和均衡技術,以及更細緻的通道分析和設計。這些改進對於確保可靠通訊、維持互連速度和保證鏈路品質至關重要。 
  • 傳統印刷電路板 (PCB) 設計和連接器已達到極限,因此需要新的解決方案,例如跨接電纜、更多奇特的電路板材料、無 PCB 連接器和其他專用互連技術。
  • 在這些速度下,光學模組的功耗和熱管理成為關鍵考慮因素,因為所需的前面板頻寬需求不斷增長,並且隨著新基礎設施部署的處理能力和密度的增加,AI 機架功率也會增長(請參閱下面的「不斷增長的功率挑戰」)。
 

有源銅纜 (ACC) 的採用

隨著資料中心向更高速度邁進,主動銅纜將開始獲得廣泛的關注,成為在最短要求距離內驅動銅互連的可行選擇,而不會產生明顯的功率或延遲損失,特別是對於 1.6T(8x200G/通道)應用。在 1.6T 及更高版本中,ACC 將開始取代大量直連銅纜 (DAC),以支援機架內和機架之間的所需互連距離。 ACC 具有多項引人注目的優勢: 

  • 與被動直連銅纜相比,電纜長度/覆蓋範圍有所增強(ACC 最長可達 3 米,而 DAC 則不到 1 米)。 
  • 與具有數位訊號處理器 (DSP) 的光學模組和主動電纜 (AEC) 相比,功耗更低 – ACC 每條電纜末端低至 2W,而 AEC 每條電纜末端高達 15W,每個光學模組高達 30W – 因此大大改善了熱特性,無需額外的液體冷卻。 
  • 由於訊號路徑更簡單,延遲減少(ACC 延遲小於 100ps,AEC 和基於 DSP 的光學模組延遲大於 50ns)
  • 短距離應用的成本效益較高。

線性可插拔光學元件 (LPO) 部署 

2025年將成為LPO技術的關鍵一年。這種創新方法消除了光學模組中耗電數位訊號處理器的需要,而是利用專門設計的組件進行訊號調節。對於單模和多模光學應用而言,向 LPO 的轉變是由以下幾個因素驅動的: 

  • 人們越來越關注資料中心的電源效率。 
  • 隨著光纖連接成本在基礎設施成本中所佔份額越來越大,業界開始推動更具成本效益的光纖解決方案。
  • 主機系統專用積體電路 (ASIC) SerDes 功能的進步使得光學模組更加簡單。
  • 龐大且不斷成長的網路硬體和光模組供應商生態系統,支援 LPO 並提供全套 LPO 產品。
  • 光網路互聯論壇(OIF)和LPO MSA(線性可插拔光學多源協定)等產業組織完成LPO介面標準,以確保多供應商的互通性。
 

日益增長的電力挑戰 

AI運算資源密度的不斷提高,正在將資料中心的功耗推向前所未有的水平。現在,一架最先進的 AI 硬體的功耗可達 125 千瓦——比多個普通家庭一年的用電量還要大。這種功率密度為整個資料中心生態系統帶來了連鎖挑戰: 

  • 由於傳統風冷不足以滿足最高密度 AI 硬體機架的需求,我們將繼續看到液體冷卻的廣泛採用,包括冷板、直接晶片和浸入式解決方案。 
  • 資料中心營運商積極探索和資助新的電源,包括核電 
  • 資料中心設計的各個方面越來越關注節能技術,包括低功耗互連技術,例如上述的 ACC 和 LPO 方法。 
  • 影響組件可靠性和性能的熱挑戰。 
  • 需要更複雜的配電和管理系統來確保向更高密度的機架提供足夠的電力。 

邊緣人工智慧:下一個前沿 

雖然基於雲端的人工智慧將繼續成長,但 2025 年將成為人工智慧開始走向邊緣的過渡年。這種轉變是由幾個關鍵因素所推動的: 

  • 人工智慧應用需要更低的延遲。 
  • 資料隱私和主權要求。 
  • 人工智慧推理的成本優化。 
  • 專用邊緣 AI 硬體的出現。 
  • 模型優化和壓縮技術的進步。

這種轉變將對基礎設施和連接產生新的要求: 

  • 無線基礎設施的演變是為了支援日益增長的邊緣運算需求,推動全球營運商向 5G-Advanced(50G 無線)轉變。  
  • 主要設備供應商為更高頻寬的無線電系統做好準備。 
  • 開發更複雜的邊緣運算架構。 
  • 將人工智慧功能整合到現有的邊緣基礎設施中。 

PON 演進:滿足不斷成長的頻寬需求 

在被動光網路 (PON) 領域,2025 年將迎來 50G PON 技術,非對稱實施將引領潮流。這種演變是由多種市場因素所推動的: 

  • 住宅和商業用戶的頻寬需求不斷增長。 
  • 雲端服務和串流媒體應用程式的採用日益增多。 
  • 需要支援邊緣運算和5G/6G回程。 
  • 來自替代高速寬頻技術的競爭。 

最初對非對稱 50G PON 的關注反映了大多數網路流量模式的當前現實,同時隨著需求的發展提供了實現對稱實施的途徑。 

展望未來:融合與創新 

這些趨勢反映了我們的網路基礎設施的不斷發展,以支援日益苛刻的應用程序,特別是人工智慧領域的應用程式。在這個快速發展的環境中取得成功需要認真關注以下幾個關鍵因素: 

  • 針對下一代資料速率的增強型元件級和系統級訊號完整性解決方案。 
  • 硬體系統設計各方面的電源效率改進,結合可隨著功率密度的增加而擴展的熱管理策略。 
  • 靈活的系統和網路架構可以適應不斷變化的工作負載需求。 
  • 經濟高效的基礎設施硬體解決方案,可以以經濟可行的方式隨著需求的增長而擴展。

隨著我們進入 2025 年,能夠有效應對這些挑戰同時提供下一代應用程式所需效能的組織將為未來做好準備。網路和運算硬體生態系統在這些多個維度進行創新的能力對於支援下一波數位轉型至關重要。