伺服器共享記憶體池技術的興起

關鍵字 :PCIe5CXL伺服器雲端google主機板

當前的伺服器運算平臺技術的發展，正陷入因記憶體架構而帶來的2大瓶頸。

第一個瓶頸，是發生在伺服器的元件層次，由於DRAM記憶體傳輸通道頻寬的增長，已經趕不上CPU核心數的成長，導致隨著CPU核心數的不斷增加，每單位運算核心可用的記憶體頻寬反而日趨減少，使得記憶體存取效率不彰。
第二個瓶頸，則發生在資料中心的伺服器平臺應用層次，出現DRAM記憶體利用率難以提升，導致大量記憶體資源面臨低利用率的閒置窘境。

為了能夠克服這些瓶頸，促成以CXL（Compute Express Link）為代表的處理器記憶體互連技術，藉此實現跨處理器、跨裝置的共享記憶體池，不僅突破既有記憶體傳輸通道的制約，提高CPU可用的記憶體容量與頻寬，也能在CPU與周邊裝置之間，動態調整記憶體資源配置，提高伺服器的記憶體利用率。

伺服器的記憶體架構瓶頸

記憶體頻寬瓶頸

過去10年以來，x86處理器的核心數提高了8到12倍，在2012年，單處理器最多不過8核心，到了2022年已增至96核心。但相對地，記憶體通道數量只從4個增加到8個與12個，僅僅提高2到3倍，遠遠跟不上處理器核心數的增長。於是，這便出現了一個弔詭的情況：越新款、越多核心的處理器，平均每個核心所能獲得的記憶體頻寬，反而越來越低，形成了運算能力的瓶頸。

而處理器直連的記憶體通道數量，主要是由處理器的接腳（Pin）數量決定，過去10年以來，x86伺服器處理器的接腳數量固然也持續增加，從LGA2011、LGA3467、LGA4094/4189，到最新的LGA4677，雖然只增加2倍多，但已經接近實體極限，主機板已經沒有更多空間，可以布置更多的處理器接腳，以及更多的記憶體直連通道了。

這也意味著，在當前的伺服器組成架構下，已經沒有增加處理器記憶體直連通道的餘裕了。

記憶體利用率瓶頸

DRAM記憶體已成為大型資料中心的關鍵成本支出項目，因此，規模越大的資料中心，記憶體容量閒置所導致的成本浪費也越嚴重，對於Azure、Google這樣的雲端服務業者來說，數十%的記憶體容量閒置，幾乎等同於數億甚至十數億美元的損失。然而，在現有的伺服器組成架構下，DRAM是與CPU直連，記憶體資源也被伺服器與CPU給綁定，每一臺伺服器形同於一座記憶體孤島，即便某臺伺服器有大量記憶體閒置，也無法配置給另一臺伺服器或其他周邊裝置使用。這也就是說，當前伺服器的記憶體是靜態配置的，無法跨伺服器或跨裝置進行動態調配，因而在既有的伺服器記憶體架構下，不可能解決記憶體資源利用率過低的問題。

另一個大家面臨雪上加霜的狀況則是，隨著GPU、SmartNIC、DPU等運算加速裝置，在伺服器上的普遍應用，這些運算加速裝置各自都含有容量可觀的DRAM，因而伺服器整體記憶體資源無法充分利用的狀況，也日益嚴重。

共享記憶體池克服記憶體架構瓶頸

★博文內容均由個人提供，與平台無關，如有違法或侵權，請與網站管理員聯繫。

★博文作者未開放評論功能