Meta 與 NVIDIA 簽署數十億美元協議:首家部署獨立 Grace CPU 的超大規模雲端
CNBC 於 2 月 17 日報導,Meta 大幅擴展與 NVIDIA 的合作夥伴關係,將採購數百萬顆晶片,涵蓋獨立 Grace CPU、Blackwell GPU 以及即將推出的 Vera Rubin 系統。分析師 Ben Bajarin 估計協議總值「肯定達數百億美元」。這不僅是一筆商業交易,更標誌著資料中心架構一場靜默但深遠的革命。
CNBC 於 2 月 17 日報導,Meta 大幅擴展與 NVIDIA 的合作夥伴關係,將採購數百萬顆晶片,涵蓋獨立 Grace CPU、Blackwell GPU 以及即將推出的 Vera Rubin 系統。分析師 Ben Bajarin 估計協議總值「肯定達數百億美元」。這不僅是一筆商業交易,更標誌著資料中心架構一場靜默但深遠的革命。
Meta 與 NVIDIA 之間的這筆交易,其規模之大、範圍之廣,即便在近年來 AI 基礎設施投資狂潮中也屬罕見。據 CNBC 援引知情人士透露,Meta 將購買「數百萬顆」NVIDIA 晶片,產品線橫跨三大類別:獨立運行的 Grace CPU、目前最頂級的 Blackwell GPU,以及 NVIDIA 下一代 Vera Rubin 系統。科技分析師 Ben Bajarin 對此交易的估值是「肯定達數百億美元」,這一數字即便對市值超過一萬五千億美元的 Meta 而言,也是一筆足以影響資產負債表的重大承諾。
值得注意的是,這筆交易發生在 Meta 已經宣布 2026 年 AI 支出將達到 1,350 億美元的背景之下。Mark Zuckerberg 在一月份的財報電話會議上曾表示,這些投資對於 Meta 維持在生成式 AI 領域的領先地位「絕對必要」。從這個角度來看,與 NVIDIA 的合作不僅僅是硬體採購,更是 Meta 整體 AI 戰略的核心支柱。
這筆交易中最引人注目的部分,是 Meta 成為全球首家將 NVIDIA Grace CPU 作為獨立處理器大規模部署的超大規模雲端企業。此前,Grace CPU 主要以「Grace Hopper」超級晶片的形式出現,與 NVIDIA 的 GPU 配對使用。但 Meta 的做法完全不同——他們要將 Grace 作為純粹的通用伺服器 CPU 來使用,直接與 Intel Xeon 和 AMD EPYC 展開競爭。
NVIDIA Grace CPU 基於 Arm Neoverse V2 架構,集成了 72 個高效能核心。它採用 LPDDR5x 記憶體技術,最高可配置 480GB 記憶體,記憶體頻寬達到 546 GB/s。相較於傳統的 DDR5 記憶體,LPDDR5x 的功耗降低了約 75%,這賦予了 Grace 在能效比上的巨大優勢。
「Grace CPU 在後端工作負載上提供兩倍的每瓦效能。」——NVIDIA 副總裁 Ian Buck
Ian Buck 的這番話揭示了 Grace 的核心競爭力所在。在超大規模資料中心營運中,電力成本和冷卻成本往往佔總運營成本的 30% 至 40%。如果 Grace 確實能將每瓦效能提升一倍,這意味著在相同的電力預算下,Meta 可以部署近兩倍的運算能力,或者在維持相同運算能力的前提下,將電力成本削減近半。
許多人可能會疑惑:在 AI 時代,為何 Meta 要大量購買「僅僅是 CPU」的處理器?答案在於 AI 系統的運作並非只有模型訓練和推論這些 GPU 密集型工作。一個完整的 AI 服務背後,存在著大量的「通用運算」工作負載:用戶請求路由、數據預處理與後處理、快取管理、API 閘道器、負載均衡、日誌記錄與監控,以及日益重要的 AI Agent 協調工作。
NVIDIA 在其聲明中特別提到:「Agentic AI 對通用 CPU 架構提出了全新的要求。」這是一個極具前瞻性的觀察。隨著 AI 應用從單一的問答模式,演進到能夠自主規劃、使用工具、與外部系統互動的「智能體」(Agent)模式,CPU 端的運算需求正在急劇增長。每一次工具調用、每一次記憶體存取、每一次多步驟推理的編排,都需要高效的 CPU 來處理。
交易中還包括了 NVIDIA 尚未正式發布的下一代 Vera Rubin 系統的部署承諾。Vera Rubin 平台預計在 2027 年推出,其 CPU 部分將採用名為「Vera」的全新處理器,配備 88 個 NVIDIA 自研的 Arm 核心。相較於 Grace 的 72 個 Neoverse V2 核心,Vera 不僅在核心數量上有所增加,更重要的是它使用的是 NVIDIA 完全自行設計的 Arm 核心,而非採用 Arm 公版設計。
這一轉變意義深遠。它表明 NVIDIA 正在像 Apple 設計 M 系列晶片那樣,走向完全自研 CPU 微架構的道路。NVIDIA 對 CPU 設計的掌控力將越來越強,可以針對其 GPU 和 AI 軟體堆疊進行深度優化,這是使用公版 Arm 設計所無法實現的。Meta 願意提前為尚未面世的 Vera Rubin 系統下訂單,足以證明他們對 NVIDIA 技術路線圖的高度信任。
這筆交易公布後,AMD 股價當日下跌了 4%。市場的反應很說明問題:投資者意識到,NVIDIA 不再僅僅是一家 GPU 公司,它正在成為一個「全棧」資料中心晶片供應商,直接挑戰 Intel 和 AMD 在通用伺服器 CPU 市場長達數十年的雙頭壟斷地位。
這對 Intel 的打擊尤其嚴重。Intel 正身處多重困境之中——製程落後、市場份額流失、財務壓力巨大。如果超大規模客戶開始將通用工作負載從 x86 轉移到 Arm 架構的 NVIDIA Grace,Intel 在資料中心領域的最後堡壘也將面臨動搖。AMD 雖然在 x86 伺服器 CPU 市場近年來表現出色,以 EPYC 處理器不斷蠶食 Intel 的份額,但 Grace CPU 的出現意味著它同時面臨來自兩個方向的夾擊——既要與 Intel 競爭存量市場,又要防禦 NVIDIA 和 Arm 生態系統對增量市場的搶佔。
Grace CPU 的部署並非孤立事件,而是 Arm 架構在資料中心領域崛起的又一個里程碑。Amazon 的 Graviton 處理器已經證明了 Arm 在雲端環境中的可行性和成本效益,目前 AWS 超過 40% 的新實例都運行在 Graviton 上。Microsoft 的 Cobalt 100 和 Google 的 Axion 也在各自的雲端平台中逐步推廣。現在,Meta 選擇 NVIDIA Grace,進一步驗證了 Arm 在超大規模運算場景中的競爭力。
更深層次來看,這代表著一種產業範式的轉移:從「一個 CPU 架構打天下」(x86),走向「根據工作負載選擇最優架構」的異構運算時代。在這個新範式下,AI 訓練用 GPU,AI 推論用專用加速器,通用運算用能效比最優的 Arm CPU,各司其職,各展所長。
要理解這筆交易的完整意義,需要將其放在 Meta 整體 AI 戰略的大背景下審視。2026 年 1,350 億美元的 AI 支出計劃,使 Meta 成為全球 AI 基礎設施投資最激進的企業之一。這筆支出涵蓋資料中心建設、晶片採購、網路設備、電力基礎設施,以及軟體開發等多個層面。
Meta 的 AI 應用場景極其廣泛:Facebook 和 Instagram 的內容推薦、Reels 短影片排序、廣告精準投放、內容審核、翻譯服務、Llama 大語言模型的訓練與部署、Meta AI 助手的運行,以及正在快速發展的 AR/VR 元宇宙應用。每一項服務都需要海量的運算資源,而且這些需求還在以指數級的速度增長。
在這種規模下,每瓦效能的微小提升都能轉化為數以億計的成本節省。Grace CPU 承諾的兩倍每瓦效能,對於 Meta 這樣的超大規模營運者而言,不是錦上添花,而是戰略性的必需品。
Meta 與 NVIDIA 的這筆交易,對香港的科技產業和投資界有著多重啟示。
香港正在積極發展資料中心產業,政府已在新田科技城和落馬洲河套區規劃了新的資料中心用地。但香港的資料中心營運商必須關注全球架構轉型的趨勢:從純 x86 環境向 Arm 與 x86 混合架構的轉變正在加速。任何新建的資料中心,如果僅僅針對 x86 進行設計和優化,可能在建成之日就已經面臨過時的風險。
香港的資料中心營運商應該開始評估 Arm 架構伺服器的部署計劃,特別是在電力成本高昂的香港,Grace CPU 所代表的高能效比 Arm 伺服器具有額外的吸引力。香港商業電價在亞太區偏高,每瓦效能提升帶來的電費節省,在香港的價值比在電價較低的地區更為顯著。
對於香港的投資者而言,這筆交易提供了重要的信號。首先,NVIDIA 的業務版圖正在從 GPU 擴展到全棧資料中心方案,其增長潛力可能被低估。其次,Intel 和 AMD 面臨的競爭壓力正在加劇,特別是在超大規模客戶端。第三,Arm 控股(Arm Holdings)作為整個 Arm 生態系統的授權者,將持續受益於 Arm 在資料中心的擴張。
更重要的是,Meta 1,350 億美元的 AI 支出計劃顯示,超大規模企業的 AI 投資軍備競賽遠未結束。對於透過港股通投資美股 ETF 的香港散戶投資者,以及管理大型組合的機構投資者來說,AI 基礎設施供應鏈仍然是未來數年的核心投資主題。
隨著 Arm 架構在資料中心的普及,香港的大學和職業培訓機構需要調整課程設置,加強 Arm 架構相關的系統設計、軟體優化和效能調校方面的教學。香港科技大學、香港中文大學等本地研究型大學已有相關研究基礎,但從產業需求的角度來看,培養具備 Arm 生態系統實戰經驗的工程師,將成為越來越緊迫的需求。