一個月三宗交易:Google 史無前例的收購節奏
在 AI 產業的競爭白熱化之際,Google DeepMind 用不到一個月的時間完成了三宗重大交易——這種收購頻率在 Google 的歷史上極為罕見。長期以來,Google 以依賴內部研發能力著稱,其 DeepMind 實驗室和 Google Brain 團隊一直是全球 AI 研究的領頭羊。然而,2026 年初的這場收購狂潮顯示,即便是擁有頂尖研究團隊的 Google,也開始認為僅靠有機成長已不足以應對當前的競爭格局。
三宗交易各自瞄準了截然不同的技術領域:Common Sense Machines 帶來的是將 2D 影像轉化為 3D 世界模型的空間 AI 能力;Hume AI 提供的是業界領先的情感辨識與表達性語音合成技術;Sakana AI 則代表了日本市場的研究深度以及由 Transformer 架構共同發明者所帶領的創新能力。這三個方向合在一起,恰好描繪出 Google 對 Gemini 下一階段進化的完整藍圖——一個能夠理解三維世界、感知人類情感、並以全球化的研究網絡持續創新的多模態 AI 平台。
值得注意的是,這三宗交易的結構各不相同:CSM 是完整的收購;Hume AI 是授權協議加團隊吸收;Sakana AI 則是策略合作夥伴關係。這種靈活的交易結構反映了 Google 在監管壓力下的務實態度——美國反壟斷機構對科技巨頭的大型收購審查越來越嚴格,Google 已經學會了用不同的方式達成相同的戰略目標。
Common Sense Machines:打開 3D 空間智能的大門
Common Sense Machines(CSM)是一家專注於空間 AI 的初創公司,其核心技術是將普通的 2D 影像和影片自動轉換為精確的 3D 世界模型。在被 Google DeepMind 收購之前,CSM 已經在電腦視覺和 3D 生成領域積累了相當的技術實力,其模型能夠從單張照片或短影片中推斷出物體的三維結構、空間關係和物理屬性。
這項技術對 Google 的價值不言而喻。隨著 AR/VR 設備的普及、自動駕駛技術的發展以及機器人技術的突破,AI 對三維世界的理解能力變得越來越關鍵。Google 的 Gemini 模型雖然在文字、圖像和語音方面已經展現出強大的多模態能力,但在 3D 空間理解方面仍有明顯的短板。CSM 的技術恰好填補了這一缺口。
更具體地說,CSM 的空間 AI 技術可以為 Gemini 帶來以下能力提升:首先,在 Google Maps 和 Street View 中實現更精確的三維場景重建;其次,為 Google 的 AR 平台提供即時的環境理解;再者,在 Waymo 自動駕駛系統中增強對道路環境的三維感知。從產品層面來看,這意味著未來的 Google 搜尋可能不僅能展示圖片結果,還能呈現互動式的 3D 模型——想像一下搜尋「香港天際線」時得到的不是靜態圖片,而是可以旋轉、縮放的三維全景。
CSM 的收購也符合 Google DeepMind 近期在世界模型領域的佈局。2025 年底推出的 Genie 系列世界模型已經展示了 Google 在理解物理世界方面的野心,而 CSM 的 2D 轉 3D 技術為這一方向提供了關鍵的數據管線和推理能力。
Hume AI:讓 Gemini 讀懂人類情感
如果說 CSM 的收購是關於理解物理世界,那麼與 Hume AI 的交易則是關於理解人類的內心世界。Hume AI 是情感 AI 領域的先驅,專注於開發能夠辨識和表達人類情感的 AI 系統,包括情感語音辨識、表達性語音合成以及所謂的「共情 AI」(empathic AI)技術。
Google 與 Hume AI 的交易採用了授權協議的結構——Google 獲得了 Hume AI 技術的使用權,同時吸收了其 CEO 和核心工程團隊,將他們直接整合到 Gemini 的語音和情感能力開發中。這種交易結構巧妙地避免了完整收購可能引發的反壟斷審查,同時確保了 Google 能夠獲得最核心的人才和技術。
Hume AI 團隊的加入對 Gemini 的語音互動體驗將帶來質的飛躍。目前的 AI 語音助手——無論是 Google Assistant、Siri 還是 Alexa——在情感表達方面仍然相當生硬。它們可以準確地回答問題,但無法感知用戶的情緒狀態,也無法調整自己的語調來匹配對話的情感氛圍。Hume AI 的技術恰好解決了這個問題。
Hume AI 的情感辨識系統能夠從語音的音調、節奏、音量和語速等特徵中判斷說話者的情緒狀態——是開心、焦慮、困惑還是沮喪。其表達性語音合成技術則能夠生成帶有適當情感色彩的語音回應。兩者結合,意味著未來的 Gemini 可能成為第一個真正能夠「有溫度」地與人對話的 AI——在你心情低落時用柔和的語調安慰你,在你興奮時用同樣活潑的方式回應你。
這項能力的商業價值巨大。在客服場景中,能夠感知客戶情緒的 AI 可以大幅提升服務品質和客戶滿意度;在醫療健康領域,情感 AI 可以輔助心理健康篩查和遠端陪伴;在教育場景中,能夠理解學生情緒的 AI 教師可以更有效地調整教學節奏。Google 顯然看到了這些應用場景的巨大潛力。
Sakana AI:Transformer 發明者回歸 Google 生態
三宗交易中最具象徵意義的莫過於與 Sakana AI 的合作。Sakana AI 由 Llion Jones 和 David Ha 共同創立,總部位於東京——這是一家立足日本的 AI 研究實驗室,被視為日本最具影響力的 AI 研究機構之一。
Llion Jones 的名字對 AI 圈的人來說並不陌生。他是 2017 年那篇改變了整個 AI 領域的論文——「Attention Is All You Need」——的共同作者之一。這篇論文提出了 Transformer 架構,而如今幾乎所有的大型語言模型——GPT、Claude、Gemini、Llama——都建立在 Transformer 架構之上。Jones 曾是 Google Brain 的研究員,2023 年離開 Google 創立了 Sakana AI。如今通過合作協議,他的研究成果重新進入了 Google 的生態系統。
David Ha 同樣是 AI 研究領域的重量級人物,曾擔任 Google Brain 在東京的研究負責人,在生成式模型和進化算法方面有深厚的研究積累。Sakana AI 的名字來自日語中的「魚」(魚群),寓意著公司的研究方法——模仿自然界中集體智慧的湧現行為。
與 Sakana AI 的合作為 Google 帶來了多重戰略價值。首先是研究深度——Sakana AI 在自動化 AI 研究流程、進化式模型優化等前沿領域有獨特的方法論,這些方法可以加速 Google 的模型研發週期。其次是地理佈局——日本是全球第三大經濟體,也是 AI 應用的重要市場。通過與紮根日本的 Sakana AI 合作,Google 可以更好地理解和服務日本市場的特殊需求,包括日語處理、文化適配和本地化應用場景。
此外,Sakana AI 在「小模型、高效率」的研究方向上也有值得注意的進展。在所有人都在追求更大模型的時候,Sakana AI 探索的是如何用更少的計算資源達到接近大模型的效果——這與 Google 希望將 AI 能力部署到邊緣設備和行動裝置上的目標不謀而合。
戰略背景:1,850 億美元資本開支與 AI 軍備競賽
要理解 Google 這場收購狂潮的深層邏輯,必須將其置於更宏觀的背景之下。2026 年,Google 宣布了高達 1,850 億美元的資本支出計劃,主要用於 AI 基礎設施建設——包括數據中心、TPU 晶片製造以及網路基礎設施。與此同時,Google Cloud 的合約積壓金額已翻倍增長至 2,400 億美元,顯示企業客戶對 Google AI 服務的需求正在急劇攀升。
這些天文數字反映了一個殘酷的現實:AI 產業的競爭已經升級為一場真正的軍備競賽。Microsoft 通過與 OpenAI 的深度綁定,在企業 AI 市場佔據了先發優勢;Amazon 通過對 Anthropic 的巨額投資,確保了 AWS 在 AI 雲端服務中的競爭力;Meta 則選擇了全面押注開源策略,通過 Llama 系列模型建立了廣泛的開發者生態。
面對這些競爭對手的不同策略,Google 選擇了「全面出擊」——既投入巨額資本建設基礎設施,又通過收購和合作快速填補技術短板。這種策略的風險和回報都很高。風險在於整合多家被收購公司的技術和人才需要時間和管理精力;回報則在於,如果整合成功,Gemini 將成為市場上能力最全面的多模態 AI 平台。
從財務角度看,Google 有充足的資源支持這一策略。Alphabet 的現金儲備和營運現金流在科技行業中名列前茅,其搜尋廣告業務仍然是全球最大的利潤引擎之一。即便是 1,850 億美元的資本支出,也在 Alphabet 的財務承受範圍之內。
2026 年 AI 巨頭競爭格局一覽
- Google:1,850 億美元資本支出計劃,Cloud 積壓訂單 2,400 億美元,一個月內完成三宗 AI 收購/合作
- Microsoft:深度綁定 OpenAI,透過 Azure 佈署企業 AI 服務,Copilot 產品線持續擴展
- Amazon:巨額投資 Anthropic,AWS Bedrock 平台整合多家模型供應商,自研晶片 Trainium 降低成本
- Meta:全面押注開源 Llama 系列,建立開發者生態,自研硬體加速訓練效率
從有機成長到積極併購:Google 戰略思維的根本轉變
Google 歷史上並非沒有進行過重大收購——2014 年以 6.6 億美元收購 DeepMind 就是一個經典案例——但其核心戰略一直是依賴內部研發能力的有機成長。Google Brain、DeepMind、Google Research 等內部團隊長期以來在 AI 研究論文的發表數量和質量上都居於全球前列。Transformer 架構本身就是 Google 內部研究的成果。
然而,2025 年的競爭態勢打破了這種自信。OpenAI 的 GPT-5 系列在多項基準測試中持續領先;Anthropic 的 Claude 在企業市場的採用率飆升;Meta 的 Llama 開源模型吸引了大量開發者生態。儘管 Google 的 Gemini 系列模型在某些領域表現出色,但在市場份額和品牌認知方面,Google 發現自己正在失去原本毋庸置疑的 AI 領導地位。
這種認知促使 Google 的戰略思維發生了根本轉變。與其花費數年時間從零開始建設 3D 空間 AI 能力或情感語音技術,不如直接收購或引入已經在這些領域建立了技術優勢的團隊。時間就是金錢——在 AI 產業的快速演進中,領先一步可能意味著贏得整個市場,而落後一步可能意味著被徹底邊緣化。
這場戰略轉變也反映了 DeepMind CEO Demis Hassabis 在 Google 內部話語權的提升。自 2023 年 Google Brain 與 DeepMind 合併以來,Hassabis 一直在推動更加激進的產品開發和市場策略。三宗收購在如此短的時間內完成,顯示出 Hassabis 獲得了來自 Alphabet CEO Sundar Pichai 和董事會的充分授權。
Gemini 多模態進化路線圖:拼圖正在完成
將三宗交易的技術能力疊加在 Gemini 現有的基礎上,我們可以勾勒出 Google 對下一代 AI 平台的完整願景。
Gemini 目前已經具備了文字理解與生成、圖像辨識與生成、語音辨識與合成、程式碼理解與撰寫等多模態能力。CSM 的加入將帶來 3D 空間理解和世界建模能力,使 Gemini 能夠「看見」並「理解」三維物理世界。Hume AI 的技術將賦予 Gemini 情感感知和表達能力,使其在語音互動中更加自然和有溫度。Sakana AI 的合作則提供了持續的研究創新動力和日本市場的深度洞察。
這個拼圖一旦完成,Gemini 將成為一個真正意義上的「全能型」AI——不僅能夠處理文字和圖像,還能理解三維空間、感知人類情感、用恰當的情感語調與人互動,並在全球不同的文化和語言環境中有效運作。這正是 Google 所追求的「通用人工智能」(AGI)道路上的關鍵里程碑。
從產品角度來看,這些能力的整合可能催生一系列革命性的新體驗。Google Meet 中的 AI 會議助手可能不僅能記錄會議內容,還能分析與會者的情緒變化並提供溝通建議;Google Lens 可能從單純的圖像辨識工具進化為能夠即時構建場景 3D 模型的空間計算平台;Google 搜尋可能從文字和連結的世界進化為沉浸式的多感官資訊探索體驗。
對香港及亞太地區的影響
Google 這場收購狂潮對香港和亞太地區有著直接而深遠的影響。首先,Sakana AI 合作案凸顯了亞洲在全球 AI 版圖中日益重要的地位。日本作為 Transformer 架構共同發明者的選擇創業地,以及 Google 願意與日本本土 AI 實驗室建立策略合作,都表明亞洲正在成為 AI 研究和產業化的重要節點,而不僅僅是消費市場。
對香港而言,這帶來了機遇與挑戰並存的局面。機遇方面,Google 在亞太地區的 AI 投資加碼意味著更多的技術、資金和人才將流入這個區域。香港作為亞太金融中心和技術人才匯聚地,有條件從這波投資浪潮中受益。特別是在 3D 空間 AI 和情感 AI 這兩個新興領域,香港的學術機構和初創企業如果能及時佈局,可能找到差異化的發展空間。
挑戰方面,Google 透過收購快速整合技術的模式提醒香港企業和投資者:AI 技術的發展速度遠超傳統產業,等待觀望的策略可能導致永久性的落後。香港的企業需要加速 AI 能力建設——無論是通過自主研發、收購初創企業還是與全球 AI 平台合作。
此外,Hume AI 的情感語音技術對香港的多語言環境有特別的意義。粵語是一門聲調語言,其情感表達的方式與英語有根本的不同。如果 Gemini 能夠整合 Hume AI 的情感辨識技術並適配粵語環境,這將極大提升 AI 語音助手在香港的實用性和用戶體驗。同時,這也為香港本地的語音 AI 初創企業提供了與 Google 合作的潛在機會。
從宏觀經濟的角度看,Google 1,850 億美元的資本支出計劃和持續的 AI 投資,也為香港作為國際金融中心提供了分析和投資 AI 產業的巨大機會。AI 相關的 IPO、二級市場交易和私募股權投資正在成為全球資本市場最活躍的板塊之一,而香港有條件成為亞太 AI 資本配置的重要樞紐。
本文要點總結
- Google DeepMind 在 2026 年 1 月底至 2 月初以前所未有的速度完成三宗 AI 交易:收購 CSM(3D 空間 AI)、與 Hume AI 達成授權協議(情感語音 AI)、以及與 Sakana AI 建立合作(日本 AI 研究)。
- CSM 的 2D 轉 3D 技術將強化 Gemini 的空間理解能力,應用於 Google Maps、AR 平台和 Waymo 自動駕駛。
- Hume AI 的 CEO 和核心工程師加入 Google,專注提升 Gemini 的情感辨識和表達性語音合成能力,打造「有溫度」的 AI 互動體驗。
- Sakana AI 由 Transformer 論文共同作者 Llion Jones 和前 Google Brain 研究員 David Ha 創立,合作為 Google 帶來研究創新力和日本市場洞察。
- 三宗交易背景是 Google 1,850 億美元資本支出計劃和 Cloud 積壓訂單翻倍至 2,400 億美元的大擴張格局。
- Google 從有機成長轉向積極 M&A 策略,反映了 AI 軍備競賽的白熱化,以及與 Microsoft(OpenAI)、Amazon(Anthropic)、Meta(Llama 開源)的全面競爭。
- 對香港而言,Google 在亞太加碼 AI 投資帶來機遇,情感 AI 的粵語適配、3D 空間 AI 和 AI 資本配置樞紐地位都是值得關注的方向。