← 返回新聞列表

World Labs 融資 10 億美元,Marble 世界模型平台正式商用——李飛飛的空間智能願景與 Autodesk 3D 革命

被譽為「AI 教母」的李飛飛(Fei-Fei Li)創辦的 World Labs 於 2026 年 2 月完成 10 億美元融資,Autodesk 單獨注資 2 億美元。旗艦產品 Marble 是全球首個正式商用的世界模型平台,能從文字、圖像或影片提示生成可持久保存、可下載匯出的完整 3D 環境。從遊戲引擎到 VR 頭戴裝置,從數碼孿生到機器人訓練場,2026 年正迅速成為「世界模型元年」。

從「理解文字」到「理解世界」:李飛飛為何押注空間智能

在 AI 領域,李飛飛的名字幾乎等同於「視覺智能」本身。2009 年,她主導創建的 ImageNet 資料集——超過 1,400 萬張標註圖像——直接催化了深度學習革命。2012 年 AlexNet 在 ImageNet 大規模視覺辨識挑戰賽上的驚人表現,被公認為現代 AI 浪潮的起點。此後,她出任 Google Cloud 首席科學家,再回歸史丹福大學執掌人類中心 AI 研究所(HAI)。然而,在學術聲望與產業影響力都已達到頂峰之際,李飛飛做出了一個令不少同行意外的決定:成立 World Labs,全力投入「空間智能」(Spatial Intelligence)。

這個決定的根源在於一個深刻的學術洞見。李飛飛多年來觀察到,大型語言模型(LLM)雖然在文字處理能力上突飛猛進,卻存在一個根本性的缺陷——它們沒有三維空間的感知能力。它們能夠寫出關於引力波的精確論文,卻無法判斷一個杯子放在桌角會不會掉落。它們可以描述一座城市的歷史脈絡,卻「看不見」街道的縱深與建築的高低錯落。換言之,LLM 學會了語言世界的統計規律,卻對語言所描述的物理世界一無所知。

「如果 AI 要真正有用,它必須理解世界,而不僅僅是文字。」——李飛飛(Fei-Fei Li)

這句話精準地概括了 World Labs 的核心命題。空間智能的目標,是讓 AI 系統像人類嬰兒一樣,在語言之前就建立起對空間深度、物體持久性、物理因果的直覺理解。嬰兒在學會說出「球」這個詞之前,就已經知道球滾到沙發下面並不會消失——這種前語言的物理認知,正是世界模型試圖賦予機器的能力。

Marble:全球首個商用世界模型平台的誕生

2025 年 11 月,World Labs 正式推出 Marble——全球第一個面向商業用途的世界模型平台。Marble 的核心能力是:使用者提供文字描述、圖像或影片提示,系統便能生成一個完整的、物理上自洽的 3D 環境。關鍵的區別在於,Marble 生成的並非只能即時瀏覽的串流畫面,而是可以持久保存、反覆編輯、直接下載匯出的完整 3D 資產。

這一特性的技術含義深遠。在 Marble 出現之前,其他世界模型(如早期的 Genie 系列)更接近「即時渲染」——系統根據使用者的輸入即時生成畫面,但這些畫面並不構成一個持久的、可操作的 3D 場景。Marble 打破了這個局限。使用者可以生成一座中世紀城堡,保存它,三天後回來繼續修改護城河的寬度,然後匯出到 Unreal Engine 或 Unity 進行進一步的遊戲開發。這種「生成——保存——編輯——匯出」的完整工作流程,讓 Marble 真正跨入了生產力工具的範疇。

AI 原生編輯工具與混合 3D 編輯器

Marble 不僅僅是一個生成器,它還配備了一套 AI 原生的編輯工具和混合式 3D 編輯器。所謂「AI 原生」,指的是編輯操作本身也由 AI 驅動——使用者可以用自然語言指令修改場景(例如「把天空改成黃昏色調」或「在廣場中央加一座噴泉」),而不需要手動操作 3D 建模軟件的複雜介面。同時,「混合式」意味着系統也保留了傳統 3D 編輯器的精確控制能力,專業設計師可以在 AI 生成的基礎上進行細緻的手動調整。

Marble 還支援多圖像提示(Multi-Image Prompting)功能——使用者可以為 3D 世界的不同區域提供不同的參考圖像。例如,為城市的商業區提供一張東京新宿的照片,為住宅區提供一張歐洲小鎮的照片,為海濱區提供一張邁阿密的照片,Marble 會將這些風格元素融合成一個連貫的、統一的 3D 環境。這種多源提示的能力,讓設計師能夠以前所未有的精細度控制生成結果,而不是完全依賴系統的「隨機發揮」。

Marble 平台核心功能一覽

  • 輸入方式:文字描述、圖像、影片提示,支援多圖像組合提示
  • 輸出格式:可持久保存、可下載的完整 3D 環境資產
  • 編輯能力:AI 原生自然語言編輯 + 混合式 3D 手動編輯器
  • 引擎相容:支援匯出至 Unreal Engine、Unity
  • VR 支援:Apple Vision Pro、Meta Quest 3
  • 推出時間:2025 年 11 月正式商用

10 億美元融資:Autodesk 為何押注 2 億美元

2026 年 2 月,World Labs 宣布完成 10 億美元融資。這輪融資的投資者陣容本身就是一份值得細讀的產業地圖:AMD、Emerson Collective、Fidelity、NVIDIA——每一個名字背後都代表着不同的產業邏輯與戰略考量。但其中最引人注目的,無疑是 Autodesk 以 2 億美元的單筆投資佔據了整輪融資五分之一的份額。

Autodesk 是全球設計軟件產業的絕對霸主。AutoCAD、Revit、Maya、3ds Max——這些名字在建築、工業設計、影視特效領域如同空氣般不可或缺。Autodesk 出資 2 億美元,首先瞄準的是娛樂產業的應用場景。影視製作中,虛擬場景的搭建是最耗時、最昂貴的環節之一。一部好萊塢大片的虛擬環境製作可能需要數百名 3D 藝術家工作數月之久。如果 Marble 的世界生成能力被整合到 Autodesk 的 Maya 或 3ds Max 工作流程中,這個環節的效率提升可能是數量級的——從「月」縮短到「天」,甚至「小時」。

但 Autodesk 的野心顯然不止於娛樂。其核心業務——建築設計(Revit)和工程設計(Fusion)——同樣可以受益於世界模型技術。建築師可以用自然語言描述一座建築的概念,Marble 生成初始的 3D 方案,然後在 Revit 中進行精確的結構工程調整。這種「AI 概念生成 + 傳統工具精細化」的混合工作流程,很可能成為未來設計行業的標準範式。

NVIDIA 和 AMD 的同時參投,延續了兩大 GPU 巨頭在世界模型賽道上的罕見共識。世界模型的訓練和推理對 GPU 算力的需求遠超 LLM——生成一個物理上自洽的 3D 環境需要同時處理幾何建模、材質渲染、光線追蹤和物理模擬等多個計算密集型任務。投資 World Labs,對這兩家晶片公司而言,既是技術方向的押注,也是未來硬件需求的播種。Emerson Collective(由 Laurene Powell Jobs 創辦的影響力投資機構)和 Fidelity(管理超過 4 萬億美元資產的基金巨頭)的加入,則分別代表了社會影響力資本和長線機構資本對世界模型方向的認可。

定價策略解讀:從免費到專業的四級階梯

Marble 的定價體系採用了 SaaS 行業經典的「免費增值」模式,分為四個層級:

  • 免費方案(Free):提供 4 次 3D 環境生成配額,讓使用者零成本體驗核心功能
  • 標準方案(Standard):每月 20 美元,適合個人創作者和獨立開發者
  • 專業方案(Pro):每月 35 美元,面向需要更高生成量和進階編輯功能的專業用戶
  • 旗艦方案(Max):每月 95 美元,針對工作室和團隊,提供最大生成配額和完整匯出功能

這個定價策略透露出幾個重要訊號。首先,World Labs 選擇了一個相對親民的價格區間。相比之下,專業 3D 建模軟件的年度授權費用動輒數千甚至上萬美元。Marble 的 Max 方案一年也只需 1,140 美元,這意味着即使是資金有限的獨立遊戲開發者或小型設計工作室,也能負擔得起這項技術。其次,免費方案的 4 次生成配額是一個經過精心計算的「鉤子」——足以讓使用者親身體驗世界模型的驚人能力,但不足以完成一個完整項目,從而推動付費轉化。

更值得注意的是,Marble 的定價暗示了其商業模式的核心假設:世界模型的價值不在於生成本身,而在於生成之後的工作流程——編輯、匯出、整合到下游工具中。這解釋了為什麼 World Labs 如此強調 Unreal Engine 和 Unity 的相容性:當使用者在 Marble 中生成的 3D 環境能夠無縫匯入主流遊戲引擎和設計軟件時,Marble 就不再是一個獨立的「玩具」,而是整個數碼內容生產管線中不可或缺的起點。

VR 與遊戲引擎相容:從實驗室到生產線

Marble 的技術架構從一開始就考慮了與主流生產工具的深度整合。其 3D 環境可以直接匯出到 Unreal Engine 和 Unity——全球兩大主流遊戲引擎,合計佔據了超過 90% 的互動 3D 內容開發市場。這一點至關重要,因為它意味着 Marble 生成的資產不是封閉的、只能在 Marble 生態系統內使用的格式,而是可以融入現有的、成熟的開發流程。

在 VR/AR 領域,Marble 支援 Apple Vision Pro 和 Meta Quest 3 這兩款目前市場上最重要的頭戴裝置。使用者可以在 Marble 中生成一個 3D 環境,然後直接在 Vision Pro 或 Quest 3 中沉浸式體驗和評估這個環境。對於建築設計師而言,這意味着可以在幾分鐘內從一段文字描述走到「站在設計方案中環顧四周」的體驗;對於遊戲設計師而言,這意味着關卡原型可以在當天就被團隊成員戴上頭盔實際走訪和測試。

「空間計算時代最大的瓶頸不是硬件,而是內容。頭戴裝置已經準備就緒,但能夠填充虛擬世界的 3D 內容嚴重匱乏。Marble 的定位,正是成為空間計算時代的內容基礎設施。」——World Labs 產品願景文件

這個觀察精準地指出了 Marble 的戰略卡位。Apple Vision Pro 和 Meta Quest 3 各自擁有龐大的硬件生態系統,但兩者都面臨同一個挑戰:高品質 3D 內容的供應不足。傳統 3D 內容製作的高門檻和長周期,意味着空間計算平台上的內容豐富度遠遠落後於硬件的能力。Marble 通過將 3D 內容的生成從「手工匠人」模式升級為「AI 工廠」模式,有潛力從根本上解決這個供需失衡。

機器人訓練場:數碼孿生的殺手級應用

Marble 最具長期戰略意義的應用場景,或許不在娛樂或設計領域,而在機器人訓練。訓練一個能夠在真實世界中可靠運作的機器人,需要海量的模擬環境數據。機器人必須在數以萬計的不同場景中反覆練習——不同的房間佈局、不同的光照條件、不同的物體擺放方式、不同的地面材質——才能建立起足夠強健的泛化能力。

傳統方法是由工程師手動構建這些模擬環境,或者使用程序化生成(Procedural Generation)隨機組合預設的模組。兩種方法各有局限:手動構建成本高昂且多樣性有限;程序化生成雖然效率較高,但生成的環境往往缺乏真實感和物理上的合理性。Marble 開闢了第三條路徑——使用世界模型生成物理上自洽、視覺上逼真、多樣性幾乎無限的訓練環境。

想像一個家用服務機器人的開發團隊。他們可以向 Marble 輸入「一個典型的香港 400 呎公寓,廚房與客廳相連,地上有一雙拖鞋和一個購物袋」這樣的提示,Marble 會生成一個完整的 3D 環境。然後他們可以用 Marble 的 AI 編輯工具快速變換數百種不同的佈局——「把沙發移到窗邊」、「地板改成木質」、「增加一隻貓」——為機器人創造出數百個訓練場景。這些場景可以直接匯入機器人模擬器,讓機器人在其中練習導航、物體識別和操作。

這正是數碼孿生(Digital Twin)概念在機器人領域的殺手級實現。有業界分析預測,到 2027 年,大多數工業機器人的訓練環境將在 Marble 等世界模型平台中生成,而非手動建造。這個預測是否過於樂觀暫且不論,但方向幾乎確定無疑:世界模型將徹底改變機器人訓練的經濟學和效率曲線。

Marble 在機器人訓練領域的優勢

  • 多樣性:通過自然語言提示快速生成數千個不同配置的訓練環境
  • 物理自洽性:生成的環境具備合理的物理屬性(重力、碰撞、摩擦係數等)
  • 成本效益:單個環境的生成成本從「數千美元」降至「幾美元」
  • 迭代速度:AI 編輯工具讓環境修改從「小時」縮短到「分鐘」
  • 匯出相容:直接匯入 Unreal Engine / Unity 基礎的機器人模擬器

競爭格局:2026 年為何被稱為「世界模型元年」

World Labs 和 Marble 並非在真空中運作。2026 年之所以被業界稱為「世界模型元年」,是因為多條技術路線同時進入了商業化階段,形成了一個前所未有的競爭密度。

Google DeepMind 的 Genie 3 在 2026 年初向公眾開放,能夠從文字描述即時生成可互動的 3D 環境。Genie 3 的技術路線與 Marble 有所不同——它更偏向即時串流生成,而非持久化的 3D 資產匯出。這意味着 Genie 3 在互動體驗和娛樂場景中可能表現更佳,但在生產力工具和下游整合方面,Marble 的持久化資產模式佔據明顯優勢。

Yann LeCun 的 AMI Labs 則代表了另一條哲學路線。LeCun 長期主張,真正的世界理解需要建立在他提出的「聯合嵌入預測架構」(JEPA)之上,而非現有的生成式方法。AMI Labs 的目標不是生成 3D 場景,而是建立一個能夠內部模擬世界狀態演變的「心智模型」。這條路線的時間線更長,但如果成功,其影響可能更加根本。

NVIDIA 的 Cosmos 平台 則走的是基礎設施路線。Cosmos 提供了世界模型開發所需的基礎架構——預訓練的基礎模型、物理模擬引擎、渲染管線——讓其他開發者在此基礎上構建自己的世界模型應用。有趣的是,NVIDIA 既投資了 World Labs,又在開發 Cosmos 作為通用平台,形成了「既是投資者,又是潛在競爭者」的複雜關係。

這些不同的技術路線——Marble 的持久化資產生成、Genie 3 的即時串流、AMI Labs 的認知架構、Cosmos 的基礎設施平台——並非零和競爭。它們更可能演變為世界模型生態系統的不同層級,就像今天的雲端運算生態由基礎設施(AWS)、平台(Kubernetes)和應用(SaaS 工具)多層共存一樣。

技術路線比較:四大世界模型方向

2026 年主要世界模型技術路線對比

  • World Labs Marble:持久化 3D 資產生成 + AI 編輯 + 多引擎匯出。商業模式:SaaS 訂閱
  • Google DeepMind Genie 3:即時串流互動 3D 環境生成。優勢:低延遲體驗。局限:資產持久化較弱
  • Yann LeCun AMI Labs:JEPA 架構驅動的認知世界模型。目標:通用世界理解。時間線:較長
  • NVIDIA Cosmos:世界模型基礎設施平台。定位:為其他開發者提供建構基礎

香港創意與科技產業的啟示

世界模型的商業化浪潮,對香港的創意產業和科技生態帶來了幾個值得深思的啟示。

影視與動畫製作:香港曾是亞洲電影工業的重鎮,近年雖然面臨資金和人才的挑戰,但在視覺特效和動畫領域仍保有一定的技術積累。Marble 及其與 Autodesk 的合作——首先聚焦於娛樂應用——直接降低了虛擬場景製作的門檻和成本。一個三至五人的本地視覺特效團隊,借助 Marble 的 Max 方案(每月不到 800 港元),可能在場景生成效率上接近過去需要三十人團隊才能達到的水準。這對於資源有限但創意不缺的香港小型工作室而言,是一個巨大的機遇窗口。

建築與城市設計:香港的建築設計行業已經廣泛使用 Autodesk 的產品線。當 Marble 的世界生成能力被整合到 Revit 或 Maya 的工作流程中時,香港的建築師將是最早的受益者之一。特別是在香港這種超高密度城市環境中,能夠快速生成和比較不同設計方案的 3D 模擬,對於應對複雜的空間約束和規劃審批流程具有實際價值。

機器人與自動化:香港的物流、零售和餐飲行業正面臨嚴峻的勞動力短缺。服務機器人和物流機器人的需求日益增長,但在香港特有的狹窄空間和複雜樓宇結構中部署機器人,需要大量的場景模擬和測試。Marble 能夠根據香港特有的空間特徵(例如唐樓樓梯間、商場扶手電梯、街市通道)生成訓練環境,這對本地機器人開發者而言是極有價值的工具。

教育與培訓:香港的大學和職業培訓機構可以利用世界模型技術構建沉浸式教學環境。醫學生可以在 AI 生成的手術室中練習空間判斷,工程專業學生可以在虛擬工地中學習結構安全評估。配合 Vision Pro 或 Quest 3,這些場景可以轉化為真正的沉浸式培訓體驗。

展望與關鍵要點

World Labs 的 10 億美元融資和 Marble 的正式商用,標誌着世界模型技術從學術概念走向產業現實的關鍵轉折。李飛飛再一次展示了她將前沿研究轉化為產業基礎設施的獨特能力——正如 ImageNet 為視覺 AI 奠定了基石,Marble 有潛力成為空間智能時代的基礎設施。

但也必須看到風險。世界模型的技術路線尚未收斂,計算成本依然高昂,評估標準仍在建立中。Marble 的持久化資產模式是否會成為行業標準,抑或被 Genie 3 的即時串流模式或 LeCun 的認知架構所取代,目前尚無定論。Autodesk 的 2 億美元投資雖然首先瞄準娛樂場景,但其長期價值取決於 Marble 技術能否真正融入設計專業人員的日常工作流程。

2026 年作為「世界模型元年」,其意義不在於某一款產品的成敗,而在於整個產業開始系統性地從「理解文字」轉向「理解世界」。對於香港的創意工作者、科技從業者和教育界人士而言,現在是開始認真學習和實驗這項技術的最佳時機——不是因為世界模型已經成熟,而是因為早期參與者往往在技術成熟時佔據最有利的位置。

本文要點總結

  • 李飛飛創辦的 World Labs 於 2026 年 2 月完成 10 億美元融資,投資者包括 Autodesk(2 億美元)、AMD、Emerson Collective、Fidelity 和 NVIDIA。
  • 旗艦產品 Marble 於 2025 年 11 月推出,是全球首個商用世界模型平台,支援從文字、圖像或影片提示生成可持久保存、可下載匯出的 3D 環境。
  • Marble 配備 AI 原生編輯工具和混合 3D 編輯器,支援多圖像提示,可匯出至 Unreal Engine 和 Unity,相容 Apple Vision Pro 和 Meta Quest 3。
  • 定價分四級:免費(4 次生成)、Standard($20/月)、Pro($35/月)、Max($95/月),採用 SaaS 免費增值模式。
  • Autodesk 合作首先聚焦娛樂應用,長期目標涵蓋建築與工業設計。機器人訓練是另一殺手級應用:預測到 2027 年大多數工業機器人將在 Marble 等平台生成的數碼孿生中訓練。
  • 競爭格局包括 Google DeepMind Genie 3(即時串流)、Yann LeCun 的 AMI Labs(認知架構)和 NVIDIA Cosmos(基礎設施平台),2026 年被稱為「世界模型元年」。
  • 香港的影視製作、建築設計、機器人部署和教育培訓領域均可受益於世界模型技術的商業化,現在是開始實驗和佈局的最佳時機。