MiniMax M2.5：中國開源 AI 模型以 Claude 三十三分之一的價格挑戰前沿性能

2026 年 2 月，中國 AI 公司 MiniMax 發布了其最新一代大型語言模型 M2.5，再次為全球 AI 產業投下一枚重磅炸彈。這個擁有 2300 億參數的開源模型，在多項權威基準測試中取得了與 Claude Opus 4.6、GPT-5.2 和 Gemini 3 Pro 相媲美甚至超越的成績——而其 API 定價僅為 Anthropic 旗艦模型的三十三分之一。更具象徵意義的是，M2.5 以 MIT 許可證開放模型權重，意味着任何人都可以自由地下載、修改和商業化使用這一模型。

消息公布後，MiniMax 在香港聯交所的股價一度飆升 15.7%，收報每股 680 港元。作為 2026 年 1 月才登陸港交所的新晉上市公司，MiniMax 的市場表現印證了投資者對中國 AI 開源模型商業價值的認可。但在這場資本市場的狂歡背後，更值得深思的問題是：當一個開源模型能夠以前沿閉源模型三十三分之一的價格提供接近同等的性能時，全球 AI 產業的定價邏輯、商業模式乃至競爭格局，是否正在發生根本性的重構？

技術架構：2300 億參數中僅激活 100 億

M2.5 的技術核心在於其精巧的 Mixture of Experts（MoE，混合專家）架構。傳統的「密集型」大型語言模型在每次推理時都會動用全部參數——這意味着一個 2300 億參數的模型在處理每一個請求時，都需要 2300 億個參數全部參與運算，所需的計算資源和能耗可想而知。MoE 架構則採用了一種截然不同的策略：模型內部被劃分為多個「專家」子網絡，每次推理時，一個智能路由機制會根據輸入內容的特性，僅選擇最相關的專家子網絡進行激活。

在 M2.5 的實現中，模型雖然擁有 2300 億的總參數量，但在處理每個具體任務時，實際激活的參數僅約 100 億。這意味着 M2.5 在任何時刻的實際計算負載僅相當於一個 100 億參數的「小型」模型——但它能夠調用的知識和能力儲備，卻是一個 2300 億參數巨型模型的完整規模。這一設計使得 M2.5 在推理效率上獲得了巨大的優勢：更少的計算意味着更低的硬體需求、更低的能耗、更快的回應速度，以及——最終——更低的使用價格。

值得注意的是，MoE 架構本身並非 MiniMax 的獨創。Google 的 Switch Transformer、Mixtral 等模型都曾採用類似的技術路線。但 M2.5 的亮點在於，它在 MoE 架構的基礎上實現了極高的壓縮比（23:1）——每 23 個總參數中僅需激活 1 個——同時在基準測試中保持了與全參數激活的頂級閉源模型相當的性能水平。這一工程成就表明，MiniMax 的研究團隊在稀疏激活的路由機制設計、專家網絡的訓練策略以及負載平衡優化等方面，積累了相當深厚的技術能力。

                        M2.5 核心技術規格
                        總參數量：2300 億（230B）
每任務激活參數：約 100 億（10B），壓縮比 23:1
架構類型：Mixture of Experts（MoE）稀疏激活
開源許可：MIT 許可證（最寬鬆的開源許可之一，允許自由商用）
M2.5-Lightning 變體：推理速度 100 tokens/秒，為同類競品的 2 倍
Lightning 運營成本：每小時持續運行僅需 1 美元
API 定價：每百萬輸入 tokens 0.15 美元（對比 Claude Opus 4.6 的 5.00 美元）

                    

基準測試：多項成績超越矽谷對手

M2.5 在多項業界公認的基準測試中展現了令人矚目的表現。在軟體工程能力的核心衡量指標 SWE-Bench Verified 中，M2.5 取得了 80.2% 的成績；在衡量 AI 代理實際任務執行能力的 Droid 測試中達到 79.7%；在 OpenCode 編程基準測試中達到 76.1%。這些數字表明，M2.5 在代碼理解、生成和調試等軟體工程核心任務上，已經具備了接近甚至比肩頂級閉源模型的實力。

更值得關注的是 M2.5 在兩項特定基準測試中擊敗了所有主要競爭對手。在 BrowseComp（瀏覽器環境任務理解與操作）測試中，M2.5 以 76.3% 的成績超越了 GPT-5.2、Gemini 3 Pro 和 Claude Opus 4.6。在 BFCL（Berkeley Function Calling Leaderboard，函數調用能力排行榜）中，M2.5 同樣以 76.8% 的成績位居榜首。函數調用能力是 AI Agent（智能代理）應用的核心基石——一個能夠準確理解和調用外部工具的模型，才能在真實的業務場景中充當自主執行任務的「數字員工」。

「當一個開源模型在 BrowseComp 和 BFCL 這類實際應用導向的測試中擊敗所有閉源對手時，這不僅是技術層面的突破，更是對整個 AI 產業商業模式的根本性挑戰。閉源模型的核心賣點是『我們的模型更強，所以值得付出溢價』——但如果開源模型同樣強大甚至更強，這一溢價的正當性就會受到嚴重質疑。」

M2.5-Lightning：速度與成本的雙重突破

除了標準版 M2.5 之外，MiniMax 還推出了 M2.5-Lightning 變體，專為高吞吐量和低延遲的應用場景進行了優化。M2.5-Lightning 的推理速度達到每秒 100 個 tokens，是同等能力級別競品的兩倍。這一速度意味着，在即時對話、實時翻譯、代碼自動補全等對延遲敏感的應用中，M2.5-Lightning 能夠提供顯著更流暢的用戶體驗。

更引人注目的是 M2.5-Lightning 的運營成本。MiniMax 宣稱，持續運行 M2.5-Lightning 的成本僅為每小時 1 美元。這一數字意味着，一家初創公司可以以每天 24 美元、每月約 720 美元的成本，獲得一個全天候運行的、性能接近前沿水準的 AI 模型服務。相比之下，使用 Claude Opus 4.6 或 GPT-5.2 的 API 進行同等規模的持續調用，月費可能輕鬆達到數萬美元。這種數量級的成本差異，對於預算有限的初創企業和中小型公司而言，可能意味着 AI 應用從「用不起」到「用得起」的質變。

定價衝擊：33 倍的價差意味着什麼

M2.5 最具衝擊力的數字或許不是任何一項基準測試分數，而是其 API 定價：每百萬輸入 tokens 僅 0.15 美元。作為對比，Anthropic 的旗艦模型 Claude Opus 4.6 的同一指標為 5.00 美元——M2.5 便宜了整整 33 倍。

這種價格差異的影響是多維度的。在個人開發者層面，一個使用 M2.5 API 構建側項目的開發者，可能用一杯咖啡的錢就能完成以前需要一頓高級餐費的 API 調用量。在企業層面，一家每月在 AI API 上支出 10 萬美元的公司，切換到 M2.5 後理論上可以將這一支出降至約 3,000 美元——或者以同樣的預算獲得 33 倍的調用量。在產業層面，如此懸殊的價格差異正在推動一些美國初創公司重新評估其技術棧選擇，部分企業已經開始將工作負載遷移到中國模型上。

當然，定價只是決策的一個維度。模型的可靠性、數據安全性、合規風險、技術支持質量、上下文窗口大小、以及在特定垂直領域的專業表現等因素，都會影響企業的最終選擇。但 33 倍的價差足以讓幾乎所有理性的技術決策者至少「認真評估一下」——而這正是 MiniMax 所追求的效果。

                        API 定價對比（每百萬輸入 tokens）
                        MiniMax M2.5：$0.15
Claude Opus 4.6（Anthropic）：$5.00（比 M2.5 貴 33 倍）
M2.5-Lightning 持續運行成本：$1/小時（約 $720/月）
推理速度（M2.5-Lightning）：100 tokens/秒（競品的 2 倍）

                    

MiniMax 的崛起：從 SenseTime 到港交所

要理解 M2.5 的發布背景，有必要回顧 MiniMax 這家公司的成長軌跡。MiniMax 成立於 2021 年，由一批從商湯科技（SenseTime）離開的研究人員創辦，總部位於上海。商湯科技作為中國計算機視覺和深度學習領域的先驅企業，為 MiniMax 的創始團隊提供了紮實的技術功底和行業經驗。

從成立之初，MiniMax 就選擇了一條與商湯不同的道路——聚焦於大型語言模型和生成式 AI，而非計算機視覺。在短短五年內，MiniMax 從一家籍籍無名的初創公司成長為中國 AI 領域的重要玩家，並於 2026 年 1 月成功在香港聯交所（HKEX）上市。這一上市時間節點恰逢全球資本市場對 AI 股票的熱情高漲，MiniMax 得以在有利的市場環境中完成上市融資。

M2.5 的發布是 MiniMax 上市後交出的第一份重磅技術答卷。股價在消息公布後飆升 15.7% 至每股 680 港元，顯示市場對這一成果的高度認可。對於關注港股 AI 板塊的投資者而言，MiniMax 的表現提供了一個有趣的投資案例——一家擁有前沿技術、激進定價策略和開源社區影響力的中國 AI 公司，如何在港交所的平台上實現價值發現。

MiniMax 的內部實踐：AI 自主化的先行者

M2.5 不僅是一個對外銷售的產品，更是 MiniMax 內部運營的核心工具。公司聲稱，其內部約 30% 的日常任務已經由 M2.5 自主完成，無需人類干預。在軟體開發方面，MiniMax 新近提交的代碼中有 80% 是由 M2.5 生成的——人類工程師的角色越來越多地轉向代碼審查、架構設計和需求定義，而非逐行編寫代碼。

這些數字如果屬實，代表着 AI 在實際企業運營中的應用深度已經達到了一個新的里程碑。30% 的任務自主完成意味着 MiniMax 的每一位員工實際上都配備了一個高效的 AI「同事」，而 80% 的 AI 生成代碼則表明，在軟體開發這一 AI 公司最核心的生產活動中，人機協作的天平已經明顯向機器一側傾斜。當然，外界對這些數字的真實性和可持續性仍持保留態度——自我報告的內部指標往往帶有宣傳成分——但即便打一定的折扣，M2.5 在 MiniMax 內部的深度應用仍然是一個值得關注的信號。

爭議陰影：模型蒸餾與知識產權之爭

M2.5 的輝煌成績單並非沒有陰影。在 M2.5 發布前後，一個不容迴避的背景是：Anthropic 公開披露，其安全團隊發現包括 MiniMax 在內的多家中國 AI 實驗室創建了超過 24,000 個虛假帳戶，大規模調用 Claude 的 API 以進行模型蒸餾（distillation）——即利用 Claude 的輸出作為訓練數據來提升自身模型的性能。

模型蒸餾是 AI 領域一個存在已久且界限模糊的技術實踐。從技術角度看，一個模型的輸出一旦被生成，就成為了可被觀察和利用的公開信息。但從商業和倫理角度看，大規模地、系統性地利用競爭對手的付費服務來訓練自己的模型，無疑觸及了知識產權保護和公平競爭的敏感地帶。Anthropic 的指控使得 M2.5 的部分基準測試表現——尤其是那些超越 Claude 的項目——蒙上了一層疑雲：這些性能提升有多少來自 MiniMax 自身的技術創新，又有多少來自對 Claude 輸出的學習和模仿？

「模型蒸餾的爭議折射出 AI 行業一個深層的結構性矛盾：在開放研究和商業競爭之間、在技術共享和知識產權保護之間，行業尚未建立起清晰的規則和共識。隨着模型性能的商業價值越來越高，這一灰色地帶的衝突只會越來越激烈。」

MiniMax 方面並未對蒸餾指控作出公開的正面回應。但值得指出的是，M2.5 的 MoE 架構設計和推理效率優化，是明確的、可驗證的工程創新，與模型蒸餾屬於不同的維度。一個模型可以在訓練數據方面存在爭議的同時，在架構設計方面擁有真正的原創性。外界對 M2.5 的評價需要在這兩個維度上分別進行，而非簡單地一筆勾銷。

產業影響：開源價格戰重塑競爭格局

閉源模型的定價壓力

M2.5 的發布加劇了閉源 AI 模型提供商面臨的定價壓力。Anthropic、OpenAI 和 Google 長期以來依靠技術護城河維持較高的 API 定價，將模型性能的領先優勢轉化為溢價收入。但當開源模型的性能逐步逼近甚至在某些維度超越閉源模型時，這一定價邏輯就面臨挑戰。33 倍的價差不僅是數字上的差距，更是一個心理和戰略上的信號：它迫使所有 AI 模型提供商重新思考，自己的定價究竟是基於真實的技術差異化，還是基於暫時的市場信息不對稱。

事實上，我們已經觀察到部分美國初創公司開始將非核心工作負載遷移到中國開源模型上。這些公司的邏輯很直接：如果一個中國開源模型能夠以三十分之一的價格完成 90% 甚至 95% 的任務，那麼將核心的、對質量要求最高的 5-10% 任務留給 Claude 或 GPT，其餘全部轉移到低成本模型上，就能在整體上大幅降低 AI 支出，同時保持足夠的服務質量。這種「分層使用」策略可能成為越來越多企業的標準做法。

中美 AI 競爭的新維度

M2.5 的發布也為中美 AI 競爭增添了新的維度。過去，這場競爭主要圍繞模型能力展開——誰的模型更強、更智能。但 MiniMax 的策略表明，競爭的焦點正在向成本效率轉移。在美國出口管制限制中國獲取最先進 GPU 的背景下，中國 AI 公司被迫在有限的算力條件下追求最大的效率——而 MoE 架構正是這一約束條件下的最優解之一。受制於硬體限制而被「逼」出來的效率創新，反而成為了中國 AI 模型在國際市場上的核心競爭優勢。

這一動態創造了一個頗具諷刺意味的局面：美國的出口管制本意是延緩中國 AI 的發展，但它在客觀上激勵了中國 AI 公司在架構效率和推理優化方面的創新，使得中國模型在成本維度上建立了顯著的競爭優勢。當中國模型以極低的價格吸引美國和全球的用戶時，出口管制的戰略效果就被部分抵消了。

香港視角：港交所的 AI 新貴

對香港金融市場而言，MiniMax 是一個值得密切關注的案例。作為 2026 年 1 月才在港交所上市的公司，MiniMax 在上市後不到兩個月就發布了一款引發全球關注的旗艦模型，股價單日飆升 15.7%——這在香港上市的科技股中是相當亮眼的表現。

MiniMax 選擇在港交所而非美國上市，反映了中國 AI 公司在中美地緣政治博弈中的戰略考量。在當前的政治環境下，一家被指控蒸餾美國 AI 公司模型的中國 AI 公司，在美國上市的可能性和可行性都非常有限。港交所為這類公司提供了一個重要的替代平台——既能進入國際資本市場，又能避開中美關係最敏感的觸點。

對於香港的 AI 產業生態而言，MiniMax 的港交所上市具有示範效應。它表明，香港的資本市場有能力承接中國前沿 AI 公司的上市需求，也有足夠的投資者基礎來支撐這類公司的估值。隨着更多中國 AI 公司考慮上市融資，港交所有可能成為中國 AI 產業的主要上市目的地之一。

對於在港的企業用戶和開發者而言，M2.5 的開源和低價策略提供了直接的實用價值。香港的科技初創公司、金融科技企業和研究機構，都可以以極低的成本部署和使用 M2.5，或者基於其開源權重進行定制化微調。MIT 許可證意味着不存在商業使用上的法律障礙——這對於重視合規性的香港企業而言是一個重要的考量因素。

                        M2.5 基準測試成績與競品對比
                        SWE-Bench Verified（軟體工程）：80.2%
Droid（AI 代理任務執行）：79.7%
OpenCode（編程能力）：76.1%
BrowseComp（瀏覽器任務）：76.3% — 超越 GPT-5.2、Gemini 3 Pro、Claude
BFCL（函數調用排行榜）：76.8% — 超越 GPT-5.2、Gemini 3 Pro、Claude

                    

關鍵要點與前瞻

MiniMax M2.5 的發布是 2026 年至今全球 AI 產業最具衝擊力的事件之一。它不僅在技術層面展示了 MoE 架構的巨大潛力，更在商業層面提出了一個尖銳的問題：當開源模型的性能接近閉源模型而價格僅為其三十分之一時，閉源模型的商業邏輯還能維持多久？

然而，M2.5 的故事也並非全然正面。模型蒸餾的爭議為其技術成就蒙上了陰影，而 Anthropic 的指控——如果屬實——也凸顯了全球 AI 行業在知識產權保護方面面臨的嚴峻挑戰。在缺乏國際共識和有效執行機制的情況下，類似的爭議只會越來越多。

對於香港而言，MiniMax 的港交所上市和 M2.5 的發布是雙重利好：既豐富了港股 AI 板塊的投資標的，也為本地的 AI 應用生態帶來了高性價比的模型選擇。在中美 AI 技術分叉持續加深的大背景下，香港在兩個生態系統之間的橋樑角色將變得更加重要——無論是在技術採用、資本流動還是人才匯聚方面。

展望未來，M2.5 的成功將激勵更多中國 AI 公司採取類似的「開源 + 極致低價」策略。這場由中國 AI 公司發起的價格戰，可能迫使 Anthropic、OpenAI 和 Google 重新調整定價策略，最終的受益者將是全球數以百萬計的 AI 開發者和企業用戶。但在享受低價紅利的同時，行業也需要正視模型蒸餾、數據安全和技術主權等深層問題，為 AI 產業的長期健康發展建立更加完善的規則框架。

無論如何，MiniMax M2.5 已經清晰地傳遞了一個信息：在全球 AI 競賽中，中國玩家不僅在技術上步步逼近，更在成本效率上建立了令人難以忽視的優勢。這場競賽的下一章節將如何展開，值得所有 AI 從業者和觀察者的持續關注。