據彭博社和 ZDNet 報導,中國 AI 新創公司 DeepSeek 正在準備於 2026 年底前發布一款完全自主的 AI 代理系統。這不會只是另一個聊天機器人——而是一個完整的 Agentic AI 系統,能夠自主執行複雜任務。
回顧「DeepSeek 時刻」
2026 年 1 月,DeepSeek R1 的發布在 AI 業界引發了被稱為「DeepSeek 時刻」的震撼。這個術語現已成為 AI 創業者和開發者頻繁使用的詞彙——一個代表突破性成就的標竿。
DeepSeek R1 為何震撼業界
- 完整推理步驟:可展示其完整的推理過程
- 超越競爭對手:在多項基準測試中超越 GPT-4 o1-mini
- 成本極低:訓練成本僅 600 萬美元,遠低於 GPT-4 的數億美元
- 開源發布:採用 MIT 授權,允許無限制商業使用
R1 發布後迅速登上 App Store 和 Google Play 免費應用榜首,在數十個國家名列第一。
從聊天到代理
DeepSeek 的下一步是從對話式 AI 過渡到自主代理系統。這類系統的特點包括:
- 自主規劃:能夠分解複雜任務並制定執行計劃
- 工具使用:可調用外部工具和 API 完成任務
- 持續執行:能夠長時間運行並適應變化
- 最小監督:需要的人類干預越來越少
中國政府 84 億美元投資
DeepSeek 的發展得到了強大的資金支持。2026 年初,與中國政府相關的基金向實用型 AI 新創公司投資了 84 億美元。這筆資金將支持包括 DeepSeek 在內的多家公司加速產品開發。
資源有限下的效率創新
DeepSeek 的成功尤其令人印象深刻,因為它是在美國對中國 AI 晶片出口管制的背景下取得的。公司使用較弱的出口版 AI 晶片,並且使用的晶片數量也更少。
這一突破被觀察者描述為對美國 AI 的「史普尼克時刻」,特別是由於其開源、低成本和高性能的模型。NVIDIA 股價在消息公布後曾一度大跌,市值蒸發 6,000 億美元。
持續的模型更新
DeepSeek 在 R1 之後持續推出更新:
- 2025 年 3 月:DeepSeek-V3-0324(MIT 授權)
- 2025 年 5 月:DeepSeek-R1-0528(MIT 授權)
- 2025 年 8 月:DeepSeek V3.1,採用混合思考/非思考模式的架構,在 SWE-bench 和 Terminal-bench 上超越 V3 和 R1 達 40%
開源模型的多樣性
DeepSeek-R1 不僅發布了完整模型,還提供了「蒸餾」版本:
DeepSeek-R1 蒸餾模型
- 15 億參數版:可在筆記本電腦上運行
- 70 億參數版:適合消費級 GPU
- 140 億參數版:平衡性能與效率
- 320 億參數版:接近完整模型性能
- 700 億參數版:完整能力版本
這些模型基於 Llama 和 Qwen 架構蒸餾而成,讓開發者可以根據自己的硬體條件選擇合適的版本。
對全球 AI 格局的影響
DeepSeek 的成功引發了全球 AI 界對開源策略的重新思考:
- 矽谷應用開始建立在中國開源模型之上
- 成本效益成為競爭焦點
- 開源 vs 閉源辯論重新升溫
- 晶片限制的效果受到質疑
「世界正以新的開源熱情回應。2026 年正準備迎來重大發布,特別是來自中國和美國。」——AI 產業觀察者
自主代理的預期能力
根據洩露的信息和業界分析,DeepSeek 的自主代理系統可能具備:
- 多步驟任務執行:從研究到報告生成的完整工作流程
- 代碼開發:從需求到部署的全流程自動化
- 數據分析:自主收集、處理和解讀數據
- 內容創作:長篇內容的自主生成和編輯
對香港科技界的啟示
DeepSeek 的發展對香港有特殊意義:
- 地理優勢:香港可作為中國 AI 技術與國際市場的橋樑
- 人才機會:熟悉中國 AI 生態系統的人才需求增加
- 應用開發:基於 DeepSeek 開源模型開發本地應用
- 合規考量:需關注數據安全和跨境數據流動法規
本文要點總結
- DeepSeek 計劃於 2026 年底前發布完全自主的 AI 代理系統
- R1 模型以 600 萬美元訓練成本創造「DeepSeek 時刻」
- 中國政府相關基金投資 84 億美元支持 AI 新創
- 在晶片限制下仍實現突破,引發「史普尼克時刻」討論
- 開源模型提供多種規模版本,從 15 億到 700 億參數
- 矽谷應用開始建立在中國開源模型之上