模型發布

Mistral AI 發布 Codestral 2.0:代碼生成模型效能媲美 GPT-5 但成本低80%

Mistral AI 發布 Codestral 2.0 代碼生成模型,在 HumanEval、MBPP 等標準基準測試中達到與 GPT-5 相當的水準,API 定價比 OpenAI 同類產品低約 80%,並支援 90+ 種程式語言。

法國 AI 新創公司 Mistral AI 今日發布 Codestral 2.0,這是其代碼生成專用模型的重大迭代版本。根據官方基準測試數據及獨立研究機構的評估,Codestral 2.0 在多項代碼生成標準測試中達到或超越 GPT-5 的表現,但 API 定價僅為後者的約 20%。

技術規格

規格Codestral 2.0
參數規模22B(官方未確認)
上下文視窗256K Token
支援程式語言90+ 種
模型架構Transformer with Sparse MoE
可用形式API(閉源)+ 研究用開放權重

基準測試表現

基準測試Codestral 2.0GPT-5 MiniClaude Sonnet 4.6
HumanEval91.2%89.7%88.4%
MBPP87.8%85.3%84.9%
LiveCodeBench82.4%80.1%79.6%
SWE-bench Verified43.7%44.2%42.8%

(以上數據來自 Mistral AI 官方報告及獨立驗證,結果可能隨測試條件有所差異)

定價策略

Codestral 2.0 的定價是其市場競爭力的核心:

  • 輸入 Token:$0.30 / 百萬 Token
  • 輸出 Token:$0.90 / 百萬 Token
  • 對比 GPT-5 完整版:$2.50/$10.00(輸入/輸出)

這意味著在相同的代碼生成任務量下,使用 Codestral 2.0 的成本約為 GPT-5 的 12-18%,對高頻調用的代碼輔助工具(如 IDE 插件、CI/CD 流水線)而言,成本節省極為顯著。

關鍵技術改進

相比上一版本 Codestral,2.0 版本的主要技術改進包括:

  1. Fill-in-the-Middle(FIM)能力大幅提升:這一對 IDE 代碼補全至關重要的功能,準確率提升約 18%,尤其在複雜函數的中間部分補全場景
  2. 長代碼上下文理解:得益於 256K 上下文視窗,Codestral 2.0 可在大型代碼庫中進行跨文件分析和重構建議
  3. 測試生成:針對現有代碼自動生成單元測試的能力顯著增強,與 pytest、Jest 等主流測試框架的整合更為流暢
  4. 多語言混合代碼:在同時涉及多種程式語言的代碼庫(如 Python 後端 + TypeScript 前端)中的表現改善

市場定位

Mistral AI 的戰略定位清晰:以「歐洲替代方案」和「成本效益最優」吸引對數據主權有要求的歐洲企業,以及對 API 成本敏感的高成長型科技公司。

Codestral 2.0 的發布進一步強化了 Mistral 在代碼 AI 細分市場的競爭力,也向市場傳遞了一個信息:頂尖代碼生成能力並不需要付出 OpenAI 級別的高昂成本。

返回首頁