Mistral AI 發布 Codestral 2.0：代碼生成模型效能媲美 GPT-5 但成本低80%

法國 AI 新創公司 Mistral AI 今日發布 Codestral 2.0，這是其代碼生成專用模型的重大迭代版本。根據官方基準測試數據及獨立研究機構的評估，Codestral 2.0 在多項代碼生成標準測試中達到或超越 GPT-5 的表現，但 API 定價僅為後者的約 20%。

技術規格

基準測試	Codestral 2.0	GPT-5 Mini	Claude Sonnet 4.6
HumanEval	91.2%	89.7%	88.4%
MBPP	87.8%	85.3%	84.9%
LiveCodeBench	82.4%	80.1%	79.6%
SWE-bench Verified	43.7%	44.2%	42.8%

（以上數據來自 Mistral AI 官方報告及獨立驗證，結果可能隨測試條件有所差異）

Codestral 2.0 的定價是其市場競爭力的核心：

這意味著在相同的代碼生成任務量下，使用 Codestral 2.0 的成本約為 GPT-5 的 12-18%，對高頻調用的代碼輔助工具（如 IDE 插件、CI/CD 流水線）而言，成本節省極為顯著。

相比上一版本 Codestral，2.0 版本的主要技術改進包括：

Fill-in-the-Middle（FIM）能力大幅提升：這一對 IDE 代碼補全至關重要的功能，準確率提升約 18%，尤其在複雜函數的中間部分補全場景
長代碼上下文理解：得益於 256K 上下文視窗，Codestral 2.0 可在大型代碼庫中進行跨文件分析和重構建議
測試生成：針對現有代碼自動生成單元測試的能力顯著增強，與 pytest、Jest 等主流測試框架的整合更為流暢
多語言混合代碼：在同時涉及多種程式語言的代碼庫（如 Python 後端 + TypeScript 前端）中的表現改善

Mistral AI 的戰略定位清晰：以「歐洲替代方案」和「成本效益最優」吸引對數據主權有要求的歐洲企業，以及對 API 成本敏感的高成長型科技公司。

Codestral 2.0 的發布進一步強化了 Mistral 在代碼 AI 細分市場的競爭力，也向市場傳遞了一個信息：頂尖代碼生成能力並不需要付出 OpenAI 級別的高昂成本。