OpenAI Q2 研究路線圖：o4 正式發布、GPT-5 Full 時間表確認

OpenAI 在第二季度開始之際，向研究社群及 API 合作夥伴透露了近期研究方向和產品路線圖，標誌著公司在推理模型和多模態能力上持續加大投入。

o4 推理模型正式 GA

OpenAI 確認，o4（最新一代推理模型）已完成 Beta 測試階段，正式對所有 API 用戶開放（General Availability）。

o4 的主要技術規格與 Q1 Beta 版基本一致：

基準測試方面，o4 在 MATH-500（97.2%）、HumanEval（96.4%）及 MMLU-Pro（91.3%）均創下 OpenAI 模型新高。

此前業界對 GPT-5 Full 版本（區別於已發布的 GPT-5 Mini）的時間表所知甚少。OpenAI 在近期向合作夥伴的簡報中，首次披露 GPT-5 Full 的關鍵信息：

研發進度

能力方向 GPT-5 Full 將重點突破以下方向：

OpenAI 研究院本季度的技術重點之一，是讓模型在使用外部工具時的行為可預測性顯著提升。

現有問題：在複雜多工具協作場景下，模型有時會選擇不合理的工具調用順序或過度依賴單一工具。

Q2 研究方向：

對開發者和研究人員而言，Q2 OpenAI 路線圖的核心影響包括：

本文信息來源於 OpenAI 合作夥伴簡報摘要及公開研究博客，部分細節待 OpenAI 官方公告確認。