模型發布

OpenAI Q2 研究路線圖:o4 正式發布、GPT-5 Full 時間表確認

OpenAI 在 Q2 開始前公布研究路線圖,確認 o4 推理模型正式向 API 用戶開放,並首次透露 GPT-5 Full 版本的部署時間表。多模態推理和工具使用能力是本季核心研究方向。

OpenAI 在第二季度開始之際,向研究社群及 API 合作夥伴透露了近期研究方向和產品路線圖,標誌著公司在推理模型和多模態能力上持續加大投入。

o4 推理模型正式 GA

OpenAI 確認,o4(最新一代推理模型)已完成 Beta 測試階段,正式對所有 API 用戶開放(General Availability)。

o4 的主要技術規格與 Q1 Beta 版基本一致:

  • 動態推理鏈:根據問題難度自動調整 Chain-of-Thought 步驟長度
  • Tool Use 能力增強:對代碼執行器、搜索工具及結構化數據提取的支持更加穩定
  • 速率限制提升:Tier 4 及以上用戶的 o4 API 速率較 o3 提升 3.5 倍

基準測試方面,o4 在 MATH-500(97.2%)、HumanEval(96.4%)及 MMLU-Pro(91.3%)均創下 OpenAI 模型新高。

GPT-5 Full 時間表首次透露

此前業界對 GPT-5 Full 版本(區別於已發布的 GPT-5 Mini)的時間表所知甚少。OpenAI 在近期向合作夥伴的簡報中,首次披露 GPT-5 Full 的關鍵信息:

研發進度

  • 預訓練已完成,目前處於 RLHF 精調及安全評估階段
  • 計劃在 2026 年中期(預計 Q3)進入受限合作夥伴測試
  • GA(正式發布)目標為 2026 年底前

能力方向 GPT-5 Full 將重點突破以下方向:

  • 長文推理:百萬級 Token 的連貫多步推理
  • 科學研究輔助:在生物化學、材料科學等領域的文獻綜合和假設生成
  • 視頻理解:從 GPT-4V 的圖像理解擴展至視頻流的動態分析

多模態工具使用研究

OpenAI 研究院本季度的技術重點之一,是讓模型在使用外部工具時的行為可預測性顯著提升。

現有問題:在複雜多工具協作場景下,模型有時會選擇不合理的工具調用順序或過度依賴單一工具。

Q2 研究方向:

  1. Tool Selection Calibration(工具選擇校準):提升模型在工具組合決策上的準確性
  2. Error Recovery Mechanism(錯誤恢復機制):當工具調用失敗時,模型能更優雅地回退並嘗試替代方案
  3. Tool Composition(工具組合):支持更複雜的多工具串聯使用模式

API 開發者影響評估

對開發者和研究人員而言,Q2 OpenAI 路線圖的核心影響包括:

變化影響
o4 GA 開放推理密集型應用可遷移至更穩定的 API 版本
o3 速率下調部分應用需重新評估成本結構
GPT-5 Full 時間表長期架構設計可考慮接入高能力模型的 API 預留

本文信息來源於 OpenAI 合作夥伴簡報摘要及公開研究博客,部分細節待 OpenAI 官方公告確認。

返回首頁