所有文章
共 177 篇文章,第 11 / 18 頁
多模態視頻理解研究進展:從靜態圖像到動態場景分析的技術突破
2026 年 Q1 多模態研究的重要突破集中在視頻理解領域:長視頻分析、動態場景推理和視頻與文字的細粒度對齊取得顯著進展,為自動駕駛、醫療影像和教育分析帶來新的應用可能。
OpenAI Q2 研究路線圖:o4 正式發布、GPT-5 Full 時間表確認
OpenAI 在 Q2 開始前公布研究路線圖,確認 o4 推理模型正式向 API 用戶開放,並首次透露 GPT-5 Full 版本的部署時間表。多模態推理和工具使用能力是本季核心研究方向。
UNESCO:僅約一成企業公開承諾 AI 治理框架,3,000 家公司調查揭示落地缺口
UNESCO 與 Thomson Reuters Foundation 發表針對 3,000 家企業的 AI 治理報告,顯示企業普遍承認 AI 重要,但真正建立人類監督、環境評估與人權影響機制的比例仍然偏低。
AI Agent 從實驗到落地:2026年Q1企業採用案例分析
2026年第一季度,AI Agent 在法律、財務、客服及軟件開發領域的企業採用率顯著加速。本文分析真實企業部署案例,探討 AI Agent 的能力邊界與實際投資回報。
AI在教育業的2026年現狀:個性化學習工具滲透率分析
2026年全球教育科技市場中,AI個性化學習工具的滲透率快速提升。Khan Academy的Khanmigo、Duolingo Max及中國智適應學習平台的實際效果數據與挑戰分析。
Apple Intelligence 2026年Q1更新:Siri 推理能力提升 寫作工具擴展至更多語言
Apple Intelligence 在 iOS 18.4 及 macOS 15.4 更新中引入改進的 Siri 推理模式、跨 App 個人情境功能,並將 AI 寫作工具擴展至包含繁體中文在內的多種語言。
中國AI政策Q1 2026:大模型備案數突破300 開源生態加速成型
2026年第一季度,中國生成式AI備案模型數量突破300個,國家網信辦發布新版AI服務管理細則,DeepSeek、百度文心、阿里通義等開源模型加速在海外傳播。
Google I/O 2026 預告:Gemini 深度整合 Android 與 Workspace 成焦點
Google I/O 2026 開發者大會預計於 5 月舉行,業界預期 Gemini 2.0 系列模型將全面整合進 Android 16、Google Workspace 及 Chrome,並可能發布多模態 AI Agent 新功能。
Mistral AI 發布 Codestral 2.0:代碼生成模型效能媲美 GPT-5 但成本低80%
Mistral AI 發布 Codestral 2.0 代碼生成模型,在 HumanEval、MBPP 等標準基準測試中達到與 GPT-5 相當的水準,API 定價比 OpenAI 同類產品低約 80%,並支援 90+ 種程式語言。
OpenAI Q1 2026 產品更新總結:GPT-5 Mini 推出 API 速率大幅提升
OpenAI 第一季度完成多項重要產品更新,包括 GPT-5 Mini 正式向 API 開發者開放、推理模型速率限制大幅提升,以及企業版 ChatGPT 新增多項安全管控功能。