今日 AI 速報(2026年4月30日)
OpenAI 終止與微軟的獨家雲端協議並全面擴展至 AWS;Google 與美國國防部簽署機密 AI 協議;Google 宣布對 Anthropic 最高 400 億美元的戰略投資;BT 與 Nscale 攜手在英國建置主權 AI 資料中心;NEURA Robotics 與 AWS 合作加速 Physical AI 發展。
OpenAI 終止與微軟的獨家雲端協議並全面擴展至 AWS;Google 與美國國防部簽署機密 AI 協議;Google 宣布對 Anthropic 最高 400 億美元的戰略投資;BT 與 Nscale 攜手在英國建置主權 AI 資料中心;NEURA Robotics 與 AWS 合作加速 Physical AI 發展。
Siemens 推出工業工程代理、Google 發布 Gemma 4 開放模型家族、Microsoft 開源 AI 代理治理工具包、Stanford AI Index 揭示責任 AI 事件急增,以及 OpenAI 攜手全球顧問公司加速 Codex 企業落地。
開放權重模型與安全監管同日升溫:Google 推出 Apache 2.0 授權的 Gemma 4;美國白宮就高風險新模型與業界磋商,企業級代理工具亦加強沙盒管控。
Anthropic 與 Google、Broadcom 的最新合作顯示,前沿 AI 模型競爭已愈來愈依賴算力長約、電力與晶片供應鏈的協同能力。
Google 研究團隊在 ICLR 2026 上揭曉了 TurboQuant 演算法。該演算法能顯著減少大型語言模型(LLM)中 KV 快取所造成的記憶體負擔,提升模型運行效率。
Google公開全新TurboQuant演算法,在不犧牲準確度的前提下,KV快取記憶體消耗降低6倍,注意力機制計算速度提高8倍,為大型AI模型運算效率樹立新標竿。
Google I/O 2026 開發者大會預計於 5 月舉行,業界預期 Gemini 2.0 系列模型將全面整合進 Android 16、Google Workspace 及 Chrome,並可能發布多模態 AI Agent 新功能。
Google 於 3 月 27 日完成 Personal Intelligence 功能向所有美國免費用戶的全面推送。該功能允許 Gemini 存取用戶的 Gmail、Google Photos、YouTube 等應用資料,實現高度個性化的 AI 回應。本文從技術架構、隱私設計和產業影響三個維度進行深度分析。
Gemini 2.0 Flash 採用原生多模態架構,拋棄了傳統 CLIP 式視覺編碼器,改以統一的 token 空間處理影像與文本。本文深度分析其技術創新、視覺問答基準表現及在醫療影像和科學圖表理解領域的突破。
Google 於 2026 年 3 月 3 日發布 Gemini 3.1 Flash-Lite,這是 Gemini 系列中最輕量的變體。該模型實現 2.5 倍回應速度提升與 45% 輸出速率加速,定價僅 0.25 美元/百萬輸入 Token,透過先進的蒸餾技術在效能與成本之間取得前所未有的平衡。
Google Research 發布 TurboQuant 壓縮演算法,能將大型語言模型的 KV 快取記憶體壓縮至 3 位元,實現最高 6 倍記憶體縮減與 8 倍速度提升,且不損失模型準確率。此研究成果將於 ICLR 2026 正式發表。