產業動態
今日 AI 速報(2026年5月2日)
OpenAI 與 AWS 擴大百億美元戰略合作;美國國防部與七家科技公司達成機密網絡 AI 部署協議,Anthropic 遭排除在外;Google 發布 TurboQuant 技術大幅壓縮 KV 快取記憶體;SoftBank Robotics 推出全自動烹飪機械人,即將登陸美國市場。
OpenAI 與 AWS 擴大百億美元戰略合作;美國國防部與七家科技公司達成機密網絡 AI 部署協議,Anthropic 遭排除在外;Google 發布 TurboQuant 技術大幅壓縮 KV 快取記憶體;SoftBank Robotics 推出全自動烹飪機械人,即將登陸美國市場。
Google 研究團隊在 ICLR 2026 上揭曉了 TurboQuant 演算法。該演算法能顯著減少大型語言模型(LLM)中 KV 快取所造成的記憶體負擔,提升模型運行效率。
Google公開全新TurboQuant演算法,在不犧牲準確度的前提下,KV快取記憶體消耗降低6倍,注意力機制計算速度提高8倍,為大型AI模型運算效率樹立新標竿。
Google Research 發布 TurboQuant 壓縮演算法,能將大型語言模型的 KV 快取記憶體壓縮至 3 位元,實現最高 6 倍記憶體縮減與 8 倍速度提升,且不損失模型準確率。此研究成果將於 ICLR 2026 正式發表。