模型發布
Google Gemini 3.1 Flash-Lite 架構解析:2.5 倍推理加速與蒸餾技術突破
Google 於 2026 年 3 月 3 日發布 Gemini 3.1 Flash-Lite,這是 Gemini 系列中最輕量的變體。該模型實現 2.5 倍回應速度提升與 45% 輸出速率加速,定價僅 0.25 美元/百萬輸入 Token,透過先進的蒸餾技術在效能與成本之間取得前所未有的平衡。
Google 於 2026 年 3 月 3 日發布 Gemini 3.1 Flash-Lite,這是 Gemini 系列中最輕量的變體。該模型實現 2.5 倍回應速度提升與 45% 輸出速率加速,定價僅 0.25 美元/百萬輸入 Token,透過先進的蒸餾技術在效能與成本之間取得前所未有的平衡。