Gemma 4 把代理能力推向終端裝置開放模型研究走入低資源部署新階段

Google 釋出的 Gemma 4 資訊，值得研究社群重視的地方，在於它把模型討論從「雲端效能」推向 終端部署能力。官方指出，Gemma 4 可處理多步規劃、自主行動、離線程式碼生成，以及視覺與音訊任務，並支援超過 140 種語言。這使其不只是一般開放模型更新，更像是一次對 代理式終端模型 的明確定義。

更具研究意義的是，Google 聲稱 Gemma 4 E2B 在部分裝置上的記憶體需求可低於 1.5GB。若這一點在更多實務場景中得到驗證，將大幅擴張研究者對低資源模型評估的重心，從傳統 benchmark 分數延伸到 端側可執行性、延遲、能耗與任務完整性。

這也代表開放模型研究的下一步，可能不再只是比較誰的參數更多，而是比較誰能在有限硬體下，完成更長鏈、更真實的推理與行動任務。