Google 釋出的 Gemma 4 資訊,值得研究社群重視的地方,在於它把模型討論從「雲端效能」推向 終端部署能力。官方指出,Gemma 4 可處理多步規劃、自主行動、離線程式碼生成,以及視覺與音訊任務,並支援超過 140 種語言。這使其不只是一般開放模型更新,更像是一次對 代理式終端模型 的明確定義。
更具研究意義的是,Google 聲稱 Gemma 4 E2B 在部分裝置上的記憶體需求可低於 1.5GB。若這一點在更多實務場景中得到驗證,將大幅擴張研究者對低資源模型評估的重心,從傳統 benchmark 分數延伸到 端側可執行性、延遲、能耗與任務完整性。
這也代表開放模型研究的下一步,可能不再只是比較誰的參數更多,而是比較誰能在有限硬體下,完成更長鏈、更真實的推理與行動任務。