Google 發布 Gemma 4:Apache 2.0 授權的開放權重多模態模型
Google 發布新一代開放權重模型 Gemma 4,改以 Apache 2.0 授權釋出,降低商用與二次開發門檻。新系列分為 E2B、E4B、26B(MoE)及 31B(Dense)四個版本,並把長上下文能力拉到 128K 至 256K;小型版本加入原生語音輸入,適合在手機或邊緣裝置離線運行。對香港及亞太開發者而言,這類「可本地部署、可商用」的模型,能在資料合規與成本控制之間提供更多選擇,也有利於把代理式工作流程落地到企業內網環境。
白宮與 Anthropic 就新模型「Mythos」風險會面:聚焦網絡安全與政府採用評估
美國白宮安排與 Anthropic 管理層會面,討論其新模型 Mythos 的安全影響與政府採用流程。外界關注點在於該模型被指在尋找與利用系統漏洞方面能力顯著提升,因此公司先把使用範圍限制在少數客戶。報道亦提到,政府與多間科技及金融機構推動合作項目,以保護關鍵軟件供應鏈免受更強的自動化攻擊。這類動向顯示,前沿模型的「能力提升」正直接帶動監管與採購審查加速,香港企業在引入高能力模型時亦需同步強化滲透測試、權限分隔及供應鏈風險管理。
OpenAI 更新 Agents SDK:加入原生沙盒執行,強化企業級代理治理
OpenAI 針對代理式應用的開發套件推出更新,主打「原生沙盒執行」與更完整的執行框架,讓代理可在受控環境內讀寫檔案、執行指令、進行長流程任務。新設計把工作空間與模型推理分離,並透過更結構化的工作目錄、記憶體設定與工具協調,減少長任務常見的狀態漂移與權限外溢。對需要把代理接入內部系統(例如工單、合規流程、代碼庫)的機構而言,沙盒化與可審計的執行記錄會成為落地關鍵;同時也提醒開發團隊,代理的安全邊界不應只靠提示詞,而要靠環境隔離與最小權限設計。
東南亞平台加速部署「具身智能」:外送機械人走向商用場景
區域科技平台正把 AI 從雲端推到街頭:有大型外送平台宣布部署 AI 外送輔助機械人,目標是縮短取餐與交接時間,提升司機周轉率。這類機械人並非完全取代人手,而是針對商場、辦公樓等高摩擦場景,把「找店、等候、搬運」等流程自動化。對香港而言,商場密度高、樓宇結構複雜,正好是具身智能的典型應用地;若機械人能與地圖、門禁、升降機及商戶系統打通,將可能改變最後一公里配送的成本結構與服務體驗。
AI 政策走向「安全評估前置」:高風險能力觸發更嚴格的上線門檻
從政府與企業的互動可見,政策討論正由「原則性倡議」轉向「可操作的前置評估」。當模型被認定具備更強的網絡攻擊或自動化能力時,監管方與採購方會更強調:第三方安全測試、限制可用客戶範圍、以及在上線前完成紅隊演練與風險披露。對香港公司而言,這意味著採用前沿模型不再只是 IT 決策,而需要法務、資訊安全與業務共同制定使用政策,包括資料分級、審批流程、以及在事故發生時的通報與追溯機制。
開放權重與商用授權的競爭升溫:企業更重視「可控性」而非單純性能
Gemma 4 以寬鬆授權釋出,反映開放權重陣營正把焦點放在可控性、可部署性與法務清晰度。對不少企業來說,是否能在自家基建上運行、能否做二次訓練與審計、以及授權條款是否足夠清楚,往往比單一排行榜名次更重要。香港在金融、醫療、公共服務等受監管行業尤其如此:即使選用較小模型,只要能在本地環境內穩定運行、配合長上下文處理內部文件與流程自動化,就可能帶來更實際的效益。
代理式 AI 進入「工程化」階段:沙盒、記憶體與工具協作成核心能力
今日多則消息都指向同一趨勢:代理式 AI 的競爭點由「能否對話」轉向「能否可靠完成任務」。要做到可靠,就必須處理三件事:一是環境隔離(沙盒)以控制風險;二是可配置的記憶體與狀態管理以避免長流程失控;三是標準化的工具介面與審計記錄以便合規。對香港的開發團隊而言,下一步不只是挑選模型,而是建立一套可重用的代理運行框架,將安全、觀測、成本與回滾機制納入產品設計,才能把代理真正變成可上線的「工作流引擎」。