美國商務部擴大「發布前」模型安全測試合作,形成更常態化的國安評估通道
過去一年,各界對「前沿模型」可能帶來的網絡攻擊自動化、關鍵基建弱點搜尋、以及更高階的惡意程式生成能力愈來愈關注。最新動向是,美國政府不再只依賴企業內部紅隊與自律承諾,而是把外部、政府參與的評估流程推向更前置的階段,並嘗試以協議形式把合作做成「可重複的制度」。
根據公開報導,美國商務部旗下的相關單位將在模型或功能正式對外推出前,對企業提供的 AI 系統進行評估。這類安排的重點,不在於逐案審批或否決,而是在正式發布前先完成測試、交換風險觀察、並建立較一致的評估與改善機制。對企業而言,這意味著產品節奏可能需要預留更長的「發布前安全窗口」,同時也可能促使更多工程資源投入到可測試性、可解釋的安全設計、以及在敏感能力上的緩解措施。
更值得留意的是,參與名單涵蓋多家大型供應商,代表市場主流模型與平台正逐步把「可被外部評估」視為基本要求。短期內,這種模式可能提高合規門檻,對中小型模型團隊形成壓力;但另一面也可能讓政府與產業在面對高風險能力時,有更快的協作回饋迴路,降低重大安全事件發生後才補救的成本。對香港企業與機構使用者而言,若日後國際供應商把這類測試結果納入企業採購或風險聲明,採購、合規與資安部門的評估流程也可能同步被「制度化」。
白宮被報導研議更正式的模型發布前審視機制:以「合作」取代「硬性規管」,但仍會影響市場競爭
除了商務部層面的合作安排外,另一條線索是白宮內部被報導正在討論更具政策色彩的「發布前審視」框架。報導指出,相關構想包括讓情報體系更早接觸新模型能力,以便在對外擴散前先做國安角度的評估,並協助加固系統防護。這反映出政府把前沿模型視為「可能改變攻防平衡」的技術類別,嘗試把安全治理從事後監管移到事前協作。
值得注意的是,白宮官員同時釋放出偏向與企業建立夥伴關係的訊號,而非全面轉向更嚴格、以法規或許可制為核心的路徑。這種做法的政治與產業含意很清晰:政府希望在降低重大風險的同時,避免過度規管造成創新外移或競爭力受損。然而,即使是自願或協議式的審視,也可能產生「準入差異」:資源較雄厚、與政府互動更成熟的公司,能更快完成評估、調整與發布;而規模較小或跨境團隊,可能需要付出更高的時間與成本,甚至在某些市場推進上變得更保守。
從市場結構看,這也可能強化一種新的競爭維度:不只是模型能力或價格,而是「治理與風險管理能力」本身。企業若能提供更透明的測試方法、更清楚的風險邊界、更完善的安全監控與事故回應流程,將更容易獲得大型客戶、政府單位與關鍵產業採用。對香港的金融、公共服務與大型企業用戶而言,未來在選型時可能更重視供應商能否提供可審計的評估證據與持續監測承諾,而不僅是功能清單。
觀察:從「自律安全」走向「可被評估的安全」,AI 供應鏈的採購與合規將更接近資安產品模式
把 AI 模型納入發布前評估,其實是在把 AI 產品化為更接近資安與關鍵系統的管理方式:先評估、再上線、持續監測、出事可回溯。這種轉變會推動三個實務趨勢。
第一,模型與平台供應商會更重視「可測試性」:包括更清楚的能力邊界、可重現的測試流程、以及對高風險指令或工具鏈的限制策略。第二,企業用戶將更常要求供應商提供風險評估摘要、模型更新節奏、以及安全事件通報機制,採購流程會更像導入雲端資安或核心銀行系統。第三,跨境治理差異可能擴大:不同司法管轄區對「發布前審視」的要求不同,供應商可能採取分區發布、分區能力限制、或分區合規文件,導致同一產品在不同市場呈現不同能力與限制。
對香港讀者而言,這些變化短期看似是美國內部政策,但由於主流 AI 供應鏈高度國際化,最終會反映到產品條款、企業合規與風險管理要求上。建議本地機構在導入外部模型與代理式系統時,及早把「模型評估證據」與「安全運行責任」納入供應商審查清單,並建立內部跨部門流程(IT、資安、法務、業務)來處理模型更新與風險變更,避免在政策與市場快速變化下被動跟隨。