今日 AI 速報（2026年5月9日）

美國研議先進模型「發布前」審視：從監管到與產業協作的路線拉鋸

美國政府近期傳出正討論建立更制度化的「模型發布前」審視安排，包括以行政命令設立跨政府與產業的工作小組，評估對新一代 AI 系統採取更一致的風險檢視機制。外界解讀，這類安排的核心不只在於安全測試本身，也在於讓政府能更早掌握模型能力邊界與潛在濫用方式，尤其是與網絡攻防、滲透與自動化漏洞利用等高風險能力相關的部分。

值得注意的是，相關討論同時出現「以合作取代硬性規管」的訊號：一方面希望維持創新速度，另一方面又要回應模型能力快速上升帶來的公共安全與國安風險。對香港企業與研究機構而言，若美國最終推動發布前審視，短期可能影響跨境採購與使用新模型的時間表（例如雲端 API 的上線節奏、企業測試窗口），中期則可能促使供應商把「可被審核的安全流程」產品化，將安全測試、模型卡與使用限制納入標準交付內容。

AI 基礎建設再加速：Nvidia 與 IREN 瞄準 5GW 供應鏈與「AI 工廠」式部署

在算力供應仍是產業擴張關鍵的背景下，市場再現大規模資料中心合作案：Nvidia 與資料中心業者 IREN 傳出以最高 5GW 的部署規模為目標，並把德州 Sweetwater 園區定位為「AI 工廠」式架構的旗艦落點。這類合作的意義在於把晶片、整機、網絡與機房設計更緊密綁定，並以更標準化的方式複製部署，降低新園區上線的不確定性。

對香港市場的啟示在於兩點：第一，雲端與託管算力的供應可能呈現「區域集中、快速擴張」的形態，企業採購算力時更需要關注供應商的交付能力、電力與網絡冗餘，以及是否能提供可驗證的 SLA；第二，當「每 token 成本」成為資料中心營運的核心指標，推理端的效率優化（量化、KV cache、批次化與路由）會更直接反映在價格與可用性上，進而影響香港本地應用落地的成本結構。

部署面資安警號：大量對外暴露的 AI 服務成為新一代攻擊面

一份針對網際網路上 AI 服務部署狀況的安全研究指出，在逾兩百萬個主機樣本中，出現約一百萬個對外暴露的 AI 相關服務。常見問題包括：預設未啟用驗證、容器配置不當、把 API 金鑰或管理憑證以明文方式放在設定檔或範例中，甚至把具高權限的代理工作流管理介面直接暴露在公網。

這類暴露的風險不止是「被人偷用算力」：更嚴重的是對話紀錄、提示詞、內部工作流與連接到其他系統的權限可能被讀取或篡改，造成資料外洩、回應被污染，甚至把下游系統（例如雲端資源、內部工具、第三方 API）一併拖入風險範圍。對香港的中小企業而言，若採用自架模型或代理框架，建議把「最小權限、預設上鎖」視為基礎要求：先做好網段隔離與身分驗證，再談功能；並且在上線前用自動化方式盤點對外端點、密鑰存放與日誌留存，避免在成長過程中積累不可見的技術債。

研究界補上「可信度表達」：讓模型學會說不確定，而不是硬答

除了政策與安全，模型可靠性也有新進展。研究人員指出，部分推理型模型在強化學習訓練下容易變得更「自信」，即使在證據不足時仍以很高把握給出答案；問題不在於模型一定更常錯，而是錯時的自信會誤導使用者。為處理這個缺口，研究提出在強化學習獎勵中加入校準項，讓模型的自我信心分數更貼近實際正確率，並在多個任務上展示能在不犧牲準確度下顯著降低校準誤差。

這對香港常見的應用場景（客服、法務輔助、投資研究摘要、醫療文件初篩）尤其重要：企業需要的往往不是「永遠回答」，而是能在低把握時主動提示風險、要求更多上下文、或把案件交回人手。若供應商開始把「不確定性」以可機器讀取的方式輸出（例如置信區間、校準後分數、拒答/升級策略），將有助於把 AI 系統納入更可審計的風控流程，也更符合香港對合規與營運穩定性的期待。