產業動態

今日 AI 速報(2026年5月9日)

本日重點涵蓋美國對先進模型可能採取的發布前審視方向、AI 基礎建設投資加速,以及部署面安全缺口與研究界提升模型『不確定性表達』的新方法。

美國研議先進模型「發布前」審視:從監管到與產業協作的路線拉鋸

美國政府近期傳出正討論建立更制度化的「模型發布前」審視安排,包括以行政命令設立跨政府與產業的工作小組,評估對新一代 AI 系統採取更一致的風險檢視機制。外界解讀,這類安排的核心不只在於安全測試本身,也在於讓政府能更早掌握模型能力邊界與潛在濫用方式,尤其是與網絡攻防、滲透與自動化漏洞利用等高風險能力相關的部分。

值得注意的是,相關討論同時出現「以合作取代硬性規管」的訊號:一方面希望維持創新速度,另一方面又要回應模型能力快速上升帶來的公共安全與國安風險。對香港企業與研究機構而言,若美國最終推動發布前審視,短期可能影響跨境採購與使用新模型的時間表(例如雲端 API 的上線節奏、企業測試窗口),中期則可能促使供應商把「可被審核的安全流程」產品化,將安全測試、模型卡與使用限制納入標準交付內容。

AI 基礎建設再加速:Nvidia 與 IREN 瞄準 5GW 供應鏈與「AI 工廠」式部署

在算力供應仍是產業擴張關鍵的背景下,市場再現大規模資料中心合作案:Nvidia 與資料中心業者 IREN 傳出以最高 5GW 的部署規模為目標,並把德州 Sweetwater 園區定位為「AI 工廠」式架構的旗艦落點。這類合作的意義在於把晶片、整機、網絡與機房設計更緊密綁定,並以更標準化的方式複製部署,降低新園區上線的不確定性。

對香港市場的啟示在於兩點:第一,雲端與託管算力的供應可能呈現「區域集中、快速擴張」的形態,企業採購算力時更需要關注供應商的交付能力、電力與網絡冗餘,以及是否能提供可驗證的 SLA;第二,當「每 token 成本」成為資料中心營運的核心指標,推理端的效率優化(量化、KV cache、批次化與路由)會更直接反映在價格與可用性上,進而影響香港本地應用落地的成本結構。

部署面資安警號:大量對外暴露的 AI 服務成為新一代攻擊面

一份針對網際網路上 AI 服務部署狀況的安全研究指出,在逾兩百萬個主機樣本中,出現約一百萬個對外暴露的 AI 相關服務。常見問題包括:預設未啟用驗證、容器配置不當、把 API 金鑰或管理憑證以明文方式放在設定檔或範例中,甚至把具高權限的代理工作流管理介面直接暴露在公網。

這類暴露的風險不止是「被人偷用算力」:更嚴重的是對話紀錄、提示詞、內部工作流與連接到其他系統的權限可能被讀取或篡改,造成資料外洩、回應被污染,甚至把下游系統(例如雲端資源、內部工具、第三方 API)一併拖入風險範圍。對香港的中小企業而言,若採用自架模型或代理框架,建議把「最小權限、預設上鎖」視為基礎要求:先做好網段隔離與身分驗證,再談功能;並且在上線前用自動化方式盤點對外端點、密鑰存放與日誌留存,避免在成長過程中積累不可見的技術債。

研究界補上「可信度表達」:讓模型學會說不確定,而不是硬答

除了政策與安全,模型可靠性也有新進展。研究人員指出,部分推理型模型在強化學習訓練下容易變得更「自信」,即使在證據不足時仍以很高把握給出答案;問題不在於模型一定更常錯,而是錯時的自信會誤導使用者。為處理這個缺口,研究提出在強化學習獎勵中加入校準項,讓模型的自我信心分數更貼近實際正確率,並在多個任務上展示能在不犧牲準確度下顯著降低校準誤差。

這對香港常見的應用場景(客服、法務輔助、投資研究摘要、醫療文件初篩)尤其重要:企業需要的往往不是「永遠回答」,而是能在低把握時主動提示風險、要求更多上下文、或把案件交回人手。若供應商開始把「不確定性」以可機器讀取的方式輸出(例如置信區間、校準後分數、拒答/升級策略),將有助於把 AI 系統納入更可審計的風控流程,也更符合香港對合規與營運穩定性的期待。

返回首頁