← 返回新聞列表

Apple AI 版 Siri 再度跳票:iOS 26.4 確認缺席,Gemini 合作與 Ferret-3 自研之路全面解析

從內部測試的技術困境,到 Google Gemini 白標整合與自研大模型的雙軌佈局——Apple 在 AI 助手競賽中正經歷最關鍵也最艱難的轉型期

當 Apple 在 2025 年 WWDC 上首次展示全面翻新的 Siri 時,全球數以億計的 iPhone 用戶為之振奮。一個能夠真正理解自然語言、整合個人數據、並與第三方應用深度互動的語音助手,終於有望從概念走向現實。然而,時至今日,這個承諾仍在不斷推遲。根據 Bloomberg 記者 Mark Gurman 於二月中旬的報導,Apple 已將新版 Siri 的核心功能從原定的 iOS 26.4 更新中撤出,改為分階段在 iOS 26.5 乃至 iOS 27 中逐步推出。對於已經等待了近一年的消費者而言,這無疑是又一次令人沮喪的延期。

更令人關注的是,2 月 17 日正式向開發者推送的 iOS 26.4 測試版中,完全沒有新版 Siri 功能的蹤影。這意味著即便是最樂觀的預測——期待新 Siri 會以「驚喜」形式出現在後續測試版中——如今也幾乎不可能成立。Apple 從未公開承諾過具體的發佈日期,僅模糊表示這些功能將在「2026 年」某個時間點推出,但市場和分析師此前普遍預期 iOS 26.4(約三月發佈)將是關鍵節點。如今看來,Apple 的 AI 轉型時間表需要大幅修正。

內部測試暴露的深層技術挑戰

延遲並非管理層的主觀選擇,而是技術現實迫使的結果。據多位知情人士透露,新版 Siri 在 Apple 內部測試中暴露了一系列令工程團隊頭痛的問題,這些問題的嚴重程度遠超預期。

首先是響應延遲問題。在當今用戶已經習慣 ChatGPT 和 Google Gemini 幾乎即時回覆的時代,新版 Siri 的回應速度明顯不達標。當系統需要調用大型語言模型來處理較為複雜的查詢時,等待時間會變得尤為明顯,這與 Apple 一貫追求的流暢用戶體驗形成了尖銳的矛盾。

其次是查詢準確度的問題。測試人員報告指出,新 Siri 在處理多步驟、需要推理的複雜問題時表現不穩定。例如,當用戶詢問涉及多個條件的問題——比如「找出上個月我和 David 討論過的那間餐廳,就是他說週末有打折的那間」——系統往往無法正確解析語義結構,給出的答案要麼不相關,要麼直接失敗。

內部測試中發現的主要技術問題

  • 響應延遲:複雜查詢的處理時間超出用戶可接受範圍,與競品的即時反饋差距明顯
  • 查詢準確度不足:多步驟推理和複雜語義解析經常失敗,給出不相關或錯誤的回答
  • ChatGPT 回退異常:系統過度依賴 ChatGPT 作為後備方案,頻繁且無預警地切換至第三方服務
  • 語速識別問題:對說話速度較快的用戶,語音辨識和語義理解的準確度大幅下降
  • 個人數據整合困難:搜索歷史訊息、郵件等個人數據的功能穩定性不足,隱私計算增加了額外的技術複雜度

第三個令人意外的問題是 ChatGPT 回退機制的失控。Apple 在 2025 年已經與 OpenAI 達成合作,讓 Siri 在無法自行處理某些問題時可以轉接至 ChatGPT。然而在內部測試中,這種轉接發生的頻率遠高於預期,而且切換往往是突然的、缺乏上下文銜接的。用戶可能正在與 Siri 進行一段連貫的對話,突然之間系統就跳轉到 ChatGPT,不僅打斷了對話流程,還引發了數據隱私方面的疑慮。

最後一個被頻繁提及的問題涉及語速識別。不少測試人員發現,當他們以正常或偏快的語速說話時——這在日常生活中是極為普遍的——Siri 的語音辨識準確度會明顯下降,進而導致語義理解出現偏差。對於一款定位為「下一代智能助手」的產品來說,連基本的語音輸入都無法穩定處理,顯然是不可接受的。

功能拆分時間表:從集中發佈到分階段推出

面對技術困難,Apple 做出了一個務實但對品牌形象有所損害的決定:將原本計劃一次性推出的新 Siri 功能拆分成多個階段逐步發佈。這種策略雖然在軟體開發中並不罕見,但對於 Apple 這樣一家以精心策劃的產品發佈聞名的公司而言,卻透露出明顯的被動與無奈。

根據目前的規劃,iOS 26.4(預計三月正式發佈)將主要包含基礎架構層面的準備工作和一些次要的改進,但不會包含任何重大的 Siri AI 升級。真正的新功能最早可能出現在 iOS 26.5 中——這個版本預計在五月前後推送——但即便如此,也僅限於部分功能,例如改進的自然語言理解和基本的跨應用操作能力。

至於最受期待的個人數據整合功能——包括搜索舊訊息、分析郵件內容、整合行事曆與備忘錄等——現在看來極有可能要推遲到 iOS 27,也就是預計在九月隨新一代 iPhone 一同發佈的版本。這些功能涉及對用戶私人數據的深度索引和語義理解,在確保隱私安全的前提下實現這些功能,技術難度遠超一般的語言模型應用。

「Apple 的困境在於,它需要在兩個幾乎矛盾的目標之間找到平衡:一方面是提供足以與 ChatGPT 和 Gemini 匹敵的 AI 能力,另一方面則是維護其引以為豪的隱私保護承諾。在競爭對手可以將用戶數據上傳至雲端進行處理的時候,Apple 必須在裝置端和其專有的 Private Cloud Compute 環境中完成所有運算,這無疑增加了巨大的技術限制。」

Google Gemini 白標合作:務實選擇背後的戰略考量

在自研能力尚未成熟的過渡期,Apple 選擇了一個出人意料但在商業邏輯上完全合理的合作夥伴:Google Gemini。據報導,Apple 已與 Google 達成協議,在 Apple 的系統中使用 Gemini 的大型語言模型能力,但這是一次「白標」合作——用戶在使用過程中不會看到任何 Google 的品牌標識,整個體驗將完全以 Apple 的名義呈現。

這項合作的技術架構頗值得關注。Gemini 模型並非直接在 Google 的伺服器上為 Apple 用戶服務,而是被部署在 Apple 自建的 Private Cloud Compute(PCC)基礎設施中。這種安排讓 Apple 在借用 Google 的模型能力的同時,仍能維持對用戶數據的完全控制——數據不會離開 Apple 的安全環境,Google 也無法接觸到任何個別用戶的資訊。

具體而言,Gemini 目前負責驅動兩個主要功能模組:摘要生成器和智能規劃助手。前者能夠自動歸納長篇郵件、文章和通知的要點,後者則協助用戶規劃行程、整理待辦事項並提供建議。這兩個功能對大型語言模型的依賴度最高,也是 Apple 現階段自研能力最薄弱的環節。

然而,這種合作關係本質上是一把雙刃劍。對 Apple 而言,它解決了短期的能力缺口問題,但也在戰略上形成了對競爭對手的依賴。如果 Google 在未來調整合作條件——無論是價格、功能限制還是數據使用條款——Apple 可能會陷入被動。更重要的是,這種安排在某種程度上削弱了 Apple 在 AI 領域「自主可控」的敘事,儘管用戶端看不到 Google 的痕跡,但行業和投資者都知道底層引擎來自何方。

「World Knowledge Answers」:打造 Siri 知識引擎

與 Gemini 合作的同時,Apple 並未放棄自主研發的努力。公司內部正在推進一個名為「World Knowledge Answers」的專案,目標是將 Siri 從一個指令執行者轉變為一個真正的知識回答引擎。這個專案的願景是讓 Siri 能夠像 Google 搜索或 ChatGPT 那樣直接回答各類知識性問題,而不是簡單地將用戶導向網頁搜索結果。

要實現這個目標,Apple 需要建構自己的知識圖譜、事實核查機制和即時資訊更新系統。這是一項浩大的工程,需要大量的數據整理、模型訓練和基礎設施投資。從目前的進度來看,這個專案的完整實現可能要到 2027 年甚至更晚才能面世。

Ferret-3:Apple 自研大模型的野心與時間表

在所有正在進行的 AI 專案中,最能體現 Apple 長期戰略意圖的是代號「Ferret-3」的自研大型語言模型。Ferret 系列並非從零開始——Apple 早在 2023 年就發表了初代 Ferret 的研究論文,展示了一個專注於視覺語言理解的多模態模型。Ferret-2 在此基礎上增強了更高解析度的圖像理解能力。而 Ferret-3 則代表著質的飛躍:它的目標是成為一個能夠完整驅動 Siri 所有 AI 功能的通用大模型。

根據知情人士的說法,Ferret-3 的開發時間表橫跨 2026 至 2027 年。Apple 的工程團隊正在同步推進模型的訓練效率、裝置端推理優化和多模態融合等多個技術方向。Apple 的獨特優勢在於其對硬體的深度掌控——從 A 系列和 M 系列晶片的神經網路引擎,到專為機器學習設計的記憶體架構——這些都讓 Apple 有可能在裝置端運行遠比競爭對手更大、更複雜的模型。

Apple AI 雙軌策略一覽

  • 短期(2026 上半年):依託 Google Gemini 白標合作驅動摘要和規劃功能,部署於 Private Cloud Compute
  • 中期(2026 下半年):iOS 27 推出更多本地化 AI 功能,World Knowledge Answers 專案部分上線
  • 長期(2027 及以後):Ferret-3 自研模型成熟,逐步取代第三方依賴,實現完全自主的 AI 生態系統

但時間是 Apple 最大的敵人。當 Google、Microsoft、Meta 和各家中國科技巨頭都在以月為單位迭代其 AI 產品時,Apple 的 Ferret-3 卻要到 2027 年才可能投入實際應用。在 AI 技術以指數速度演進的當下,18 個月的時間差足以讓競爭格局發生根本性的改變。

領導層變動:從 Giannandrea 到 Rockwell 的權力交接

Siri 的延遲也與 Apple AI 團隊的高層人事變動密切相關。2026 年初,長期主管 Apple 機器學習與 AI 策略的 John Giannandrea 正式退休。Giannandrea 曾是 Google 搜索和 AI 部門的資深高管,2018 年被 Apple 招攬,負責重建公司的 AI 能力。在他的領導下,Apple 開始認真對待深度學習和大型語言模型的研究,但批評者指出他的風格過於謹慎和學術化,導致 Apple 在 AI 產品化方面落後於競爭對手。

接替 Giannandrea 的是 Mike Rockwell——一位在 Apple 內部以推動 AR/VR 技術聞名的高管。Rockwell 此前主導了 Vision Pro 混合實境頭戴裝置的開發,對於將尖端技術轉化為消費者產品有豐富的經驗。Apple 選擇 Rockwell 而非傳統的 AI 研究背景人選來領導 AI 部門,這個決定本身就傳遞了一個明確的信號:公司需要的不是更多的研究突破,而是將現有技術快速轉化為可用產品的執行力。

「Apple 的問題從來不是缺乏 AI 研究人才或技術積累——他們在每年的頂級 AI 會議上發表的論文數量絲毫不遜於 Google 和 Meta。真正的瓶頸在於從實驗室到產品的最後一公里。選擇 Rockwell 來領導這個轉型,表明 Apple 已經意識到需要用產品思維而非純研究思維來驅動 AI 戰略。」

不過,領導層的更替在短期內不可避免地帶來了組織調整和策略重新校準的過渡期。新任主管需要時間來評估現有專案的優先級、重組團隊架構並建立新的決策流程。這個磨合期恰好與 Siri 大改造的關鍵開發階段重疊,客觀上為延遲增添了另一重因素。

連鎖反應:四款新產品受到波及

Siri 的延遲不僅僅是一個軟體更新的問題,它正在對 Apple 的整體產品路線圖產生實質性的連鎖影響。據報導,至少四款即將推出的硬體產品直接受到波及。

第一款是 Apple 籌備已久的智能家居中樞設備。這款產品被設計為 Apple 智能家居生態系統的核心控制器,其核心賣點正是由 AI 驅動的新版 Siri 提供自然語言交互和場景智能控制。缺少了全面升級的 Siri,這款產品的差異化優勢將大打折扣。

第二款是智能門鈴產品。Apple 計劃推出一款整合了影像辨識和語音助手功能的門鈴,用戶可以通過 Siri 查看來訪者資訊、遠程對講並控制門鎖。這款產品同樣高度依賴新 Siri 的上下文理解和設備間協作能力。

第三款則是傳聞中的 AR 眼鏡。作為 Vision Pro 之後的下一步穿戴式計算嘗試,輕量化 AR 眼鏡將更加依賴語音交互——畢竟在眼鏡形態下,手勢操作和視線追蹤只能覆蓋部分使用場景,自然語言指令才是最核心的交互方式。一個功能不完整的 Siri 意味著 AR 眼鏡的用戶體驗將大打折扣。

最後是新一代 Apple TV。Apple 正在將 Apple TV 從一個純粹的串流媒體播放器重新定位為家庭 AI 助手的載體,配備螢幕的新 Apple TV 預計將以 Siri 作為主要交互界面。新版 Siri 的缺席同樣限制了這款產品的功能展示。

三月產品發表會與 Visual Intelligence 的務實轉向

值得注意的是,Apple 已確定於 3 月 2 日至 4 日舉辦產品發表活動。在新版 Siri 缺席的情況下,Apple 預計將把重心放在 Visual Intelligence 功能上——這是 Apple Intelligence 框架中相對成熟且能夠可靠展示的部分。Visual Intelligence 利用 iPhone 的攝像頭實現即時物件辨識、場景理解和翻譯等功能,由於更多依賴裝置端的視覺模型而非大型語言模型,因此開發進度相對順利。

這種策略性的聚焦選擇反映了 Apple 在當下的務實態度:與其強行展示一個不夠成熟的 AI 助手,不如重點呈現已經準備就緒的功能,以維持產品質量的口碑。但這同時也意味著,Apple 在 AI 助手這個最受關注的領域,至少還需要數個月才能給出令人滿意的答案。

對香港消費者與本地生態的影響

對香港的 Apple 用戶而言,Siri 延遲的影響可能比其他市場更為顯著。香港是全球 iPhone 滲透率最高的市場之一,大量消費者依賴 Apple 生態系統進行日常通訊、工作協作和生活管理。在 Apple Intelligence 的語言支援方面,繁體中文和廣東話一直不在首發語言之列,這意味著香港用戶可能要比英語市場的用戶等待更長的時間才能體驗到完整的新版 Siri。

從更宏觀的角度來看,Apple 的 AI 延遲為香港本地的 AI 創業生態提供了一個值得思考的窗口。當全球最大的消費電子公司都在 AI 產品化上遭遇困難時,這恰恰說明了將實驗室成果轉化為億萬用戶可用的產品,本身就是一個極具挑戰性的工程問題。對於香港的科技企業和研究機構而言,在垂直領域——如金融科技、醫療健康、物流和法律服務——建立深度的 AI 應用能力,可能比追逐通用大模型的軍備競賽更加務實和有效。

此外,Apple 在 Private Cloud Compute 上的投資方向對香港的數據中心產業也有啟示意義。隨著 AI 推理需求的爆發式增長,以及亞太地區對數據主權和隱私合規日益重視,香港作為國際數據樞紐的定位有望得到強化——前提是本地能夠提供足夠的算力基礎設施和清晰的數據治理框架。

AI 助手的競爭全景:Apple 還有追趕的機會嗎?

將 Apple 的處境放在整個 AI 助手競爭格局中來看,情況並不樂觀但也遠非絕望。Google 的 Gemini 已經深度整合進 Android 系統和各項 Google 服務,提供從搜索到創作到編程的全方位能力。Microsoft 的 Copilot 正在改變數以億計辦公用戶的工作方式。Meta 的 AI 助手在 WhatsApp、Instagram 和 Facebook 三大平台上觸及了超過 30 億用戶。而 OpenAI 的 ChatGPT 已經成為 AI 助手的代名詞。

然而,Apple 擁有一個任何競爭對手都無法複製的優勢:對整個用戶體驗堆疊的端到端控制。從晶片到操作系統,從應用框架到隱私架構,Apple 是唯一一家能夠在硬體、軟體和服務三個層面同時優化 AI 體驗的公司。當 Ferret-3 和更先進的自研模型最終成熟時,Apple 有機會提供一種與競品根本不同的 AI 體驗——一種真正深度整合於裝置、尊重隱私、且在所有 Apple 設備間無縫流轉的智能助手。

問題在於,這個「最終」會在什麼時候到來,以及屆時市場是否還會給 Apple 足夠的時間和耐心。在科技產業中,遲到者並非沒有逆轉的先例——Apple 自己就曾在智能手機、平板電腦和智能手錶三個品類中以後來者身份最終主導市場。但 AI 的競爭節奏與過往截然不同,模型能力的迭代以周計算,用戶習慣的遷移也在加速。Apple 能否再次上演後來居上的經典劇本,將是 2026 至 2027 年科技產業最值得關注的懸念之一。

本文重點總結

  • 再度延期:新版 AI Siri 確認不會在 iOS 26.4 中出現,功能分散至 iOS 26.5(五月)和 iOS 27(九月)分階段推出
  • 技術障礙:內部測試暴露響應延遲、查詢不準確、ChatGPT 回退失控、語速識別不佳等多項問題
  • Gemini 白標合作:Apple 使用 Google Gemini 驅動摘要和規劃功能,但以白標方式隱藏 Google 品牌,運行於 Apple 自建 PCC 基礎設施
  • Ferret-3 自研路線:Apple 開發自有大模型 Ferret-3,目標 2026-2027 年間成熟,最終取代第三方依賴
  • 領導層更替:AI 主管 John Giannandrea 退休,由 Vision Pro 負責人 Mike Rockwell 接任,強調產品執行力
  • 四產品受阻:智能家居中樞、智能門鈴、AR 眼鏡和新 Apple TV 均因 Siri 延遲受到影響
  • 三月活動聚焦:Apple 3 月 2-4 日活動預計以 Visual Intelligence 為主打,避開尚未就緒的 Siri 升級

Apple 的 AI 轉型之路註定不會平坦。在追求隱私保護與 AI 能力之間尋找平衡、在借力外部夥伴與培養自主能力之間做出取捨、在用戶期望與技術現實之間管理落差——這些都是沒有標準答案的難題。但如果回顧 Apple 的歷史,這家公司最擅長的從來不是搶佔先機,而是在準備充分之後交出一份足以重新定義品類的答卷。新版 Siri 能否成為這樣的答卷,時間會給出最終的評判。