← 返回新聞列表

Perplexity 推出 Model Council:多模型交叉驗證開啟 AI 搜索新時代

2026 年 2 月 5 日,AI 搜索引擎 Perplexity 推出了一項名為「Model Council」的革命性功能:讓三個頂尖 AI 模型同時回答同一個問題,再由一個「主席」模型綜合分析各方觀點。這不是簡單的多模型並行——它是 AI 行業從「單一模型崇拜」走向「集體智慧」的標誌性轉折。

從單一模型到模型委員會:範式的轉變

過去三年,AI 行業的主流敘事一直圍繞著「哪個模型最強」展開。GPT-4 發布時被譽為天花板,Claude 3 打破了這個天花板,Gemini 又聲稱超越了所有人。每隔幾個月,排行榜上的王座就會易主,而用戶則在不同模型之間疲於奔命,試圖為每個任務找到最佳選擇。

Perplexity 的 Model Council 提出了一個根本不同的問題:與其執著於尋找「最好的模型」,為什麼不讓多個模型同時工作,然後比較它們的答案?

這個理念的核心洞察來自一個簡單的認知科學原理:每一個 AI 模型都有盲點。Claude 可能在推理方面表現卓越,但在某些特定領域的事實回憶上不如 GPT;GPT 可能在代碼生成上領先,但在處理模糊性和細微差別時不如 Claude。單獨使用任何一個模型,你都無法知道它的回答是否落入了自己的盲區。但當三個模型對同一個問題給出一致的答案時,你的信心就會顯著提升。

Model Council 的運作機制

三個「顧問」,一個「主席」

Model Council 的架構可以用一個董事會會議的比喻來理解。當用戶提出一個查詢時,系統將其同時發送給三個前沿模型——例如 Claude Opus 4.6、GPT-5.2 和 Gemini 3.0。這三個模型獨立生成各自的回答,互不干擾,確保觀點的獨立性。

然後,一個「主席」模型(預設為 Claude Opus 4.5)介入,它的任務不是給出自己的答案,而是綜合分析三個顧問模型的輸出。主席模型執行四項關鍵職能:

  • 識別共識:找出三個模型一致同意的觀點和事實,這些通常是可靠性最高的內容。
  • 標示分歧:明確指出模型之間存在分歧的地方,並分析分歧的可能原因。
  • 挖掘獨特洞見:某個模型可能提出了另外兩個模型忽略的有價值觀點,主席模型會將其提煉出來。
  • 評估證據強度:對各個論點的證據基礎進行評估,區分有據可查的事實和推測性判斷。
「共識是信心的信號,分歧是警告的信號。當三個獨立的 AI 模型在一個事實問題上達成一致,你可以相當有信心地相信這個答案。但當它們出現嚴重分歧時,這恰恰是告訴你:這個問題比你以為的更複雜,需要更謹慎的判斷。」

收斂與發散:雙重價值

Model Council 最精妙的設計在於,它同時利用了模型回答的收斂性和發散性。

收斂——多個模型給出相似答案——提供了一種隱式的交叉驗證。這類似於科學研究中的獨立重複實驗:當不同的實驗室使用不同的方法得出相同的結論時,這個結論的可信度就大大增加。在 AI 領域,不同的模型基於不同的訓練數據、不同的架構和不同的對齊方法,如果它們在事實問題上收斂,這種一致性是非常有意義的。

發散——模型之間的分歧——同樣具有巨大價值。分歧可能揭示問題的多面性,暴露隱含的前提假設,或者指出某個模型可能的幻覺(hallucination)。對於投資研究這樣的高風險決策場景,知道「哪裡存在不確定性」往往比得到一個自信滿滿但可能錯誤的答案更有價值。

Model Council 的核心使用場景

  • 投資研究:分析一家公司的前景時,不同模型可能基於不同的數據維度(財務數據、市場趨勢、管理團隊評估)給出不同的權重,綜合分析比單一觀點更全面。
  • 複雜決策:涉及多方利益權衡的商業決策,Model Council 可以呈現不同的決策框架和考量因素。
  • 創意腦力激盪:在創意工作中,模型之間的「分歧」反而是靈感的來源,不同模型的獨特視角可以激發意想不到的創意方向。
  • 事實核查:對於新聞事實、歷史事件或科學知識的查詢,多模型一致性是判斷答案可靠性的強有力指標。

定價策略與市場定位

Model Council 目前僅對 Perplexity Max 訂閱用戶開放,月費 200 美元(年費 2,000 美元)。這個定價策略清晰地表明了 Perplexity 的市場定位:這不是面向一般消費者的功能,而是面向專業研究人員、分析師和決策者的高端工具。

從成本結構來看,這個定價完全合理。每次 Model Council 查詢需要同時調用三個頂尖模型和一個主席模型,API 成本大約是單模型查詢的四倍以上。對於一個月進行數百次深度研究查詢的專業用戶來說,200 美元的月費與直接購買各家 API 相比其實是划算的——更不用說 Perplexity 還提供了精心設計的綜合分析層。

值得注意的是,Perplexity 已暗示 Model Council 可能會在未來擴展到 Pro 訂閱層級(月費 20 美元),並且行動裝置的支持也即將推出。這意味著隨著模型 API 成本的持續下降,多模型交叉驗證可能在一兩年內成為 AI 搜索的標準功能,而非高端附加值。

幻覺問題的系統性解決方案

AI 模型的幻覺問題(Hallucination)一直是阻礙企業大規模採用的最大障礙之一。單一模型的幻覺率即使降到 5% 以下,對於金融、法律、醫療等需要高準確性的領域仍然不可接受。

Model Council 提供了一種系統性的緩解方案。概率論告訴我們,三個獨立事件同時出錯的概率遠低於單一事件出錯的概率。如果三個模型的幻覺是獨立的(即它們不會在相同的地方犯相同的錯誤),那麼三個模型同時產生相同幻覺的概率接近單一模型幻覺率的三次方。

當然,現實情況並非如此理想——不同模型可能因為共享相似的訓練數據而在某些領域產生相關的幻覺。但即便如此,多模型交叉驗證仍然顯著降低了幻覺風險。更重要的是,當模型之間出現分歧時,系統會主動提醒用戶存在不確定性,而不是像單一模型那樣自信地呈現可能錯誤的信息。

從「信任模型」到「驗證模型」

Model Council 代表著 AI 使用範式的一個重要轉變:從「信任一個模型的輸出」到「驗證多個模型的共識」。這與金融行業的「雙重審核」原則和科學研究的「同行評審」機制異曲同工。

這種轉變的深層含義是:我們不再期望任何單一 AI 模型是完美的。相反,我們建立了一個承認和管理不完美性的系統。這是一種更成熟、更務實的 AI 使用哲學。

行業競爭格局的影響

Model Council 的推出對 AI 搜索和模型提供商的競爭格局都有深遠影響。

對於 AI 搜索市場,Perplexity 通過 Model Council 建立了一個獨特的護城河。Google 的 AI Overviews 和 OpenAI 的 ChatGPT 搜索功能都依賴於自家模型,而 Perplexity 作為模型中立的平台,天然適合實現多模型策略。這種架構上的差異化可能成為 Perplexity 對抗科技巨頭的關鍵武器。

對於模型提供商來說,Model Council 意味著它們之間的競爭從「零和博弈」變成了「正和博弈」。在傳統的「選擇最好的模型」範式下,第二名就意味著失敗。但在多模型交叉驗證的範式下,每個有獨特優勢的模型都有其存在價值。這可能鼓勵更多的模型專業化,而非所有人都追求成為全能冠軍。

對香港的啟示

金融研究的範式升級

香港作為亞洲最重要的金融中心之一,投資研究和分析是其核心產業。Model Council 的多模型交叉驗證方法與金融分析的本質需求高度契合。在證券分析中,分析師本就被訓練要從多個角度審視同一個投資機會——基本面、技術面、市場情緒、宏觀環境。Model Council 實際上將這種多維度分析方法自動化了。

想像一個場景:一位香港對沖基金分析師需要快速評估一家在港上市的中國科技公司。Model Council 可以同時從英文、中文數據源提取信息,比較不同模型對財務數據的解讀,標出分析師可能忽略的風險因素。當三個模型都對某個潛在風險發出警告時,這比任何單一模型的預警都更值得重視。

專業服務的質量提升

香港的法律、會計和諮詢行業同樣可以從多模型驗證中受益。法律研究需要高度的準確性——錯誤引用一個案例或法條可能導致嚴重後果。會計師在處理跨境稅務問題時面臨複雜的規則交叉。這些場景中,多模型交叉驗證可以作為額外的質量把關層。

建立對 AI 的校準信任

香港的專業人士對 AI 的態度普遍是「謹慎樂觀」——他們認可 AI 的潛力,但對其可靠性心存疑慮。Model Council 提供的不僅是更準確的答案,更是一種「校準的信任」——你知道什麼時候可以信任答案(多模型共識),什麼時候需要人工判斷(模型分歧)。這種透明度對於建立專業人士對 AI 工具的信心至關重要。

本文要點總結

  • Perplexity Model Council 於 2026 年 2 月 5 日推出,讓三個前沿 AI 模型(如 Claude Opus 4.6、GPT-5.2、Gemini 3.0)同時回答查詢,再由主席模型(預設 Claude Opus 4.5)綜合分析。
  • 共識(收斂)是可靠性的信號,分歧(發散)是不確定性的警告——兩者對用戶都有巨大價值。
  • 多模型交叉驗證從概率上顯著降低了 AI 幻覺風險,為高準確性需求場景提供了系統性解決方案。
  • 目前僅對 Max 訂閱用戶(月費 200 美元)開放,定位為專業研究工具,但未來可能擴展至更廣泛的用戶群。
  • Model Council 代表從「信任單一模型」到「驗證多模型共識」的範式轉變,改變了 AI 可靠性的評估方式。
  • 對香港金融研究、專業服務和企業 AI 採用具有直接應用價值,尤其在需要高準確性和多維度分析的場景中。