十萬人 vs AI 創意力大比拼：最新研究揭示誰更有創造力

一項發表於《Scientific Reports》的突破性研究震動了 AI 和心理學界。這項由蒙特利爾大學 Karim Jerbi 教授領導、包括 AI 先驅 Yoshua Bengio 在內的國際團隊進行的研究，比較了十萬名人類參與者和多個大語言模型的創造力表現。

研究設計

這是史上最大規模的 AI vs 人類創造力比較研究。研究團隊測試了包括 ChatGPT（GPT-4）、Claude、Gemini 等多個大語言模型，並將其表現與 100,000 名人類參與者進行對比。

主要測試工具是發散性聯想任務（Divergent Association Task，DAT），這是一種測量發散性創造力的標準工具——即從單一起點產生多樣化、原創想法的能力。DAT 要求參與者產出十個語義上盡可能不同的詞彙。

                        研究規模
                        人類參與者：100,000 人
測試的 AI 模型：GPT-4、Claude、Gemini 等
測試工具：發散性聯想任務（DAT）
研究機構：蒙特利爾大學、多倫多大學、Mila、Google DeepMind

                    

核心發現

AI 超越普通人

研究發現，GPT-4 等 AI 模型在發散性語言創造力任務上已超越人類的平均表現。這意味著，如果隨機挑選一個普通人和 GPT-4 進行創意比賽，AI 更有可能獲勝。

但頂尖人才仍佔優勢

然而，研究也揭示了一個關鍵發現：創意力前 50% 的人類超越了所有測試的 AI 模型，而前 10% 的創意天才更是遙遙領先。

「最具創造力的個體仍然明顯超越即使是最好的 AI 系統。這表明人類創造力的上限遠未被 AI 觸及。」

影響 AI 創意力的因素

溫度參數

研究發現，AI 的創造力可以通過調整「溫度」（temperature）參數來調節。低溫度時，AI 產出謹慎、可預測的輸出；高溫度時，則引入更多隨機性，產生更多樣化和原創的聯想。

提示詞策略

指令的措辭方式強烈影響 AI 創造力。例如，基於詞源學的提示策略會導致更不明顯的聯想，從而獲得更高的創造力分數。

更新不等於更創意

有趣的是，研究發現較新版本的 AI 並不一定更有創造力。有時候，新版本的創造力反而下降。研究者認為這可能是因為新版本為了速度和成本優化，犧牲了部分創造力。

對創意產業的影響

這項研究對創意產業有重要啟示：

AI 作為輔助：對於需要大量創意輸出的工作，AI 可以作為有效的輔助工具
人類仍是核心：需要頂級創意的工作——如藝術創作、品牌策略、創新研發——人類仍然不可替代
協作模式：最佳策略可能是人機協作，利用 AI 的量產能力和人類的頂級創意

方法論創新

這項研究的另一個貢獻是提供了一套標準化的 AI vs 人類創造力比較方法。未來的研究者可以使用相同的框架追蹤 AI 創造力的發展。

對香港創意產業的啟示

香港作為亞洲創意之都，這項研究提供了重要參考。本地廣告、設計、媒體公司可以更有信心地將 AI 用於創意流程，同時確保人類創意人才的核心價值。

對於個人而言，這項研究也是一個提醒：在 AI 時代，培養和發揮獨特的創造力比以往任何時候都更重要。

                        本文要點總結
                        史上最大規模研究：10 萬人 vs 多個 AI 模型
GPT-4 等 AI 已超越人類平均創意水平
但前 50% 的人類仍超越所有 AI，前 10% 遙遙領先
AI 創意可通過溫度參數和提示詞策略調節
新版 AI 不一定更有創意，有時反而下降