十萬人 vs AI 創意力大比拼:最新研究揭示誰更有創造力
史上最大規模比較研究發現:AI 超越普通人,但創意天才仍是人類的專利
一項發表於《Scientific Reports》的突破性研究震動了 AI 和心理學界。這項由蒙特利爾大學 Karim Jerbi 教授領導、包括 AI 先驅 Yoshua Bengio 在內的國際團隊進行的研究,比較了十萬名人類參與者和多個大語言模型的創造力表現。
這是史上最大規模的 AI vs 人類創造力比較研究。研究團隊測試了包括 ChatGPT(GPT-4)、Claude、Gemini 等多個大語言模型,並將其表現與 100,000 名人類參與者進行對比。
主要測試工具是發散性聯想任務(Divergent Association Task,DAT),這是一種測量發散性創造力的標準工具——即從單一起點產生多樣化、原創想法的能力。DAT 要求參與者產出十個語義上盡可能不同的詞彙。
研究發現,GPT-4 等 AI 模型在發散性語言創造力任務上已超越人類的平均表現。這意味著,如果隨機挑選一個普通人和 GPT-4 進行創意比賽,AI 更有可能獲勝。
然而,研究也揭示了一個關鍵發現:創意力前 50% 的人類超越了所有測試的 AI 模型,而前 10% 的創意天才更是遙遙領先。
「最具創造力的個體仍然明顯超越即使是最好的 AI 系統。這表明人類創造力的上限遠未被 AI 觸及。」
研究發現,AI 的創造力可以通過調整「溫度」(temperature)參數來調節。低溫度時,AI 產出謹慎、可預測的輸出;高溫度時,則引入更多隨機性,產生更多樣化和原創的聯想。
指令的措辭方式強烈影響 AI 創造力。例如,基於詞源學的提示策略會導致更不明顯的聯想,從而獲得更高的創造力分數。
有趣的是,研究發現較新版本的 AI 並不一定更有創造力。有時候,新版本的創造力反而下降。研究者認為這可能是因為新版本為了速度和成本優化,犧牲了部分創造力。
這項研究對創意產業有重要啟示:
這項研究的另一個貢獻是提供了一套標準化的 AI vs 人類創造力比較方法。未來的研究者可以使用相同的框架追蹤 AI 創造力的發展。
香港作為亞洲創意之都,這項研究提供了重要參考。本地廣告、設計、媒體公司可以更有信心地將 AI 用於創意流程,同時確保人類創意人才的核心價值。
對於個人而言,這項研究也是一個提醒:在 AI 時代,培養和發揮獨特的創造力比以往任何時候都更重要。