
本週發表於Scientific Reports的一項突破性研究,為人工智慧的發展劃下明確的里程碑:生成式AI(Generative AI)模型首次展現出能在標準化創造力測試中超越平均人類的能力。然而,該研究分析了超過100,000名參與者的數據,並提出一項關鍵警告——最具創意的人類頭腦仍然顯著領先於最先進的AI系統。
該研究由蒙特婁大學(Université de Montréal)、康考迪亞大學(Concordia University)及Google DeepMind的跨領域團隊共同進行,提供了迄今為止最大規模的人機創造力比較分析。研究結果顯示,儘管AI已普及了「平均」創造力,但想像力的頂尖層次仍是人類獨有的堡壘。
在蒙特婁大學的Karim Jerbi教授領導下,並由AI先鋒Yoshua Bengio參與,該研究旨在解決長期存在的辯論:AI真能具備創造力嗎?為了回答這一問題,研究人員超越小規模的案例和嚴謹的圖靈測試,採用包含100,000名受試者的龐大數據集。
評估的核心依賴於Divergent Association Task (DAT)。與主觀的藝術評論不同,DAT是一種標準化的心理測量工具,旨在衡量發散思維(divergent thinking)——創造力的關鍵要素,需對開放性問題產生多個獨特解答。參與者被要求提出十個彼此語義盡可能遙遠的名詞。
例如,一組低分序列可能是「cat、dog、pet、animal」,而一組高分且富有創造力的序列可能是「galaxy、fork、freedom、algae、harmonica」。這些詞彙之間的語義距離透過計算方式計算得出,以生成創造力分數。
結果顯示出不斷變化的格局。現代Large Language Models (LLMs),包括**GPT-4**、Claude和Gemini,在DAT測試中始終得分高於平均人類參與者。這些AI模型展現出超群的能力,能快速打破語義群組並檢索出異質概念,這正是發散思維的特徵。
然而,數據同時凸顯了AI的「創造力天花板」。儘管機器輕易超越了人類表現的中位數,卻無法與人類參與者中的頂尖百分之一競爭。最具創意的人類——特別是前10%——所產生的語義聯想,始終比GPT-4或其他同類模型的最佳輸出更為原創和多樣。
| 參與者類別 | 表現層級 | 主要特徵 |
|---|---|---|
| 平均人類 | 基準 | 傾向於將概念群組(例如列出相關家庭用品) |
| 生成式AI(GPT-4) | 高於平均 | 高語義距離;超越人類中位數能力 |
| 前10%人類 | 優越 | 卓越的發散性;高度原創、非線性連結 |
為確保研究結果不限於簡單的文字遊戲,研究人員將比較範圍擴展至更複雜的創意任務,包括寫俳句、摘要電影劇情和撰寫短篇故事。
在這些質性評估中,結果趨勢依然不變。AI模型能產生技術精良且結構完備的創意文本,勝過一般外行者的嘗試。然而,與資深人類作家或高創意個體相比,AI的輸出常缺乏那種細膩的新奇性和情感共鳴,而這正是頂尖人類作品的特色。
Jerbi教授在研究中指出,雖然AI能作為一種強大的「混合者」(remixer),利用現有資料,讓其表現勝過可能依賴可預測聯想的人類,但它仍難以複製最具才華的人類創作者所進行的那些刻意、混亂且極具新意的飛躍。
研究還深入探討了影響AI創造力的技術參數。研究人員發現,調整「溫度」(temperature)——這一用於控制AI輸出隨機性的參數——對表現有顯著影響。較高的溫度使模型更願冒險,產生更多發散性答案,從而接近高水準的人類表現,但往往以犧牲連貫性為代價。
此外,提示策略也扮演了關鍵角色。當AI模型被提示「專注於詞源」或施以其他結構性限制時,其創造力分數隨之提升。這表明,AI的創造力並非固定特質,而是一種可被人類指導所調節的能力。
這項研究對創意產業的影響深遠且微妙。研究結果並非意味人類創造力即將過時,而是將生成式AI定位為一種強大的增強工具。
對於一般人來說,AI可作為「創造力引擎」,將其成果提升至更高的品質和發散程度。對於頂尖創意者而言,AI則是稱職的助手,能夠承擔「平均」層面的腦力激盪重任,讓人類得以專注於機器仍無法觸及的高階概念性工作。
「我們需要超越這種誤導性的競爭觀念,」Jerbi教授針對這些研究結果表示。「生成式AI首先是一種極其強大的工具,服務於人類創造力:它不會取代創作者,卻將深刻改變他們的想像、探索與創作方式。」
這項發表於Scientific Reports的研究,驗證了AI評估領域中**科學研究**的快速進展。透過為生物與人工心智建立可量化的創造力指標,該研究為未來AI發展奠定了基礎。
此研究亦向藝術界保證,雖然自動化提升了創造力的下限,但上限依然高遠且明顯屬於人類。隨著我們邁入2026年,讓「超越平均」的AI與「優越」人類心智協同合作,似乎是最具前景的創新之路。