AIが10万人規模の大規模研究で平均的な人間の創造性を上回る

AIは平均的な人間を創造性で上回るが、トップの頭脳が依然として圧倒的である

今週 Scientific Reports に掲載された画期的な研究は、人工知能の進化において決定的なマイルストーンを示しました。初めて、生成的AI（Generative AI）モデルが標準化された創造性テストで平均的な人間を上回る能力を示したのです。しかし、10万人を超える参加者のデータを分析したこの研究には重要な留意点があります――最も創造的な人間の頭脳は、最先端のAIシステムでさえも依然として大きく凌駕しています。

モントリオール大学、コンコルディア大学、およびGoogle DeepMindの学際的チームによって行われたこの研究は、人間と機械の創造性を比較した最大規模の分析を提供します。結果は、AIが「平均的な」創造性を民主化した一方で、想像力の上限は依然として明確に人間の領域に留まっていることを示唆しています。

研究規模：10万人の参加者

モントリオール大学のカリム・ジェルビ教授を中心に、AIの先駆者ヨシュア・ベンジオの協力を得て行われたこの研究は、長年の議論—AIは本当に創造的になり得るのか—に決着をつけることを目指しました。そのために、研究者たちは小規模な逸話や厳格なチューリングテストを超え、10万人の被験者を含む大規模なデータセットを活用しました。

評価の中核には、**発散的連想課題（Divergent Association Task: DAT）**がありました。主観的な芸術批評とは異なり、DATは発散的思考を測定するために設計された標準化された心理学的手法です。発散的思考とは、開かれた問題に対して複数の独自解を生成する創造性の重要な要素です。参加者には、意味的にできるだけ遠く離れた名詞を10個生成するよう求められました。

例えば、低得点の列は「cat, dog, pet, animal」のようになる一方、高得点で創造性の高い列は「galaxy, fork, freedom, algae, harmonica」のようになります。これらの単語間の意味的距離は計算的に算出され、創造性スコアが導き出されました。

比較結果：「平均」しきい値

結果は変化しつつある状況を明らかにしました。GPT-4、Claude、Geminiなどの最新の大規模言語モデル（LLM）は、DATで平均的な人間の参加者よりも一貫して高いスコアを記録しました。これらのAIモデルは、意味的なクラスターを破り、異なる概念を迅速に抽出する優れた能力を示し、これは発散的思考の証です。

しかし、データはAIに「創造性の天井」が存在することも浮き彫りにしました。機械は簡単に人間の中央値のパフォーマンスを超えたものの、参加者の上位パーセンタイルと競うことはできませんでした。最も創造的な人間――具体的には上位10％――は、GPT-4や同等のモデルの最高出力よりも一貫してより独創的で多様な意味連想を生成しました。

以下の表は、研究で観察された比較パフォーマンスのレベルをまとめたものです：

被験者グループ	パフォーマンス状況	主な特徴
平均的な人間	ベースライン	概念をクラスター化しがち（例：関連する家事用品を列挙）
生成的AI（GPT-4）	平均以上	意味的距離が大きく、中央値以上の人間の能力を超える
上位10％の人間	優れた	卓越した発散性；非常に独創的で非線形な連想

単純な連想を超えて

発見が単純な言葉遊びに限られないことを確認するために、研究者たちは比較をより複雑な創造的課題にまで拡張しました。これには、俳句の作成、映画のプロットの要約、短編小説の執筆などが含まれます。

これらの質的評価においても、同じ傾向が維持されました。AIモデルは、技術的に洗練され構造的に整った創造的テキストを生成し、平均的な素人の試みに勝る成果を示しました。しかし、熟練の人間の作家や高度に創造的な個人と比較すると、AIの生成物はしばしば微妙な新規性や感情的共鳴が欠けており、トップの人間の作品に見られる特徴を再現できていませんでした。

ジェルビ教授は研究で、AIは既存のデータを強力に「リミックス」する存在として機能し、予測可能な連想に頼りがちな人間を上回る一方で、最も才能ある人間のクリエイターが行う意図的で突発的かつ非常に新奇な飛躍を再現するのは困難であると指摘しています。

「temperature」とプロンプトの役割

研究では、AIの創造性に影響を与える技術的パラメータにも踏み込みました。研究者たちは、「temperature」というAIの出力のランダム性を制御するパラメータを調整すると、パフォーマンスに大きく影響することを発見しました。温度を高く設定することで、モデルはよりリスクを取って回答を発散させ、高度な人間のパフォーマンスに近づく一方で、一貫性が損なわれることがしばしばありました。

さらに、プロンプト戦略も重要な役割を果たしました。AIモデルに「語源について具体的に考えよ」と指示したり、他の構造的制約を与えたりすると、創造性スコアが向上しました。これは、AIの創造性は固定された特性ではなく、人間のガイドによって大きく左右される調整可能な能力であることを示唆しています。

置き換えではなくツールとして

この研究が創造産業にもたらす意味は深遠ですが、微妙です。人間の創造性の陳腐化を示すのではなく、生成的AIを強力な拡張ツールとして位置づけています。

一般の人にとって、AIは「創造性エンジン」として機能し、アウトプットを質と発散性の高い新たな基準へ引き上げます。トップクラスのクリエイターにとって、AIはブレインストーミングの「平均的」な作業を担う有能なアシスタントとなり、人間は依然として機械が及ばない高次の概念的作業に集中できるようになります。

「この誤った競争意識を超える必要があります」とジェルビ教授は結果について述べています。「生成的AIは何よりもまず人間の創造性を支える非常に強力なツールとなりました。クリエイターを置き換えるのではなく、彼らの想像、探求、創造の方法を根本から変革するでしょう。」

科学的意義

この研究は Scientific Reports に掲載され、AI評価の分野における**科学研究**の急速な進展を裏付けるものです。生物的な心と人工的な心の両方に適用可能な創造性の定量化指標を確立することで、将来のAI開発の基盤を提供します。

また、クリエイティブコミュニティに対して、自動化によって創造性の底辺が引き上げられた一方で、天井は高く明らかに人間のままであることを保証します。2026年に向けて、「平均を超える」AIと「優れた」人間の頭脳の協働こそが、イノベーションの最も有望な道筋に見えます。