L'IA dépasse la créativité humaine moyenne dans une vaste étude de 100 000 participants

L'IA surpasse l'humain moyen en créativité, mais les esprits les plus brillants restent incontestés

Une étude révolutionnaire publiée cette semaine dans Scientific Reports a marqué une étape décisive dans l'évolution de l'intelligence artificielle : pour la première fois, des modèles d'IA générative (Generative AI) ont démontré leur capacité à surpasser l'humain moyen aux tests de créativité standardisés. Cependant, l'étude, qui a analysé les données de plus de 100 000 participants, apporte une mise en garde cruciale : les esprits humains les plus créatifs surpassent toujours de manière significative même les systèmes d'IA les plus avancés.

Menée par une équipe pluridisciplinaire de l'Université de Montréal, de l'Université Concordia et de Google DeepMind, la recherche constitue à ce jour la plus vaste analyse comparative de la créativité humaine face à celle des machines. Les résultats suggèrent que si l'IA a démocratisé la créativité « moyenne », les plus hauts niveaux de capacité imaginative restent un bastion résolument humain.

L'ampleur de l'étude : 100 000 participants

Dirigée par le professeur Karim Jerbi de l'Université de Montréal et bénéficiant des contributions du pionnier de l'IA Yoshua Bengio, l'étude vise à trancher le débat de longue date : l'IA peut-elle vraiment être créative ? Pour y répondre, les chercheurs sont allés au-delà des anecdotes à petite échelle et des tests de Turing rigoureux, en exploitant un jeu de données massif impliquant 100 000 sujets humains.

Le cœur de l'évaluation reposait sur la Tâche d'association divergente (Divergent Association Task, DAT). Contrairement aux critiques artistiques subjectives, le DAT est un instrument psychologique standardisé conçu pour mesurer la pensée divergente, un composant clé de la créativité qui consiste à générer plusieurs solutions uniques à un problème ouvert. Les participants devaient produire dix noms aussi sémantiquement éloignés les uns des autres que possible.

Par exemple, une séquence à faible score pourrait être « chat, chien, animal de compagnie, animal », tandis qu'une séquence à score élevé, très créative, pourrait ressembler à « galaxie, fourchette, liberté, algue, harmonica ». La distance sémantique entre ces mots a été calculée de manière informatique pour obtenir un score de créativité.

Résultats de la comparaison : le seuil « moyen »

Les résultats ont révélé un paysage en mutation. Les Grands modèles de langage (Large Language Models, LLMs) modernes, notamment GPT-4, Claude et Gemini, ont systématiquement obtenu des scores supérieurs à ceux de l'humain moyen au DAT. Les modèles d'IA ont démontré une capacité supérieure à briser les clusters sémantiques et à récupérer rapidement des concepts disparates, marque distinctive de la pensée divergente.

Cependant, les données ont également mis en évidence un « plafond de créativité » pour l'IA. Si les machines ont facilement dépassé la performance médiane des humains, elles n'ont pas réussi à rivaliser avec le percentile supérieur des participants humains. Les individus les plus créatifs — en particulier les 10 % les mieux classés — ont systématiquement généré des associations sémantiques plus originales et variées que les meilleures productions de GPT-4 ou de ses homologues.

Le tableau suivant résume les niveaux de performance comparatifs observés dans l'étude :

Groupe de participants	Niveau de performance	Caractéristiques clés
Humains moyens	Référence	Tendance à regrouper les concepts (par ex. énumération d'objets ménagers connexes)
IA générative (Generative AI) (GPT-4)	Au-dessus de la moyenne	Grande distance sémantique ; dépasse la capacité humaine médiane
10 % des meilleurs humains	Supérieur	Divergence exceptionnelle ; connexions hautement originales et non linéaires

Au-delà des simples associations

Pour s'assurer que les résultats ne se limitaient pas à de simples jeux de mots, les chercheurs ont étendu la comparaison à des tâches créatives plus complexes, notamment la rédaction de haïkus, la synthèse de synopsis de films et la rédaction de nouvelles.

Dans ces évaluations qualitatives, le schéma s'est confirmé. Les modèles d'IA ont produit des textes créatifs techniquement compétents et structurellement solides, surpassant les tentatives d'une personne lambda. Pourtant, comparé à des écrivains humains expérimentés ou à des individus très créatifs, le rendu de l'IA manquait souvent de la subtilité novatrice et de la résonance émotionnelle qui caractérisent les meilleures œuvres humaines.

Le professeur Jerbi a noté dans l'étude que si l'IA agit comme un « remixer » redoutable de données existantes, lui permettant de surpasser des humains qui peuvent s'appuyer sur des associations prévisibles, elle peine à reproduire les bonds intentionnels, erratiques et profondément novateurs réalisés par les créateurs humains les plus talentueux.

Le rôle de la « température » et du prompting

L'étude s'est également penchée sur les paramètres techniques qui influencent la créativité de l'IA. Les chercheurs ont constaté que l'ajustement de la « température », un paramètre qui contrôle la randomisation des sorties de l'IA, avait un impact significatif sur la performance. Des températures plus élevées ont permis aux modèles de prendre davantage de risques, générant des réponses plus divergentes qui les rapprochaient des performances humaines de haut niveau, bien souvent au détriment de la cohérence.

Par ailleurs, les stratégies de prompting ont joué un rôle crucial. Lorsque les modèles d'IA étaient incités à « réfléchir spécifiquement à l’étymologie » ou soumis à d'autres contraintes structurelles, leurs scores de créativité s'amélioraient. Cela suggère que la créativité de l'IA n'est pas un trait fixe mais une capacité modulable qui dépend largement de l'orientation humaine.

Un outil, pas un substitut

Les implications de cette étude pour les industries créatives sont profondes mais nuancées. Plutôt que de signaler l'obsolescence de la créativité humaine, les résultats positionnent l'IA générative comme un outil d'augmentation puissant.

Pour la personne moyenne, l'IA peut servir de « moteur de créativité », élevant son résultat à un niveau de qualité et de divergence supérieur. Pour les créatifs de haut niveau, l'IA sert d'assistant compétent capable de gérer la tâche « moyenne » du brainstorming, laissant à l'humain le soin de se concentrer sur les travaux conceptuels de haut niveau que les machines ne peuvent toujours pas réaliser.

« Nous devons dépasser ce faux sentiment de compétition », a déclaré le professeur Jerbi au sujet des résultats. « L'IA générative est avant tout devenue un outil extrêmement puissant au service de la créativité humaine : elle ne remplacera pas les créateurs, mais transformera profondément leur manière d'imaginer, d'explorer et de créer. »

Importance scientifique

Cette recherche, publiée dans Scientific Reports, valide les progrès rapides de la recherche scientifique dans le domaine de l'évaluation de l'IA. En établissant une métrique quantifiable de la créativité applicable tant aux esprits biologiques qu'aux esprits synthétiques, l'étude fournit une base pour le développement futur de l'IA.

Elle rassure également la communauté artistique sur le fait que si le plancher de la créativité a été relevé par l'automatisation, le plafond reste élevé et résolument humain. À mesure que nous avançons en 2026, la collaboration entre l'IA « dépassant la moyenne » et l'esprit humain « supérieur » semble être la voie la plus prometteuse pour l'innovation.