La IA supera la creatividad humana media en un gran estudio de 100.000 participantes

La IA supera al humano promedio en creatividad, pero las mentes más brillantes siguen dominando

Un estudio innovador publicado esta semana en Scientific Reports ha marcado un hito definitivo en la evolución de la inteligencia artificial: por primera vez, los modelos de IA generativa (Generative AI) han demostrado la capacidad de superar al humano promedio en pruebas estandarizadas de creatividad. Sin embargo, el estudio, que analizó datos de más de 100,000 participantes, incluye una salvedad crítica: las mentes humanas más creativas aún superan significativamente incluso a los sistemas de IA más avanzados.

Realizada por un equipo multidisciplinario de la Université de Montréal, la Concordia University y Google DeepMind, la investigación ofrece el análisis comparativo más amplio hasta la fecha sobre la creatividad humana frente a la de las máquinas. Los hallazgos sugieren que, si bien la IA ha democratizado la creatividad "promedio", los niveles más altos de capacidad imaginativa siguen siendo un dominio claramente humano.

La escala del estudio: 100,000 participantes

Dirigido por el profesor Karim Jerbi de la Université de Montréal y con aportaciones del pionero de la IA Yoshua Bengio, el estudio buscó zanjar el debate de larga data: ¿Puede la IA ser realmente creativa? Para responder a esta pregunta, los investigadores fueron más allá de anécdotas de pequeña escala y rigurosas pruebas de Turing, desplegando un conjunto de datos masivo que involucra a 100,000 sujetos humanos.

El núcleo de la evaluación se basó en la Divergent Association Task (DAT). A diferencia de las críticas artísticas subjetivas, el DAT es un instrumento psicológico estandarizado diseñado para medir el pensamiento divergente —un componente clave de la creatividad que implica generar múltiples soluciones únicas a un problema abierto. Se pidió a los participantes que generaran diez sustantivos que estuvieran lo más distantes semánticamente posible entre sí.

Por ejemplo, una secuencia con baja puntuación podría ser «cat, dog, pet, animal», mientras que una secuencia con alta puntuación y gran creatividad podría ser «galaxy, fork, freedom, algae, harmonica». La distancia semántica entre estas palabras se calculó de forma computacional para obtener una puntuación de creatividad.

Resultados de la comparación: el umbral «promedio»

Los resultados revelaron un panorama cambiante. Los modernos Large Language Models (LLMs), incluidos GPT-4, Claude y Gemini, obtuvieron puntuaciones consistentemente superiores a las del participante humano promedio en el DAT. Los modelos de IA demostraron una capacidad superior para romper agrupaciones semánticas y recuperar conceptos dispares con rapidez, un rasgo característico del pensamiento divergente.

Sin embargo, los datos también pusieron de manifiesto un «techo de creatividad» para la IA. Aunque las máquinas superaron con facilidad el rendimiento humano medio, no pudieron competir con el percentil superior del 10 % de participantes humanos. Los humanos más creativos—específicamente el 10 % superior—generaron de manera consistente asociaciones semánticas más originales y variadas que las mejores respuestas de GPT-4 o sus pares.

La siguiente tabla resume los niveles de rendimiento comparativo observados en el estudio:

Grupo de participantes	Nivel de rendimiento	Características clave
Humanos promedio	Línea de base	Tiende a agrupar conceptos (p. ej., listar elementos domésticos relacionados)
IA generativa (GPT-4)	Por encima del promedio	Alta distancia semántica; supera la capacidad media humana
Humanos del 10 % superior	Superior	Divergencia excepcional; conexiones altamente originales y no lineales

Más allá de asociaciones simples

Para garantizar que los hallazgos no se limitaran a simples juegos de palabras, los investigadores ampliaron la comparación a tareas creativas más complejas, como escribir haikus, resumir tramas de películas y redactar relatos breves.

En estas evaluaciones cualitativas, el patrón se mantuvo firme. Los modelos de IA produjeron texto creativo técnicamente competente y estructuralmente sólido que superó los intentos de la persona promedio. Sin embargo, al compararlo con escritores humanos expertos o con individuos altamente creativos, la producción de la IA a menudo carecía de la sutil novedad y la resonancia emocional que caracterizaban las mejores obras humanas.

El profesor Jerbi señaló en el estudio que, si bien la IA actúa como un formidable «remezclador» de datos existentes, lo que le permite superar a los humanos que pueden apoyarse en asociaciones predecibles, tiene dificultades para replicar los saltos intencionales, erráticos y profundamente novedosos realizados por los creadores humanos más talentosos.

El papel de la «temperatura» y el prompting

El estudio también profundizó en los parámetros técnicos que influyen en la creatividad de la IA. Los investigadores descubrieron que ajustar la «temperatura» —un parámetro que controla la aleatoriedad de la salida de una IA— impactaba significativamente en el rendimiento. Temperaturas más altas permitían a los modelos asumir mayores riesgos, generando respuestas más divergentes que los acercaban al desempeño humano de alto nivel, aunque a menudo a costa de la coherencia.

Además, las estrategias de prompting desempeñaron un papel crucial. Cuando se pedía a los modelos de IA que «pensaran específicamente en etimología» o se les imponían otras restricciones estructurales, sus puntuaciones de creatividad mejoraban. Esto sugiere que la creatividad de la IA no es un rasgo fijo, sino una capacidad modulable que depende en gran medida de la orientación humana.

Una herramienta, no un reemplazo

Las implicaciones de este estudio para las industrias creativas son profundas pero matizadas. En lugar de señalar la obsolescencia de la creatividad humana, los hallazgos posicionan a la IA generativa como una poderosa herramienta de aumento.

Para la persona promedio, la IA puede servir como un «motor de creatividad», elevando su producción a un nivel base más alto de calidad y divergencia. Para los creativos de primera línea, la IA actúa como un asistente competente que puede encargarse del trabajo pesado «promedio» de la lluvia de ideas, permitiendo al humano centrarse en el trabajo conceptual de alto nivel que las máquinas aún no pueden abordar.

«Necesitamos ir más allá de esta engañosa sensación de competencia», declaró el profesor Jerbi sobre los hallazgos. «La IA generativa se ha convertido, ante todo, en una herramienta extremadamente poderosa al servicio de la creatividad humana: no reemplazará a los creadores, sino que transformará profundamente la manera en que imaginan, exploran y crean.»

Significado científico

Esta investigación, publicada en Scientific Reports, valida el rápido progreso de la investigación científica en el campo de la evaluación de la IA. Al establecer una métrica cuantificable para la creatividad que se aplica tanto a las mentes biológicas como a las sintéticas, el estudio proporciona una base para el futuro desarrollo de la IA.

También reafirma a la comunidad artística que, aunque la base de la creatividad se ha elevado gracias a la automatización, el techo sigue siendo alto y distintivamente humano. A medida que avanzamos hacia 2026, la colaboración entre la IA que «supera al promedio» y la mente humana «superior» parece ser el camino más prometedor para la innovación.