ИИ превосходит средний человеческий креатив в масштабном исследовании с 100 000 участниками

ИИ (AI) превосходит среднестатистического человека в креативности, но лучшие умы по-прежнему непобедимы

Новаторское исследование, опубликованное на этой неделе в Scientific Reports, ознаменовало важную веху в развитии искусственного интеллекта: впервые модели генеративного ИИ (Generative AI) продемонстрировали способность превзойти среднестатистического человека в стандартизированных тестах на креативность. Однако, исследование, в котором были проанализированы данные более чем 100 000 участников, содержит важное уточнение — самые креативные умы человека по-прежнему значительно превосходят даже самые передовые системы ИИ.

Проведённое мультидисциплинарной командой из Université de Montréal, Concordia University и Google DeepMind исследование представляет собой крупнейший сравнительный анализ человеческой и машинной креативности на сегодняшний день. Полученные результаты показывают, что, хотя ИИ демократизировал «среднюю» креативность, высшие уровни воображения по-прежнему остаются исключительной прерогативой человека.

Масштаб исследования: 100 000 участников

Под руководством профессора Karim Jerbi из Université de Montréal и при участии пионера в области ИИ Yoshua Bengio, исследование было направлено на разрешение давнего спора: может ли ИИ действительно быть креативным? Чтобы ответить на этот вопрос, исследователи вышли за рамки мелкомасштабных анекдотов и строгих тестов Тьюринга, использовав обширный набор данных с участием 100 000 человек.

Основу оценки составляло задание Divergent Association Task (DAT). В отличие от субъективных художественных критик, DAT является стандартизированным психологическим инструментом, предназначенным для измерения дивергентного мышления — ключевого элемента креативности, включающего в себя генерацию множества уникальных решений для открытой проблемы. Участникам предлагалось назвать десять существительных, максимально семантически удалённых друг от друга.

Например, последовательность с низким баллом может выглядеть так: «cat, dog, pet, animal», тогда как для последовательности с высоким баллом и высоким уровнем креативности это может быть «galaxy, fork, freedom, algae, harmonica». Семантическое расстояние между этими словами вычислялось с помощью компьютера для определения оценки креативности.

Результаты сравнения: порог «среднего»

Современные большие языковые модели (Large Language Models, LLMs), включая GPT-4, Claude и Gemini, постоянно набирали более высокие оценки, чем средний человеческий участник DAT. Модели ИИ продемонстрировали превосходную способность разрывать семантические кластеры и быстро находить разрозненные концепции, что является отличительной чертой дивергентного мышления.

Однако данные также выявили «потолок креативности» для ИИ. Хотя машины легко превзошли медианные показатели людей, они не смогли конкурировать с верхним процентилем участников-людей. Самые креативные люди — а именно верхние 10% — постоянно генерировали семантические ассоциации более оригинальные и разнообразные, чем лучшие результаты GPT-4 или её аналогов.

В таблице ниже обобщены результаты сравнительного анализа, выявленные в исследовании:

Группа участников	Результат	Ключевые характеристики
Среднестатистические люди	Базовый уровень	Склонность объединять концепции (например, перечислять связанные с домом предметы)
Генеративный ИИ (GPT-4)	Выше среднего	Высокое семантическое расстояние; превосходит медианные возможности человека
Верхние 10% людей	Превосходный	Исключительное дивергентное мышление; очень оригинальные, нелинейные связи

Выход за пределы простых ассоциаций

Чтобы убедиться, что результаты не ограничиваются простыми словесными играми, исследователи расширили сравнение, включив более сложные творческие задания, такие как написание хокку, пересказ сюжета фильма и создание коротких рассказов.

В этих качественных оценках закономерность сохранилась. Модели ИИ генерировали технически грамотный и структурно корректный креативный текст, превосходящий попытки среднего непрофессионала. Однако по сравнению с опытными писателями или очень креативными людьми выводы ИИ часто лишались тонкой новизны и эмоционального резонанса, которые характеризуют работы лучших людей.

Профессор Jerbi отметил в исследовании, что хотя ИИ выступает в роли мощного «ремиксера» существующих данных, что позволяет ему превосходить людей, опирающихся на предсказуемые ассоциации, ему трудно воспроизвести намеренные, хаотичные и глубоко новые скачки, совершённые самыми талантливыми человеческими творцами.

Роль «temperature» и стратегий подсказок

Исследование также затронуло технические параметры, влияющие на креативность ИИ. Исследователи выяснили, что настройка «temperature» — параметра, контролирующего рандомность вывода ИИ — значительно влияет на результаты. Более высокие значения «temperature» позволяли моделям идти на больший риск, создавая более дивергентные ответы, которые приближали их к уровню высококлассного человеческого исполнения, хотя зачастую за счёт связности.

Кроме того, стратегии подсказок играли решающую роль. Когда моделям ИИ предлагали «думать конкретно об этимологии» или задавали другие структурные ограничения, их оценки креативности улучшались. Это говорит о том, что креативность ИИ — не фиксированная черта, а параметризуемая способность, сильно зависящая от человеческого руководства.

Инструмент, а не замена

Последствия этого исследования для креативных индустрий значительны, но многогранны. Вместо того чтобы сигнализировать об устаревании человеческой креативности, результаты позиционируют генеративный ИИ как мощный инструмент расширения возможностей.

Для рядового человека ИИ может выступать в роли «двигателя креативности», поднимая их результаты на более высокий базовый уровень качества и дивергенции. Для топовых творцов ИИ служит компетентным ассистентом, способным справляться с «средним» объёмом мозгового штурма, позволяя человеку сосредоточиться на высокоуровневой концептуальной работе, до которой машины пока не дотягиваются.

«Нам нужно выйти за пределы этого вводящего в заблуждение ощущения конкуренции», — заявил профессор Jerbi, комментируя результаты. «Генеративный ИИ прежде всего стал невероятно мощным инструментом, служащим человеческой креативности: он не заменит создателей, но глубоко преобразит то, как они воображают, исследуют и творят.»

Научная значимость

Это исследование, опубликованное в Scientific Reports, подтверждает быстрый прогресс Scientific Research в области оценки ИИ. Установив количественно измеримый показатель креативности, применимый как к биологическим, так и к синтетическим умам, исследование закладывает основу для будущего развития ИИ.

Оно также убеждает творческое сообщество в том, что хотя минимальный уровень креативности был повышен автоматизацией, максимальный всё ещё остаётся высоким и однозначно человеческим. По мере того как мы приближаемся к 2026 году, сотрудничество между ИИ, превосходящим средний уровень, и «превосходящим» человеческим разумом представляется наиболее перспективным путём для будущих инноваций.