Искусственный интеллект сегодня креативнее, чем среднестатистический человек

Могут ли генеративные системы искусственного интеллекта, такие как ChatGPT, проявлять настоящую креативность? На этот вопрос попытались ответить исследователи с кафедры психологии Монреальского университета. Результаты, опубликованные в журнале Scientific Reports, демонстрируют заметный сдвиг: генеративные ИИ-системы теперь способны опережать среднестатистического человека по ряду показателей креативности. При этом исследование подтверждает, что наиболее креативные люди по-прежнему остаются выше даже самых продвинутых моделей ИИ.

В ходе работы ученые протестировали несколько крупных языковых моделей, включая ChatGPT, Claude, Gemini и другие, сравнив их результаты с данными 100 000 участников-людей. Результаты показывают переломный момент: некоторые модели, включая GPT-4, превзошли средний уровень людей в задачах, направленных на оценку дивергентной лингвистической креативности. Дальнейший анализ выявил важную закономерность: хотя некоторые модели ИИ теперь опережают среднестатистического человека, самые высокие уровни креативности остаются уникально человеческими.

При более детальном рассмотрении оказалось, что верхняя половина участников-людей демонстрировала средние показатели выше, чем все протестированные языковые модели. Разрыв был особенно заметен среди 10% самых креативных людей. Для объективного сравнения людей и ИИ исследователи использовали несколько методов, главным из которых стал тест на дивергентные ассоциации (Divergent Association Task, DAT). Этот психологический тест измеряет дивергентную креативность – способность генерировать множество оригинальных и разнообразных идей на основе одного запроса.

В тесте DAT участникам – будь то люди или ИИ – предлагается придумать десять слов, максимально различающихся по смыслу. Пример креативного набора слов может включать "галактика, вилка, свобода, водоросли, губная гармоника, квантовый, ностальгия, бархат, ураган, фотосинтез". Результаты теста во многом согласуются с данными других проверенных методов оценки креативности, которые применяются для генерации идей, письма и творческого решения задач. Несмотря на то, что DAT основан на языке, он оценивает не только словарный запас, но и более широкий спектр когнитивных процессов, задействованных в творческом мышлении. Среди преимуществ теста – его быстрота и доступность: выполнение занимает всего 2-4 минуты, и он доступен онлайн для широкой аудитории.

Опираясь на эти результаты, исследователи проверили, может ли способность ИИ успешно справляться с простой задачей на словесные ассоциации переноситься на более сложные творческие задания. Для этого они провели прямое сравнение языковых моделей и людей в упражнениях на творческое письмо. Испытания включали написание хайку (трехстрочной поэтической формы), составление кратких пересказов сюжетов фильмов и создание небольших рассказов. Результаты подтвердили ту же тенденцию: хотя ИИ иногда обыгрывал среднестатистических участников, наиболее опытные авторы по-прежнему сохраняли явное преимущество.