Ученые обучают ИИ по "детсадовскому" методу, чтобы подготовить его к сложным задачам

В статье, опубликованной в журнале Nature Machine Intelligence, исследователи показали, что рекуррентные нейронные сети (RNN) справляются с более сложными задачами эффективнее, если предварительно обучаются на простых когнитивных заданиях. Авторы назвали этот подход "программой детского сада" – по аналогии с тем, как детям сначала дают базовые знания, а затем учат применять их в более сложных ситуациях.

Рекуррентные нейронные сети (RNN), которые обрабатывают последовательную информацию с опорой на ранее полученные данные, особенно эффективны в таких задачах, как распознавание речи и перевод текста. Однако обучение RNN с использованием традиционных методов оказывается затруднительным при решении сложных когнитивных задач. Эти методы не всегда способны воспроизвести ключевые черты поведения людей и животных, на которые стремится ориентироваться искусственный интеллект.

Чтобы справиться с этой проблемой, исследователи из Центра науки о данных Нью-Йоркского университета, сначала провели эксперименты с крысами. Грызунов обучали находить воду в коробке с несколькими портами. Чтобы понять, где и когда появится вода, крысы должны были установить связь между подачей воды и определенными звуковыми сигналами, а также светом в портах. При этом вода не подавалась сразу после сигналов, поэтому животным нужно было научиться ожиданию. Таким образом, им пришлось усвоить отдельные простые принципы, а затем объединить их для выполнения более сложной задачи – получения воды.

Полученные результаты помогли понять, как животные используют навыки, приобретённые при выполнении простых задач, для решения более сложных.

Опираясь на эти выводы, ученые применили аналогичный подход к обучению RNN: вместо поиска воды нейросети обучались стратегии ставок, где нужно было принимать базовые решения для увеличения выигрыша со временем. Затем исследователи сравнили эффективность этого "детсадовского" подхода с традиционными методами обучения RNN. Результаты показали, что RNN, прошедшие обучение по новой модели, осваивали задачи быстрее, чем сети, обученные с использованием стандартных методов.