ИИ-модели научились общаться, и это ускорило их работу почти в 3 раза

Ученые из Института Вейцмана и корпорации Intel создали алгоритмы, позволяющие разным моделям ИИ работать вместе. Устранение языкового барьера между системами ускоряет работу в 2,8 раз.

Работа выложена на сервере препринтов arxiv.

До недавнего времени каждая ИИ-модель использовала свой уникальный набор токенов, понятный только ей самой. Это создавало барьер для совместной работы систем от различных разработчиков. Крупные технологические компании уже применяли метод "декодирования на лету", когда быстрая малая модель делает первоначальную оценку запроса, а большая и медленная модель проверяет и корректирует ответ. Но этот подход работает только с моделями, "говорящими" на одном цифровом языке.

Новое решение включает два основных алгоритма. Первый позволяет моделям переводить свои выходные данные в универсальный формат, понятный всем системам. Второй – заставляет модели фокусироваться на токенах с одинаковым значением для различных систем, подобно словам "банан" или "интернет", которые звучат практически идентично в разных человеческих языках, такие токены и становятся отправной точкой декодирования.

Результаты превзошли ожидания исследователей. Вместо потери информации при "переводе", новые алгоритмы ускорили работу больших языковых моделей в среднем в 1,5 раза, а в лучших случаях – в 2,8 раза. Алгоритмы уже выложены в открытый доступ на платформе Hugging Face Transformers и стали частью стандартных инструментов для эффективной работы ИИ.

Особенно важным это решение становится для периферийных устройств – смартфонов, дронов и автономных автомобилей, которые должны полагаться на ограниченные вычислительные мощности при отсутствии интернет-соединения. В случае беспилотного автомобиля более быстрая обработка данных может спасти от катастрофы.

Исследование открывает новый этап разработки коллаборативного ИИ, где разработчики могут свободно комбинировать лучшие качества различных моделей, создавая более эффективные и доступные решения для миллионов пользователей по всему миру.