Инструмент ИИ помогает ученым "общаться" с генетическими данными
Благодаря современным методам секвенирования РНК биомедицинские исследователи могут измерять активность генов в миллионах отдельных клеток, создавая детальные карты тканей, органов и различных заболеваний. Однако анализ таких огромных массивов данных требует редкого набора навыков – глубоких знаний в области биологии и умения писать программный код, превращающий данные в научные выводы. Именно с этой идеей группа ученых из Центра исследований молекулярной медицины CeMM Австрийской академии наук создала CellWhisperer. Этот инструмент на основе ИИ объединяет данные экспрессии генов с описательными текстами из более чем миллиона биологических образцов.
CellWhisperer предоставляет исследователям интуитивное чат-интерфейс на английском языке, который позволяет изучать сложные биологические процессы без необходимости писать сложный код. Работа, опубликованная в журнале Nature Biotechnology, демонстрирует, как искусственный интеллект открывает новые возможности взаимодействия ученых с биологическими данными и помогает глубже понять механизмы заболеваний.
CellWhisperer применяет мультимодельное глубокое обучение, объединяя профили активности генов с соответствующими биологическими описаниями, которые исследователи собрали из открытых баз данных при помощи ИИ-моделей. Такое сочетание позволяет выполнять поиск по обширным наборам данных с помощью обычных текстовых запросов – например: "Покажи иммунные клетки из воспаленной толстой кишки у пациентов с аутоиммунными заболеваниями".
Кроме того, мультимодальная система CellWhisperer включает большую языковую модель, способную имитировать обсуждения между биологами и биоинформатиками при интерпретации данных. Благодаря этому взаимодействие с ней похоже на разговор с виртуальным коллегой-экспертом, который анализирует информацию и делает биологически осмысленные выводы. Пользователь может, например, спросить о генах, активных в определенных клетках, и получить пояснение о возможных биологических функциях и последствиях их активности. Инструмент интегрирован в удобный веб-интерфейс на базе популярного браузера CELLxGENE и доступен для свободного использования онлайн.
Чтобы продемонстрировать возможности CellWhisperer в биомедицинских исследованиях, ученые протестировали его на данных секвенирования РНК отдельных клеток, полученных во время эмбрионального развития человека. При простых запросах вроде "сердце" или "мозг" модель смогла определить стадии развития, типы клеток и гены-маркеры, участвующие в формировании соответствующих органов. Многие из найденных маркеров совпадали с уже известными генами, связанными с развитием, а некоторые указали на ранее не идентифицированные гены-кандидаты.