ИИ-модель создает целые хромосомы и небольшие ДНК

Генетики разработали ИИ-модель, которая была обучена на ДНК 128 тысяч организмов от человека до бактерий. Модель уже собрала с нуля ДНК бактерии и хромосому дрожжей.

В 2016 году генетик Крейг Вентер и его коллеги синтезировали с нуля первый сложный

организм, способный к самостоятельному метаболизму, – бактерию Mycoplasma mycoides. Генетики собрали ДНК бактерии буквально по крохотным фрагментам. Сначала они включили в геном только те гены, о которых было известно, что они необходимы. Но бактерия не смогла нормально делиться. Тогда они стали добавлять в геном шаг за шагом гены, про которые не было точно известно, зачем они нужны. В конце концов бактерия смогла питаться и делиться. На это ушло еще 5 лет. Эта работа показала, что такую сборку вряд ли удастся масштабировать, и в первую очередь потому, что далеко не про все гены мы знаем, какую работу они делают в клетке.

В новой работе генетики Arc Institute, Стэнфордского университета и сотрудники компании Nvidia подошли к проблеме сборки живого организма не "снизу-вверх", как это сделал Вентер, а "сверху-вниз". Помог им в этом искусственный интеллект.

ИИ-модель Evo-2 была обучена на 128 тысячах геномов, охватывающих практически все древо жизни от людей до одноклеточных бактерий и архей. Общее количество нуклеотидов в обучающем дата-сете составило более 9 триллионов. Модель не выясняла роль каждого гена в конкретном геноме, как это было в эксперименте Вентера, а действовала "по аналогии" с реальными живыми организмами. В результате модель Evo-2 собрала не только ДНК бактерии Mycoplasma genitalium, которую Вентеру тоже удалось собрать (ее ДНК состоит из 600000 нуклеотидов), но и митохондриальную ДНК человека и хромосому дрожжей длиной в 330000 нуклеотидов.

Модель является полностью открытой. Ученые предлагают использовать Evo-2 и собранный огромный дата-сет другим генетикам для собственных экспериментов. Разработчики ожидают, что ученые разных стран воспользуются моделью и коллективными усилиями сформируют своего рода "магазин приложений", которые собирают самые разные геномы, как существующих, так полностью искусственных организмов.