Новая модель ИИ может во время вашего сна прогнозировать риск заболеваний

Плохой ночной сон не только приводит к сонливости на следующий день, но и может служить ранним сигналом заболеваний, которые проявятся спустя годы. Исследователи из Медицинской школы Стэнфорда вместе с коллегами создали модель искусственного интеллекта, способную по физиологическим показателям одной ночи сна прогнозировать вероятность более чем 100 различных заболеваний. Система с названием SleepFM была обучена на данных 65 000 человек и почти 600 000 часов записей сна. Информация собиралась методом полисомнографии – комплексного исследования, которое фиксирует работу мозга, сердечный ритм, дыхание, движения глаз и ног и другие показатели.

Полисомнография считается "золотым стандартом" изучения сна и проводится в лабораторных условиях под ночным наблюдением специалистов. Как выяснили ученые, такие записи представляют собой огромный, ранее почти неиспользованный источник данных о здоровье человека. Чтобы эффективно использовать огромный объем данных о сне, ученые создали базовую модель – разновидность ИИ, которая обучается на больших массивах информации и затем может применяться к самым разным задачам. Примером таких систем являются крупные языковые модели вроде ChatGPT, которые обучаются на колоссальных наборах текстов.

Для обучения SleepFM использовали 585 000 часов полисомнографических записей, полученных у пациентов различных лабораторий сна. Эти данные разбили на фрагменты по пять секунд – подобно тому, как языковые модели разбивают текст на слова. Модель научилась объединять несколько типов сигналов – электроэнцефалограмму, электрокардиограмму, электромиограмму, показатели пульса и дыхательного потока – и понимать связи между ними.

Чтобы добиться этого, исследователи предложили новый подход к обучению – контрастное обучение с исключением одного элемента. Суть метода в том, что одна категория данных намеренно скрывается, а модель должна "додумать" недостающую информацию, опираясь на остальные сигналы. После предварительного обучения SleepFM донастроили для решения конкретных задач. Сначала ее проверили на привычных задачах – распознавании стадий сна и определении тяжести апноэ. Результаты оказались на уровне или даже лучше, чем у современных специализированных моделей.

Затем команда перешла к более сложной цели – прогнозированию заболеваний на годы вперед на основе ночных записей сна. Для этого нужно было сопоставить данные полисомнографии с долгосрочными медицинскими сведениями об этих же людях. К счастью, исследователи имели доступ к медицинским архивам клиники сна, которые велись более 50 лет.

Модель SleepFM проанализировала более тысячи типов заболеваний, указанных в медицинских картах, и выявила 130 состояний, риск которых можно достаточно надежно предсказывать по данным одной ночи сна. Особенно высокой точностью модель отличалась при прогнозировании онкологических заболеваний, осложнений беременности, болезней сердца и психических расстройств – ее показатели достигали значения индекса согласованности (C-индекса) выше 0,8.

C-индекс – это распространенная метрика, которая показывает, насколько точно модель может предсказать, кто из двух людей из одной группы столкнется с событием раньше. SleepFM продемонстрировала впечатляющие результаты при прогнозировании болезни Паркинсона (C-индекс 0,89), деменции (0,85), ишемической болезни сердца (0,84), инфаркта миокарда (0,81), рака предстательной железы (0,89), рака молочной железы (0,87), а также риска смерти (0,84).