Динамическое фенотипирование больных: искусственный интеллект воплощает классические представления Гиппократа о медицине

Динамическое фенотипирование больных: искусственный интеллект воплощает классические представления Гиппократа о медицине

Учёные выяснили, что большие данные и методы искусственного интеллекта позволяют выявить внутреннюю динамику заболеваний и помогают прогнозировать кризисы в области здравоохранения

Отец медицины Гиппократ рассматривал любого пациента с тем или иным заболеванием как процесс, который может быть описан правилами его динамики. Например, он ввел термин «кризис» в болезни как решающую точку бифуркации, определяющую судьбу больного в достаточно четко определенные моменты времени. Это представление о болезни как о специфическом и сложном динамическом процессе является противоположностью наивной идее дискретного диагноза, определяющего болезнь как состояние.

Следуя идеям Косской школы, основанной Гиппократом, на протяжении многих веков работа многих тысяч лучших специалистов в области медицины была направлена на то, чтобы преобразовать скрупулезные наблюдения за миллионами траекторий заболеваний отдельных пациентов в стандартные медицинские протоколы. Благодаря этим усилиям сегодня в определенных случаях можно сделать прогноз для больного, а не просто диагностировать его текущее состояние. Но нам требуется нечто гораздо большее: необходимо выявить типичные кризисы и составить надежный индивидуальный прогноз.

Сегодня мы можем исследовать организм пациента более системно, чем когда-либо ранее, даже на молекулярном уровне. В некоторых случаях мы можем зафиксировать все, что происходит с целыми странами в плане здравоохранения, в виде миллиардов историй болезни. Могут ли эти «большие данные» в сочетании с методами искусственного интеллекта ускорить процесс роста медицинских знаний? Именно на этот вопрос постаралась ответить международная исследовательская группа, в состав которой входят учёные из Лестерского университета (Великобритания), Института Кюри (Франция), Красноярского государственного медицинского университета и Университета Лобачевского. Исследование было недавно опубликовано в GigaScience, ведущем журнале оксфордской издательской группы, посвящённом «большим данным».

Применение «больших данных» с точки зрения медицины долгое время было связано с принципом кластеризации. Состояние больного может быть представлено в виде вектора в многомерном пространстве, объединяющем все элементы собранной информации, включая очень точные молекулярные измерения. Собирая множество таких векторов, можно подумать о применении машинного обучения без учителя и определить подгруппы больных со схожими состояниями.

Гипотеза заключается в том, что каждая такая подгруппа больных требует специфического лечения. Чем больше такой информации мы собираем, тем яснее становится, что мы можем определить все больше и больше кластеров, что дает возможность все более и более точно классифицировать больных по подтипам заболеваний. Однако такой подход удивительным образом оказывается в прямом противоречии с наследием Гиппократа, так как, классифицируя мгновенные состояния пациентов, мы, как правило, пренебрегаем динамической природой болезни как процесса.

Наблюдаемое в данный конкретный момент состояние больного не говорит о том, как он оказался в этом состоянии, о том процессе, который мог протекать несколько лет и которому могли предшествовать другие диагнозы. Сейчас речь идет об изменении парадигмы – от определения болезни как статического моментального снимка состояния организма к понятию индивидуализированной клинической траектории или траектории болезни, представляющей историю пациента, где взаимодействуют и оказывают взаимное влияние несколько диагнозов.

Миллионы таких траекторий можно сгруппировать в динамические фенотипы, представляющие собой меньшее количество основных стереотипных патологических сценариев. Современные методы искусственного интеллекта, основанные на сборе большого количества клинически значимых данных, могут помочь нам в проведении такого динамического фенотипирования больных.

«Однако при этом мы сталкиваемся с одной серьёзной проблемой. Построение точной индивидуальной клинической траектории требует длительного наблюдения за больным, при этом необходимо обеспечить систематический сбор информации о состоянии его организма. Эти данные (называемые длительными или диахроническими наблюдениями) очень трудно собирать, и обходится это весьма дорого. Мы располагаем гораздо большим объёмом синхронных (моментальных) данных, полученных путём наблюдения за пациентами в течение относительно короткого периода времени (например, во время пребывания в больнице). Возможно ли на основе таких наблюдений реконструировать клинические траектории и динамические фенотипы?», – задаётся вопросом профессор Лестерского университета и руководитель мегагранта «Масштабируемые сети систем искусственного интеллекта для анализа данных растущей размерности» в Университете Лобачевского Александр Горбань.

В недавно опубликованном исследовании, проведённом профессором Горбанем совместно с Андреем Зиновьевым (Институт Кюри, Франция) и их сотрудниками, учёные выдвинули гипотезу о том, что если число синхронных наблюдений будет достаточно большим, то они будут отображать структуру клинических траекторий, поскольку каждый пациент будет представлять различное состояние прогрессирующего заболевания по определенной траектории болезни.

Затем крупномасштабные клинические данные могут быть смоделированы в виде букета расходящихся клинических траекторий, даже если данные синхронны по своей природе и ни один из больных не отслеживается в течение длительного времени. Корень этого букета соответствует наименее сложному состоянию заболевания, из которого развивается большое количество возможных патологических сценариев. Листья букета показывают конечные состояния, соответствующие летальному исходу или состоянию хронического тяжелого заболевания.

Было предложено моделировать клинические данные, используя перспективный метод машинного обучения, так называемый метод главных деревьев, основанный на идее топологической грамматики, который был разработан ранее теми же авторами и успешно применяется в других областях, таких как анализ наборов данных по отдельным клеткам.

Этот подход был применён к двум большим общедоступным наборам клинических данных наблюдений из двух наиболее сложных областей общественного здравоохранения: кардиологии и лечения диабета. Первый набор данных был собран профессором Сергеем Головенкиным, ведущим автором исследования, в Красноярской межрайонной клинической больнице (Россия) в 1992-1995 годах, но только недавно был передан в общественное достояние.

Анализ, основанный на применении метода главных деревьев, выявил десять различных клинических траекторий, при этом каждый больной с инфарктом миокарда может классифицироваться в соответствии с одной из этих траекторий. Каждая из траекторий характеризуется четко различимыми паттернами летальности и других осложнений, а также специфическими факторами риска: поэтому определение типа траектории пациента на как можно более ранней стадии должно влиять на выбор терапии и увеличивать шансы на успех лечения.

Во второй части исследования был проанализирован большой массив данных, полученных за 10 лет (с 1999 по 2008 год) ведения больных диабетом в 130 больницах и интегрированных сетях медицинских услуг в США. Авторы также выявили наличие клинических траекторий, различающихся по вероятности повторной госпитализации в течение одного месяца после выхода из больницы. В этом случае определение клинической траектории может помочь скорректировать процедуры диагностики (в частности, проведение теста на гликолизированный гемоглобин HbA1c), что должно улучшить оказание медицинской помощи и свести к минимуму случаи повторной госпитализации.

Исследователи утверждают, что предлагаемая методика является достаточно общей и может быть применена ко многим различным заболеваниям и типам данных. Она позволит усовершенствовать анализ историй болезни в электронном виде, а также улучшить результаты непрерывного мониторинга пациентов с использованием носимых медицинских приборов.

Программное обеспечение доступно на github.com.

На рисунке — Десять клинических траекторий, выделенных из набора данных по осложнениям инфаркта миокарда, собранных Красноярским государственным медицинским университетом (Россия). Каждая точка представляет собой наблюдение пациента с диагнозом инфаркт миокарда, цвет обозначает возможные осложнения этого заболевания.

Источник: robogeek.ru