Применение алгоритмов машинного обучения для разработки модели прогнозирования результатов выживаемости больных раком легких в РК

Авторы

  • Р.Е. Кадырбаева КазНИИОиР
  • В.А. Макаров
  • Д.Р. Кайдарова
  • С.Е. Есентаева
  • Ж.А. Калматаева
  • М.Е. Мансурова
  • Н. Кадырбек
  • И.И. Новиков
  • С.Т. Олжаев

Ключевые слова:

рак легкого, прогностическая значимость, машинное обучение, рецидивы, общая выживаемость

Аннотация

Актуальность: В ряде исследований было показано, что модели, созданные с помощью искусственного интеллекта, являют-
ся более точными, чем обычная система стадирования TNM, поскольку они строятся на анализе большого объема данных, отра-
жающих как биологические, так и клинические особенности течения болезни. На этом основании модели, созданные с помощью
машинного обучения, были рекомендованы в качестве альтернативных или дополняющих TNM классификацию прогностических
инструментов.
Цель исследования – оценить прогностическую значимость ряда клинико-морфологических факторов и применить алго-
ритмы машинного обучения для прогнозирования результатов общей выживаемости больных с раком легких.
Методы: Проведен анализ истории болезни пациентов с раком легкого (n=19379) из базы данных ЭРОБ за 2014-2018 гг., про-
изведена оценка влияния факторов риска на общую выживаемость по методу Каплана-Мейера. Примененные в работе алгорит-
мы машинного обучения (Random Forest Classifier, Gradient Boosting Classifier, Logistic Regression Model, Decision Tree Classifier, K
Nearest Neighbors (KNN) Classifier) реализованы на языке программирования Python.
Результаты: В нашем исследовании были проанализированы истории болезни 19 379 пациентов. На момент исследования
среди мужчин были живы 6 171 больных (39,8%), при этом медиана выживаемости составила 8,3 месяцев (SE – 0,154 месяцев,
95% ДИ – 7,96-8,56). Среди женщин были живы 1 962 больных (49,5%), при этом медиана выживаемости составила 15,43
месяцев (SE – 1,0 месяц, 95% ДИ – 13,497-17,363). У большинства (61,4%) пациентов НМРЛ был диагностирован в распростра-
ненной стадии: у 9 189 человек (47,4%) – на III стадии, у 4 655 (24%) – на IV стадии. Оценка достоверности различий в медиане
выживаемости (χ2=3991,6, р=0,00) указывает на прогностическую значимость и влияние стадии опухолевого процесса на вы-
живаемость больных.
Заключение: Модели машинного обучения позволяют прогнозировать риск развития летального исхода больных как после
хирургического лечения, так и после постановки на учет в базу данных ЭРОБ. Создание пациент-ориентированных систем
поддержки принятия врачебных решений позволяет выбрать оптимальные стратегии адъювантной терапии, диспансерного
наблюдения и частоты диагностических исследований.

Загрузки

Опубликован

27.10.2022