Применение алгоритмов машинного обучения для разработки модели прогнозирования результатов выживаемости больных раком легких в РК
Ключевые слова:
рак легкого, прогностическая значимость, машинное обучение, рецидивы, общая выживаемостьАннотация
Актуальность: В ряде исследований было показано, что модели, созданные с помощью искусственного интеллекта, являются более точными, чем обычная система стадирования TNM, поскольку они строятся на анализе большого объема данных, отражающих как биологические, так и клинические особенности течения болезни. На этом основании модели, созданные с помощью машинного обучения, были рекомендованы в качестве альтернативных или дополняющих TNM классификацию прогностических
инструментов.
Цель исследования – оценить прогностическую значимость ряда клинико-морфологических факторов и применить алгоритмы машинного обучения для прогнозирования результатов общей выживаемости больных с раком легких.
Методы: Проведен анализ истории болезни пациентов с раком легкого (n=19379) из базы данных ЭРОБ за 2014-2018 гг., произведена оценка влияния факторов риска на общую выживаемость по методу Каплана-Мейера. Примененные в работе алгоритмы машинного обучения (Random Forest Classifier, Gradient Boosting Classifier, Logistic Regression Model, Decision Tree Classifier, K Nearest Neighbors (KNN) Classifier) реализованы на языке программирования Python.
Результаты: В нашем исследовании были проанализированы истории болезни 19 379 пациентов. На момент исследования среди мужчин были живы 6 171 больных (39,8%), при этом медиана выживаемости составила 8,3 месяцев (SE – 0,154 месяцев, 95% ДИ – 7,96-8,56). Среди женщин были живы 1 962 больных (49,5%), при этом медиана выживаемости составила 15,43 месяцев (SE – 1,0 месяц, 95% ДИ – 13,497-17,363). У большинства (61,4%) пациентов НМРЛ был диагностирован в распространенной стадии: у 9 189 человек (47,4%) – на III стадии, у 4 655 (24%) – на IV стадии. Оценка достоверности различий в медиане выживаемости (χ2=3991,6, р=0,00) указывает на прогностическую значимость и влияние стадии опухолевого процесса на выживаемость больных.
Заключение: Модели машинного обучения позволяют прогнозировать риск развития летального исхода больных как после хирургического лечения, так и после постановки на учет в базу данных ЭРОБ. Создание пациент-ориентированных систем поддержки принятия врачебных решений позволяет выбрать оптимальные стратегии адъювантной терапии, диспансерного наблюдения и частоты диагностических исследований.