Preview

Кардиоваскулярная терапия и профилактика

Расширенный поиск

Нейросетевой анализ связей факторов риска с фатальным событием в зависимости от продолжительности проспективного наблюдения

https://doi.org/10.15829/1728-8800-2025-4324

EDN: QNKWLS

Содержание

Перейти к:

Аннотация

Цель. Сравнить значимость факторов риска (ФР) при нейросетевом моделировании фатального исхода для сроков проспективного наблюдения 10, 20, 30 и 40 лет.

Материал и методы. Из российской части исследования Липид­ных клиник 1975-1982гг включены 13263 мужчины и 5691 женщина с наблюдением до 2017г, конечной точкой являлась смерть от всех причин. Анализировали пол, возраст, величины артериального давления, частоты сердечных сокращений, индекса массы тела, показатели липидов крови, статусы курения и образования, наличие артериальной гипертензии и гипотензии. Для построения многомерных моделей использовали программы-имитаторы искусственных нейронных сетей.

Результаты. По данным общего анализа чувствительности значимость всех включенных в модели входных переменных увеличивается с удлинением срока проспективного наблюдения. Минимальная значимость изученных ФР наблюдается при 10-летнем наблюдении у женщин.

Заключение. Нейросетевой прогноз вероятности фатального события с использованием исследованных ФР достигает максимальной информативности к 30 годам проспективного наблюдения.

Для цитирования:


Вилков В.Г., Шальнова С.А., Баланова Ю.А., Муромцева Г.А., Имаева А.Э., Драпкина О.М. Нейросетевой анализ связей факторов риска с фатальным событием в зависимости от продолжительности проспективного наблюдения. Кардиоваскулярная терапия и профилактика. 2025;24(4):4324. https://doi.org/10.15829/1728-8800-2025-4324. EDN: QNKWLS

For citation:


Vilkov V.G., Shalnova S.A., Balanova Yu.A., Muromtseva G.A., Imaeva A.E., Drapkina O.M. Neural network analysis of the relationships of risk factors with a fatal event depending on prospective follow-up duration. Cardiovascular Therapy and Prevention. 2025;24(4):4324. (In Russ.) https://doi.org/10.15829/1728-8800-2025-4324. EDN: QNKWLS

Введение

Ранее было показано, что при анализе медико-биологических данных целесообразно приоритетно использовать непараметрические и нелинейные статистические методы [1]. Этому способствует прогресс вычислительной техники, сделавший возможным широкое внедрение в практику программ-имитаторов искусственных нейронных сетей (ИНС) [2].

С использованием нейросетевых моделей исследовали связи факторов риска (ФР) с вероятностью фатального исхода по данным 40-летнего проспективного наблюдения в крупном популяционном исследовании — российской части исследования Липидных клиник.

Цель — проанализировать динамику значимости ФР для прогноза вероятности фатального исхода с использованием многомерных нейросетевых моделей при сроках проспективного наблюдения 10, 20, 30 и 40 лет.

Материал и методы

Данные получены в одномоментном популяционном исследовании 1975-1982гг [3], проведенном в Институте профилактической кардиологии Всесоюзного кардиологического научного центра АМН СССР (ныне Национальный медицинский исследовательский центр терапии и профилактической медицины Минздрава России — НМИЦ ТПМ), с проспективным наблюдением за смертностью по состоянию на 2017г, продолжительность наблюдения до 42 лет. В анализ включены 13263 мужчины и 5691 женщина в возрасте 18-82 лет с непропущенными значениями всех изученных показателей, общее количество "человеко-лет" наблюдения составило 456269.

Анализировали пол, возраст и величины показателей, характеризующих ряд ФР хронических неинфекционных заболеваний: артериальной гипертензии (АГ) и артериальной гипотензии (АГт), систолического (САД), диастолического (ДАД) артериального давления (АД), среднего динамического АД (СрАД), которое рассчитывалось из САД и ДАД по формуле Хикэма, частоты сердечных сокращений (ЧСС), концентраций в сыворотке крови общего холестерина (ХС), ХС липопротеинов высокой плотности (ЛВП), ХС, не входящего в состав ЛВП (ХС неЛВП), который рассчитывали как разность между измеренными значениями концентраций в сыворотке крови общего ХС и ХС ЛВП), триглицеридов (ТГ), индекса массы тела (ИМТ), статусов курения и образования. В качестве конечной точки использовали смерть от всех причин при сроках наблюдения 10, 20, 30 и 40 лет, доли фатальных событий составили у мужчин 14, 37, 44 и 63%, у женщин — 7, 22, 31 и 33%, соответственно.

Для АГ использовали два критерия: 1) АГ1 (АГ критерий 1, с учетом анамнеза, номинативная переменная с двумя значениями) — если имеются сведения об установленном врачом диагнозе АГ или проводится лечение антигипертензивными лекарственными средствами или в момент обследования САД и/или ДАД >139 и/или 89 мм рт.ст.; 2) АГ2 (АГ критерий 2, без учета анамнеза, номинативная переменная с двумя значениями) — если САД и/или ДАД в момент обследования >139 и/или 89 мм рт.ст., соответственно.

Для АГт также использовали два критерия: 1) АГт1 (АГт критерий 1, номинативная переменная с двумя значениями) — если САД и/или ДАД не >90/60 мм рт.ст. [4]; 2) АГт2 (АГт критерий 2, разработанный нами ранее критерий прогностически неблагоприятной АГт, номинативная переменная с двумя значениями) — если величина СрАД меньше пограничной величины, которая для мужчин российской популяции составляет 70 мм рт.ст., для женщин 68 мм рт.ст. [5].

Характеризующая статус курения номинативная переменная имела два значения — курит в настоящее время/никогда не курил или бросил курить. Характеризующая статус образования номинативная переменная также имела два значения — образование не выше среднего/выше среднего.

Статистический анализ. Использовали свободно распространяемые версии программного обеспечения, включая пробные версии продуктов компаний StatSoft Inc./TIBCO Software Inc. и IBM Corp.

При построении нейросетевых моделей зависимости вероятности фатального события (смерти от всех причин) от изученного набора ФР использовали полносвязные ИНС-классификаторы с прямым распространением сигнала [6]. В качестве входных элементов ИНС использовали характеризующие ФР показатели, включавшие 16 переменных, из них 10 количественных (возраст, САД, ДАД, СрАД, ЧСС, ИМТ, концентрации в сыворотке крови общего ХС, ХС ЛВП, ХС неЛВП, ТГ) и 6 номинативных — статусы курения, образования, два критерия АГ и два критерия АГт.

Нейросетевые модели зависимости вероятности фатального исхода от совокупности ФР строили раздельно для мужчин и женщин для каждого из сроков наблюдения 10, 20, 30 и 40 лет, всего 8 объектов анализа.

Для сравнения значимости входных элементов (независимых переменных в терминах классического регрессионного анализа) использовали общий анализ чувствительности из пакета статистических программ STATISTICA (StatSoft Inc./TIBCO Software Inc.), рассчитывали отношение ошибок нейросетевого прогноза (ER) включающей все входы ИНС и ИНС с поочередным включением и исключением входов [7]. Для каждого объекта с полным набором входов строили не <1000 ИНС типа трехслойный персептрон (с одним промежуточным слоем), среди которых отбирали 500 лучших ИНС для анализа значимости входов. Входную переменную считали значимой в рамках данной нейросетевой модели при величине ER >1,0. В 500 лучших ИНС для статистической оценки отличий от уровня 1,0 с использованием процедур бутстрепа из пакета статистических программ SPSS (IBM Corp.) рассчитывали медиану ER и 95% доверительный интервал медианы, а также нижний 2,5% процентиль эмпирического распределения величин ER [8].

Результаты

В нейросетевых моделях зависимости вероятности фатального исхода от ФР сравнивали значимость включенных в анализ входных переменных (характеризующих ФР показателей) с использованием процедуры общего анализа чувствительности [7].

На рисунке 1 представлены результаты сравнения значимости всех включенных в анализ входных переменных при длительности проспективного наблюдения 10, 20, 30 и 40 лет у мужчин российской популяции.

Результаты следует интерпретировать следующим образом. Если ER =1,0, то наличие или отсутствие входной переменной в модели не влияет на точность прогноза вероятности фатального события. Если ER <1,0, то исключение входной переменной из модели возможно уточнит прогноз. Если ER >1,0, то включение входной переменной в модель повышает точность прогноза: чем больше ER превышает уровень 1,0, тем весомее роль данной входной переменной в модели.

Из рисунка 1 видно, что у мужчин при 10-летнем наблюдении средние значения ER для всех количественных переменных визуально почти не отличаются от уровня 1,0.

На рисунке 2 в крупном масштабе представлены величины ER для количественных переменных у мужчин при 10-летнем наблюдении. Отличия от 1,0 доверительных интервалов медиан возраста, ЧСС, ХС ЛВП и ИМТ обусловлены значительным числом нейросетей из отобранных 500, для которых величины ER заметно превышают 1,0 при близком к единице медианном уровне (ХС ЛВП), либо за счет компактного расположения отдельных величин ER вокруг медианного уровня, ненамного превышающего 1,0 (возраст, ЧСС), либо имеет место сочетание обеих причин (ИМТ).

Из числа номинативных входных переменных образование при 10-летнем наблюдении незначимо, медиана ER для курения значимо >1,0, медианы ER номинативных переменных для АГ и АГт находятся в пределах 1,2-1,6. Для всех переменных при сроке наблюдения 10 лет 2,5% процентили эмпирического распределения величин ER не превышают 1,0.

На рисунке 1 отчетливо видно, что по мере увеличения срока проспективного наблюдения медианные значения величин ER для части входных переменных увеличиваются, и для всех входов статистическая значимость отличий от уровня 1,0 усиливается. При 30-летнем наблюдении для всех изученных ФР медиана ER превышает уровень 1,0 по 95% доверительному интервалу, 2,5% процентилю эмпирического распределения ER также во всех случаях превышают 1,0. При 40-летнем наблюдении в сравнении с 30-летним для количественных переменных, таких как возраст, АД, ЧСС, липиды крови и ИМТ, медианные уровни мало отличаются при уменьшении разброса результатов для разных ИНС, значимость номинативных переменных (курение, образование, АГ и АГт) визуально выглядит практически одинаково.

У женщин (рисунок 3) в целом наблюдаются схожие закономерности, к 30-летнему сроку наблюдения все входные переменные становятся значимыми как по 95% доверительному интервалу медианы ER, так и по 2,5% процентилю. Однако для сроков наблюдения 10 и 20 лет значимость ФР у женщин слабее в сравнении с мужчинами, особенно это заметно при 10-летнем наблюдении (все медианы ER визуально близки к 1,0, по 95% доверительному интервалу значимы только общий ХС и номинативные переменные АГ). При 40-летнем наблюдении в сравнении с 30-летним, как и у мужчин, часть переменных становятся незначимыми по 2,5% процентилю эмпирического распределения величин ER.

Рис. 1 Отношение ошибки (ER) нейросетевых моделей с полным и селективными наборами входных переменных в контексте общего анализа чувствительности у мужчин при проспективном наблюдении за вероятностью смерти от всех причин в течение 10, 20, 30 и 40 лет.

Примечание: по оси абсцисс входные переменные: Возраст, САД — систолическое АД, ДАД — диастолическое АД, СрАД — среднее динамическое АД, ЧСС — частота сердечных сокращений, ХС — холестерин, ХС ЛВП — холестерин липопротеинов высокой плотности, ХС неЛВП — холестерин, не входящий в состав ЛВП, ТГ — триглицериды, ИМТ — индекс массы тела, Курение — статус курения, Образование — статус образования, АГ1 — артериальная гипертензия критерий 1, АГ2 — артериальная гипертензия критерий 2, АГт1 — артериальная гипотензия критерий 1, АГт2 — артериальная гипотензия критерий 2.

По оси ординат величины ER по данным бутстрепа выборки из 500 нейросетей, горизонтальная линия внутри ящичной диаграммы с усами соответствует медиане, нижние и верхние границы закрашенного бокса соответствуют 25% и 75% квартилям, звездочками и кружками обозначены выбросы (сильно отклоняющиеся величины ER). Статистическая значимость: & — 95% доверительный интервал медианы ER расположен выше уровня 1,0; && — 2,5% процентиль эмпирических величин ER >1,0.

Рис. 2 Фрагмент рисунка 1 в крупном масштабе для мужчин при наблюдении 10 лет, только количественные входные переменные (см. примечания к рисунку 1).

Примечание: по оси абсцисс входные переменные. По оси ординат величины ER. Статистическая значимость: & — 95% доверительный интервал медианы ER расположен выше уровня 1,0.

Рис. 3 Отношение ошибки (ER) нейросетевых моделей с полным и селективными наборами входных переменных в контексте общего анализа чувствительности у женщин при проспективном наблюдении за вероятностью смерти от всех причин в течение 10, 20, 30 и 40 лет (см. примечания к рисунку 1).

Примечание: по оси абсцисс входные переменные. По оси ординат величины ER по данным бутстрепа выборки из 500 нейросетей. Статистическая значимость: & — 95% доверительный интервал медианы ER расположен выше уровня 1,0; && — 2,5% процентиль эмпирических величин ER >1,0.

Обсуждение

Известные из литературы сведения о значимости различных ФР для прогноза дожития как правило получены посредством вариантов регрессии Кокса, которая в настоящее время является безусловным лидером среди инструментов решения таких задач [9-11]. Это, по существу, один из вариантов линейной регрессии с присущими линейным методам анализа ограничениями.

В настоящей работе предпринята попытка решить подобную задачу с использованием нейросетей, которые являются нелинейными по своей природе [2][7].

Из рисунков 1 и 3 видно, что практически для всех изученных входных переменных их роль в моделях прогноза в целом возрастает при увеличении времени наблюдения как у мужчин, так и у женщин, и достигает максимума к 30 годам наблюдения. Одной из причин этого может быть увеличение доли завершенных наблюдений. Интерпретировать различия между сроками наблюдения 30 и 40 лет пока сложно, необходимо повторение анализа при более длительном наблюдении.

Для методов анализа дожития характерно повышение точности прогноза по мере увеличения времени наблюдения и доли завершенных наблюдений. Особенностью данной работы является демонстрация этой закономерности при использовании нелинейных по своей природе нейросетевых моделей. С практической точки зрения, в т.ч. для планирования эпидемиологических исследований, представляют интерес описанные ориентиры в отношении длительности наблюдения за когортой. Для изученных нами ФР влияние на вероятность смерти от всех причин становится заметным начиная с 20 лет наблюдения (особенно для женщин) и далее нарастает к 30 годам.

Для таких ФР как возраст, уровни АД и ЧСС, концентрации липидов крови, статусы курения и образования полученные результаты в целом согласуются с ранее известными данными, включая российские исследования [11-14]. Применительно к АГт при использовании жестких диагностических критериев наши результаты соответствуют точке зрения о ее негативном влиянии на дожитие [15][16].

Ограничения исследования. Выборка была сформирована случайным образом из населения нескольких районов Москвы, в анализ включены все наблюдения у лиц 18-82 лет с непропущенными значениями всех включенных в модели ФР. Проспективное наблюдение осуществлялось только за смертностью.

Заключение

На протяжении 40-летнего наблюдения прогноз вероятности фатального события с использованием перечисленных ФР достигает максимальной информативности к 30 годам проспективного наблюдения.

Отношения и деятельность. Работа выполнена в рамках Государственного задания на 2024-2025гг № 124013100902-3 "Моделирование риска хронических неинфекционных заболеваний/сердечно-сосудистых заболеваний на основе российских проспективных популяционных исследований".

Список литературы

1. Вилков В. Г., Шальнова С. А. Обоснование применения нелинейных статистических методов при анализе связей факторов риска с фатальными событиями по данным длительного проспективного наблюдения в популяциях России и Соединенных Штатов Америки. Профилактическая медицина. 2024;27(11):34-9. doi:10.17116/profmed20242711134.

2. Горбань А. Н., Дунин-Барковский В. Л., Кирдин А. Н. и др. Нейроинформатика. Новосибирск: Наука, 1998:1-296. ISBN: 5-02-031410-2.

3. Шальнова С. А., Деев А. Д., Шестов Д. Б. Прогностическая оценка эпидемиологических характеристик ишемической болезни сердца. Кардиология. 1997;9:49-54.

4. Лапин В. В. Артериальная гипотензия. В кн: Кардиология: руководство для врачей в 2 т. / Под ред. Перепеча Н. Б., Рябова С. И. СПб.: СпецЛит, 2008;1:442-60. ISBN: 978-5-299-00346-8.

5. Вилков В. Г., Баланова Ю. А., Капустина А. В. и др. Артериальная гипотензия и дожитие: диагностические критерии в популяциях Российской Федерации и Соединенных Штатов Америки. Российский кардиологический журнал. 2021;26(5):4365. doi:10.15829/1560-4071-2021-4365.

6. Neural networks: STATISTICA Neural Networks. M.: Goryachaya liniya-Telekom, 2001:1-182. (In Russ.) Нейронные сети: STATISTICA Neural Networks. М.: Горячая линия-Телеком, 2001:1-182. ISBN: 5-93517-015-9.

7. Боровиков В. STATISTICA: искусство анализа данных на компьютере. Для профессионалов. СПб.: Питер, 2001:601-40. ISBN: 5-318-00302-8.

8. Бююль А., Цёфель П. SPSS: искусство обработки информации: Анализ статистических данных и восстановление скрытых закономерностей. СПб.:ООО "ДиаСофтЮП", 2002:1-608. ISBN: 5-93772-014-8.

9. Kannel WB, McGee D, Gordon T. A general cardiovascular risk profile: The Framingham study. Am J Cardiol. 1976;38(1):46-51. doi:10.1016/0002-9149(76)90061-8.

10. Pocock SJ, McCormack V, Gueyffier F, et al. A score for predic­ting risk of death from cardiovascular disease in adults with raised blood pressure, based on individual patient data from randomised controlled trials. Br Med J. 2001;323:75-81. doi:10.1136/bmj.323.7304.75.

11. Шальнова С. А., Оганов Р. Г., Деев А. Д. Оценка и управление суммарным риском сердечно-сосудистых заболеваний у населения России. Кардиоваскулярная терапия и профилактика. 2004;3(4):4-11.

12. Шальнова С. А., Деев А. Д., Оганов Р. Г. и др. Частота пульса и смертность от сердечно-сосудистых заболеваний у российских мужчин и женщин. Результаты эпидемиологического исследования. Кардиология. 2005;45(10):45-50.

13. Шальнова С. А., Имаева А. Э., Капустина А. В. и др. Смертность населения 55 лет и старше и ее ассоциации с ишемической болезнью сердца, традиционными факторами риска и маркерами воспаления: результаты Проспективного когортного исследования. Российский кардиологический журнал. 2016;21(6):15-9. doi:10.15829/1560-4071-2016-6-15-19.

14. Visseren FLJ, Mach F, Smulders YM, et al. 2021 ESC Guidelines on cardiovascular disease prevention in clinical practice. Eur Heart J. 2021;42(34):3227-337. doi:10.1093/eurheartj/ehab484.

15. Boshuizen HC, Izaks GJ, van Buuren S, et al. Blood pressure and mortality in elderly people aged 85 and older: community based stu­dy. BMJ. 1998;316(7147):1780-4. doi:10.1136/bmj.316.7147.1780.

16. Ohkubo T, Imai Y, Tsuji I, et al. Reference values for 24-hour am­bu­latory blood pressure monitoring based on a prognostic criterion: the Ohasama Study. Hypertension. 1998;32(2):255-9. doi:10.1161/01.hyp.32.2.255.


Об авторах

В. Г. Вилков
ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России
Россия

Вилков Владимир Галикович — д.м.н., в.н.с. отдела эпидемиологии хронических неинфекционных заболеваний.

Москва

Research ID K-7862-2017



С. А. Шальнова
ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России
Россия

Шальнова Светлана Анатольевна — д.м.н., профессор, руководитель отдела эпидемиологии хронических неинфекционных заболеваний.

Москва



Ю. А. Баланова
ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России
Россия

Баланова Юлия Андреевна — д.м.н., в.н.с. отдела эпидемиологии хронических неинфекционных заболеваний.

Москва



Г. А. Муромцева
ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России
Россия

Муромцева Галина Аркадьевна — к.б.н., в.н.с. отдела эпидемиологии хронических неинфекционных заболеваний.

Москва



А. Э. Имаева
ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России
Россия

Имаева Асия Эмвяровна — д.м.н., в.н.с. отдела эпидемиологии хронических неинфекционных заболеваний.

Москва



О. М. Драпкина
ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России
Россия

Драпкина Оксана Михайловна — д.м.н., профессор, академик РАН, директор.

Москва



Дополнительные файлы

Что известно о предмете исследования?

  • Известно влияние на дожитие таких факторов риска (ФР), как возраст, величина артериального давления и частота сердечных сокращений, нарушения липидного профиля крови, ожирение, статусы курения и образования.
  • Связи дожития с ФР в большинстве случаев выявлены и доказаны с использованием множественной линейной регрессии.
  • Известно, что в медицинских исследованиях предпочтительным является использование нелинейных статистических методов.

Что добавляют результаты исследования?

  • С использованием нелинейных по своей природе искусственных нейронных сетей изучена сравнительная значимость перечисленных ФР при длительном проспективном наблюдении за российской популяцией.

Рецензия

Для цитирования:


Вилков В.Г., Шальнова С.А., Баланова Ю.А., Муромцева Г.А., Имаева А.Э., Драпкина О.М. Нейросетевой анализ связей факторов риска с фатальным событием в зависимости от продолжительности проспективного наблюдения. Кардиоваскулярная терапия и профилактика. 2025;24(4):4324. https://doi.org/10.15829/1728-8800-2025-4324. EDN: QNKWLS

For citation:


Vilkov V.G., Shalnova S.A., Balanova Yu.A., Muromtseva G.A., Imaeva A.E., Drapkina O.M. Neural network analysis of the relationships of risk factors with a fatal event depending on prospective follow-up duration. Cardiovascular Therapy and Prevention. 2025;24(4):4324. (In Russ.) https://doi.org/10.15829/1728-8800-2025-4324. EDN: QNKWLS

Просмотров: 75


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1728-8800 (Print)
ISSN 2619-0125 (Online)