Применение сверточной нейронной сети, обученной на сверхмалой выборке, для определения немодифицируемых факторов риска сердечно-сосудистых заболеваний (пола и возраста) по цифровым фотографиям глазного дна

Д. Г. Гогниева; Д. К. Валетов; А. Ю. Суворов; Н. А. Ершова; М. Х. Дуржинская; И. В. Воробьева; З. З. А. Фашафша; А. Н. Гаджиахмедова; А. Ам. Абашева; А. Сидамонидзе; С. Ш. Балкар; Ю. Юсеф; М. В. Будзинская; Д. А. Сычев; Л. К. Мошетова; Ю. В. Василевский; А. Л. Сыркин; Ф. Ю. Копылов

doi:10.15829/1728-8800-2026-4643

Применение сверточной нейронной сети, обученной на сверхмалой выборке, для определения немодифицируемых факторов риска сердечно-сосудистых заболеваний (пола и возраста) по цифровым фотографиям глазного дна

https://doi.org/10.15829/1728-8800-2026-4643

EDN: GMYPPY

Полный текст:

PDF (Rus) HTML XML

сгенерировать QR код

Содержание

Перейти к:

Аннотация

Цель. Оценка эффективности сверточной нейронной сети, обученной на сверхмалой выборке, для определения немодифицируемых факторов риска сердечно-сосудистых заболеваний (пола и возраста) по цифровым фотографиям глазного дна.

Материал и методы. Использована архитектура EfficientNet B3, предобученная на базе данных ImageNet. Исследование проводилось на собственном патентованном наборе данных, содержащем цифровые фотографии центрального поля глазного дна и демографические показатели пациентов, разделенном на обучающую (227 фото) и (131 фото) тестовую части. Для определения точности прогнозирования возраста оценивалась средняя абсолютная ошибка (MAE), коэффициент детерминации (R²) и графики Бланда- Альтмана. Для прогнозирования пола — чувствительность, специфичность, положительная и отрицательная прогностическая ценность, а также площадь под ROC-кривой.

Результаты. MAE для возраста составила 6,04 (95% доверительный интервал (ДИ): 5,11-7,11), R² — 0,638 (95% ДИ: 0,486-0,759). Площадь под ROC-кривой для прогнозирования пола составила 0,79 (95% ДИ: 0,70-0,87). Чувствительность, специфичность, отрицательная и положительная прогностическая ценность, а также сбалансированная точность (при пороге вероятности 0,5) были следующими: 88, 58,1, 81,8, 70,1 и 73,2%, соответственно.

Заключение. Полученные результаты демонстрируют высокую точность определения пола и умеренную точность определения возраста, что свидетельствует о возможности создания диагностической модели на очень небольшом наборе данных.

Ключевые слова

нейронные сети, искусственный интеллект, фотография глазного дна, пол, возраст, немодифицируемые факторы риска сердечно-сосудистых заболеваний

Для цитирования:

Гогниева Д.Г., Валетов Д.К., Суворов А.Ю., Ершова Н.А., Дуржинская М.Х., Воробьева И.В., Фашафша З.З., Гаджиахмедова А.Н., Абашева А.А., Сидамонидзе А., Балкар С.Ш., Юсеф Ю., Будзинская М.В., Сычев Д.А., Мошетова Л.К., Василевский Ю.В., Сыркин А.Л., Копылов Ф.Ю. Применение сверточной нейронной сети, обученной на сверхмалой выборке, для определения немодифицируемых факторов риска сердечно-сосудистых заболеваний (пола и возраста) по цифровым фотографиям глазного дна. Кардиоваскулярная терапия и профилактика. 2026;25(4):4643. https://doi.org/10.15829/1728-8800-2026-4643. EDN: GMYPPY

For citation:

Gognieva D.G., Valetov D.K., Suvorov A.Yu., Ershova N.A., Durzhinskaya M.Kh., Vorobyeva I.V., Fashafsha Z.Z., Gadzhiakhmedova A.N., Abasheva A.A., Sidamonidze A., Balkar S.Sh., Yusef Yu., Budzinskaya M.V., Sychev D.A., Moshetova L.K., Vasilevsky Yu.V., Syrkin A.L., Kopylov F.Yu. Сonvolutional neural network trained on an ultra-small sample to identify non-modifiable cardiovascular risk factors (sex and age) by digital fundus photographs. Cardiovascular Therapy and Prevention. 2026;25(4):4643. (In Russ.) https://doi.org/10.15829/1728-8800-2026-4643. EDN: GMYPPY

Введение

Возраст ≥55 лет у мужчин и ≥65 лет у женщин, а также мужской пол являются значимыми немодифицируемыми факторами риска (ФР) развития сердечно-сосудистых заболеваний (ССЗ) [1]. По данным систематического обзора Damen JA, et al. (2016), подавляющее большинство моделей, разработанных для прогнозирования риска данных заболеваний, учитывает стандартные показатели, включая возраст, курение, артериальное давление и липидный профиль. При этом бóльшая часть моделей не проходила внешнюю независимую валидацию и в связи с этим не может применяться в реальной клинической практике [2]. На сегодняшний день, согласно рекомендациям Европейского общества кардиологов, оценка сердечно-сосудистого риска (ССР) в общей популяции рекомендована для мужчин >40 и женщин >50 лет (или в постменопаузе) без известных ФР, а систематический скрининг показан всем лицам, имеющим хотя бы один ФР. Для его оценки рекомендуется использовать шкалы SCORE2 (Systematic Coronary Risk Estimation 2), SCORE2-OP (Systematic Coronary Risk Estimation 2-Older Persons), хотя площадь под ROC-кривой для первой составляет 0,75 (95% доверительный интервал (ДИ): 0,74-0,77), а для второй всего 0,63 (95% ДИ: 0,60-0,65) [1][3]. Очевидно, что существующие подходы к определению ССР недостаточно эффективны. А если учесть тот факт, что сердечно-сосудистая заболеваемость и смертность наиболее высоки в странах с низким и средним уровнем жизни, где доступ к квалифицированной медицинской помощи зачастую ограничен, поиск простых современных унифицированных и экономически эффективных методик оценки риска приобретает особое значение.

Развитие современных технологий привело к появлению нейронных сетей, способных обрабатывать различные медицинские изображения; так в работе Poplin R, et al. (2018) при помощи нейронной сети, обученной на больших данных (284335 пациентов) удалось не только эффективно определить отдельные ФР сердечно-сосудистых осложнений (возраст, пол, курение, систолическое артериальное давление), но и частоту их возникновения, площадь под ROC-кривой составила 0,70 [4]. Следует отметить, что основным фактором, ограничивающим разработку и применение нейронных сетей в целом, и в медицине в частности, является недостаток больших данных. В связи с этим разработка методик, направленных на преодоление данного ограничения, представляется достаточно перспективным направлением.

Представленная работа выполнена в рамках реализации проекта Приоритета 2030 "Цифровая кардиология с искусственным интеллектом" 03.000.Б.166 и является частью основного исследования, направленного на разработку универсального калькулятора ССР, использующего каскад нейросетевых моделей для его прогнозирования исключительно на основе цифровых изображений глазного дна. Этот инструмент призван облегчить массовый скрининг без участия медицинского персонала, особенно в отдаленных регионах и странах с низким и средним уровнем дохода, где доступ к квалифицированной медицинской помощи ограничен.

Ниже представлены данные, полученные в ходе исследования, не имеющего аналогов на территории Российской Федерации и посвященного оценке диагностической эффективности нейронной сети, обученной на сверхмалой выборке (наименьший набор данных), описанный в мировой научной литературе — 360 цифровых фотографий глазного дна от 180 пациентов) для прогнозирования немодифицируемых факторов ССР, в частности пола и возраста, с использованием цифровых фотографий глазного дна.

Материал и методы

От 23 мая 2025г получено свидетельство о государственной регистрации программы для электронно-вычислительных машин "Программное обеспечение для определения возраста пациентов, как фактора риска сердечно-сосудистых заболеваний, основанное на применении сверточной нейронной сети" № 2025662882, от 03 июня 2025 года — "Программное обеспечение для определения пола пациентов, как фактора риска сердечно-сосудистых заболеваний, основанное на применении сверточной нейронной сети" № 2025664252.

Описание набора данных. Исследование было одобрено локальным этическим комитетом (протокол № 05-21 от 10.03.2021) и соответствовало принципам Хельсинкской декларации. Все пациенты подписали информированное согласие.

В исследовании использовалась собственная патентованная обезличенная база (358 пациентов), включающая: цифровые фотографии глазного дна (центральное поле), полученные после расширения зрачков; демографическую информацию, такую как пол, возраст; информацию о наличии офтальмологических заболеваний. Фотографии глазного дна были получены с помощью медицинской цифровой камеры Optomed Smartscope PRO (Optomed USA Inc., Сан-Франциско, Калифорния), расширение зрачков достигалось с помощью Феникамида (международное непатентованное название: тропикамид + фенилэфрин) производства общества с ограниченной ответственностью "Гротекс".

В базу не включались пациенты, имеющие следующие офтальмологические состояния: врождённые и приобретённые заболевания, приводящие к необратимой потере зрения (анофтальм, атрофия зрительного нерва и травма глаза); помутнение зрительных сред, препятствующее качественной визуализации глазного дна; диабетический макулярный отек и другие патологии, затрагивающие макулярную область, включая возрастную макулярную дегенерацию, центральную серозную хориоретинопатию и центральный серозный хориоретинит.

Архитектура нейронной сети. В качестве базовой модели выбрана EfficientNet-B3 — одна из самых популярных и масштабируемых нейросетевых архитектур для классификации изображений, разработанная с использованием методов автоматической оптимизации параметров. EfficientNet является предобученной моделью (уже обучена на большом массиве изображений, не обучен лишь последний слой) [5-7]. В настоящем исследовании сформирован ансамбль из 20 отдельных моделей типа EfficientNet-B3, каждая из которых обучалась параллельно на общем обучающем массиве (разделение данных для каждой модели описано в разделе "Описание процесса обучения"). Таким образом, получались различные 20 моделей, при наличии новых (тестовых, проверяемых) данных каждая модель давала свою вероятность или значение (в случае возраста), затем предсказания моделей усреднялись. Такой подход позволил обеспечить более устойчивый результат предсказаний. Программный код доступен по запросу.

Предобработка данных. Все снимки были получены с камер в цифровом виде в формате *.jpg или *.png, трансформированы для достижения оптимальной яркости, контрастности и насыщенности, а затем переведены в тензоры. Затем была проведена процедура аугментации, или внесения намеренных искажений (цветокоррекция, повороты) исходных снимков, для увеличения их количества и разнообразия, ~25% снимков обучающего массива [8]. Аугментация может позволить построить модель с более стабильными результатами, но без существенного повышения количества снимков. Предобработка включала центральное кадрирование с сохранением 50% от площади снимка (до размера 256×256 пикселей), затем фото были переведены в черно-белые изображения с понижением контрастности на 25%, а также усреднением по яркости по каждому снимку.

Описание процесса обучения. Набор данных был разделён на обучающую (70%) и тестовую (30%) части. При разделении не допускалось попадание снимков разных глаз одного пациента (правый/левый) и в обучающую, и в тестовую части. Схематическое описание процесса обучения представлено на рисунке 1.

Рис. 1 Процесс обучения ансамблевой модели.

Обучающая выборка включала 227 пациентов, из которых 124 (54,6%) были мужчинами. В таблице 1 представлено распределение пациентов в данной выборке по возрастным группам, а на рисунке 2 — распределение пациентов обучающего набора данных по полу в разных возрастных группах.

Таблица 1

Распределение пациентов по возрастным группам в обучающем наборе данных

Показатель, лет	n	Среднее	SD	Мин.	25%	Медиана	75%	Макс.
Все пациенты	227	52,5	15,5	20	39	54	64	105
<30	23	26,9	2,7	20	25	28	29	30
31-40	40	35,7	2,9	31	33	36	38,3	40
41-50	34	46,4	2,8	41	44	47	49	50
51-60	50	56,1	3,1	51	53,3	56,5	58,8	60
61-70	53	64,8	2,9	61	62	64	67	70
70+	27	76,3	6,7	71	72,5	75	77	105

Примечание: SD — стандартное отклонение.

Рис. 2 Распределение пациентов обучающего набора данных по полу в разных возрастных группах.

Тестовый набор данных включал 131 пациента, из которых 69 (52,6%) были мужчинами. Распределение пациентов по возрастным группам в тестовой выборке представлено в таблице 2. На рисунке 3 показано распределение пациентов в тестовом наборе данных по полу в разных возрастных группах.

Таблица 2

Распределение пациентов по возрастным группам в тестовом наборе данных

Показатель, лет	n	Среднее	SD	Мин.	25%	Медиана	75%	Макс.
Все пациенты	131	54,0	14,3585	26	43	56	65	84
<30	9	28,1	1,6	26	27	27	30	30
31-40	20	35,6	2,1	32	34	35,5	37	39
41-50	18	45,5	3,2	41	44	45	47,8	50
51-60	36	55,7	3,3	51	52	56	59	60
61-70	31	64,9	2,9	61	62	65	67,5	70
71>	17	75,3	3,7	71	72	75	77	84

Примечание: SD — стандартное отклонение.

Рис. 3 Распределение пациентов тестового набора данных по полу в разных возрастных группах.

Затем для каждой из 20 моделей обучающий массив был случайным образом снова разделен на внутреннюю обучающую и валидационную выборку (необходимо для контроля переобучения, подбора гиперпараметров, ранней остановки), что позволяло моделям несколько по-разному параллельно обучаться. Соотношение внутренней обучающей и валидационной выборок также составило 70 и 30%. При разделении не допускалось попадание снимков разных глаз одного пациента (правый/левый) и в обучающую, и в валидационную части. Разделение на части для каждой модели ансамбля выполнялось случайно, поэтому модели обучались на разных объектах выборки, что позволило разным моделям ансамбля лучше искать различия и зависимости в наборе данных.

При разделении данных на три вышеупомянутых массива (обучающий, валидационный, тестовый) использована стратификация по переменной исхода в случае пола, в случае возраста стратификация проводилась с учетом медианного значения (Me) возраста (доля наблюдений >Me возраста должна была составлять ~50% по каждому из 3 массивов).

В качестве оптимизатора применён алгоритм ADAM (Adaptive Moment Estimation), использующий адаптивный шаг обучения для каждого параметра, что позволяет модели быстрее сходиться к оптимальным значениям параметров, ускорить процесс обучения и получить более точные результаты.

При обучении использованы следующие подходы: два варианта batch size — 32 и 64 тензора, показатель скорости обучения также использован в двух вариантах — 0,0001 и 0,00001. Таким образом, имелось 4 комбинации гиперпараметров. На каждую комбинацию было запланировано не >150 эпох обучения, однако на каждой эпохе проводилась оценка текущего значения функции потерь для валидационного массива. Если значение было минимальным, конфигурация данной эпохи сохранялась и в последующем использовалась в качестве "наилучшей" в данной комбинации. Таким образом, каждая из 20 моделей обучалась на протяжении не <150 эпох, но лучшие конфигурации могли быть отобраны и до завершения обучения. Пример функции потерь и выбора модели представлен на рисунке 4. Список из лучших моделей по каждой комбинации сортировался по площади под ROC-кривой для валидационного массива, в итоге отбиралась модель с самым высоким значением данного показателя. Затем проводилась оценка этой модели на тестовом массиве.

Рис. 4 Кривые функции потерь при обучении случайной модели из ансамбля.

Статистический анализ. Статистический анализ проводился с использованием Python 3.10 (Anaconda distribution). Для прогнозирования возраста применялась модель-регрессор, для оценки ее предиктивных свойств — средняя абсолютная ошибка (MAE) и коэффициент детерминации (R²), а также графический метод Бланда-Альтмана.

Для определения мужского пола использовалась модель-классификатор. Качество модели оценивалось с помощью ROC-анализа, который включал расчет площади под ROC-кривой. Для прогнозов, основанных на обучающем наборе данных, был установлен порог 0,5 для преобразования вероятностей в класс (мужской пол). Валидация с использованием тестового набора данных включала оценку площади под ROC-кривой как для вероятностей, так и для чувствительности, специфичности, положительных и отрицательных прогностических значений для установленного порога.

Статистическая мощность исследования. Для расчета объема требуемой выборки использована формула Buderer NM (1996) [9].

Для фиксированной чувствительности количество наблюдений с реальным исходом оценивалось по формуле:

Общее количество наблюдений с учетом распространенности оценивалось по формуле:

Для фиксированной специфичности количество наблюдений без наличия исхода оценивалось по формуле:

Общее количество наблюдений с учетом распространенности оценивалось по формуле:

Итоговое количество пациентов в исследовании оценивалось по формуле:

n=max(⎡n_1⎤,⎡n_2⎤),

где: z=1,96 (Z-статистика с учетом ошибки I рода не >5%); SN — ожидаемая чувствительность; SP — ожидаемая специфичность; p — распространенность исхода; w — желаемая широта 95% ДИ (целая, а не половинная широта или 2 × предельная ошибка выборки).

Первоначальные гипотезы исходили из того, что пол будет равновероятным (p=q=0,5), ожидаемая чувствительность и специфичность составят не <80% с учетом желаемой широты 95% ДИ: 20% (т.е., по 10% с каждой стороны), ошибка I рода не >5%. Таким образом, потребуется не <32 наблюдений (по 18 каждого класса), что соответствует минимальному объемы выборки для валидации. В случае, если общий обучающий массив соотносится с тестовым, как 70/30% в обучающей выборке должно быть не <76 наблюдений (по 38 каждого класса).

Для расчета объема требуемой выборки для определения возраста использованы подходы из таблицы 2 публикации Seabrook JA (2025), на основании предполагаемого коэффициента детерминации на уровне умеренного размера эффекта [10]. Таким образом, в тестовую выборку необходимо было включить не <114 наблюдений, в обучающую выборку — 266 наблюдений.

Для полученных в исследовании статистических метрик оценки качества проведено бутстрепирование с не менее, чем 1000 итерациями для расчета 95% ДИ.

Результаты

Результаты внешней валидации на тестовом наборе данных представлены ниже.

Определение возраста

Распределение для ошибок в предсказании возраста отличалось от нормального, p-значение теста Шапиро-Уилка <0,001. Визуально распределение ошибки симметрично и имеет колоколообразную форму с некоторыми выбросами с обеих сторон. Распределение ошибок в тестовом наборе данных представлено на рисунке 5.

Рис. 5 Распределение ошибок в тестовом наборе данных.

Средняя абсолютная ошибка для показателя возраста составила 6,04 (95% ДИ: 5,11; 7,11), а R² — 0,638 (95% ДИ: 0,486; 0,759). В таблице 3 представлены показатели MAE и R² для различных возрастных групп.

Таблица 3

Средняя абсолютная ошибка и R² для различных возрастных групп

Возрастная группа, лет	Значение MAE (95% ДИ)	Значение R² (95% ДИ)	n
<30	7,35 (3,38; 13,46)	0,370 (0,0; 0,642)	9
31-40	7,81 (4,69; 11,9)	0,572 (0,084; 0,869)	20
41-50	4,59 (2,84; 6,34)	0,558 (0,0; 0,880)	18
51-60	3,77 (2,82; 4,94)	0,652 (0,352; 0,843)	36
61-70	4,97 (3,75; 6,3)	0,658 (0,322; 0,866)	31
70+	11,57 (8,42; 15,33)	0,562 (0,001; 0,885)	17

Примечание: ДИ — доверительный интервал, MAE — средняя абсолютная ошибка, R² — коэффициент детерминации.

Самый низкий показатель MAE наблюдается в возрастной группе 51-60 лет, в целом ошибка имела тенденцию к снижению у пациентов в возрасте 41-70 лет, вероятно, из-за большей доли этой группы в обучающем наборе данных.

На диаграмме Бланда-Альтмана (рисунок 6) видно, что до 60 лет ошибки распределены равномерно относительно центральной тенденции в диапазоне от +10 до -10. У пациентов старшего возраста ошибка смещается в сторону отрицательных значений, что свидетельствует о том, что модель недооценивает возраст пациентов.

Рис. 6 Диаграмма Бланда-Альтмана для возраста.

Примечание: SD — стандартное отклонение.

Определение пола

Чувствительность, специфичность, положительная и отрицательная прогностические ценности, сбалансированная точность модели с порогом вероятности 0,5 для определения пола составили 88 (95% ДИ: 80,3; 95,4), 58,1 (95% ДИ: 45,8; 70,9), 81,8 (95% ДИ: 70,0; 92,6), 70,1 (95% ДИ: 60,2; 80,0), 73,2 (95% ДИ: 65,7; 80,3), соответственно.

Для данного исхода приведен график точность-полнота (precision-recall) на рисунке 7.

Рис. 7 Кривая точность-полнота (precision-recall) для пола.

Модель демонстрирует умеренное качество определения пола, площадь под ROC-кривой — 0,79 (95% ДИ: 0,70; 0,87), рисунок 8.

Рис. 8 Площадь под ROC-кривой для пола.

Примечание: AUC — площадь ROC-кривой.

Средняя точность (precision) составила 0,74, что может свидетельствовать об умеренных дискриминационных способностях архитектуры.

Обсуждение

Несмотря на достижения в области медицинских технологий, основной проблемой исследований в области искусственного интеллекта является сбор и валидация больших данных. В частности, получение и хранение цифровых фотографий глазного дна не является рутинной клинической практикой, требует расширения зрачка, что, в свою очередь, значительно усложняет процесс их накопления. Кроме того, многие общедоступные базы созданы преимущественно на данных лиц азиатской расы, что может ограничивать эффективность моделей при применении к европейской популяции, в частности российской. Одним из возможных решений является разработка моделей нейронных сетей, обучаемых на значительно меньших выборках. Ниже представлены исследования-аналоги, в которых используются наборы данных различных размеров.

Первым исследованием, направленным на определение диагностической эффективности нейронной сети в выявлении ФР ССЗ принято считать работу Poplin R, et al. (2018), где для обучения сверточной нейронной сети архитектуры Inception-v3 были использованы данные 284335 пациентов из Британского биобанка и базы данных EyePACS, внешний тестовый набор данных был представлен 13025 фотографиями глазного дна. В данном исследовании MAE для возраста составила 3,26 лет, а площадь под ROC-кривой для пола 0,97 [4].

Dieck S, et al. (2020) [11] предприняли попытку воспроизвести исследование Poplin R, et al. (2018), используя двуклассовую сверточную нейронную сеть. Для обучения и тестирования так же применялись фотографии из Британского биобанка (70% обучающая, 20% валидационная и 10% тестовая наборы данных). Точность при определении пола составила 82,9%. Авторы отмечают, что это может быть связано с различиями моделей и с тем, что для обучения нейросети использовалось меньше данных, чем в исследовании Poplin R, et al. (2018) [4], т.к. отсутствовал доступ к базе EyePACS [11].

В исследовании Korot, E, et al. (2021) была представлена модель, предсказывающая пол по цифровым фотографиям глазного дна с использованием глубокого обучения на платформе Google Cloud AutoML без написания программного кода. Обучение производилось на 84743 фотографиях из Британского биобанка. Для внешней валидации использовалась выборка из 252 фотографий. Площадь под ROC-кривой для пола составила 0,93, чувствительность 83,9%, специфичность 72,2%, положительная прогностическая ценность 78,2%, точность 78,6%. При этом диагностическая эффективность модели снижалась при наличии на фотографиях патологии центральной ямки макулы зрительного нерва (точность 69,4 vs 85,4%), в нашем исследовании данная патология являлась критерием исключения [12].

В исследовании Kim YD, et al. (2020) для обучения нейронной сети были использованы 243688 фотографий. Тестовая выборка включала 4 категории пациентов: 40659 фото пациентов с артериальной гипертензией (АГ), 14 189 с сахарным диабетом (СД), 113510 с анамнезом употребления табака и 24366 здоровых некурящих людей. Все изображения были получены из архива изображений сетчатки глаза больницы Бундан Сеульского национального университета (SBRIA). Исследователи использовали архитектуру ResNet-152, предобученную на базе данных ImageNet. Нейронная сеть показала высокую эффективность в определении возраста у здоровых некурящих людей: R² — 0,92, MAE — 3,06 года. Показатели MAE были сопоставимы у людей с АГ — 3,46 лет, СД — 3,55 лет и у лиц, употребляющих табак, — 2,65 лет, в то время как показатели R² были достаточно низкими: 0,74, 0,75 и 0,86, соответственно. При анализе подгрупп было показано, что MAE увеличивалась, а точность снижалась у лиц >60 лет, как в группе здоровых, так и при АГ, СД и курении в анамнезе [13]. В нашем исследовании наибольшая эффективность наблюдалась в возрастной группе от 51 до 60 лет, анализ показателей эффективности в подгруппах с анамнезом АГ, СД, курения и иных значимых нозологий не представлялся возможным в связи с малым объемом выборки исследования.

Большой объём обучающих наборов данных в описанных выше исследованиях, вероятно, способствовал высоким показателям эффективности использованных в них моделей. Однако программные коды не находятся в открытом доступе, что затрудняет оценку воспроизводимости результатов. Важно отметить, что нейронные сети в данных работах обучались исключительно на материалах Британского биобанка и не тестировались на независимых внешних базах.

В исследовании Betzler BK, et al. (2021) был разработан алгоритм для определения пола пациента, основанный на архитектуре Visual Geometry Group-16. Изучены три разновидности моделей, основанные на анализе разных областей глазного дна: диск зрительного нерва, макула, периферические поля. Обучение проводилось на базе данных исследования "Singapore Epidemiology of Eye Diseases", включавшем 172170 изображений от 9 956 пациентов в возрасте ≥40 лет. База была разделена на обучающую 79,9% и тестовую части 20,1%. Площадь под ROC-кривой для общей группы составила 0,87, для лиц <65 лет — 0,89 и 0,82 в группе пациентов ≥65 лет. Наилучшие показатели диагностической эффективности были получены для модели, основанной на анализе зоны диска зрительного нерва (AUC 0,91 для пациентов <65 лет и 0,86 для лиц ≥65 лет) [14].

Обучение нейросети в исследовании Taha AM, et al. (2022) проводилось на базе данных из репозитория Kaggle, включающего 20000 фотографий глазного дна, который был разделен на наборы данных для обучения, внутренней валидации и тестирования (60, 20 и 20%, соответственно). Информация о расе пациентов в описании базы данных отсутствует. Была использована архитектура сети Xception. Площадь под ROC-кривой модели для предсказания пола составила 0,99, точность (precision), точность (accuracy)¹, полнота (recall)² и f1-score³ — 96,83% [15].

В работах Kim YD, et al. (2020) и Betzler BK, et al. (2021) использовались большие обучающие наборы данных, включающие представителей азиатской расы [13][14], а в исследовании Taha AM, et al. (2022) [15] расовая принадлежность пациентов для обучающего набора данных описана не была. Следует отметить, что расовые различия могут влиять на эффективность моделей при внешней валидации с участием представителей других рас. Настоящее исследование было выполнено с применением фото глазного дна лиц преимущественно европеоидной расы, российской популяции. Хотя это и является ограничением для масштабирования модели, важно отметить, что данное исследование является первым на подобной выборке.

В исследовании Gerrits, N, et al. (2020) использовалась нейронная сеть архитектуры Mobile-Net-V2, предобученная на базе данных ImageNet. Обучение проводилась на 7200 фотографиях глазного дна жителей Катара. Для возраста MAE составила 2,78 лет, а площадь под ROC-кривой для пола — 97,0 [16].

В исследовании Khan, NC, et al. (2022) применялась нейросеть архитектуры DenseNet201, для обучения использована 1021 фотография глазного дна пациентов с установленным диагнозом СД, изображения были разделены на обучающий (80%) и тестовый (20%) наборы данных. Для показателя пола площадь под ROC-кривой составила 0,85, а для возраста старше 70 лет — 0,90 [17].

В исследовании Berk A, et al. (2023) модель для определения пола была обучена на 7012 фотографиях глазного дна из баз данных DOVS и ODIR (Канада). Площадь под ROC-кривой для пола составила 0,72. Авторы пришли к выводу, что ансамблирование имеет решающее значение для повышения производительности сверточных нейронных сетей, таких как ResNet-152, предварительно обученных на ImageNet, особенно с небольшими наборами данных для обучения [18].

Из представленных выше исследований только в трех обучение нейронных сетей проводилось на выборках малого размера. При этом в двух из них показатели точности по определению пола были сопоставимы с полученными нами, а показатели эффективности определения возраста были выше, что можно объяснить меньшим размером обучающей выборки в нашем исследовании.

В связи с гетерогенностью методологии упомянутых исследований (архитектура нейронных сетей, особенности их обучения и обработки данных, различных размеров выборок и т.д.) их малым количеством, а также отсутствием попыток воспроизведения и внешней валидации, прямое сравнение исследований не представляется возможным. Их описание представлено в таблице 4.

Таблица 4

Сравнительная характеристика исследований, в которых обучение нейросетей проводилось с использованием малых наборов данных

Источник, год	База данных	Количество фото в обучающем наборе данных, n	Архитектура нейронной сети	Показатели диагностической эффективности для возраста	Показатели диагностической эффективности для пола
Gerrits N, et al. (2020) [16]	Qatar Biobank (население Ближнего Востока)	7200	MobileNet-V2 Предобучение на ImageNet	MAE 2,78 R² 0,89	AUC 0,97
Khan NC, et al. (2022) [17]	Клиники первичной медико-санитарной помощи "Stanford Healthcare" и/или сети клиник "Stanford University Health Alliance"	1021	DenseNet201	ImageNet Pre-Trained Model
				70+ AUC 0,90	AUC 0,85
				Retinal Image Pre-Trained Model
				70+ AUC 0,84	AUC 0,57
Berk A, et al. (2023) [18]	DOVS ODIR	7012	ResNet-152 Предобучение на ImageNet	нет данных	AUC 0,72
Нейронная сеть, представленная в данной статье	Собственная патентованная база данных	360	EfficentNet B3 Предобучение на ImageNet	MAE 6,04 R² 0,638	AUC 0,79

Примечание: AUC — площадь под ROC-кривой, MAE — средняя абсолютная ошибка, R² — коэффициент детерминации.

К ограничениям представленной работы можно отнести ее одноцентровой характер, отсутствие независимой внешней валидации, малый объем тестовой выборки, отсутствие анализа влияния технических особенностей фоторегистрации глазного дна (освещенность, тип камеры, угол съёмки и т.д.), дихотомическое представление о поле пациентов, не учитывающее интерсекс-вариации. Учитывая вышесказанное, важно отметить, что полученные результаты пока не позволяют использовать модель для клинического применения, а носят исследовательский характер.

Заключение

Представленная работа является частью более крупного исследования, направленного на разработку и валидацию универсального калькулятора ССР, использующего каскад нейросетевых моделей для прогнозирования наличия различных факторов ССР исключительно на основе цифровых изображений глазного дна.

Представленная методика, основанная на анализе фотографий глазного дна человека нейронной сетью, обученной на сверхмалой выборке, показала высокую эффективность в определении пола и умеренную эффективность в установлении возраста пациентов. Для внедрения разработки в реальную клиническую практику необходимы дальнейшие исследования, направленные преодоление ограничений, приведенных выше.

Отношения и деятельность: все авторы заявляют об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.

1. Показатель accuracy показывает, насколько близко результаты измерений к принятому значению. Данная метрика отражает количество правильно проставленных меток класса (истинно положительных и истинно отрицательных) от общего количества данных. Показатель precision показывает, насколько близки отдельные измерения или прогнозы друг к другу. Метрика оценивает последовательность и надёжность результатов.

2. Recall — доля истинно положительных результатов (полнота). Эта метрика измеряет, как часто модель точно спрогнозировала истинный результат, когда результат на самом деле является истинным, т.е. насколько точно модель нашла все фактически истинные значения в наборе данных.

3. f1 (f1 score) — метрика в машинном обучении, представляющая собой гармоническое среднее между точностью (precision) и полнотой (recall). Она используется для оценки качества бинарных моделей классификации и является полезной особенно в случаях, когда распределение классов несбалансировано, т.к. обеспечивает баланс между количеством ложноположительных и ложноотрицательных срабатываний.

Список литературы

1. Visseren FLJ, Mach F, Smulders YM, et al. 2021 ESC Guidelines on cardiovascular disease prevention in clinical practice. Eur Heart J. 2021;42(34):3227-337. doi:10.1093/eurheartj/ehab484.

2. Damen JAAG, Hooft L, Schuit E, et al. Prediction models for cardiovascular disease risk in the general population: systematic review. BMJ. 2016;353:i2416. doi:10.1136/bmj.i2416.

3. van Trier TJ, Snaterse M, Boekholdt SM, et al. Validation of Systematic Coronary Risk Evaluation 2 (SCORE2) and SCORE2-Older Persons in the EPIC-Norfolk prospective population cohort. Eur J Prev Cardiol. 2024;31(2):182-9. doi:10.1093/eurjpc/zwad318.

4. Poplin R, Varadarajan AV, Blumer K, et al. Prediction of car diovascular risk factors from retinal fundus photographs via deep learning. Nat Biomed Eng. 2018;2(3):158-64. doi:10.1038/s41551-018-0195-0.

5. Alshoraihy A. EfficientNetB3 in Leukemia Detection: Advancements in Medical Imaging Analysis. Medinformatics. 2025; 2(3):219-25. doi:10.47852/bonviewMEDIN52023293.

6. Weiss K, Khoshgoftaar TM, Wang DD. A survey of transfer learning. J Big Data. 2016;3(1):9. doi:10.1186/s40537-016-0043-6.

7. Ganaie MA, Hu M, Malik AK, et al. Ensemble deep learning: A review. Eng Appl Artif Intell. 2022;115:105151. doi:10.1016/j.engappai.2022.105151.

8. Xu M, Yoon S, Fuentes A, et al. A comprehensive survey of image augmentation techniques for deep learning. Pattern Recognit. 2023;109347. doi:10.1016/j.patcog.2023.109347.

9. Buderer NM. Statistical methodology: I. Incorporating the prevalence of disease into the sample size calculation for sensitivity and specificity. Acad Emerg Med. 1996;3(9):895-900. doi:10.1111/j.1553-2712.1996.tb03538.x.

10. Seabrook JA. Powering Nutrition Research: Practical Strategies for Sample Size in Multiple Regression. Nutrients. 2025;17:2668. doi:10.3390/nu17162668.

11. Dieck S, Ibarra M, Moghul I, et al. Factors in Color Fundus Photographs That Can Be Used by Humans to Determine Sex of Individuals. Trans Vis Sci Tech. 2020;9(7):8. doi:10.1167/tvst.9.7.8.

12. Korot E, Pontikos N, Liu X, et al. Predicting sex from retinal fundus photographs using automated deep learning. Sci Rep. 2021;11:10286. doi:10.1038/s41598-021-89743-x.

13. Kim YD, Noh KJ, Byun SJ, et al. Effects of Hypertension, Diabetes, and Smoking on Age and Sex Prediction from Retinal Fundus Images. Sci Rep. 2020;10:4623. doi:10.1038/s41598-020-61519-9.

14. Betzler BK, Yang HHS, Thakur S, et al. Gender Prediction for a Multiethnic Population via Deep Learning Across Different Retinal Fundus Photograph Fields: Retrospective Cross-sectional Study. JMIR Med Inform. 2021;9(6):e25165. doi:10.2196/25165.

15. Taha AM, Zarandah QMM, Abu-Nasser BS, et al. Gender Prediction from Retinal Fundus Using Deep Learning. Int J Acad Inf Syst Res. 2022;6(5):57-63.

16. Gerrits N, Elen B, Craenendonck TV, et al. Age and sex affect deep learning prediction of cardiometabolic risk factors from retinal images. Sci Rep. 2020;10:9432. doi:10.1038/s41598-020-65794-4.

17. Khan NC, Perera C, Dow ER, et al. Predicting Systemic Health Features from Retinal Fundus Images Using Transfer Learning-Based Artificial Intelligence Models. Diagnostics. 2022;12(7):1714. doi:10.3390/diagnostics12071714.

18. Berk A, Ozturan G, Delavari P, et al. Learning from small data: Classifying sex from retinal images via deep learning. PLoS ONE. 2023;18(7):e0289211. doi:10.1371/journal.pone.0289211.

Об авторах

Д. Г. Гогниева

ФГАОУ ВО "Первый Московский государственный медицинский университет им. И.М. Сеченова" Минздрава России (Сеченовский Университет)
Россия

Дарья Геннадиевна Гогниева — к.м.н., с.н.с. Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

Д. К. Валетов

Дмитрий Кириллович Валетов — ассистент кафедры высшей математики, механики и математического моделирования.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

А. Ю. Суворов

Александр Юрьевич Суворов — к.м.н., с.н.с. Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

Н. А. Ершова

Наталья Алексеевна Ершова — студентка Института клинической медицины им. Н. В. Склифосовского, член студенческого научного кружка Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

М. Х. Дуржинская

Мадина Хикметовна Дуржинская — к.м.н., с.н.с. Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

И. В. Воробьева

ФГАОУ ВО "Российский университет дружбы народов им. Патриса Лумумбы"
Россия

Ирина Витальевна Воробьева — д.м.н., доцент, профессор кафедры глазных болезней.

Ул. Миклухо-Маклая, д. 6, Москва, 117198

З. З. А. Фашафша

Фашафша Заки З. А. — к.м.н., н.с. Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

А. Н. Гаджиахмедова

Аида Нурмагомедовна Гаджиахмедова — стажер- исследователь Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

А. Ам. Абашева

Алина Амировна Абашева — студентка Института клинической медицины им. Н. В. Склифосовского, член студенческого научного кружка Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

А. Сидамонидзе

ДПО "Российская медицинская академия непрерывного профессионального образования" Минздрава России
Россия

Александр Сидамонидзе — к.м.н., м.н.с. отдела инновационных витреоретинальных технологий.

Ул. Россолимо, д.11А, Б, Москва, 119021

С. Ш. Балкар

Сантия Шамиль Балкар — врач-офтальмолог 3 офтальмологического отделения.

Ул. Россолимо, д.11А, Б, Москва, 119021

Ю. Юсеф

Юсеф Юсеф — д.м.н., профессор, директор.

Ул. Россолимо, д.11А, Б, Москва, 119021

М. В. Будзинская

Мария Викторовна Будзинская — д.м.н., г.н.с. отдела патологии сетчатки и зрительного нерва, профессор кафедры офтальмологии.

Ул. Россолимо, д.11А, Б, Москва, 119021

Д. А. Сычев

ФГБНУ "Научно- исследовательский институт глазных болезней им. М.М. Краснова"
Россия

Дмитрий Алексеевич Сычев — д.м.н., профессор, академик РАН, зав. кафедрой клинической фармакологии и терапии им. акад. Б. Е. Вотчала.

Ул. Баррикадная, д. 2/1, стр.1, Москва, 123242

Л. К. Мошетова

ФГБНУ "Научно- исследовательский институт глазных болезней им. М.М. Краснова"
Россия

Лариса Константиновна Мошетова — д.м.н., профессор, академик РАН, президент.

Ул. Баррикадная, д. 2/1, стр.1, Москва, 123242

Ю. В. Василевский

Юрий Викторович Василевский — д.ф.- м.н., член-корр. РАН, зав. кафедрой высшей математики, механики и математического моделирования.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

А. Л. Сыркин

Абрам Львович Сыркин — д.м.н., кафедры кардиологии, функциональной и ультразвуковой диагностики Института клинической медицины им. Н. В. Склифосовского.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

Ф. Ю. Копылов

Филипп Юрьевич Копылов — д.м.н., профессор, директор Института персонализированной кардиологии Научно-технологического парка биомедицины.

Ул. Трубецкая, д. 8, стр. 2, Москва, 119048

Что известно о предмете исследования?

Сверточные нейронные сети нашли широкое применение в анализе медицинских изображений различного формата.

Что добавляют результаты исследования?

Исследование не имеет аналогов на территории Российской Федерации.
Результаты исследования демонстрируют возможность получения эффективных диагностических моделей, основанных на применении систем искусственного интеллекта, при обучении их на сверхмалой выборке (наименьший наборов данных, описанный в мировой научной литературе).

Рецензия

Для цитирования:

For citation:

JATS XML

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 1728-8800 (Print)
ISSN 2619-0125 (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Кардиоваскулярная терапия и профилактика

Полный текст:

Аннотация

Ключевые слова

Для цитирования:

For citation:

Введение

Материал и методы

Результаты

Определение возраста

Определение пола

Обсуждение

Заключение

Список литературы

Об авторах

Рецензия

Для цитирования:

For citation:

Использование куки-файлов