<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">cardiovascular</journal-id><journal-title-group><journal-title xml:lang="ru">Кардиоваскулярная терапия и профилактика</journal-title><trans-title-group xml:lang="en"><trans-title>Cardiovascular Therapy and Prevention</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1728-8800</issn><issn pub-type="epub">2619-0125</issn><publisher><publisher-name>«SILICEA-POLIGRAF» LLC</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.15829/1728-8800-2025-4130</article-id><article-id custom-type="edn" pub-id-type="custom">YXVRIN</article-id><article-id custom-type="elpub" pub-id-type="custom">cardiovascular-4130</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>АРТЕРИАЛЬНАЯ ГИПЕРТОНИЯ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>ARTERIAL HYPERTENSION</subject></subj-group></article-categories><title-group><article-title>Разработка и валидация моделей машинного обучения, прогнозирующих госпитализации пациентов с артериальной гипертензией в течение 12 месяцев</article-title><trans-title-group xml:lang="en"><trans-title>Development and validation of machine learning models predicting hospitalizations of hypertensive patients over 12 months</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-6359-0763</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Андрейченко</surname><given-names>А. Е.</given-names></name><name name-style="western" xml:lang="en"><surname>Andreychenko</surname><given-names>A. E.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Андрейченко Анна Е. — к.ф.- м.н., руководитель направления искусственного интеллекта</p><p>Петрозаводск</p></bio><bio xml:lang="en"><p>Petrozavodsk</p></bio><email xlink:type="simple">anna.ev.andreychenko@yandex.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-0513-8557</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Ермак</surname><given-names>А. Д.</given-names></name><name name-style="western" xml:lang="en"><surname>Ermak</surname><given-names>A. D.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Ермак Андрей Д. — аналитик данных направления искусственного интеллекта</p><p>Петрозаводск</p></bio><bio xml:lang="en"><p>Petrozavodsk</p></bio><email xlink:type="simple">aermak@webiomed.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-8745-857X</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Гаврилов</surname><given-names>Д. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Gavrilov</surname><given-names>D. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Гаврилов Денис В. — эксперт по медицине</p><p>Петрозаводск</p></bio><bio xml:lang="en"><p>Petrozavodsk</p></bio><email xlink:type="simple">dgavrilov@webiomed.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-2350-977X</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Новицкий</surname><given-names>Р. Э.</given-names></name><name name-style="western" xml:lang="en"><surname>Novitsky</surname><given-names>R. E.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Новицкий Роман Э. — генеральный директор</p><p>Петрозаводск</p></bio><bio xml:lang="en"><p>Petrozavodsk</p></bio><email xlink:type="simple">roman@webiomed.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-4453-8430</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Драпкина</surname><given-names>О. М.</given-names></name><name name-style="western" xml:lang="en"><surname>Drapkina</surname><given-names>O. M.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Драпкина Оксана М. — д.м.н., профессор, академик РАН, директор</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">drapkina@bk.ru</email><xref ref-type="aff" rid="aff-2"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-7380-8460</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Гусев</surname><given-names>А. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Gusev</surname><given-names>A. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Гусев Александр В. — к.т.н., с.н.с. отдела научных основ организации здравоохранения</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">agusev@webiomed.ru</email><xref ref-type="aff" rid="aff-3"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru">ООО "К-Скай"<country>Россия</country></aff><aff xml:lang="en">OOO K-Sky<country>Russian Federation</country></aff></aff-alternatives><aff-alternatives id="aff-2"><aff xml:lang="ru">ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России<country>Россия</country></aff><aff xml:lang="en">National Medical Research Center for Therapy and Preventive Medicine<country>Russian Federation</country></aff></aff-alternatives><aff-alternatives id="aff-3"><aff xml:lang="ru">ФГБУ "Центральный научно-­исследовательский институт организации и информатизации здравоохранения" Минздрава России;&#13;
ГБУЗ города Москвы "Научно-­практический клинический центр диагностики и телемедицинских технологий ДЗМ".<country>Россия</country></aff><aff xml:lang="en">Central Research Institute for Health Organization and Informatics;&#13;
Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies<country>Russian Federation</country></aff></aff-alternatives><pub-date pub-type="collection"><year>2025</year></pub-date><pub-date pub-type="epub"><day>01</day><month>10</month><year>2024</year></pub-date><volume>24</volume><issue>1</issue><fpage>4130</fpage><lpage>4130</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Андрейченко А.Е., Ермак А.Д., Гаврилов Д.В., Новицкий Р.Э., Драпкина О.М., Гусев А.В., 2025</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="ru">Андрейченко А.Е., Ермак А.Д., Гаврилов Д.В., Новицкий Р.Э., Драпкина О.М., Гусев А.В.</copyright-holder><copyright-holder xml:lang="en">Andreychenko A.E., Ermak A.D., Gavrilov D.V., Novitsky R.E., Drapkina O.M., Gusev A.V.</copyright-holder><license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://cardiovascular.elpub.ru/jour/article/view/4130">https://cardiovascular.elpub.ru/jour/article/view/4130</self-uri><abstract><sec><title>Цель</title><p>Цель. Разработать с использованием алгоритмов машинного обучения модели прогнозирования госпитализаций пациентов с артериальной гипертензией (АГ) в течение 12 мес. и провести их валидацию на данных реальной клинической практики.</p></sec><sec><title>Материал и методы</title><p>Материал и методы. По сведениям из деперсонифицированных электронных медицинских карт, полученных из платформы Webiomed, отобрано 1165770 записей 151492 пациентов с АГ. В качестве предикторов, после первоначальной селекции, были использованы анамнестические, конституциональные, клинические, инструментальные и лабораторные данные, широко применяемые в рутинной врачебной практике, всего 43 признака. Для создания моделей применялись инструменты автоматического машинного обучения. Рассматривался широкий набор алгоритмов, включая логистическую регрессию, методы, основанные на деревьях решений c использованием градиентного бустинга и бэггинга, дискриминантный анализ, алгоритм на основе нейронных сетей и наивный байесовский классификатор. Для внешней валидации использованы данные отдельного региона.</p></sec><sec><title>Результаты</title><p>Результаты. Наилучшие результаты показала модель XGBoost, достигнув AUROC (площадь под характеристической кривой) 0,849 (95% доверительный интервал: 0,825-0,873) при внутреннем тестировании и 0,815 (95% доверительный интервал 0,797-0,835) при внешней валидации.</p></sec><sec><title>Заключение</title><p>Заключение. В результате исследования разработана новая высокоточная модель прогнозирования госпитализации пациентов с АГ по данным реальной клинической практики. Результаты внешней валидации предложенного прогностического инструмента показали относительную устойчивость к новым данным из другого региона, что в совокупности с показателями качества отражает возможность ее апробации в реальной клинической практике.</p></sec></abstract><trans-abstract xml:lang="en"><sec><title>Aim</title><p>Aim. To develop models for predicting hospitalizations of hypertensive (HTN) over 12 months using machine learning algorithms and to validate them using real-world practice data.</p></sec><sec><title>Material and methods</title><p>Material and methods. Based on the data from depersonalized electronic health records obtained from the Webiomed platform, 1165770 records of 151492 patients with HTN were selected. After the initial selection, a total of 43 anamnestic, constitutional, clinical, and paraclinical features were used as predictors. Automatic machine learning tools were used to create the models. A wide range of algorithms was considered, including logistic regression, decision tree-based methods using gradient boosting and bagging, discriminant analysis, a neural network algorithm and a naive Bayes classifier. Data from a single region were used for external validation.</p></sec><sec><title>Results</title><p>Results. The XGBoost model showed the best results, achieving an area under the ROC curve (AUC) of 0,849 (95% confidence interval: 0,825-0,873) during internal testing and 0,815 (95% confidence interval: 0,797-0,835) during external validation.</p></sec><sec><title>Conclusion</title><p>Conclusion. A new highly accurate model for predicting hospitaliza­tion of HTN patients based on real-world data was developed. The results of external validation of the final model showed relative re­sistance to new data from another region that in combination with quality metrics presents the possibility of its approval for application in clinical practice.</p></sec></trans-abstract><kwd-group xml:lang="ru"><kwd>артериальная гипертензия</kwd><kwd>госпитализация</kwd><kwd>прогнозные модели</kwd><kwd>машинное обучение</kwd></kwd-group><kwd-group xml:lang="en"><kwd>hypertension</kwd><kwd>hospitalization</kwd><kwd>predictive models</kwd><kwd>machine learning</kwd></kwd-group></article-meta></front><body><sec><title>Введение</title><p>Артериальная гипертензия (АГ) — это синдром повышения систолического (САД) артериального давления (АД) ≥140 мм рт.ст. и/или диастолического АД (ДАД) ≥90 мм рт.ст., обусловленный известной причиной (вторичная АГ), либо не связанный с выявлением явных причин, приводящих к развитию вторичных форм АГ (гипертоническая болезнь) [<xref ref-type="bibr" rid="cit1">1</xref>].</p><p>АГ относится к категории заболеваний с неуклонными темпами роста распространенности и представляет большую угрозу за счет ранней инвалидизации и высокой смертности пациентов. Согласно приблизительным оценкам, ~10% мировых расходов на здравоохранение приходится на лечение и профилактику АГ [<xref ref-type="bibr" rid="cit2">2</xref>]. При этом, на примере системы здравоохранения США, показано, что ежегодные расходы на госпитализацию по поводу АГ увеличились с 40 млрд за период с 1979 по 1982гг до 113 млрд за период с 2003 по 2006гг [<xref ref-type="bibr" rid="cit3">3</xref>]. Таким образом, стабильный популяционный рост, увеличение продолжительности жизни, распространенность АГ и тяжесть ее осложнений приводят к значительному социальному ущербу и колоссальным экономическим расходам.</p><p>В научной литературе опубликованы результаты нескольких исследований, связанных с разработкой моделей на основе алгоритмов машинного обучения (МО) с целью прогнозирования развития отдельных осложнений у пациентов с АГ [4-11]. В этих работах сильно варьировали размеры наборов данных (от 3395 до 2037027 записей), а также были использованы различные клинические группы пациентов с АГ. В исследовании Lee SJ, et al. [<xref ref-type="bibr" rid="cit6">6</xref>] в анализируемую группу дополнительно вошли пациентки с повышением АД во время беременности, а в исследовании Wu X, et al. [<xref ref-type="bibr" rid="cit7">7</xref>] акцент сделан на АГ у молодых пациентов в возрасте 14-39 лет. Значение площади под характеристической кривой (AUROC) либо C-index, как интегральной метрики качества в задаче бинарной классификации, при проведении внутреннего тестирования существующих моделей, находилось в интервале 0,60-0,932 со средним значением 0,772 согласно результатам 4-х исследований [<xref ref-type="bibr" rid="cit4">4</xref>][<xref ref-type="bibr" rid="cit6">6</xref>][<xref ref-type="bibr" rid="cit10">10</xref>][<xref ref-type="bibr" rid="cit11">11</xref>]. В единственной публикации с описанием процедуры проведения внешней валидации [<xref ref-type="bibr" rid="cit9">9</xref>] исследованы результаты модели, использующей значения 555 признаков, что делает ее неприменимой для клинической практики.</p><p>Таким образом, оценка риска внеплановой госпитализации пациентов с АГ и своевременное вмешательство в тактику их ведения на амбулаторном этапе особенно важны как для всего здравоохранения, так и для профилактики развития осложнений у отдельного пациента, a создание и внедрение многофакторной персонифицированной модели прогнозирования этих госпитализаций для дальнейшей ее практической апробации остается актуальной задачей.</p><p>Цель исследования — разработать с использованием алгоритмов МО модели прогнозирования госпитализаций пациентов с артериальной гипертензией (АГ) в течение 12 мес. и провести их валидацию на данных реальной клинической практики.</p></sec><sec><title>Материал и методы</title><p>Проведено многоцентровое ретроспективное обсервационное исследование. Основой для него послужила база данных платформы Webiomed, содержащая обезличенные данные электронных медицинских карт (ЭМК) 11,6 млн пациентов. Для анализа был собран набор данных, включающий 1165770 записей о 151492 пациентах с диагнозом АГ, обозначенным в ЭМК соответствующими кодами международной классификации болезней 10 пересмотра (МКБ-10) (таблица 1), в возрасте 18-100 лет за период с 2000 по 2023гг из 11 регионов РФ. Каждая запись представляла собой случай оказания медицинской помощи, включая врачебные осмотры, а также инструментальные и лабораторные исследования. Из полученного набора данных были отложены 44527 записей из одного отдельного региона для проведения внешней валидации [<xref ref-type="bibr" rid="cit12">12</xref>]. Оставшиеся данные были разделены на обучающую (80%) и тестовую выборки (10%), 10% были использованы для настройки гиперпараметров различных алгоритмов МО (рисунок 1).</p><p>В качестве целевого события в исследовании выступал факт госпитализации пациента в круглосуточный стационар по поводу самой АГ и/или ее осложнений в течение года после исследуемого случая лечения. В процессе сбора данных случаи, после которых не было зафиксировано таких госпитализаций, но отсутствовала какая-либо информация о пациенте через &gt;12 мес., исключались из набора. Коды МКБ-10, использовавшиеся для отбора пациентов с АГ, а также определения наличия целевого события (класс 1) или его отсутствия (класс 0), представлены в таблице 1.</p><p>Платформа Webiomed поддерживает автоматическое извлечение &gt;2900 машиночитаемых признаков из ЭМК, включая социо-демографические, антропометрические, лабораторные, инструментальные, физикальные и анамнестические данные. Из всего этого множества медицинским экспертом изначально был отобран 61 признак в качестве предикторов госпитализации пациентов с АГ (приложение 1). Количественные признаки с заполненностью менее чем в 10% записей для разработки и валидации моделей не использовались.</p><p>Основные этапы обработки данных и моделирования проводились согласно разработанной методике, описанной в предыдущих работах [13, 14]. Для статистического анализа и построения моделей МО использовали язык программирования Python версии 3.9. Результаты анализа количественных данных представлены в виде медианы (Ме) и интерквартильного размаха (Q25-Q75), а также минимальных и максимальных значений (Min-Max), а категориальных — в виде долей. Сравнение количественных переменных между группами с целевым событием и без него проводилось с использованием теста Манна-Уитни, категориальных — с помощью χ2. Значение p&lt;0,05 принималось за статистически значимое. Для анализа эффективности и качества моделей использовали AUROC [<xref ref-type="bibr" rid="cit15">15</xref>]. Доверительные интервалы (ДИ) метрики оценивали с помощью метода бутстрапинг на основе случайной генерации тысячи псевдовыборок из 5 тыс. наблюдений [<xref ref-type="bibr" rid="cit16">16</xref>]. Пороговые значения для активации определялись с использованием индекса Юдена, а также целевых уровней прогностических ценностей для отрицательного (0,999) и положительного (0,5) результатов (ПЦОР/NPV/negative predictive value и ПЦПР/PPV/positive predictive value, соответственно).</p><p>При обработке наборов данных к пропущенным значениям в количественных признаках, а также значениям, выходящим за границы, установленные медицинским экспертом на основании клинической практики, применялось заполнение фиксированной константой "-10000" [<xref ref-type="bibr" rid="cit17">17</xref>]. Упомянутые границы значений представлены в приложении 1. Заполнение пропусков в бинарных признаках проводилось с помощью нулей (отрицание наличия признака). На этапе масштабирования данных использовали несколько подходов: их трансформацию с помощью гистограммной нормализации или стандартизации, а также использование данных в изначальной размерности [<xref ref-type="bibr" rid="cit18">18</xref>][<xref ref-type="bibr" rid="cit19">19</xref>]. Для исследования целесообразности коррекции дисбаланса классов использовались следующие алгоритмы: Random Undersampling, Random Oversampling, Synthetic Minority Oversampling Technique и Adaptive Synthetic Sampling Approach [<xref ref-type="bibr" rid="cit20">20</xref>].</p><p>Моделирование включало использование логистической регрессии (LR) c L2 регуляризацией, алгоритмов градиентного бустинга (AdaBoost, LightGBM, XGBoost, CatBoost), бэггинга (Random Forest, Extra Trees), линейного и квадратичного дискриминантного анализа, наивного байесовского классификатора и нейронной сети (Multi-layer Perceptron) с одним скрытым слоем из ста нейронов, функцией активации "Relu", L2 регуляризацией и оптимизацией на основе стохастического градиентного спуска.</p><p>Первый этап моделирования проводили с использованием всех признаков, включенных в набор после консультации с медицинским экспертом (приложение 1). Для каждой из архитектур итеративно проверяли все возможные подходы к обработке данных с использованием различных комбинаций заполнения пропусков, масштабирования, и коррекции дисбаланса классов. Для дальнейшего изучения использовали ту обработку, при которой, после обучения модели с дефолтными гиперпараметрами, было получено максимальное значение AUROC на наборе данных для внутреннего тестирования. Определение же оптимальных гиперпараметров для всех алгоритмов проводилось с использованием PyCaret [<xref ref-type="bibr" rid="cit21">21</xref>] и Random Grid Search [<xref ref-type="bibr" rid="cit22">22</xref>] на обработанных соответствующим образом данных, оптимизируя AUROC на отложенном наборе для настройки гиперпараметров. Сам поиск заложен в структуру модуля и происходит по заранее сформированным на основе опыта создателей библиотеки сеткам значений, которые могут, при необходимости, быть модифицированы. После этой процедуры модели были повторно обучены на обучающем наборе с использованием отобранных гиперпараметров.</p><p>На основании чисел Шепли [<xref ref-type="bibr" rid="cit23">23</xref>] были отобраны признаки, совокупная значимость которых составила не &lt;95% от значимости всех признаков для лучшей по итогам первой фазы обучения модели на основе XGBoost (приложение 2). С использованием только этих предикторов, в уже определенной ранее соответствующей обработке, для всех алгоритмов был проведен второй этап моделирования, в котором были повторены шаги с настройкой гиперпараметров и непосредственным обучением моделей. До внешней валидации допускались те модели, которые показали пересечение 95% ДИ AUROC на наборах данных для обучения и внутреннего тестирования (рисунок 2). В этот список вошли модели на основе LR, LightGBM, XGBoost, CatBoost, RandomForest, ExtraTrees и Multi-layer Perceptron. Выбор итоговой модели основывался на максимальном значении AUROC по итогам проведенной внешней валидации, пересечении ДИ метрики и минимальном различии порогов активации на основе индекса Юдена при внутреннем тестировании и внешней валидации.</p><table-wrap id="table-1"><caption><p>Таблица 1</p><p>Группы кодов МКБ-10, наличие которых в ЭМК пациента учитывалось на разных этапах формирования набора данных</p><p>Примечание: * — включая все подкоды. МКБ-10 — международная классификация болезней, ЭМК — электронная медицинская карта.</p></caption><table><tbody><tr><td>Группа</td><td>Коды МКБ</td></tr><tr><td>Критерий включения пациентов в исследование</td><td>I10*, I11*, I12*, I13*, I15*</td></tr><tr><td>Определение наличия целевого события</td></tr><tr><td>Основное заболевание</td><td>I10*, I11*, I12*, I13*, I15*</td></tr><tr><td>Кардиологические осложнения</td><td>I20-I25*, I48*, I49*, I50*, I51.7, I51.8, I51.9, I46.0, I42.0</td></tr><tr><td>Нефрологические осложнения</td><td>N18*, N19*, N20, R80, N26</td></tr><tr><td>Цереброваскулярные осложнения</td><td>I61*, I63-I66*, I69*, G45*, F01.1, F01.2, F01.3, F01.8, F01.9, I67.3</td></tr><tr><td>Офтальмологические осложнения</td><td>H35.0</td></tr><tr><td>Сосудистые осложнения</td><td>I70*, I73.8, I73.9</td></tr></tbody></table></table-wrap><fig id="fig-1"><caption><p>Рис. 1 Дизайн исследования.</p><p>Примечание: АГ — артериальная гипертония.</p></caption><graphic xlink:href="cardiovascular-24-1-g001.png"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/1/MoRc4zakGDdCK1nI3izCZkusJE70oeP1zlq3c3mc.png</uri></graphic></fig><fig id="fig-2"><caption><p>Рис. 2 Алгоритм выбора итоговой модели.</p><p>Примечание: AUROC — площадь под характеристической кривой.</p></caption><graphic xlink:href="cardiovascular-24-1-g002.png"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/1/J94hshAf1M96uLnDf7yPWXAuer0LgsIOFgRwYWYz.png</uri></graphic></fig></sec><sec><title>Результаты</title><p>Заполненность признаков в наборе данных до разделения его на выборки для разработки и внешней валидации отражена на рисунке 3. Среди жалоб чаще всего встречались слабость, кашель, головная боль, головокружение, боль за грудиной, нарушение зрения, отеки и одышка. Самыми распространенными осложнениями были цереброваскулярные катастрофы, ишемическая болезнь сердца (ИБС), аритмии, варикозное расширение вен нижних конечностей и сердечная недостаточность (СН).</p><p>В результате формирования набора данных для разработки в группу с целевым событием были включены 49634 (4%) записи. Оставшиеся 1071609 (96%) были отнесены к группе без целевого события (класс 0). При сравнении двух классов в этом наборе были выявлены статистически значимые различия ряда предикторов (приложение 1), таких как масса тела, возраст, количество госпитализаций и обращений в поликлинику за последние 12 мес., уровни глюкозы, холестерина, САД, ДАД, частота дыхательных движений и частота сердечных сокращений. В классе 1 чаще встречались жалобы на боль за грудиной, головную боль, головокружение, нарушение зрения, носовые кровотечения, одышку, отеки, тошноту и рвоту. Пациенты класса 1 чаще имели отягощенную наследственность по инфаркту миокарда, а также ожирение, сахарный диабет (СД), ИБС, СН, аритмии и цереброваскулярные заболевания.</p><p>В набор данных для внешней валидации вошло 44527 записей пациентов: класс 1 — 4335 (9,7%), класс 0 — 40192 (90,3%). При сравнении распределения и частоты выявления предикторов между двумя наборами обнаружены значимые различия для СД, дислипидемии, железодефицитной анемии, ИБС, почечной недостаточности, фибрилляции предсердий, цереброваскулярных заболеваний, СН и ряда других признаков.</p><p>Значения AUROC, полученные на наборах для внешней валидации, внутреннего тестирования и обучения для всех отобранных архитектур, представлены в таблице 2. Модель XGBoost продемонстрировала лучшую способность различать классы 1 и 0, а также стабильность на внешних данных, используя итоговые 43 признака. Значение метрики AUROC составило 0,849 (95% ДИ: 0,825-0,873) при внутреннем тестировании и 0,815 (95% ДИ: 0,797-0,835) при внешней валидации. Модель на основе LightGBM также успешно прошла внешнюю валидацию и соответствовала всем критериям алгоритма отбора (рисунок 2). Однако предпочтение было отдано XGBoost на основании наименьшего различия между рассчитанными максимумами индекса Юдена согласно внутреннему тестированию и при внешней валидации.</p><p>Для разделения записей на три группы риска [<xref ref-type="bibr" rid="cit24">24</xref>] на наборе данных для тестирования нами дополнительно рассчитаны два порога активации в зависимости от целевых ПЦОР (0,999) и ПЦПР (0,5). ROC-кривая модели XGBoost при проведении внешней валидации с указанием трех порогов представлена на рисунке 4. Для внешних данных точность модели с порогом классификации 0,232, при котором достигнуто целевое значение ПЦОР на внутреннем тестировании (0,999), составила 0,2 (95% ДИ: 0,189-0,021). Чувствительность при этом составила 0,996 (95% ДИ: 0,986-1,000), а специфичность — 0,163 (95% ДИ: 0,152-0,173). При использовании второго порога (0,978) с ожидаемой ПЦПР при тестировании, равной 0,5, метрики качества были следующими: точность — 0,956 (95% ДИ: 0,950-0,961), чувствительность — 0,083 (95% ДИ: 0,047-0,012), специфичность — 0,996 (95% ДИ: 0,994-0,998). Значимость 10-и наиболее значимых для итоговой модели признаков, определённых по модулю чисел Шепли, показана на рисунке 5.</p><table-wrap id="table-2"><caption><p>Таблица 2</p><p>AUROC [ 95% ДИ] на наборах для обучения, внутреннего тестирования и внешней валидации для исследованных методов МО</p><p>Примечание: ДИ — доверительный интервал, МО — машинное обучение, AUROC — площадь под характеристической кривой. Проведена сортировка по значению метрики при проведении внешней валидации.</p></caption><table><tbody><tr><td>Модель</td><td>Обучение</td><td>Внутреннее тестирование</td><td>Внешняя валидация</td></tr><tr><td>XGBoost</td><td>0,861 [ 0,840-0,882]</td><td>0,856 [ 0,833-0,878]</td><td>0,816 [ 0,797-0,834]</td></tr><tr><td>LightGBM</td><td>0,865 [ 0,841-0,888]</td><td>0,860 [ 0,834-0,883]</td><td>0,814 [ 0,795-0,830]</td></tr><tr><td>Random Forest</td><td>0,921 [ 0,901-0,942]</td><td>0,918 [ 0,896-0,938]</td><td>0,811 [ 0,792-0,829]</td></tr><tr><td>Extra Trees</td><td>0,897 [ 0,871-0,920]</td><td>0,895 [ 0,871-0,919]</td><td>0,780 [ 0,760-0,800]</td></tr><tr><td>CatBoost</td><td>0,916 [ 0,898-0,934]</td><td>0,912 [ 0,893-0,930]</td><td>0,777 [ 0,756-0,798]</td></tr><tr><td>LR</td><td>0,783 [ 0,750-0,814]</td><td>0,779 [ 0,747-0,809]</td><td>0,775 [ 0,754-0,795]</td></tr><tr><td>Multi-layer Perceptron</td><td>0,669 [ 0,633-0,703]</td><td>0,671 [ 0,636-0,705]</td><td>0,665 [ 0,640-0,690]</td></tr></tbody></table></table-wrap><fig id="fig-3"><caption><p>Рис. 3 Заполненность значений в итоговом наборе данных.</p><p>Примечание: поля, выделенные синим цветом, обозначают заполненные значения признаков; поля, выделенные жёлтым цветом, обозначают пропуски. Цветное изображение доступно в электронной версии журнала.</p></caption><graphic xlink:href="cardiovascular-24-1-g003.png"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/1/doCUwsB1q8wk7ehek86HQbHhKA5fjPnWt2NciSPq.png</uri></graphic></fig><fig id="fig-4"><caption><p>Рис. 4 ROC-кривая с 95% ДИ итоговой модели XGBoost, полученная по результатам прогнозирования на наборе данных для внешней валидации.</p><p>Примечание: ДИ — доверительный интервал, PPV_порог — порог при целевом значении ПЦПР (прогностическая ценность положительного результата), NPV_порог — порог при целевом значении ПЦОР (прогностическая ценность отрицательного результата).</p></caption><graphic xlink:href="cardiovascular-24-1-g004.png"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/1/y9PgrJvzpgFu3drfvvDySKaJFPvAIVQvV7iYXua1.png</uri></graphic></fig><fig id="fig-5"><caption><p>Рис. 5 Топ-10 значимых признаков лучшей модели XGBoost.</p><p>Примечание: АД — артериальное давление.</p></caption><graphic xlink:href="cardiovascular-24-1-g005.png"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/1/SEbH8llhbN1vGvZWQdDVcrQwOJMvNOudeHBIml2h.png</uri></graphic></fig></sec><sec><title>Обсуждение</title><p>Методы МО хорошо зарекомендовали себя в разработке прогностических инструментов для определения исходов многофакторных заболеваний. При этом в качестве предикторов, используются рутинные клинические и лабораторно-инструментальные параметры, которые можно легко отслеживать и контролировать при визите пациента. Однако среди опубликованной на настоящий момент литературы, нами не было найдено ни одной публикации, где в качестве целевого события использовался именно факт госпитализации пациента по поводу осложнений АГ. Среди немногих работ, связанных с изучением течения этого заболевания, в качестве цели исследования чаще всего использовалось прогнозирование развития сердечно-сосудистых катастроф или заболеваний почек [4-11].</p><p>В ряде публикаций, как и в нашей работе, был отмечен выраженный дисбаланс классов в сформированных наборах данных. При этом только несколько коллективов описали использование алгоритмов балансировки при разработке моделей [<xref ref-type="bibr" rid="cit4">4</xref>][<xref ref-type="bibr" rid="cit6">6</xref>][<xref ref-type="bibr" rid="cit8">8</xref>], однако без проведения аналогичных нашему сравнений влияния различных подходов на значение целевой метрики качества. Только в двух работах был описан сам алгоритм определения целевого события, и основывался он на наличии выбранных кодов по МКБ-10 в ЭМК пациента и датах их регистрации [<xref ref-type="bibr" rid="cit5">5</xref>][<xref ref-type="bibr" rid="cit6">6</xref>]. Данная особенность является недостатком как настоящего, так и упомянутых исследований, ввиду возможности оказания медицинской помощи пациенту в медицинской организации, данные от которой не использовались, а также риска ошибки с кодированием диагнозов в реальной практике. Другими важными ограничениями являются изменение подходов к лекарственной терапии за период сбора данных в 21 год, невысокая точность извлечения препаратов и их доз, а также невозможность оценки приверженности пациентов терапии, которые не позволили нам включить лекарственную терапию в обучение моделей. Вместе с тем необходимо отметить, что лекарственная терапия напрямую влияет на значения признаков, участвующих в прогнозе модели (показатели АД, поражение органов-мишеней), и таким образом — на целевое событие разработанной модели.</p><p>Отдельного внимания заслуживает присутствие пропусков среди значений количественных признаков. Использование таких данных, с одной стороны, позволяет подготовить модель к условиям реальной практики и работе с ограниченной информацией о пациенте, а с другой — может приводить к смещениям оценок. На примере этого набора нами была выявлена примечательная особенность интерпретации данных линейными алгоритмами МО, обученными при подавляющем количестве пропусков. В этом случае они оказались чувствительны к используемому методу заполнения и переставали оценивать количественные признаки как дискретные, а вместо этого выделяли две категории: записи c реальным значением и заполненной константой. Данная проблема, с нашей точки зрения, значима ввиду потери большого объёма информации, которую можно получить из изменчивости признака, и, возможно, стала основной причиной слабых результатов методов, основанных не на деревьях решений. Все это открывает перспективу для новых исследований, в которых стоит определить оптимальную пороговую заполненность количественных признаков в наборах данных для обучения моделей.</p><p>В настоящей работе предложено разделение пациентов на три группы риска с помощью двух порогов активации, что имеет значительную клиническую ценность. Первый порог позволяет точно и эффективно выделить пациентов с низким риском госпитализации, что дает возможность избежать излишней медицинской нагрузки и проведения ненужных обследований. Второй порог, с высокой специфичностью, помогает с уверенностью выявить пациентов с высоким риском, что позволяет заранее корректировать стратегию лечения и более агрессивно вмешиваться в процессе их наблюдения. Это может существенно улучшить прогноз и качество жизни таких пациентов, снизив вероятность развития осложнений, требующих госпитализации. Такой подход способствует более точному и персонализированному оказанию помощи, что является критически важным в условиях перегрузки системы здравоохранения. Эти факты подчеркивают значительный потенциал разработанной модели как дополнительного инструмента для скрининга пациентов с АГ. С учетом устойчивости модели, продемонстрированной при внешней валидации, ее можно использовать в практических проспективных исследованиях.</p></sec><sec><title>Заключение</title><p>В результате исследования была успешна разработана и валидирована модель МО на основе XGBoost, метрики которой соответствовали результатам инструментов, представленных в ранее опубликованных исследованиях. Результаты внешней валидации подтвердили, что модель сохраняет свою стабильность при обработке данных из других регионов, что, в сочетании с её качественными характеристиками, свидетельствует о возможности ее применения в реальной клинической практике. Подход, включающий выделение трех групп риска, значительно увеличивает ценность настоящей разработки, позволяя формировать группы пациентов с реально высоким или низким риском госпитализации.</p><p>Отношения и деятельность: все авторы заявляют об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.</p><table-wrap id="table-3"><caption><p>Приложение 1. Описательная статистика набора данных</p><p>Результаты анализа количественных данных представлены в виде медианы и интерквартильного размаха (Q25, Q75), а также Min-Max значений, а категориальных — в виде долей</p><p>Примечание: АлАТ — аланинаминотрансфераза, АсАТ — аспартатаминотрансфераза, ДАД — диастолическое артериальное давление, ИБС — ишемическая болезнь сердца, ИМ — инфаркт миокарда, ЛЖ — левый желудочек, САД — систолическое артериальное давление, СН — сердечная недостаточность, ФВ — фракция выброса, ФП — фибрилляция предсердий, ЭКГ — электрокардиограмма(-фия). Критерии дислипидемии: общий холестерин (ХС) ≥5,0 ммоль/л, ХС липопротеинов низкой плотности ≥3,0 ммоль/л, ХС липопротеинов высокой плотности ≤1,1 ммоль/л для женщин, ХС липопротеинов высокой плотности ≤1,0 ммоль/л для мужчин, триглицериды ≥1,7 ммоль/л.</p></caption><table><tbody><tr><td>Признак</td><td>Границы для идентификации выбросов</td><td>Класс 0 (n=1071609)</td><td>Класс 1 (n=49634)</td><td>p</td><td>Набор для внешней валидации (n=44527)</td><td>Набор для разработки (n=1121243)</td><td>p</td></tr><tr><td>Анамнестические</td></tr><tr><td>Варикозное расширение вен нижних конечностей, n (%)</td><td> </td><td>92076 (8,6)</td><td>4136 (8,3)</td><td>0,046</td><td>2774 (6,2)</td><td>96212 (8,6)</td><td>&lt;0,001</td></tr><tr><td>Сахарный диабет, n (%)</td><td> </td><td>22433 (2,1)</td><td>1656 (3,3)</td><td>&lt;0,001</td><td>2427 (5,5)</td><td>24089 (2,1)</td><td>&lt;0,001</td></tr><tr><td>Дислипидемия, n (%)</td><td> </td><td>133965 (12,5)</td><td>5874 (11,8)</td><td>&lt;0,001</td><td>6729 (15,1)</td><td>139839 (12,5)</td><td>&lt;0,001</td></tr><tr><td>Железодефицитная анемия, n (%)</td><td> </td><td>64413 (6,0)</td><td>3208 (6,5)</td><td>&lt;0,001</td><td>3098 (7,0)</td><td>67621 (6,0)</td><td>&lt;0,001</td></tr><tr><td>ИБС, n (%)</td><td> </td><td>167040 (15,6)</td><td>15666 (31,6)</td><td>&lt;0,001</td><td>5559 (12,5)</td><td>182706 (16,3)</td><td>&lt;0,001</td></tr><tr><td>Количество госпитализацийза 12 мес.</td><td> </td><td>0,0 (0,0, 1,0)</td><td>1,0 (0,0, 1,0)</td><td>&lt;0,001</td><td>1,0 (0,0, 1,0)</td><td>0,0 (0,0, 1,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(0,0; 7,0)</td><td>(0,0; 11,0)</td><td> </td><td>(0,0; 8,0)</td><td>(0,0; 11,0)</td><td> </td></tr><tr><td>Количество обращенийв поликлинику за 12 мес.</td><td> </td><td>1,0 (0,0, 2,0)</td><td>1,0 (0,0, 2,0)</td><td>&lt;0,001</td><td>1,0 (0,0, 4,0)</td><td>1,0 (0,0, 2,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(0,0; 17,0)</td><td>(0,0; 27,0)</td><td> </td><td>(0,0; 25,0)</td><td>(0,0; 27,0)</td><td> </td></tr><tr><td>Нетоксический зоб, n (%)</td><td> </td><td>59117 (5,5)</td><td>2450 (4,9)</td><td>&lt;0,001</td><td>1922 (4,3)</td><td>61567 (5,5)</td><td>&lt;0,001</td></tr><tr><td>Ожирение, n (%)</td><td> </td><td>108737 (10,1)</td><td>4612 (9,3)</td><td>&lt;0,001</td><td>8175 (18,4)</td><td>113349 (10,1)</td><td>&lt;0,001</td></tr><tr><td>Отягощенная наследственность по ИМ, n (%)</td><td> </td><td>134592 (12,6)</td><td>4986 (10,0)</td><td>&lt;0,001</td><td>4078 (9,2)</td><td>139578 (12,4)</td><td>&lt;0,001</td></tr><tr><td>Почечная недостаточность,n (%)</td><td> </td><td>12627 (1,2)</td><td>2272 (4,6)</td><td>&lt;0,001</td><td>4484 (10,1)</td><td>14899 (1,3)</td><td>&lt;0,001</td></tr><tr><td>СН, n (%)</td><td> </td><td>82286 (7,7)</td><td>6732 (13,6)</td><td>&lt;0,001</td><td>1956 (4,4)</td><td>89018 (7,9)</td><td>&lt;0,001</td></tr><tr><td>ФП, n (%)</td><td> </td><td>74992 (7,0)</td><td>11102 (22,4)</td><td>&lt;0,001</td><td>4968 (11,2)</td><td>86094 (7,7)</td><td>&lt;0,001</td></tr><tr><td>Цереброваскулярныезаболевания, n (%)</td><td> </td><td>238582 (22,3)</td><td>16318 (32,9)</td><td>&lt;0,001</td><td>14772 (33,2)</td><td>254900 (22,7)</td><td>&lt;0,001</td></tr><tr><td>Отек легких, n (%)</td><td> </td><td>11558 (1,1)</td><td>2588 (5,2)</td><td>&lt;0,001</td><td>800 (1,8)</td><td>14146 (1,3)</td><td>&lt;0,001</td></tr><tr><td>Табакокурение, n (%)</td><td> </td><td>321932 (30,0)</td><td>17637 (35,5)</td><td>&lt;0,001</td><td>15398 (34,6)</td><td>339569 (30,3)</td><td>&lt;0,001</td></tr><tr><td>Конституциональные</td></tr><tr><td>Масса тела, кг</td><td>[ 20, 200]</td><td>77,0(67,0, 88,0)</td><td>78,0(67,0, 89,5)</td><td>&lt;0,001</td><td>83,0(71,0, 96,0)</td><td>77,0(67,0, 88,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(21,0; 175,0)</td><td>(34,0; 170,0)</td><td> </td><td>(31,0; 165,0)</td><td>(21,0; 175,0)</td><td> </td></tr><tr><td>Возраст, лет</td><td>[ 18, 100]</td><td>62,0(54,0, 70,0)</td><td>69,0(61,0, 77,0)</td><td>&lt;0,001</td><td>54,0(45,0, 61,0)</td><td>62,0(54,0, 70,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(18,0; 90,0)</td><td>(18,0; 100,0)</td><td> </td><td>(18,0; 93,0)</td><td>(18,0; 90,0)</td><td> </td></tr><tr><td>Пол мужской, n (%)</td><td> </td><td>310367 (29,0)</td><td>19964 (40,2)</td><td>&lt;0,001</td><td>16210 (36,4)</td><td>330331 (29,5)</td><td>&lt;0,001</td></tr><tr><td>Рост, см</td><td>[ 100, 250]</td><td>163,0(157,0, 169,0)</td><td>163,0(156,0, 170,0)</td><td>&lt;0,001</td><td>165,0(160,0, 172,0)</td><td>163,0(157,0, 169,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(100,0; 195,0)</td><td>(100,0; 205,0)</td><td> </td><td>(100,0; 198,0)</td><td>(100,0; 205,0)</td><td> </td></tr><tr><td>Клинические</td></tr><tr><td>Боль за грудиной, n (%)</td><td> </td><td>858487 (80,1)</td><td>43119 (86,9)</td><td>&lt;0,001</td><td>33465 (75,2)</td><td>901606 (80,4)</td><td>&lt;0,001</td></tr><tr><td>Признак</td><td>Границы для идентификации выбросов</td><td>Класс 0 (n=1071609)</td><td>Класс 1 (n=49634)</td><td>p</td><td>Набор для внешней валидации (n=44527)</td><td>Набор для разработки (n=1121243)</td><td>p</td></tr><tr><td>Боль, связанная с дыханием, n (%)</td><td> </td><td>120803 (11,3)</td><td>7197 (14,5)</td><td>&lt;0,001</td><td>12969 (29,1)</td><td>128000 (11,4)</td><td>&lt;0,001</td></tr><tr><td>Головная боль, n (%)</td><td> </td><td>907050 (84,6)</td><td>38348 (77,3)</td><td>&lt;0,001</td><td>34086 (76,6)</td><td>945398 (84,3)</td><td>&lt;0,001</td></tr><tr><td>Головокружение, n (%)</td><td> </td><td>877094 (81,8)</td><td>43974 (88,6)</td><td>&lt;0,001</td><td>33669 (75,6)</td><td>921068 (82,1)</td><td>&lt;0,001</td></tr><tr><td>Кашель, n (%)</td><td> </td><td>909625 (84,9)</td><td>39791 (80,2)</td><td>&lt;0,001</td><td>37923 (85,2)</td><td>949416 (84,7)</td><td>&lt;0,001</td></tr><tr><td>Лихорадка, n (%)</td><td> </td><td>872381 (81,4)</td><td>35446 (71,4)</td><td>&lt;0,001</td><td>37555 (84,3)</td><td>907827 (81,0)</td><td>&lt;0,001</td></tr><tr><td>Митральная недостаточность, n (%)</td><td> </td><td>347646 (32,4)</td><td>22589 (45,5)</td><td>&lt;0,001</td><td>11038 (24,8)</td><td>370235 (33,0)</td><td>&lt;0,001</td></tr><tr><td>Нарушение зрения, n (%)</td><td> </td><td>843412 (78,7)</td><td>36908 (74,4)</td><td>&lt;0,001</td><td>32425 (72,8)</td><td>880320 (78,5)</td><td>&lt;0,001</td></tr><tr><td>Нерегулярный пульс, n (%)</td><td> </td><td>122590 (11,4)</td><td>12378 (24,9)</td><td>&lt;0,001</td><td>3020 (6,8)</td><td>134968 (12,0)</td><td>&lt;0,001</td></tr><tr><td>Неритмичные тоны сердца, n (%)</td><td> </td><td>320240 (29,9)</td><td>25264 (50,9)</td><td>&lt;0,001</td><td>12146 (27,3)</td><td>345504 (30,8)</td><td>&lt;0,001</td></tr><tr><td>Носовые кровотечения, n (%)</td><td> </td><td>149210 (13,9)</td><td>9169 (18,5)</td><td>&lt;0,001</td><td>7473 (16,8)</td><td>158379 (14,1)</td><td>&lt;0,001</td></tr><tr><td>Общая слабость, n (%)</td><td> </td><td>997748 (93,1)</td><td>47899 (96,5)</td><td>&lt;0,001</td><td>41215 (92,6)</td><td>1045647 (93,3)</td><td>&lt;0,001</td></tr><tr><td>Одышка, n (%)</td><td> </td><td>740394 (69,1)</td><td>43829 (88,3)</td><td>&lt;0,001</td><td>29196 (65,6)</td><td>784223 (69,9)</td><td>&lt;0,001</td></tr><tr><td>Отеки, n (%)</td><td> </td><td>814809 (76,0)</td><td>39570 (79,7)</td><td>&lt;0,001</td><td>35520 (79,8)</td><td>854379 (76,2)</td><td>&lt;0,001</td></tr><tr><td>Плохая переносимостьфизических нагрузок, n (%)</td><td> </td><td>46481 (4,3)</td><td>3410 (6,9)</td><td>&lt;0,001</td><td>6630 (14,9)</td><td>49891 (4,4)</td><td>&lt;0,001</td></tr><tr><td>Рвота, n (%)</td><td> </td><td>296477 (27,7)</td><td>15796 (31,8)</td><td>&lt;0,001</td><td>10167 (22,8)</td><td>312273 (27,9)</td><td>&lt;0,001</td></tr><tr><td>Сердцебиение, n (%)</td><td> </td><td>507898 (47,4)</td><td>30394 (61,2)</td><td>&lt;0,001</td><td>20113 (45,2)</td><td>538292 (48,0)</td><td>&lt;0,001</td></tr><tr><td>Тошнота, n (%)</td><td> </td><td>485899 (45,3)</td><td>23170 (46,7)</td><td>&lt;0,001</td><td>20733 (46,6)</td><td>509069 (45,4)</td><td>&lt;0,001</td></tr><tr><td>Хрипы в легких, n (%)</td><td> </td><td>166064 (15,5)</td><td>15030 (30,3)</td><td>&lt;0,001</td><td>22919 (51,5)</td><td>181094 (16,2)</td><td>&lt;0,001</td></tr><tr><td>Цианоз кожи, n (%)</td><td> </td><td>85794 (8,0)</td><td>12028 (24,2)</td><td>&lt;0,001</td><td>7143 (16,0)</td><td>97822 (8,7)</td><td>&lt;0,001</td></tr><tr><td>Шумы в сердце, n (%)</td><td> </td><td>52277 (4,9)</td><td>6523 (13,1)</td><td>&lt;0,001</td><td>932 (2,1)</td><td>58800 (5,2)</td><td>&lt;0,001</td></tr><tr><td>Инструментальные</td></tr><tr><td>Венозный застой легкихпо данным рентгеновских исследований, n (%)</td><td> </td><td>56797 (5,3)</td><td>8733 (17,6)</td><td>&lt;0,001</td><td>6379 (14,3)</td><td>65530 (5,8)</td><td>&lt;0,001</td></tr><tr><td>Гипертрофия ЛЖ, n (%)</td><td> </td><td>144358 (13,5)</td><td>9916 (20,0)</td><td>&lt;0,001</td><td>11467 (25,8)</td><td>154274 (13,8)</td><td>&lt;0,001</td></tr><tr><td>ДАД, мм рт.ст.</td><td>[ 20, 150]</td><td>80,0(80,0, 85,0)</td><td>80,0(80,0, 90,0)</td><td>&lt;0,001</td><td>80,0(80,0, 90,0)</td><td>80,0(80,0, 85,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(20,0; 150,0)</td><td>(20,0; 150,0)</td><td> </td><td>(21,0; 150,0)</td><td>(20,0; 150,0)</td><td> </td></tr><tr><td>Изменение фазыреполяризации ЭКГ, n (%)</td><td> </td><td>497968 (46,5)</td><td>24277 (48,9)</td><td>&lt;0,001</td><td>11812 (26,5)</td><td>522245 (46,6)</td><td>&lt;0,001</td></tr><tr><td>Короткий интервал PQ, n (%)</td><td> </td><td>57173 (5,3)</td><td>3545 (7,1)</td><td>&lt;0,001</td><td>1173 (2,6)</td><td>60718 (5,4)</td><td>&lt;0,001</td></tr><tr><td>Крупноочаговые измененияна ЭКГ, n (%)</td><td> </td><td>360114 (33,6)</td><td>22105 (44,5)</td><td>&lt;0,001</td><td>15514 (34,8)</td><td>382219 (34,1)</td><td>&lt;0,001</td></tr><tr><td>Предсердная экстрасистолия, n (%)</td><td> </td><td>146658 (13,7)</td><td>12088 (24,4)</td><td>&lt;0,001</td><td>5901 (13,3)</td><td>158746 (14,2)</td><td>&lt;0,001</td></tr><tr><td>Синдром раннейреполяризации желудочков, n (%)</td><td> </td><td>45963 (4,3)</td><td>2179 (4,4)</td><td>0,088</td><td>1510 (3,4)</td><td>48142 (4,3)</td><td>&lt;0,001</td></tr><tr><td>Синусовая брадикардия, n (%)</td><td> </td><td>221257 (20,6)</td><td>10950 (22,1)</td><td>&lt;0,001</td><td>5944 (13,3)</td><td>232207 (20,7)</td><td>&lt;0,001</td></tr><tr><td>Синусовая тахикардия, n (%)</td><td> </td><td>184558 (17,2)</td><td>10079 (20,3)</td><td>&lt;0,001</td><td>6717 (15,1)</td><td>194637 (17,4)</td><td>&lt;0,001</td></tr><tr><td>САД, мм рт.ст.</td><td>[ 40, 250]</td><td>130,0(120,0, 140,0)</td><td>130,0(125,0, 145,0)</td><td>&lt;0,001</td><td>127,5(120,0, 140,0)</td><td>130,0(120,0, 140,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(40,0; 250,0)</td><td>(40,0; 250,0)</td><td> </td><td>(41,0; 250,0)</td><td>(40,0; 250,0)</td><td> </td></tr><tr><td>ФВ ЛЖ, %</td><td>[ 0, 100]</td><td>64,0(60,0, 68,0)</td><td>60,0(53,0, 64,0)</td><td>&lt;0,001</td><td>62,0(58,0, 66,0)</td><td>64,0(60,0, 68,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(20,0; 78,0)</td><td>(30,0; 72,0)</td><td> </td><td>(32,0; 77,0)</td><td>(20,0; 78,0)</td><td> </td></tr><tr><td>Частота дыхательныхдвижений, в мин</td><td>[ 5, 65]</td><td>16,5(16,0, 18,0)</td><td>17,0(16,0, 18,0)</td><td>&lt;0,001</td><td>17,0(16,0, 18,0)</td><td>16,5(16,0, 18,0)</td><td>0,057</td></tr><tr><td>Min-Max значения</td><td> </td><td>(5,0; 65,0)</td><td>(8,0; 62,0)</td><td> </td><td>(5,0; 60,0)</td><td>(5,0; 65,0)</td><td> </td></tr><tr><td>Признак</td><td>Границы для идентификации выбросов</td><td>Класс 0 (n=1071609)</td><td>Класс 1 (n=49634)</td><td>p</td><td>Набор для внешней валидации (n=44527)</td><td>Набор для разработки (n=1121243)</td><td>p</td></tr><tr><td>Частота сердечныхсокращений, в мин</td><td>[ 25, 300]</td><td>72,0(68,0, 77,0)</td><td>72,0(68,0, 78,0)</td><td>&lt;0,001</td><td>74,0(70,0, 79,0)</td><td>72,0(68,0, 77,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(25,0; 250,0)</td><td>(25,0; 200,0)</td><td> </td><td>(28,0; 195,0)</td><td>(25,0; 250,0)</td><td> </td></tr><tr><td>Лабораторные</td></tr><tr><td>АлАТ, МЕ/л</td><td>[ 5, 5000]</td><td>19,7(14,2, 28,8)</td><td>18,0(13,0, 26,9)</td><td>&lt;0,001</td><td>24,5(17,5, 38,0)</td><td>19,6(14,1, 28,6)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(5,0; 2585,1)</td><td>(5,0; 601,0)</td><td> </td><td>(5,0; 2116,0)</td><td>(5,0; 2585,1)</td><td> </td></tr><tr><td>АсАТ, МЕ/л</td><td>[ 5, 5000]</td><td>22,0(18,0, 28,0)</td><td>22,0(17,5, 29,0)</td><td>0,054</td><td>25,8(20,0, 34,0)</td><td>22,0(18,0, 28,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(5,0; 1822,0)</td><td>(5,0; 1296,2)</td><td> </td><td>(6,0; 3846,0)</td><td>(5,0; 1822,0)</td><td> </td></tr><tr><td>Глюкоза, ммоль/л</td><td>[ 1, 50]</td><td>5,7 (5,1, 6,7)</td><td>6,0 (5,2, 7,5)</td><td>&lt;0,001</td><td>5,8 (5,1, 7,1)</td><td>5,7 (5,1, 6,7)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(2,0; 50,0)</td><td>(2,7; 49,5)</td><td> </td><td>(1,0; 50,0)</td><td>(2,0; 50,0)</td><td> </td></tr><tr><td>Креатинин, мкмоль/л</td><td>[ 10, 500]</td><td>84,0(73,7, 97,0)</td><td>92,0(76,8, 112,0)</td><td>&lt;0,001</td><td>81,0(70,0, 96,0)</td><td>84,0(74,0, 97,1)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(40,0; 500,0)</td><td>(30,0; 500,0)</td><td> </td><td>(45,0; 500,0)</td><td>(30,0; 500,0)</td><td> </td></tr><tr><td>Лейкоциты, 109/л</td><td>[ 0,1, 75]</td><td>6,6 (5,4, 8,0)</td><td>7,2 (5,8, 8,8)</td><td>&lt;0,001</td><td>6,7 (5,5, 8,2)</td><td>6,6 (5,4, 8,0)</td><td>&lt;0,001</td></tr><tr><td>Min-Max значения</td><td> </td><td>(0,6; 75,0)</td><td>(1,2; 74,5)</td><td> </td><td>(1,6; 56,5)</td><td>(0,6; 75,0)</td><td> </td></tr><tr><td>Общий холестерин, ммоль/л</td><td>[ 1, 25]</td><td>5,2 (4,4, 6,2)</td><td>4,8 (3,9, 5,9)</td><td>&lt;0,001</td><td>5,2 (4,3, 6,1)</td><td>5,2 (4,3, 6,2)</td><td>0,062</td></tr><tr><td>Min-Max значения</td><td> </td><td>(1,0; 25,0)</td><td>(1,0; 25,0)</td><td> </td><td>(1,0; 23,0)</td><td>(1,0; 25,0)</td><td> </td></tr></tbody></table></table-wrap><table-wrap id="table-4"><caption><p>Приложение 2. Список предикторов, использованных в разработке итоговых версий моделей (в алфавитном порядке)</p></caption><table><tbody><tr><td> </td><td>Название признака</td><td>Относительная значимость признака</td></tr><tr><td>1</td><td>Аланинаминотрансфераза</td><td>0,039</td></tr><tr><td>2</td><td>Аспартатаминотрансфераза</td><td>0,026</td></tr><tr><td>3</td><td>Боль за грудиной, в т.ч. купирующаяся нитроглицерином</td><td>0,042</td></tr><tr><td>4</td><td>Венозный застой легких</td><td>0,081</td></tr><tr><td>5</td><td>Масса тела</td><td>0,099</td></tr><tr><td>6</td><td>Возраст</td><td>0,300</td></tr><tr><td>7</td><td>Гипертрофия левого желудочка по данным ЭКГ</td><td>0,038</td></tr><tr><td>8</td><td>Глюкоза крови</td><td>0,035</td></tr><tr><td>9</td><td>Головная боль</td><td>0,069</td></tr><tr><td>10</td><td>Головокружение</td><td>0,112</td></tr><tr><td>11</td><td>Диастолическое артериальное давление</td><td>0,034</td></tr><tr><td>12</td><td>Изменение фазы реполяризации</td><td>0,115</td></tr><tr><td>13</td><td>Ишемическая болезнь сердца</td><td>0,076</td></tr><tr><td>14</td><td>Кашель</td><td>0,098</td></tr><tr><td>15</td><td>Количество госпитализаций за 12 мес.</td><td>0,129</td></tr><tr><td>16</td><td>Количество обращений в поликлинику за 12 мес.</td><td>0,170</td></tr><tr><td>17</td><td>Креатинин крови</td><td>0,082</td></tr><tr><td>18</td><td>Крупноочаговые изменения</td><td>0,044</td></tr><tr><td>19</td><td>Лейкоциты крови</td><td>0,042</td></tr><tr><td>20</td><td>Лихорадка</td><td>0,136</td></tr><tr><td>21</td><td>Митральная недостаточность</td><td>0,011</td></tr><tr><td>22</td><td>Нарушение зрения</td><td>0,091</td></tr><tr><td>23</td><td>Неритмичные тоны сердца</td><td>0,143</td></tr><tr><td>24</td><td>Общая слабость</td><td>0,059</td></tr><tr><td>25</td><td>Общий холестерин</td><td>0,032</td></tr><tr><td>26</td><td>Одышка</td><td>0,226</td></tr><tr><td>27</td><td>Отеки</td><td>0,071</td></tr><tr><td>28</td><td>Пол</td><td>0,183</td></tr><tr><td>29</td><td>Предсердная экстрасистолия</td><td>0,117</td></tr><tr><td>30</td><td>Рвота</td><td>0,085</td></tr><tr><td>31</td><td>Рост</td><td>0,097</td></tr><tr><td>32</td><td>Сердечная недостаточность</td><td>0,020</td></tr><tr><td>33</td><td>Сердцебиение</td><td>0,058</td></tr><tr><td>34</td><td>Систолическое артериальное давление</td><td>0,132</td></tr><tr><td>35</td><td>Табакокурение</td><td>0,064</td></tr><tr><td>36</td><td>Фибрилляция предсердий</td><td>0,074</td></tr><tr><td>37</td><td>Фракция выброса левого желудочка</td><td>0,368</td></tr><tr><td>38</td><td>Хрипы в легких</td><td>0,126</td></tr><tr><td>39</td><td>Цереброваскулярные заболевания</td><td>0,056</td></tr><tr><td>40</td><td>Цианоз кожи</td><td>0,140</td></tr><tr><td>41</td><td>Частота дыхания</td><td>0,113</td></tr><tr><td>42</td><td>Частота сердечных сокращений</td><td>0,051</td></tr><tr><td>43</td><td>Шумы в сердце</td><td>0,046</td></tr></tbody></table></table-wrap></sec></body><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Кобалава Ж. Д., Конради А. О., Не­до­года С. В. и др. Артериальная гипертензия у взрослых. Кли­нические рекомендации 2020. Российский кардиологический журнал. 2020;25(3):3786. doi:10.15829/1560-4071-2020-3-3786.</mixed-citation><mixed-citation xml:lang="en">Kobalava ZD, Konradi AO, Nedogoda SV, et al. Arterial hypertension in adults. Clinical guidelines 2020. Russian Journal of Cardiology. 2020;25(3):3786. (In Russ.) doi:10.15829/1560-4071-2020-3-3786.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Gaziano TA, Bitton A, Anand S, et al. The global cost of nonoptimal blood pressure. J Hypertens. 2009;27:1472-7. doi:10.1097/HJH.0b013e32832a9ba3.</mixed-citation><mixed-citation xml:lang="en">Gaziano TA, Bitton A, Anand S, et al. The global cost of nonoptimal blood pressure. J Hypertens. 2009;27:1472-7. doi:10.1097/HJH.0b013e32832a9ba3.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Wang G, Fang J, Ayala C. Hypertension-­associated hospitalizations and costs in the United States, 1979-2006. Blood Pressure. 2014;23: 126-33. doi:10.3109/08037051.2013.814751.</mixed-citation><mixed-citation xml:lang="en">Wang G, Fang J, Ayala C. Hypertension-­associated hospitalizations and costs in the United States, 1979-2006. Blood Pressure. 2014;23: 126-33. doi:10.3109/08037051.2013.814751.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Lee W, Lee J, Lee H, et al. Prediction of hypertension complications risk using classification techniques. Ind Eng Manag Syst. 2014; 13:449-53. doi:10.7232/iems.2014.13.4.449.</mixed-citation><mixed-citation xml:lang="en">Lee W, Lee J, Lee H, et al. Prediction of hypertension complications risk using classification techniques. Ind Eng Manag Syst. 2014; 13:449-53. doi:10.7232/iems.2014.13.4.449.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Feng Y, Leung AA, Lu X, et al. Personalized prediction of incident hospitalization for cardiovascular disease in patients with hyper­tension using machine learning. BMC Med Res Methodol. 2022; 22:325. doi:10.1186/s12874-022-01814-3.</mixed-citation><mixed-citation xml:lang="en">Feng Y, Leung AA, Lu X, et al. Personalized prediction of incident hospitalization for cardiovascular disease in patients with hyper­tension using machine learning. BMC Med Res Methodol. 2022; 22:325. doi:10.1186/s12874-022-01814-3.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Lee SJ, Lee SH, Choi HI, et al. Deep learning improves prediction of cardiovascular disease-­related mortality and admission in pa­tients with hypertension: analysis of the Korean National Health Information Database. J Clin Med. 2022;11:6677. doi:10.3390/jcm11226677.</mixed-citation><mixed-citation xml:lang="en">Lee SJ, Lee SH, Choi HI, et al. Deep learning improves prediction of cardiovascular disease-­related mortality and admission in pa­tients with hypertension: analysis of the Korean National Health Information Database. J Clin Med. 2022;11:6677. doi:10.3390/jcm11226677.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Wu X, Yuan X, Wang W, et al. Value of a machine learning ap­proach for predicting clinical outcomes in young patients with hyper­tension. Hypertension. 2020;75:1271-8. doi:10.1161/HYPERTENSIONAHA.119.13404.</mixed-citation><mixed-citation xml:lang="en">Wu X, Yuan X, Wang W, et al. Value of a machine learning ap­proach for predicting clinical outcomes in young patients with hyper­tension. Hypertension. 2020;75:1271-8. doi:10.1161/HYPERTENSIONAHA.119.13404.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Ren Y, Fei H, Liang X, et al. A hybrid neural network model for predicting kidney disease in hypertension patients based on elect­ronic health records. BMC Med Inform Decis Mak. 2019;19:51. doi:10.1186/s12911-019-0765-4.</mixed-citation><mixed-citation xml:lang="en">Ren Y, Fei H, Liang X, et al. A hybrid neural network model for predicting kidney disease in hypertension patients based on elect­ronic health records. BMC Med Inform Decis Mak. 2019;19:51. doi:10.1186/s12911-019-0765-4.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Park J, Kim JW, Ryu B, et al. Patient-­level prediction of cardio-­cerebrovascular events in hypertension using Nationwide Claims Data. J Med Intern Res. 2019;21:11757. doi:10.2196/11757.</mixed-citation><mixed-citation xml:lang="en">Park J, Kim JW, Ryu B, et al. Patient-­level prediction of cardio-­cerebrovascular events in hypertension using Nationwide Claims Data. J Med Intern Res. 2019;21:11757. doi:10.2196/11757.</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Lacson RC, Baker B, Suresh H, et al. Use of machine-­learning algorithms to determine features of systolic blood pressure variability that predict poor outcomes in hypertensive patients. Clin Kidney J. 2019;12:206-12. doi:10.1093/ckj/sfy049.</mixed-citation><mixed-citation xml:lang="en">Lacson RC, Baker B, Suresh H, et al. Use of machine-­learning algorithms to determine features of systolic blood pressure variability that predict poor outcomes in hypertensive patients. Clin Kidney J. 2019;12:206-12. doi:10.1093/ckj/sfy049.</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Chen R, Yang Y, Miao F, et al. 3-year risk prediction of coronary heart disease in hypertension patients: a preliminary study. 2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. 2017;1182-5. doi:10.1109/EMBC.2017.8037041.</mixed-citation><mixed-citation xml:lang="en">Chen R, Yang Y, Miao F, et al. 3-year risk prediction of coronary heart disease in hypertension patients: a preliminary study. 2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. 2017;1182-5. doi:10.1109/EMBC.2017.8037041.</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Moons KGM, Altman DG, Reitsma JB, et al. Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD): explanation and elaboration. Ann Intern Med. 2015;162:W1-73. doi:10.7326/M14-0698.</mixed-citation><mixed-citation xml:lang="en">Moons KGM, Altman DG, Reitsma JB, et al. Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD): explanation and elaboration. Ann Intern Med. 2015;162:W1-73. doi:10.7326/M14-0698.</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Андрейченко А. Е., Ермак А. Д., Гаврилов Д. В. и др. Разработка и валидация моделей машинного обучения, прогнозирующих риск госпитализации пациентов с сахарным диабетом в течение последующих 12 месяцев. Сахарный диабет. 2024;27(2):142-57. doi:10.14341/DM13065.</mixed-citation><mixed-citation xml:lang="en">Andreychenko AE, Ermak AD, Gavrilov DV, et al. Development and validation of machine learning models to predict unplanned hospi­ta­lizations of patients with diabetes within the next 12 months. Dia­betes mellitus. 2024;27(2):142-57. (In Russ.) doi:10.14341/DM13065.</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Анд­рей­ченко А. Е., Лучинин А. С., Ившин А. А. и др. Разработка и ва­лидация моделей прогнозирования общего риска преэк­ламп­сии и риска ранней преэклампсии с использованием алго­ритмов машинного обучения в первом триместре беременности. Акушерство и гинекология. 2023;2:94-107. doi:10.18565/aig.2023.101.</mixed-citation><mixed-citation xml:lang="en">Andreychenko AE, Luchinin AS, Ivshin AA, et al. Development and va­lidation of models to predict total and early-­onset preeclampsia in the first trimester of pregnancy using machine learning algo­rithms. Akusherstvo i Ginekologiya. 2023;2:94-107. (In Russ.) doi:10.18565/aig.2023.101.</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Sokolova M, Lapalme G. A systematic analysis of performance measures for classification tasks. Information Processing &amp; Mana­gement. 2009;45:427-37. doi:10.1016/j.ipm.2009.03.002.</mixed-citation><mixed-citation xml:lang="en">Sokolova M, Lapalme G. A systematic analysis of performance measures for classification tasks. Information Processing &amp; Mana­gement. 2009;45:427-37. doi:10.1016/j.ipm.2009.03.002.</mixed-citation></citation-alternatives></ref><ref id="cit16"><label>16</label><citation-alternatives><mixed-citation xml:lang="ru">Zoubir AM, Iskander DR. Bootstrap Methods and Applications: A Tu­torial for the Signal Processing Practitioner. IEEE Signal Processing Magazine. 2007;24:10-9. doi:10.1109/MSP.2007.4286560.</mixed-citation><mixed-citation xml:lang="en">Zoubir AM, Iskander DR. Bootstrap Methods and Applications: A Tu­torial for the Signal Processing Practitioner. IEEE Signal Processing Magazine. 2007;24:10-9. doi:10.1109/MSP.2007.4286560.</mixed-citation></citation-alternatives></ref><ref id="cit17"><label>17</label><citation-alternatives><mixed-citation xml:lang="ru">Ding Y, Simonoff JS. An investigation of missing data methods for classification trees applied to binary response data. J Mach Learn Res. 2010;11:131-70. doi:10.1145/1756006.1756012.</mixed-citation><mixed-citation xml:lang="en">Ding Y, Simonoff JS. An investigation of missing data methods for classification trees applied to binary response data. J Mach Learn Res. 2010;11:131-70. doi:10.1145/1756006.1756012.</mixed-citation></citation-alternatives></ref><ref id="cit18"><label>18</label><citation-alternatives><mixed-citation xml:lang="ru">Cao XH, Stojkovic I, Obradovic Z. A robust data scaling algorithm to improve classification accuracies in biomedical data. BMC Bioinformatics. 2016;17. doi:10.1186/s12859-016-1236-x.</mixed-citation><mixed-citation xml:lang="en">Cao XH, Stojkovic I, Obradovic Z. A robust data scaling algorithm to improve classification accuracies in biomedical data. BMC Bioinformatics. 2016;17. doi:10.1186/s12859-016-1236-x.</mixed-citation></citation-alternatives></ref><ref id="cit19"><label>19</label><citation-alternatives><mixed-citation xml:lang="ru">Amorim LB, Cavalcanti GD, Cruz RM. The choice of scaling tech­nique matters for classification performance. Appl Soft Comput. 2023;133. doi:10.1016/j.asoc.2022.109924.</mixed-citation><mixed-citation xml:lang="en">Amorim LB, Cavalcanti GD, Cruz RM. The choice of scaling tech­nique matters for classification performance. Appl Soft Comput. 2023;133. doi:10.1016/j.asoc.2022.109924.</mixed-citation></citation-alternatives></ref><ref id="cit20"><label>20</label><citation-alternatives><mixed-citation xml:lang="ru">Weiss GM. Foundations of Imbalanced Learning. In: Haibo H, Yunqian M. Imbalanced Learning: Foundations, Algorithms, and Ap­pli­cations. USA: John Wiley &amp; Sons. 2013:13-41. ISBN: 9781118074626.</mixed-citation><mixed-citation xml:lang="en">Weiss GM. Foundations of Imbalanced Learning. In: Haibo H, Yunqian M. Imbalanced Learning: Foundations, Algorithms, and Ap­pli­cations. USA: John Wiley &amp; Sons. 2013:13-41. ISBN: 9781118074626.</mixed-citation></citation-alternatives></ref><ref id="cit21"><label>21</label><citation-alternatives><mixed-citation xml:lang="ru">Gain U, Hotti V. Low-code AutoML-augmented data pipeline — a review and experiments. JPCS. 2021;1828. doi:10.1088/1742-6596/1828/1/012015.</mixed-citation><mixed-citation xml:lang="en">Gain U, Hotti V. Low-code AutoML-augmented data pipeline — a review and experiments. JPCS. 2021;1828. doi:10.1088/1742-6596/1828/1/012015.</mixed-citation></citation-alternatives></ref><ref id="cit22"><label>22</label><citation-alternatives><mixed-citation xml:lang="ru">Bergstra J, Bengio Y. Random search for hyper-­parameter opti­mization. J Mach Learn Res. 2012;13:281-305.</mixed-citation><mixed-citation xml:lang="en">Bergstra J, Bengio Y. Random search for hyper-­parameter opti­mization. J Mach Learn Res. 2012;13:281-305.</mixed-citation></citation-alternatives></ref><ref id="cit23"><label>23</label><citation-alternatives><mixed-citation xml:lang="ru">Lundberg SM, Erion G, Chen H, et al. From local explanations to global understanding with explainable AI for trees. Nat Mach Intell. 2020;2:56-67. doi:10.1038/s42256-019-0138-9.</mixed-citation><mixed-citation xml:lang="en">Lundberg SM, Erion G, Chen H, et al. From local explanations to global understanding with explainable AI for trees. Nat Mach Intell. 2020;2:56-67. doi:10.1038/s42256-019-0138-9.</mixed-citation></citation-alternatives></ref><ref id="cit24"><label>24</label><citation-alternatives><mixed-citation xml:lang="ru">Fischer BG, Evans AT. SpPin and SnNout are not enough. It’s time to fully embrace likelihood ratios and probabilistic reasoning to achieve diagnostic excellence. J Gen Inter Med. 2023;38:2202-4. doi:10.1007/s11606-023-08177-5.</mixed-citation><mixed-citation xml:lang="en">Fischer BG, Evans AT. SpPin and SnNout are not enough. It’s time to fully embrace likelihood ratios and probabilistic reasoning to achieve diagnostic excellence. J Gen Inter Med. 2023;38:2202-4. doi:10.1007/s11606-023-08177-5.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
