Перейти к:
Пропущенные и ошибочные данные в клинических исследованиях: влияние на получаемый результат и способы предупреждения
https://doi.org/10.15829/1728-8800-2025-4572
EDN: QIGEJM
Аннотация
В статье приводятся сведения о пропущенных и ошибочных данных в клинических исследованиях в области медицины и их влиянии на полученный результат. Описывается значимость "потерянных" для наблюдения больных в проспективных исследованиях и отдельных пропущенных данных у конкретного пациента. Приводится пример базы данных регистра острого коронарного синдрома с пропущенными данными. Упоминается о проблеме подложных данных. Рассматриваются различные способы восполнения пропущенных данных в клинических регистрах, а также основные принципы их предупреждения. Проводится анализ отечественных регистров острого коронарного синдрома с точки зрения упоминания о пропущенных данных и потерянных для наблюдения больных.
Ключевые слова
Для цитирования:
Марцевич С.Ю. Пропущенные и ошибочные данные в клинических исследованиях: влияние на получаемый результат и способы предупреждения. Кардиоваскулярная терапия и профилактика. 2025;24(10):4572. https://doi.org/10.15829/1728-8800-2025-4572. EDN: QIGEJM
For citation:
Martsevich S.Yu. Missing and incorrect data in clinical trials: impact on the final result and ways of prevention. Cardiovascular Therapy and Prevention. 2025;24(10):4572. (In Russ.) https://doi.org/10.15829/1728-8800-2025-4572. EDN: QIGEJM
Введение
Под пропущенными, или неполными, данными (missing data) в самом общем смысле понимают отсутствие значений в наборе данных, которые должны были быть зарегистрированы в научном исследовании. Под ошибочными данными (incorrect data) понимают неверные данные, которые возникли либо при заполнении первичной документации, либо при введении информации в системы электронного накопления и обработки данных.
Понятно, что наличие как пропущенных, так и ошибочных данных может исказить результаты последующего анализа научного исследования. В клинических исследованиях (КИ) наличие пропущенных и ошибочных данных особенно опасно, т.к. при статистической обработке оно может исказить полученный результат и, соответственно, привести к ошибочным выводам.
Пропущенные данные
С одной стороны, значимость проблемы пропущенных данных в медицине обсуждается в течение нескольких десятков лет [1][2], с другой стороны, до сих пор большинство исследователей при проведении КИ игнорирует их наличие и соответственно идет (вольно или невольно) на искажение получаемого результата. Хорошо известно, что пропущенные данные встречаются в КИ любого типа: рандомизированных, эпидемиологических, клинических наблюдательных [3][4], однако, в последних эта проблема является наиболее острой, т.к. в них включается относительно небольшое число пациентов. Поэтому значимость каждого пациента может иметь большое значение.
Причины пропущенных данных могут быть различны, их подробное описание не входит в задачи данной публикации. Условно их подразделяют на полностью случайные, частично случайные, неслучайные [5][6]. Последние представляют наибольшую опасность для исследователя, т.к. приводят к так называемому смещению полученного результата [6][7]. Неслучайные пропущенные данные не всегда могут быть выявлены исследователем, этот факт в еще большей мере увеличивает риск их отрицательного влияния на получаемый результат. На рисунке 1 показано, как выглядят пропущенные данные в одном из регистров острого коронарного синдрома (ОКС) "СТОКС" (Ступинский регистр ОКС, зарегистрирован на сайте ClinicalTrials.gov NCT06845384) в таблице EXCEL (пропущенные данные выделены желтым цветом). Хорошо видно, что некоторые клетки после ввода информации так и остались пустыми. В некоторых клетках стоит цифра "9", обозначая отсутствие данных по определенному показателю. Нетрудно догадаться, что в ряде случаев имеют место случайно пропущенные данные, которые в принципе можно восполнить (см. ниже). В других случаях, например, когда больной умер, изучаемые показатели восполнить невозможно.

Рис. 1 База данных регистра ОКС "СТОКС".
Примечание: желтым цветом выделены пропущенные данные; "0" — отсутствие признака; "1" — наличие признака; "9" — неизвестно. ОКС — острый коронарный синдром, СМП — скорая медицинская помощь.
Известно, что ряд методов статистической обработки данных нельзя использовать, если набор данных содержит пустые ячейки. Однако далеко не все исследователи (в т.ч. профессиональные статистики) знают, что именно по этой причине некоторые крупные статистические программы (например, SAS, SPSS) изначально настроены на исключение лиц с пропущенными данными из анализа [7-10]. Нетрудно понять, что при обработке результатов КИ это может привести к потере важнейшей информации и существенно повлиять на достоверность полученного результата, о чем исследователь может даже не догадываться.
По правилам проведения любых исследований (не только в области медицины) исследователь заранее должен определить, что он будет делать с отсутствующими данными при вводе полученной информации, чтобы не оставлять пустых ячеек. Для дихотомических признаков, т.е. тех, которые могут принимать только два значения — "да" (обычно кодируется как "1") или "нет" (обычно кодируется как "0"), как правило, должен предусматриваться третий вариант ответа — "неизвестно" (обычно кодируется как "9"). К сожалению, это правило сплошь и рядом нарушается, пункт "неизвестно" часто вообще обходят стороной. Это приводит к заведомому искажению данных, т.к. вынуждает заполняющего карту исследователя вводить неверные данные (особенно если система не позволяет оставлять незаполненные клетки).
Стоит напомнить, что целый ряд методов статистического анализа, например, метод парных сравнений Стьюдента, бинарная логистическая регрессия (один из наиболее часто используемых методов анализа в КИ), в принципе не приемлют включение в анализ более чем двух значений одного признака, поэтому указанный выше способ (введение пункта "неизвестно") для этих методов абсолютно не подходит. При расчетах программы автоматически "выбрасывают" как клетки с пустыми значениями, так и клетки с данными "неизвестно". Любопытно, что многие исследователи об этом даже не догадываются, хотя при этом полученный результат может быть очень далек от истинного.
В то же время, некоторые методы статистического анализа допускают наличие неполных данных, что является очень важным при проведении проспективных исследований и их последующем анализе. Такое возможно, например, при оценке выживаемости больных. Хорошо известный метод регрессионного анализа Кокса (Cox regression model) вполне допускает, что данные об исходе для ряда пациентов будут неизвестны (так называемые цензурированные данные) [10-14].
Основные типы пропущенных данных в КИ
В КИ пропущенные данные можно условно разделить еще на две категории: когда полностью отсутствуют данные о конкретном пациенте (в т.ч. неизвестен его жизненный статус) и когда у конкретного пациента отсутствуют данные о некоторых показателях (например, нет данных об уровне холестерина).
"Потерянные" пациенты
"Потерянные", или выпавшие из-под наблюдения, пациенты играют особую роль в проспективных КИ. Потеря больных, особенно при длительных сроках наблюдения, — обычное и почти неизбежное явление [15]. В англоязычной литературе укрепился специальный термин — LTFU (lost to follow-up) [16], обозначающий выпавших из-под наблюдения больных. Число "потерянных" пациентов обычно (но далеко не всегда) прямо связано с длительностью наблюдения. "Потеря" больных объясняется как чисто медицинскими причинами (нежелание контактировать с врачом, отсутствие приверженности назначенному лечению и пр.), так и общими причинами (смена номера телефона, места жительства и т.д.). Важно, чтобы доля "потерянных" больных не превышала определенного процента от всех включенных больных (см. ниже).
Кроме того, необходимо убедиться, отличаются ли "потерянные" больные по своим исходным характеристикам от больных, жизненный статус которых известен. Если такое различие обнаружено, становится очевидным, что потеря больных является не случайной (см. выше), в таком случае анализ выживаемости может быть заведомо дефектным [17].
Несмотря на важность отмеченных выше закономерностей, далеко не все исследователи считают нужным сообщать о "потерянных" больных. Между тем, хорошо известно, что "теряются" обычно больные, отличающиеся от сохранивших контакт с исследователем больных [18]. В первую очередь, это лица с пониженным социальным статусом, пациенты, не склонные выполнять назначения врача [19][20], и т.д.
Клинические регистры, в которые происходит сплошное (а не селективное) включение больных, особенно чувствительны к "потерям" больных. Поиск "потерянных" больных нередко является сложной задачей. Так, например, в одном из международных рандомизированных контролируемых исследований с длительным периодом наблюдения не удавалось установить контакт по телефону с одной из наблюдавшихся больных. Настойчивые поиски, в т.ч. в Единой медицинской информационной системе (ЕМИАС), не приносили желаемого результата. Лишь при активном посещении сотрудниками поликлиники квартиры, в которой проживала больная, удалось установить факт ее смерти несколько месяцев назад.
Четких нормативов, какое количество потерянных больных допустимо в проспективных КИ, не существует. По мнению разных исследователей, эта доля колеблется от 5 до 15% [17]. Очевидно, что при значительных потерях анализ полученных результатов будет некорректным. Несмотря на это, некоторые исследователи считают возможным проводить анализ при значительно меньшем отклике, в итоге получая результат, далекий от реального [21].
Пропущенные данные у отдельных пациентов
Существует мнение, что в проспективных КИ пропущенных данных быть не может, однако это утверждение очень далеко от истины, особенно когда речь идет о наблюдательных КИ. Потерянные или пропущенные данные являются неизбежным спутником любого наблюдательного КИ. Как отмечалось выше, пропущенные данные обычно относят к трем видам: случайно пропущенные, частично случайно пропущенные и неслучайно пропущенные. Если первые два вида пропущенных данных в принципе можно восполнить путем тщательного поиска недостающей информации, расспроса пациентов, лечащих врачей, то третий вид пропущенных данных вообще невосполним. Например, в течение какого-то определенного времени в данном лечебном учреждении по определенной причине при ОКС не выполнялся анализ крови на высокочувствительный тропонин. Естественно, данные об этом показателе не могут быть восполнены никогда. Другой пример: мы никогда не сможем восполнить данные о приверженности к назначенному лечению умерших больных.
Ошибочные данные (incorrect data)
Борьба с ошибочными данными в первую очередь должна начинаться с контроля первичной медицинской документации [22]. Широкое внедрение метода электронных карт, как при проведении КИ, так и в практическом здравоохранении, существенно усложняет поставленную задачу, т.к. нередко такие данные сразу попадают в электронные базы данных, где их выявить гораздо сложнее. Существуют определенные алгоритмы предупреждения введения ошибочных данных (например, система не позволит ввести нереальные значения года рождения или резко отклоняющиеся от нормальных значения какого-либо биохимического показателя). Понятно, однако, что эти алгоритмы в принципе не могут предусмотреть всех вариантов ввода ошибочных данных (например, когда вместо данных одного пациента вводят данные другого).
Аналогичные алгоритмы существуют и при анализе результатов уже введенных данных. Истинность некоторых показателей и в этом случае может быть установлена только при непосредственной проверке уже введенных данных. Существует так называемая система выборочного аудита, когда проверяют достоверность всех уже введенных данных какого-то одного случайно выбранного пациента. К сожалению, при описании протоколов КИ и оценке их результатов большинство исследователей не считает нужным упоминать об использовании (или о неиспользовании) методов контроля за ошибочно введенными данными.
Подложные данные (fake data)
К сожалению, в публикациях, посвященных различным проблемам медицины, не обходится без так называемых подложных данных. Известные специалисты по доказательной медицине BW Mol и J Ioannidis в редакционной статье сообщают о том, что за последние несколько лет более чем в 800 статьях, представленных для публикации в крупные медицинские рецензируемые журналы, были выявлены те или иные признаки подлога. Из этих статей 80 были впоследствии отозваны из-за различных проблем с достоверностью опубликованных результатов [23]. Такие исследования стали называть "зомбированными" (zombie trials) [24]. Случаи отзыва уже опубликованных статей из-за сомнений в достоверности полученных в них результатов в российских медицинских журналах неизвестны.
Способы борьбы с пропущенными данными
Как бороться с "потерями" больных
Никаких способов замещения (см. ниже) "потерянных" больных в принципе не существует. Невозможно заниматься и их "предупреждением", т.к. такие попытки (например, с помощью ужесточения критериев включения) всегда приводят к формированию селективных групп больных, существенно отличающихся от реальной клинической практики [25].
Заранее можно информировать пациента (и получить у него информированное согласие) о возможных контактах после выписки из стационара. Такой шаг, безусловно, повысит отклик больных при проспективном наблюдении. Настойчивые поиски потерянных больных с использованием разных источников информации, способны улучшить результат. Например, в регистре ЛИС-3 (Люберецкое исследование смертности больных, перенесших острый инфаркт миокарда) первоначальный отклик при проспективном наблюдении больных, перенесших ОКС, составил всего 60,5% (по телефонному опросу). Поскольку такой отклик не может считаться достаточным для анализа, была сделана попытка выяснить жизненный статус не откликнувшихся больных с помощью различных баз данных, а также путем знакомства с документацией поликлиник, к которым были прикреплены "потерянные" больные. Эти меры позволили повысить отклик до 87,2% [26], после чего был проведен окончательный анализ полученных результатов.
Следует помнить, что далеко не все источники сведений о больных содержат клинически значимую информацию. Так, оценка посмертных диагнозов с помощью свидетельств о смерти, выданных отделами ЗАГС, может привести к совершенно неправильным выводам, поскольку в них указывается обычно лишь непосредственная причина смерти, и то не всегда правильная. Данная проблема была особенно актуальной в период минувшей пандемии новой коронавирусной инфекции (COVID-19 — COrona VIrus Disease 2019), когда многим пациентам, умершим от сердечно-сосудистых заболеваний, присваивали посмертный диагноз COVID-19.
Как бороться с пропущенными данными у отдельных больных
Для крупных баз данных и основанных на них регистрах используют различные способы замещения (imputation) [27][28]1. Существует несколько способов такого замещения, использующихся в самых различных областях науки [29-31], описание которых не входит в задачи данной публикации. Несложно понять, что в клинических регистрах (т.е. тех, где имеется непосредственный контакт исследователя с больным), в которые включаются обычно несколько сотен больных, отсутствие сведений о каждом больном может привести к существенному смещению результатов, особенно в тех случаях, когда отсутствующие данные являются неслучайными [9][10]. Поэтому для небольших клинических регистров такие методы ни в коем случае нельзя назвать приемлемыми.
Наиболее реалистичным методом борьбы с пропущенными данными отдельных пациентов является попытка их восполнения [32]. Впервые такая попытка в российских регистрах была предпринята нами в регистре ТАРГЕТ-ВИП (Проспективный госпитальный регистр больных с предполагаемыми или подтвержденными коронавирусной инфекцией COVID-19 и внебольничной пневмонией), куда включались больные, госпитализированные с острой коронавирусной инфекцией [33]. Отсутствующие в историях болезни данные оперативно восполнялись клиническими ординаторами во время нахождения больных в стационаре, а после выписки из стационара — курирующими регистр врачами с помощью телефонного контакта. Понятно, что даже такая система не может восполнить всех отсутствующих данных, особенно тех, которые отсутствовали неслучайно, но уменьшить их количество может вполне.
Оценка упоминания о "потерянных" больных и пропущенных данных в российских регистрах ОКС
В настоящей работе была предпринята попытка изучить проблему "потерянных" больных и пропущенных данных на примере ОКС. ОКС является особым состоянием, при котором получить все данные о больном даже в проспективных исследованиях в принципе не представляется возможным. Объясняется это достаточно просто: тяжесть состояния многих больных при поступлении в стационар часто не позволяет получить важнейшую для врача информацию (время начала ангинозного приступа, лекарственный анамнез, наличие сопутствующих заболеваний и пр.), которая является необходимой для принятия врачебных решений. Тем не менее, мы регулярно видим, что сведения о невозможности сбора упомянутых данных игнорируются исследователями при интерпретации полученных результатов.
Поэтому задачей проводимого в данной работе анализа было оценить, насколько полно в отечественных регистрах ОКС отражена проблема пропущенных данных и соответственно, как это могло повлиять на сделанные в исследовании выводы.
В анализ были включены все отечественные исследования ОКС, отвечающие требованиям регистров [9][10]. Кроме того, в анализ включены два исследования, не отвечающие требованиям регистров, в которых могла содержаться важная информация о данных, полученных при поступлении больных ОКС в стационар и их лечении в стационаре, а также при их дальнейшем наблюдении, если КИ было проспективным. Полученные результаты представлены в таблице 1.
Таблица 1
Наличие упоминаний о пропущенных и неверно введенных данных в отечественных регистрах ИМ и ОКС
|
Название исследования |
Годы проведения |
Количество включенных больных |
Вид исследования |
Наличие сведений о неверно введенных и пропущенных данных |
Наличие сведений о "потерянных" больных при проспективном наблюдении |
Примечание |
|
ЛИС [47][48] |
2008-2013* |
961 |
Ретропроспективный |
Да |
Да, потеряны 11,6% |
Средний срок наблюдения 1,75 лет. При оценке ключевых показателей присутствовал пункт "неизвестно" |
|
Хабаровский регистр [34] |
2014 |
321 |
Проспективный |
Нет |
Да, потеряны 6,2% |
Медиана наблюдения — 2,5 года |
|
ХМАО — Югра** [35] |
2008-2010 |
395 |
Одномоментный |
Нет |
— |
Время начала ангинозной боли приводится только для больных, которым проводили ЧКВ (n=274) |
|
RusACSR [42] |
2008-2015 |
254584 |
Ретроспективный, одномоментный |
Нет |
— |
При вводе данных программа не позволяла вводить "конфликтующие и подложные" данные |
|
Кемеровский регистр [36] |
2009 |
471 |
Ретропроспективный |
Нет |
Нет |
5 лет проспективного наблюдения |
|
Рекорд-3 [21][43] |
2015 |
2504 1918 в проспективной части |
Проспективный |
Да |
Да, потеряны 36,3% |
Данные о 87 пациентах признаны непригодными к обработке и удалены (в основном из-за отсутствия данных об исходах) |
|
Первый московский регистр ОКС [37] |
2012 |
584 |
Проспективный |
Нет |
Да, потеряны 75% |
Срок наблюдения 6 мес. |
|
Регистр КАРДИО-ЦКБ [38] |
2012-2015 |
569 |
Проспективный (30 дней) |
Нет |
Нет |
— |
|
Томск [45] |
2019-2021 |
600 |
Ретроспективный без периода наблюдения |
Да |
— |
Включались только больные с ОКСбпST. Исключены истории болезни с "недостаточным для проведения анализа набором данных" (n=134). Не отвечает всем требованиям регистра |
|
Федеральный регистр ОКС [44] |
2019 |
27029 |
Одномоментный |
Да |
— |
Отмечается, что "Достаточное количество данных для верификации ОКС имелось у 20 757 (76,8%) больных", которые и были включены в анализ |
|
Забайкальский регистр [39] |
2018-2019 |
793 |
Одномоментный |
Нет |
— |
— |
|
РЕГИОН-ИМ [40] |
2020-2023*** |
10884 |
Проспективный |
Нет |
Данные пока не публиковались |
— |
|
Кемерово [41] |
2021 |
1293 |
Проспективный |
Нет |
Да, 7,9% |
12 мес. проспективного наблюдения |
Примечание: * — период проспективного наблюдения; ** — по-видимому, был частью регистра RusACSR; *** — данные проспективной части пока не опубликованы. ИМ — инфаркт миокарда, ОКС — острый коронарный синдром, ОКСбпST — ОКС без подъема сегмента ST, КАРДИО-ЦКБ — Исследование ОКС у пациентов из группы высокого риска, ЛИС — Люберецкое исследование смертности больных, перенесших острый инфаркт миокарда, РЕГИОН-ИМ — Российский Регистр пациентов с острым инфарктом миокарда, RusACSR — The Russian Acute Coronary Syndrome Registry.
Необходимость упоминания о пропущенных данных и способах их замещения большинство исследователей полностью игнорирует [34-41] (таблица 1). В некоторых исследованиях [42] есть информация, что при вводе данных система не позволяла вводить "конфликтующие и подложные" данные, однако невозможно понять, как это могло быть реализовано на практике. В ряде исследований [21][43-45] отмечается, что больные с недостаточным или неполным объемом данных были просто исключены из анализа. Об опасности такой практики для сделанных в исследовании выводов упоминают многие исследователи [27][46].
Что касается "потерянных" при проспективном наблюдении больных, то в некоторых исследованиях [36][38] упоминание о них просто отсутствует. В тех же исследованиях, где такие цифры приводятся [21][37], доля "потерянных" больных может достигать 75% (!), что не позволяет рассматривать сделанные в них выводы как вытекающие из полученных результатов. Лишь в некоторых проспективных регистрах [34][41][45][47][48] доля "потерянных" больных не превышала установленных значений, поэтому результаты проведенного в них анализа можно признать корректными.
Как могут повлиять пропущенные данные на полученный результат при оценке течения ОКС
Прямыми примерами, демонстрирующими ответ на поставленный вопрос, мы пока не располагаем. Однако проводимый в настоящее время проспективный регистр ОКС "СТОКС" (Ступинский регистр ОКС, зарегистрирован на сайте ClinicalTrials.gov NCT06845384) показал, что среди больных ОКС, поступающих в региональный сосудистый центр, ~ у 15% больных данные о таком важнейшем показателе, как время возникновения ангинозной боли, вообще не могут быть получены даже при активном расспросе врача. Можно представить, как были искажены данные о таком показателе, как время, прошедшее от начала ангинозной боли до поступления больного в стационар, в тех регистрах, где о пропущенных данных не упоминалось.
Заключение
Пропущенные данные часто встречаются в КИ, посвященных изучению ОКС, они могут существенно повлиять на полученный результат. Однако большинство исследователей не считает нужным упоминать о пропущенных данных и способах их предупреждения. Лучшим способом восполнения пропущенных данных является ступенчатая система контроля за ними. Доля выпавших из-под наблюдения больных при проспективном наблюдении не должна превышать 5-15%, независимо от доли потерянных больных необходимо сравнивать их исходные клинико-демографические характеристики с теми больными, с которыми установлен контакт.
Отношения и деятельность: автор заявляет об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.
1. Аладышкина А. С, Лакшина В. В., Леонова Л. А., Максимов А. Г. Особенности работы с данными, характеризующими здоровье населения: заполнение пропусков в данных. Социальные аспекты здоровья населения [сетевое издание] 2020;66(1):12. doi:10. 21045/2071-5021-2020-66-1-12. URL: http://vestnik.mednet.ru/content/view/1139/30/lang,ru/.
Список литературы
1. Rubin DB. Inference and missing data. Biometrika. 1976;63: 581-92.
2. Schafer JL. Analysis of Incomplete Multivariate Data, Chapter 4. London: Chapman and Hall, 1997.
3. National Research Council. The Prevention and Treatment of Missing Data in Clinical Trials. Washington, DC: National Academies Pr.; 2010. doi:10.17226/12955.
4. Cole SR, Zivich PN, Edwards JK, et al. Missing Outcome Data in Epidemiologic Studies. Am J Epidemiol. 2023;192(1):6-10. doi:10.1093/aje/kwac179.
5. Little RJ, D’Agostino R, Cohen ML, et al. The prevention and treatment of missing data in clinical trials. N Engl J Med 2012; 367:1355-60. doi:10.1056/NEJMsr1203730.
6. Stack CB, Butterworth T, Goldin R. Designed Learning: Missing Data in Clinical Research. Ann Intern Med. 2018;168(10):744. doi:10.7326/M18-0534.
7. Papageorgiou G, Grant SW, Takkenberg JJM, Mokhles MM. Statistical primer: how to deal with missing data in scientific research? Interact Cardiovasc Thorac Surg. 2018;27(2):153-8. doi:10.1093/icvts/ivy102.
8. Гржибовский А. М., Унгуряну Т. Н. Анализ биомедицинских данных с использованием пакета статистических программ SPSS: учебное пособие. — Архангельск: Изд-во Северного государственного медицинского университета, 2017. 296 с.
9. Gliklich RE, Dreyer NA, Leavy MB. Registries for Evaluating Patient Outcomes: A User’s Guide. 3rd edition. Rockville (MD): Agency for Healthcare Research and Quality (US);2014 Apr. Report No.: 13(14)-EHC111.
10. Марцевич С. Ю., Лукина Ю. В., Кутишенко Н. П. и др. Медицинские регистры. Роль в доказательной медицине. Рекомендации по созданию. Методические рекомендации. М.: ООО "Силицея-Полиграф", 2023. 44 с. ISBN: 978-5-6049087-8-5. doi:10.15829/ROPNIZ-m1-2023. EDN: OCKJVC.
11. Cox DR, Oakes D. Analysis of Survival Data. Chapman and Hall, London, 1984. 201 p. ISBN: 9781315137438. doi:10.1201/9781315137438.
12. Abd ElHafeez S, D'Arrigo G, Leonardis D, et al. Methods to Analyze Time-to-Event Data: The Cox Regression Analysis. Oxid Med Cell Longev. 2021;2021:1302811. doi:10.1155/2021/1302811.
13. Гланц С. Медико-биологическая статистика. М: Практика, 1998. ISBN: 5-89816-009-4.
14. D'Arrigo G, El Hafeez SA, Mezzatesta S, et al. Common mistakes in biostatistics. Clin Kidney J. 2024;17(7):sfae197. doi:10.1093/ckj/sfae197.
15. Nutt CT. Lost to Follow-up. Acad Med. 2019;94(12):1850. doi:10.1097/ACM.0000000000002966.
16. Tong CYM, Koh RYV, Lee ES. A scoping review on the factors associated with the lost to follow-up (LTFU) amongst patients with chronic disease in ambulatory care of high-income countries (HIC). BMC Health Serv Res. 2023;23(1):883. doi:10.1186/s12913-023-09863-0.
17. Dettori JR. Loss to follow-up. Evid Based Spine Care J. 2011; 2(1):7-10. doi:10.1055/s-0030-1267080.
18. Akl EA, Briel M, You JJ, et al. Potential impact on estimated treatment effects of information lost to follow-up in randomised controlled trials (LOST-IT): systematic review. BMJ. 2012;344: e2809. doi:10.1136/bmj.e2809.
19. Hess CN, Hiatt WR. Lost in translation: Why "lost to follow-up" matters. Vasc Med. 2019;24(4):339-40. doi:10.1177/1358863X19853623.
20. Huang RS, Naidu SC, Mihalache A, et al. Loss to Follow-Up in Patients With Proliferative Diabetic Retinopathy or Diabetic Macular Edema. JAMA Netw Open. 2024;7(12):e2450942. doi:10.1001/jamanetworkopen.2024.50942.
21. Эрлих А. Д. Клинические характеристики и исходы у пациентов с острым коронарным синдромом и промежуточной фракцией выброса левого желудочка (данные регистра "Рекорд-3"). Сердце. 2017;16(4):246-52. doi:10.18087/RHJ.2017.4.2369.
22. Gitt AK, Bueno H, Danchin N, et al. The role of cardiac registries in evidence-based medicine. Eur Heart J. 2010;31(5):525-9. doi:10.1093/eurheartj/ehp596.
23. Mol BW, Ioannidis JPA. How do we increase the trustworthiness of medical publications? Fertil Steril. 2023;120(3 Pt 1):412-4. doi:10.1016/j.fertnstert.2023.02.023.
24. Carlisle JB. False individual patient data and zombie randomised controlled trials submitted to Anaesthesia. Anaesthesia. 2021; 76(4):472-9. doi:10.1111/anae.15263.
25. Марцевич С. Ю. Мнение эксперта о статье "Результаты пилотного клинического исследования безопасности и эффективности оригинального антитромбоцитарного препарата из группы ингибиторов гликопротеиновых IIb/IIIa-рецепторов при остром коронарном синдроме". Кардиоваскулярная терапия и профилактика. 2023;22(7):3686. doi:10.15829/1728-8800-2023-3686. EDN: XZITPX.
26. Марцевич С. Ю., Золотарева Н. П., Загребельный А. В. и др. Динамика показателей отдаленной смертности у больных, перенесших инфаркт миокарда по данным Люберецкого регистра ЛИС. Рациональная Фармакотерапия в Кардиологии. 2022;18(2):176-82. doi:10.20996/1819-6446-2022-04-05.
27. Tseng CH, Chen YH. Regularized approach for data missing not at random. Stat Methods Med Res. 2019;28(1):134-50. doi:10.1177/0962280217717760.
28. Sainani KL. Dealing With Missing Data. PM R. 2015;7(9):990-4. doi:10.1016/j.pmrj.2015.07.011.
29. O’Neill RT, Temple R. The prevention and treatment of missing data in clinical trials: an FDA perspective on the importance of dealing with it. Clin Pharmacol Ther. 2012;91:550-4.
30. Peacock JL, Peacock PJ. Oxford Handbook of Medical Statistics. Oxford University Press; 2nd edition. — 640 p.
31. Siddique J, Brown CH, Hedeker D, et al. Missing Data in Longitudinal Trials — Part B, Analytic Issues. Psychiatr Ann. 2008; 38(12):793-801. doi:10.3928/00485713-20081201-09.
32. Mainzer RM, Moreno-Betancur M, Nguyen CD, et al. Gaps in the usage and reporting of multiple imputation for incomplete data: findings from a scoping review of observational studies addressing causal questions. BMC Med Res Methodol. 2024; 24(1):193. doi:10.1186/s12874-024-02302-6.
33. Драпкина О. М., Карпов О. Э., Лукьянов М. М. и др. Проспективный госпитальный регистр больных с предполагаемыми или подтвержденными коронавирусной инфекцией COVID-19 и внебольничной пневмонией (ТАРГЕТ-ВИП): характеристика включенных больных и оценка исходов стационарного этапа лечения. Кардиоваскулярная терапия и профилактика. 2020;19(6):2727. doi:10.15829/1728-8800-2020-2727.
34. Давидович И. М., Малай Л. Н., Кутишенко Н. П. Отдаленные результаты и приверженность терапии у пациентов после острого инфаркта миокарда: данные регистра (Хабаровск). Клиницист. 2017;11(1):36-44. doi:10.17650/1818-8338-2016-10-4-36-44.
35. Урванцева И. А., Саламатина Л. В., Милованова Е. В. и др. Региональный опыт ведения регистра острого коронарного синдрома. Кардиология. 2013;8:11-4.
36. Седых Д. Ю., Неверова Ю. Н., Ваккосов К. М., Барбараш О. Л. Результаты 5-летнего наблюдения за пациентами после инфаркта миокарда. Сибирское медицинское обозрение. 2018;(3):51-8. doi:10.20333/2500136-2018-3-51-58.
37. Эрлих А. Д. от имени всех участников Первого московского регистра ОКС. Первый московский регистр острого коронарного синдрома: результаты 6-месячного наблюдения. Неотложная кардиология. 2014;2:3-9.
38. Ломакин Н. В., Бурячковская Л. И., Сумароков А. Б. и др. Регистровое исследование острого коронарного синдрома у мультиморбидных пациентов: 30-дневный прогноз. Кардиология. 2019;59(11):14-20. doi:10.18087/cardio.2019.11.n723.
39. Зайцев Д. Н., Говорин А. В., Шангина А. М., Сизых Н. В. Первые результаты регистра больных острым коронарным синдромом в Забайкальском крае. Забайкальский медицинский вестник. 2020;1:27-32.
40. Бойцов С. А., Шахнович Р. М., Эрлих А. Д. и др. Регистр острого инфаркта миокарда. РЕГИОН-ИМ — Российский рЕГИстр Острого иНфаркта миокарда. Кардиология. 2021;61(6):41-51. doi:10.18087/cardio.2021.6.n1595.
41. Кинаш В. И., Кашталап В. В., Федоров Д. А. и др. Отдаленные исходы у пациентов с инфарктом миокарда 1-го и 2-го типов (данные одноцентрового регистрового исследования). Сибирский журнал клинической и экспериментальной медицины. 2024;39(1):202-9. doi:10.29001/2073-8552-2024-391-202-209.
42. Gridnev VI, Kiselev AR, Posnenkova OM, et al. Objectives and Design of the Russian Acute Coronary Syndrome Registry (RusACSR). Clin Cardiol. 2016;39:1-8. doi:10.1002/clc.22495.
43. Эрлих А. Д., Грацианский Н. А. от имени участников регистра РЕКОРД-3. Российский регистр острого коронарного синдрома "РЕКОРД-3". Характеристика пациентов и лечение до выписки из стационара. Кардиология. 2016;56(4):16-24. doi:10.18565/cardio.2016.4.16-24.
44. Сагайдак О. В., Ощепкова Е. В., Попова Ю. В. и др. Анализ оказания медицинской помощи больным с острым коронарным синдромом в 2019 году (по данным федерального регистра острого коронарного синдрома). Кардиологический вестник. 2020;3:37-45. doi:10.36396/MS.2020.16.3.005.
45. Несова А. К., Цыдыпова Д. Б., Рябов В. В. Клинический профиль больных с острым коронарным синдромом без подъема сегмента ST: опыт регионального сосудистого центра. Кардиоваскулярная терапия и профилактика. 2024;23(8):3994. doi:10.15829/1728-8800-2024-3994. EDN: DJOGIQ.
46. Singhal R, Rana R. Intricacy of missing data in clinical trials: Deterrence and management. Int J Appl Basic Med Res. 2014; 4(Suppl 1):S2-5. doi:10.4103/2229-516X.140706.
47. Марцевич С. Ю., Кутишенко Н. П., Гинзбург М. Л. и др. Исследование ЛИС (Люберецкое исследование смертности больных, перенесших острый инфаркт миокарда): портрет заболевшего. Кардиоваскулярная терапия и профилактика. 2011;10(6):89-93. doi:10.15829/1728-8800-2011-6-89-93.
48. Марцевич С. Ю., Гинзбург М. Л., Кутишенко Н. П. и др. Люберецкое исследование смертности (исследование ЛИС): факторы, влияющие на отдаленный прогноз жизни после перенесенного инфаркта миокарда. Профилактическая медицина. 2013;16(2): 32-8.
Об авторе
С. Ю. МарцевичРоссия
Марцевич Сергей Юрьевич — д.м.н., профессор, руководитель отдела профилактической фармакотерапии.
Петроверигский пер., 10, стр. 3, Москва, 101990
Дополнительные файлы
Что известно о предмете исследования?
- Пропущенные и ошибочные данные часто встречаются при проведении клинических исследований, игнорирование их наличия может привести к неверным выводам.
Что добавляют результаты исследования?
- Приводится конкретный пример таблицы с пропущенными данными регистра острого коронарного синдрома. Проанализированы российские регистры острого коронарного синдрома на предмет упоминания о пропущенных данных и "потерянных" больных.
Рецензия
Для цитирования:
Марцевич С.Ю. Пропущенные и ошибочные данные в клинических исследованиях: влияние на получаемый результат и способы предупреждения. Кардиоваскулярная терапия и профилактика. 2025;24(10):4572. https://doi.org/10.15829/1728-8800-2025-4572. EDN: QIGEJM
For citation:
Martsevich S.Yu. Missing and incorrect data in clinical trials: impact on the final result and ways of prevention. Cardiovascular Therapy and Prevention. 2025;24(10):4572. (In Russ.) https://doi.org/10.15829/1728-8800-2025-4572. EDN: QIGEJM

















































