Перейти к:
Конечные точки: виды, особенности выбора, интерпретация полученных результатов на примере кардиологических исследований
https://doi.org/10.15829/1728-8800-2022-3243
Аннотация
Важность проведения качественных рандомизированных контролируемых исследований на современном этапе развития медицины сложно переоценить. Каждое такое исследование пытается дать ответ на конкретный клинический вопрос. Для этого необходимо заранее задать показатель достижения конкретного результата за определенный период времени. Этим показателем является конечная точка (КТ) исследования, т.е. тот или иной исход заболевания или изменение лабораторных и функциональных показателей организма. Ее выбор напрямую влияет на предполагаемый дизайн и на объем выборки исследования. В статье приведена классификация и иерархия КТ (в зависимости от цели), описаны особенности и ограничения применения важных клинических исходов и суррогатных показателей. Описаны причины, почему широкое распространение в кардиологических исследованиях получили именно комбинированные КТ. Отдельного внимания заслуживает интерпретация КТ в рамках вторичного анализа, положительный результат которых можно оценить только в том случае, если будет продемонстрирован эффект лечения по первичному показателю эффективности или безопасности. Текущий обзор дополнен клиническими примерами исследований, выполненных в кардиологии.
Ключевые слова
Для цитирования:
Навасардян А.Р., Марцевич С.Ю. Конечные точки: виды, особенности выбора, интерпретация полученных результатов на примере кардиологических исследований. Кардиоваскулярная терапия и профилактика. 2022;21(5):3243. https://doi.org/10.15829/1728-8800-2022-3243
For citation:
Navasardyan A.R., Martsevich S.Yu. Endpoints: types, selection, interpretation of the results obtained on the example of cardiology studies. Cardiovascular Therapy and Prevention. 2022;21(5):3243. (In Russ.) https://doi.org/10.15829/1728-8800-2022-3243
Введение
За последние 30-40 лет медицинская наука претерпела значительные изменения. За этот период в кардиологии стали апробироваться новые подходы к лечению и профилактике сердечно-сосудистых заболеваний (ССЗ). Появились новые классы препаратов, влияющих на исходы заболевания. Во многом это было достигнуто за счет проведения крупных эпидемиологических и рандомизированных контролируемых исследований (РКИ). Проведение РКИ, где использовали плацебо или сравнение с принятым стандартом лечения, легло в основу принципа медицины, основанной на доказательствах (evidence based medicine).
Первым классическим РКИ считается исследование, посвящённое изучению стрептомицина у больных туберкулезом — The British Streptomycin Trial in Tuberculosis, 1946г. Количество включенных в это исследование определяли не расчетом объема выборки, а количеством исследуемого препарата, участники не подписывали форму информированного согласия, проводили его не по правилам GCP (Good Clinical Practice). Впервые правила GCP были опубликованы в США только в 1977г. Эффективность стрептомицина оценивалась клинически. Понятие конечной точки (КТ) не было определено заранее. Тем не менее, именно в нем удалось сформировать исследуемые группы случайным образом с помощью рандомизации [1][2].
Таким образом, цель любого РКИ — это подтвердить клинический эффект лекарственного препарата (ЛП) или метода лечения, либо опровергнуть его. Для этого формируются две гипотезы: нулевая гипотеза, указывающая на отсутствие эффекта, и альтернативная (рабочая), которая свидетельствует об обратном. Для достижения цели необходимо установить меру, отражающую клиническую эффективность ЛП. Основной мерой эффективности является частота достижения “первичной” КТ. Что касается самого термина КТ — это всегда достижение конкретного результата за конкретный промежуток времени. Клинические и статистические критерии достижения результата определяются заранее и фиксируются в протоколе исследования. В конечном итоге по частоте выявления КТ в исследуемых группах подтверждается та или иная гипотеза. Особенности выбора первичных КТ во многом предопределяют дизайн и результаты РКИ1 [3]. Цель настоящего обзора — описание разновидностей КТ, особенности их выбора и влияние на результаты РКИ.
Поиск литературы проводили по базам данных PubMed и eLIBRARY на русском и английском языках. Поиск полнотекстовых статей проводили по ключевым словам, которые представлены в статье на двух языках. В результате поиска были выбраны 36 публикаций из >200, тема которых содержала информацию о КТ. Поиск в PubMed осуществляли по следующим ключевым словам: clinical outcome, primary end points, secondary end points, composite, multicomponent end points, surrogate end points. Исключением являются примеры клинических исследований, среди которых были выбраны те, что наиболее ярко иллюстрируют рассматриваемые в обзоре аспекты проблемы.
Виды КТ
На основании различных критериев выделяют несколько классификаций КТ:
1. По числу оцениваемых компонентов КТ подразделяются на однокомпонентные и многокомпонентные, последние называются также комбинированными КТ (composite endpoint).
2. КТ может быть первичной, вторичной и исследовательской. Первичная КТ характеризует основной показатель эффективности (или безопасности). Вторичная КТ — дополнительный исход, оцениваемый в рамках исследования. Как правило, вторичные КТ предоставляют дополнительную информацию о первичной КТ, состоянии пациента или его заболевании. Зачастую — это компоненты комбинированной КТ2. Показатели, не имеющие прямого отношения к первичной КТ, но изучаемые в рамках проводимого исследования для оценки дополнительных эффектов ЛП, называются исследовательскими (поисковыми). В дальнейшем выявление различий в исследовательских КТ может служить для формирования новой гипотезы и нового исследования.
3. По характеру показателей, которые планируется отслеживать в исследовании, КТ подразделяются на “жесткие” и “мягкие” (суррогатные). Показатели, напрямую отражающие прогноз больных, исходы болезни, такие как общая смерть, смерть от сердечно-сосудистых причин, острый инфаркт миокарда (ОИМ), острое нарушение мозгового кровообращения (ОНМК), декомпенсация хронической сердечной недостаточности (ХСН) и т.д. — такие КТ принято называть “жесткими” (hard endpoints). Смерть от ССЗ — наиболее жесткий показатель в кардиологических исследованиях, однако далеко не всегда удается установить причину смерти, поэтому ее иногда заменяют на общую смерь больных или смерть от всех причин. Несмотря на то, что смерть от всех причин является наиболее важной “жесткой” КТ, у этого показателя есть ряд ограничений в использовании. Во-первых, показатель смерти очень низок. В связи с этим нужны большие РКИ для достижения статистических отличий по этому показателю. Во-вторых, если говорить про смерть от всех причин, на этот показатель может влиять большое количество факторов. Поэтому, как правило, ее рассматривают в качестве вторичной КТ. Хорошим примером является исследование DAPT (Dual Antiplatelet Therapy), в рамках которого оценивали влияние двойной антитромбоцитарной терапии в течение 12-30 мес. с момента реваскуляризации на риск тромбоза стента, основных неблагоприятных сердечно-сосудистых и цереброваскулярных событий по сравнению с группой больных, принимающих аспирин и плацебо. Первичную КТ (тромбоз стента и основные неблагоприятные сердечно-сосудистые и цереброваскулярные события (ОИМ, ОНМК и смерть) удалось снизить, тем не менее, частота смерти от всех причин была выше в группе принимающих двойную антитромбоцитарную терапию за счет некардиоваскулярных причин. Основными причинами смерти были кровотечения, травма и злокачественные новообразования (ЗНО). При этом смерть по причине ЗНО имела самую большую структуру и, возможно, из-за дисбаланса ЗНО между группами были выявлены различия по показателю смерти от всех причин [4].
Если эффект оценивается с помощью достижения целевых значений лабораторных показателей (изменение уровня глюкозы натощак, гликированного гемоглобина, липидов крови и т.д.), показателей диагностических методов (изменение плотности костей, объема опухоли, фракции выброса левого желудочка и т.д.) или показателей гемодинамики (изменение ударного объема, увеличение толерантности к физической нагрузке, нормализация уровня артериального давления — АД), такие КТ принято называть суррогатными (surrogate endpoint) или “мягкими” (рисунок 1). Данное деление достаточно условно.
Рис. 1 Иерархия КТ.
Примечание: ЧДД — частота дыхательных движений, ЧСС — частота сердечных сокращений, ССС — сердечно-сосудистая смерть, ВТЭО — венозные тромбоэмболические осложнения.
Выбор КТ во многом влияет на дизайн исследования, объем выборки и ценность полученных результатов. Как правило, чем важнее клинический исход, тем реже частота его возникновения, что диктует необходимость включения большого числа пациентов и более длительного наблюдения для достижения приемлемой мощности исследования. Имеются специальные формулы для расчета необходимого объема выборки [5]. Однако стоит отметить, что зачастую достижение достоверной статистической разницы не всегда свидетельствует о клинической ценности использования нового препарата или метода.
Напротив, при использовании суррогатных КТ частота событий увеличивается, что приводит к снижению количества включенных в него субъектов и стоимости [6]. Однако необходимо быть уверенным в клинической и практической значимости суррогатной КТ.
Далее будут рассмотрены отдельные виды КТ и варианты их анализа в клинических исследованиях.
Комбинированная (многокомпонентная) КТ
Последние несколько десятилетий в кардиологии на смену однокомпонентным КТ пришли комбинированные и этому есть ряд объективных причин. Во-первых, заболевания имеют несколько вариантов клинического течения [7]. Например, атеросклероз является генерализованным состоянием и может проявляться (манифестировать) в виде ОИМ, ОНМК, заболеваний периферических артерий и сердечно-сосудистой смерти. Таким образом, если имеется ЛП, влияющий на сердечнососудистый риск (ССР), в качестве первичной КТ может быть комбинация различных исходов заболевания. Во-вторых, за последние десятилетия претерпела изменение базовая терапия, которая состоит из препаратов ранее доказавших свою эффективность в РКИ. На ее фоне все труднее стало демонстрировать эффект препарата, основываясь только на однокомпонентной КТ. В-третьих, объединив несколько интересующих показателей, можно увеличить частоту комбинированной КТ и тем самым снизить объем выборки [8]. Однако данный подход чреват последствиями в клинической интерпретации РКИ [9]. С точки зрения статистики каждый из компонентов комбинированный КТ имеет одинаковую значимость. В рамках РКИ оцениваются исходы (КТ и ее компоненты) и время до наступления этого исхода. Зависимость возможного наступления события от времени изучается статистическими методами дожития (survival analysis). Наиболее распространенными методами являются таблицы выживаемости, метод КапланаМейера и регрессия Кокса. В рамках анализа дожития с объектом исследования в любой промежуток наблюдения может произойти интересующие события. Кроме того, в модели дожития включаются независимые переменные (пол, возраст, сахарный диабет и др.), которые могут повлиять на риск наступления события. Таким образом, в рамках этих моделей фундаментальный интерес представляет функция дожития (время до наступления события) и функция риска развития этого события. В большинстве крупных РКИ для оценки исхода относительно времени используют кривые Каплана-Мейера, для оценки риска — регрессионную модель Кокса. Последняя оценивает влияние множества предикторов на исход с учетом периода наблюдения. Более подробно про модели дожития можно ознакомиться в статье Шарашовой Е.Е. и др. [10]. КТ в том виде, в котором они вошли в медицину, во много обусловлены статистическими методами оценки исследований. Если в исследовании используется комбинированная КТ, которая состоит из смерти, ОИМ и госпитализации в связи с ухудшением состояния (например, из-за декомпенсации ХСН), то с точки зрения статистических моделей все эти компоненты равнозначны между собой. В связи с этим в комбинированную КТ необходимо включать равные или близкие по влиянию на прогноз пациентов клинические исходы. Кроме того, в рамках анализа первичной КТ фиксируется развитие только первого компонента комбинированной КТ [11]. При этом развившиеся последующие события, возможно, более значимые с точки зрения прогноза, не будут включаться в анализ по первичной КТ и могут войти только в анализ по вторичной КТ. На рисунках 2 А и 2 Б приведены два возможных варианта последовательности развития компонентов первичной КТ. Исследуемый препарат демонстрирует (визуально) более низкую частоту событий (рисунок 2 А). Наиболее частым компонентом первичной КТ у исследуемого препарата выступает госпитализация. Факт госпитализации фиксируется в первичном анализе. Последующие события, которые могут происходить с пациентом, в первичный анализ не входят. При этом у пациента после госпитализации может произойти более серьезный клинический исход — ОИМ или пациент может умереть (рисунок 2 А). Напротив, в группе активного компаратора (рисунок 2 Б) после перенесенного ОИМ пациент может остаться жив, при этом статус пациента также никак не учитывается в первичном анализе. Данный пример демонстрирует важность оценки статуса пациента до конца исследования и оценки отдельных компонентов в рамках вторичного анализа. Это позволит оценить, за счет какого компонента достигался конечный результат. Кроме того, возможна конкуренция компонентов между собой. Например, если бы смерть не входила в состав первичной КТ, частота смертельных исходов была бы выше в группе исследуемого препарата, частота развития ОИМ и госпитализации была бы ниже в группе исследуемого препарата прямо пропорционально частоте выбывания пациентов в связи со смертью. Таким образом, единственный компонент, который не конкурирует с другими, — это смерть [12-14].
Рис. 2 Возможная потеря клинически важной информации при использовании комбинированной КТ: А — исследуемый препарат, Б — активный компаратор.
Таким образом, желательно:
- последующее наблюдение всех пациентов, в т.ч. после получения несмертельного компонента комбинированной КТ. В рамках дополнительного анализа заранее запланировать оценку отдельных компонентов, что позволит определить структуру комбинированной КТ и исключить ситуацию, при которой лечение оказывает неблагоприятное воздействие на наиболее важный, но редкий компонент, а отличие достигается ценой влияния на события меньшей клинической важности, которые встречаются чаще [15][16]. Моделей дожития, которые могли бы учитывать несколько эпизодов развития КТ в рамках одного анализа на данный момент, не существует.
- включать в комбинированную КТ клинически сопоставимые между собой компоненты [12], т.е. не объединять редкие клинически важные “жесткие” исходы с более частыми “мягкими” суррогатными [8][16].
Помимо конкуренции компонентов КТ между собой стоит отметить, что включение в комбинированную КТ событий малочувствительных к влиянию вмешательства может привести к маскировке (смещению) конечного эффекта, т.е. к снижению мощности исследования [17]. Подобная ситуация, по-видимому, произошла в исследовании PROactive пиоглитазона vs плацебо у пациентов с сахарным диабетом 2 типа с макрососудистыми заболеваниями в анамнезе. Комбинированная КТ включала в себя 8 компонентов: смерть от всех причин, нефатальный ОИМ, ОНМК, острый коронарный синдром, любое хирургическое или эндоваскулярное вмешательство в коронарных артериях или артериях ног и ампутацию выше лодыжки. По данной КТ не удалось продемонстрировать различие пиоглитазона по сравнению с плацебо, однако анализ вторичной КТ, включающий всего три наиболее крупных клинических события (смерть от всех причин, нефатальный ОИМ и ОНМК), продемонстрировал эффективность пиоглитазона [15][18].
Комбинированная КТ может формироваться не только путем объединения разных проявлений заболевания, но и путем объединения основных показателей эффективности и безопасности. Например, в исследовании Hokusai VTE Cancer, где эдоксабан сравнивался с далтепарином в рамках лечения и вторичной профилактики тромбозов у пациентов с выявленным ЗНО, первичная КТ исследования объединила как показатели эффективности (частота венозных тромбоэмболических осложнений), так и показатели безопасности (частота больших кровотечений) [19]. С одной стороны, такой подход позволяет сразу оценить пользу/риск от использования исследуемого препарата. С другой стороны, включение в первичную КТ основных неблагоприятных событий терапии (больших кровотечений) может сместить акцент исследования от оценки эффективности в сторону профиля польза/риск. В ряде случаев такой подход не приветствуется с регуляторной точки зрения, особенно в исследованиях не меньшей эффективности (noninferiority) [15][16]. В рамках такого подхода частота тромбоза глубоких вен и тромбоэмболия легочной артерии приравниваются к эпизоду большого кровотечения. Стоит отметить, что показатели безопасности исследуемого препарата всегда оцениваются либо в рамках первичной КТ безопасности отдельно от КТ эффективности, либо в рамках вторичных целей исследования, что, в конечном итоге, также позволяет оценить пользу/риск исследуемого ЛП. Например, в исследованиях рассчитывается показатель чистой клинической выгоды (net clinical benefit). Данный показатель включает как частоту событий эффективности, так и частоту событий профиля безопасности. Бывают исследования, в которых имеются две первичные КТ — КТ эффективности и КТ безопасности.
Суррогатные КТ
Суррогатная КТ — показатель, заменяющий отчетливый клинический исход болезни достижением некого другого показателя, который ассоциирован с этим исходом, например, снижение исходных цифр АД, холестерина (ХС), креатинина и т.д. Суррогатная КТ должна поддаваться четкой количественной оценке. Важно понимать, что для суррогатных КТ должны быть прописаны уровень необходимого изменения, время и стойкость достижения эффекта. Например, препарат снижает уровень общего ХС в течение нескольких месяцев, если целевые показатели ХС достигают определенного уровня при нескольких измерениях подряд. Классическим примером является оценка Международного нормализованного отношения (МНО) у пациентов с фибрилляцией предсердий в РКИ при лечении непрямыми антикоагулянтами. Этот показатель должен находиться в течение определенного времени в заданном диапазоне (например: 2,0-3,0). В противном случае терапия антагонистами витамина К не считается эффективной или безопасной.
В отличие от крупных клинических событий, частота которых относительно невелика, суррогатные КТ выявляются чаще и проще, что снижает продолжительность и стоимость исследования. Это позволяет с меньшими затратами выводить на рынок новые ЛП. Как правило, суррогатными КТ являются лабораторные и инструментальные показатели. Однако не все так однозначно бывает при использовании суррогатных клинических КТ в исследованиях.
Примером, демонстрирующим, что не всегда суррогатный показатель может ассоциироваться с клиническим исходом, является исследование CAST (The Cardiac Arrythmya Supression Trial) [20]. В 70-80-х гг применение антиаритмических препаратов 1С класса у пациентов с ОИМ и после него было рутинной клинической практикой в связи с тем, что эти препараты подавляли число желудочковых аритмий (экстрасистол). Считалось, что, наряду со снижением частоты желудочковых эктопий, снижается и частота внезапной смерти у этих пациентов. Однако исследование было досрочно остановлено в связи с увеличением случаев смерти в группах антиаритмических препаратов 1С класса (энкаинид, флекаинид или морицизин) по сравнению с плацебо. Был выявлен проаритмогенный эффект (увеличение риска желудочковой тахикардии) у антиаритмических препаратов этого класса. В данном случае анализ суррогатной КТ оказался неверным.
Другой пример подтверждает, что не всегда ЛП, показавший эффективность в исследовании с суррогатной КТ, достигал успеха при использовании жесткой КТ: существовало мнение, что препараты, влияющие на ударный объем, могут положительно влиять на прогноз больных ХСН с низкой фракцией выброса (ФВ). Увеличение данного показателя (в момент наблюдения за пациентом) способствовало субъективному улучшению, нормализации показателей гемодинамики и снижению симптомов нарушения кровообращения [21]. Однако при проведении плацебо-контролируемых РКИ с негликозидными инотропными средствами было выявлено увеличение смертности в отдаленном периоде [22]. Более того, даже краткосрочная терапия, приводила к ухудшению прогноза у этих больных [23]. Напротив, бета-адреноблокаторы (β-АБ), обладающие отрицательным инотропным эффектом, у больных ХСН с низкой ФВ усугубляли (в краткосрочном периоде) симптомы недостаточности, снижали толерантность к физической нагрузке. Однако в долгосрочной перспективе эти препараты продемонстрировали высокую эффективность в плане снижения ССР. На данный момент β-АБ являются одним из основных классов препаратов, улучшающих прогноз для этих пациентов, в т.ч. за счет снижения влияния симпатической нервной системы на сердечно-сосудистую [24].
Большинство современных суррогатных КТ, которые продемонстрировали свою связь с клиническими исходами, были изучены в рамках крупных проспективных эпидемиологических и рандомизированных исследований. Влияние уровня гликемии, уровня АД и высоких показателей липидов крови на сердечно-сосудистые события были выявлены в крупных международных исследованиях: UKPDS (United Kingdom Prospective Diabetes Study), DECODE (Diabetes Epidemiology: Collaborative analysis of Diagnostic criteria in Europe), Фремингемское исследование, Мюнстерское исследование, исследование MRFIT (Multiple Risk Factor Intervention Trial) и др. Тем не менее, имеется ряд работ, свидетельствующих, что риск атеротромботических событий можно снизить за счет влияния на провосполительный каскад, не изменяя уровень атерогенных липопротеинов. Например, в рамках исследования CANTOS (Anti-Inflammatory Therapy with Canakinumab for Atherosclerotic Disease) иммунодепрессивное средство канакинумаб снижал риск сердечно-сосудистых событий (ОИМ, ОНМК и сердечно-сосудистую смерть) на 15%, не влияя при этом на липидный профиль. Такой результат был достигнут на фоне базовой терапии статинами [25][26].
Таким образом, можно выделить несколько основных свойств, которыми должна обладать суррогатная КТ:
- биологическая взаимосвязь между суррогатной КТ и клиническими проявлениями заболевания;
- подтверждение валидности в крупных эпидемиологических исследованиях;
- демонстрация высокой воспроизводимости в исследованиях;
- наличие РКИ, демонстрирующих взаимосвязь между суррогатными показателями и течением заболевания.
В таблице 1 приведены суррогатные КТ, которые показали связь с исходами в рамках крупных проспективных наблюдательных исследований [27][28].
Таблица 1
Суррогатные КТ, которые изучались в рамках эпидемиологических исследований
Примечание: ЛНП — липопротеины низкой плотности, HbA1c — гликированный гемоглобин. СД-2 — сахарный диабет 2 типа, ОКС — острый коронарный синдром, ССС — сердечно-сосудистая смерть. MRFIT — Multiple Risk Factor Intervention Trial, UKPDS — United Kingdom Prospective Diabetes Study, DECODE — Diabetes Epidemiology: Collaborative analysis of Diagnostic criteria in Europe.
По мнению ряда авторов, даже использование суррогатных КТ эффективности, имеющих высокую корреляцию с “жесткими” КТ, не всегда позволяет оценить его безопасность. Если первичная КТ эффективности исследования — суррогатный показатель, объем выборки и длительность исследования могут быть недостаточными для полноценной оценки профиля безопасности исследуемого препарата [29][30]. Серьезные нежелательные явления могут встречаться нечасто, в связи с этим, в рамках небольших исследований они могут быть не выявлены. Хорошим примером, демонстрирующим целесообразность проведения крупных РКИ не только с целью оценки эффективности ЛП, но и его безопасности, служит первое и крупнейшее исследование по первичной профилактике ССЗ, которое было проведено с клофибратом.
Клофибрат — один из первых гиполипидемических ЛП, созданный на основе инсектицида, который приводил к снижению уровня ХС у сельскохозяйственных работников во Франции. Первые публикации, связывающие ишемическую болезнь сердца и высокую концентрацию ХС, появились в начале 1950г [31]. В 1964г началась подготовка первого большого плацебо-контролируемого РКИ по первичной профилактике ССЗ. Всего было включено >15 тыс. пациентов. В этом исследовании с применением клофибрата удалось продемонстрировать снижение риска сердечно-сосудистых исходов, особенно в группе здоровых добровольцев с исходно высоким уровнем ХС. Тем не менее, в группе клофибрата наблюдалось повышение случаев смерти, обусловленной, главным образом, билиарными и кишечными расстройствами, в т.ч. на фоне развития онкологических процессов, а также холецистэктомий [32]. Этот пример демонстрирует необходимость проведения крупных РКИ не только для оценки профиля эффективности препарата, но и профиля безопасности.
На клинические исходы могут влиять разные показатели: артериальное давление, уровень липидов крови, глюкозы и др. (таблица 1). Проводя исследования с суррогатными КТ, необходимо учитывать эти и другие показатели, которые могут влиять на клинические исходы.
Следует подчеркнуть, что комбинирование “жестких” КТ с суррогатными показателями не рекомендуется. Во-первых, как уже было отмечено ранее, все показатели комбинированной КТ с точки зрения статистической модели равны между собой. Во-вторых, частота суррогатных показателей будет превышать частоту более крупных клинически важных событий, что может привести к устранению влияния последних на результат исследования [33, 34]. Например, в исследовании PREAMI (Perindopril and Remodeling in Elderly with Acute Myocardial Infarction Study) изучалось влияние периндоприла на ремоделирование левого желудочка (ЛЖ) и клинические результаты у пациентов пожилого возраста, перенесших ОИМ. Первичная КТ была комбинированной и включала важные конечные исходы, такие как смерть и госпитализация по поводу декомпенсации ХСН, а также суррогатный показатель в виде ремоделирования ЛЖ. В группе периндоприла первичная КТ была ниже, чем в группе плацебо. Это было достигнуто за счет суррогатного компонента, тогда как различий между группами по жестким компонентам, таким как смерть и госпитализация, не было [35]. В-третьих, такой анализ может быть осложнен такой широко известной в статистике проблемой, как конкурирующие риски (competing risks), когда появление определенных КТ может быть невозможным в связи с наступлением других конечных исходов3.
Несмотря на вышеперечисленные ограничения, суррогатные показатели в качестве критериев оценки эффективности в РКИ применяются достаточно часто. Исследовательская группа (Ravi B. и др.) провела анализ использования первичных КТ в опубликованных РКИ в области кардиоло гии за период 2002-2012гг. Поиск основывался на 8 журналах, входящих в Web of Science. КТ были разделены на клинические “жесткие”, промежуточные и суррогатные. Промежуточные КТ включали симптомы заболевания и функциональные показатели пациентов (толерантность к физической нагрузке, АД, одышка, частота сердечных сокращений, пиковое потребление кислорода, качество жизни). Суррогатные КТ включали все лабораторные тесты, кроме того: размер просвета сосудов, толщину комплекса интима-медиа, ФВ и систолический объем ЛЖ. Всего было проанализировано 1224 РКИ. Исследования с суррогатными (66,8%) и промежуточными (73,9%) КТ в отличие от клинических (56,9%) с большей вероятностью (р<0,001) завершались с положительным результатом. Кроме того, с течением времени число исследований с “жесткими” КТ, которые завершались положительно, снижалось, в отличие от исследований с суррогатными КТ. Относительные пропорции использования КТ за период проведения исследования не различались между собой. Наибольший объем выборки был в исследованиях с “жесткими” КТ, медиана составила 1028 человек, в группе промежуточных — 281 человек и в группе суррогатных показателей — 187 человек. Исследования с суррогатными точками завершались раньше (в среднем 1,6 vs 2,4 лет в исследованиях с “жесткими” КТ), набор пациентов проходил быстрее, и они реже были многонациональными. По источникам финансирования исследования не различались между собой [36].
Данный обзор демонстрирует, что с течением времени число исследований с “жесткими” КТ, которые завершаются положительно для исследуемой терапии, неуклонно снижается. Это может зависеть от разных причин. Одной из возможных причин является мощная сопутствующая базовая терапия, которую в РКИ пациенты принимают согласно современным клиническим рекомендациям. Данные препараты (ингибиторы ангиотензинпревращающего фермента, β-АВ, статины) применяются в клинической практике в связи с наличием РКИ, подтверждающих влияние этих групп препаратов на риск сердечно-сосудистых исходов. Таким образом, новому исследуемому препарату необходимо продемонстрировать свой дополнительный эффект на фоне базовой терапии, которую пациент обязан применять в рамках РКИ согласно современным клиническим рекомендациям. Возможно, по этой причине не удалось продемонстрировать эффективность нового препарата (серелаксина) для пациентов с острой СН в исследовании с “жесткими” КТ RELAX-AHF-2 (Efficacy, Safety and Tolerability of Serelaxin When Added to Standard Therapy in AHF), тогда как в исследовании с суррогатными показателями удалось снизить первичную КТ — RELAX-AHF (Efficacy and Safety of Relaxin for the Treatment of Acute Heart Failure) [37][38].
Вторичный анализ КТ
Отдельного внимания заслуживает интерпретация КТ в рамках вторичного анализа. Положительный результат, полученный при рассмотрении вторичных КТ, можно интерпретировать только в том случае, если будет продемонстрирован эффект лечения по первичной КТ4. В противном случае полученные результаты можно отнести к поисковым. Интересным примером, демонстрирующим это, является оценка эффективности лозартана по сравнению с каптоприлом у пожилых пациентов с СН в рамках исследований ELITE (Evaluation of Losartan in the Elderly Study) (таблица 2). В исследовании ELITE I изучали влияние лозартана на уровень креатинина по сравнению с терапией каптоприлом. Первичная конечная цель исследования была классической суррогатной КТ — изменение уровня креатинина в сыворотке крови. Различия между группами по этому показателю отсутствовали. Однако лечение лозартаном привело к неожиданному снижению смертности. Такой исход был компонентом вторичной КТ эффективности [39], после чего были сделаны ошибочные выводы о влиянии лозартана на смертность у пациентов с ХСН и низкой ФВ. Для подтверждения этого результата по существующим на тот момент принципам было запланировано другое исследование — ELITE II с похожими критериями включения и с первичной КТ — общая смерть [40]. Оно не продемонстрировало преимуществ лозартана в снижении смерти пациентов [41]. Эти примеры являются яркой демонстрацией того, как анализ исследования по вторичной КТ может приводить к неверным выводам.
Таблица 2
Сравнительные исследования лозартана по сравнению с каптоприлом
Примечание: КТ — компьютерная томография, ОИМ — острый инфаркт миокарда, СН — сердечная недостаточность, ССС — сердечно-сосудистая смерть, ФВ — фракция выброса, ФК — функциональный класс, NYHA — New-York Heart Association.
Таким образом, результат, полученный по вторичным КТ, может лишь дополнить полученную информацию по первичному исходу, улучшить понимание механизма действия ЛП и сформировать гипотезу для дальнейших исследований. Например, при оценке эффективность лекарства от остеопороза первичной КТ может быть частота переломов костей, а в качестве вторичной КТ может выступать плотность кости.
Для минимизации возможности неправильной интерпретации и предотвращения манипуляции данными, все изучаемые показатели, а также анализы и последующие субанализы заранее определяются протоколом и статистическим планом исследования (statistical analysis plan). Изменение первичной КТ не допускается в процессе проведения исследования5 [3]. Также необходимо относиться консервативно ко всем ретроспективным (post hoc) анализам в связи с тем, что они не были определены заранее протоколом и статистическим планом исследования (SAP) [15][42].
Заключение
Важность РКИ для современной медицины сложно переоценить. Даже в неблагоприятных эпидемиологических условиях распространения вируса SARSCoV-2 (Severe Acute Respiratory Syndrome CoronaVirus), для поиска новых эффективных препаратов проводятся РКИ [43-47]. Одним из важных аспектов при проведении РКИ является выбор КТ. Вопрос выбора суррогатных (“мягких”) или “жестких” КТ на современном этапе имеет две составляющие. Первая — интерпретация полученных данных на основании проводимых РКИ. При всем удобстве использования суррогатных КТ остаются вопросы, связанные с их ассоциацией с клиническими исходами. Использование “жестких” КТ позволяет лучше и надежнее оценить влияние ЛП на клинически важные исходы. Однако это влияет на дизайн исследования, объем выборки и, в итоге, на стоимость исследовательской программы.
Комбинированные КТ позволяют оценить влияние ЛП на разные клинические состояния; при этом следует понимать, что с точки зрения статистического анализа все компоненты комбинированной КТ равны между собой. При использовании комбинированных КТ желательно проводить последующее наблюдение за пациентами после получения ими несмертельного компонента комбинированной КТ. Это необходимо делать с целью наиболее полной оценки их прогноза к концу исследования.
Вторичные КТ, как правило, предоставляют дополнительную информацию о первичной КТ, состоянии пациента или его заболевании. Положительный результат, полученный в рамках вторичных КТ, можно интерпретировать только в том случае, если будет продемонстрирован эффект лечения по первичной КТ.
Новый ЛП, изучаемый в современных РКИ, как правило, демонстрирует свой эффект на фоне сопутствующей терапии. В реальной клинической практике далеко не все пациенты принимают все необходимые базовые ЛП, которые соответствуют современным клиническим рекомендациям. Можно предположить, что в реальной клинической практике эффект нового ЛП, который был продемонстрирован в РКИ будет больше в связи с более высоким остаточным ССР. Основная проблема снижения риска сердечно-сосудистых событий связана не столько с отсутствием новых ЛП, которые снижают риск, сколько с низкой частотой назначений ЛП, снижающих эти исходы и с низкой приверженностью пациентов к терапии [48-50].
Отношения и деятельность. Навасардян А.Р. является руководителем региональных медицинских советников в компании АО “Байер”. Этот факт не оказал влияния на содержание публикации и все авторы заявляют об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.
1. International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use (ICH). International Conference on Harmonisation. ICH harmonized tripartite guideline E9. Statistical principals for clinical trials. https://www.ich.org/page/efficacy-guidelines. (24.11.2021).
2. FDA (U. S. Food and Drug Administration). Multiple Endpoints in Clinical Trials. Guidance for Industry. Draft Guidance. http://www.fda.gov/downloads/Drugs/GuidanceComplianceRegulatoryInformation/Guidances/UCM536750.pdf (24.11.2021).
3. FDA (U.S. Food and Drug Administration).
4. FDA (U.S. Food and Drug Administration).
5. Там же.
Список литературы
1. Hill AB. Memories of the British Streptomycin Trial in Tuberculosis. The first randomized clinical trial. Control Clin Trials. 1990;11(2):77-9. doi:10.1016/0197-2456(90)90001-i.
2. Streptomycin in Tuberculosis Trials Committee. Streptomycin treatment of pulmonary tuberculosis. Br Med J. 1948;2(4582): 769-82.
3. Huitfeldt B, Danielson L, Ebbutt A, et al. Choice of Control in Clinical Trials–Issues and Implications of ICH-E10. Ther Innov Regul Sci. 2001;35(4):1147-56. doi:10.1177/009286150103500411.
4. Mauri L, Kereiakes DJ, Yeh RW, et al. Twelve or 30 months of dual antiplatelet therapy after drug-eluting stents. N Engl J Med. 2014;371(23):2155-66. doi:10.1056/NEJMoa1409312.
5. Moher D, Dulberg CS, Wells GA. Statistical power, sample size, and their reporting in randomized controlled trials. JAMA. 1994;272(2):122-4. doi:10.1001/jama.1994.03520020048013.
6. Stolberg HO, Norman G, Trop I. Randomized controlled trials. AJR Am J Roentgenol. 2004;183(6):1539-44. doi:10.2214/ajr.183.6.01831539.
7. Sankoh AJ, Li H, D’Agostino RB Sr. Composite and multicomponent end points in clinical trials. Stat Med. 2017;36(28):4437-40. doi:10.1002/sim.7386.
8. Ferreira-González I, Busse JW, Heels-Ansdell D, et al. Problems with use of composite end points in cardiovascular trials: systematic review of randomised controlled trials. BMJ. 2007;334(7597):786. doi:10.1136/bmj.39136.682083.AE.
9. Chi GY. Some issues with composite endpoints in clinical trials. Fundam Clin Pharmacol. 2005;19(6):609-19. doi:10.1111/j.14728206.2005.00370.x.
10. Шарашова Е. Е., Холматова К. К., Горбатова М. А. и др. Применение анализа выживаемости в здравоохранении с использованием пакета статистических программ SPSS. Наука и здравоохранение. 2017;5:5-28.
11. Rauch G, Kieser M. An expected power approach for the assessment of composite endpoints and their components. Comput Stat Data An. 2013;60:111-22. doi:10.1016/j.csda.2012.11.001.
12. Lubsen J, Kirwan BA. Combined endpoints: can we use them? Stat Med. 2002;21(19):2959-70. doi:10.1002/sim.1300.
13. Cannon CP. Clinical perspectives on the use of composite endpoints. Control Clin Trials. 1997;18(6):517-29; discussion 546-9. doi:10.1016/s0197-2456(97)00005-6.
14. Freemantle N, Calvert M, Wood J, et al. Composite outcomes in randomized trials: greater precision but with greater uncertainty? JAMA. 2003;289(19):2554-9. doi:10.1001/jama.289.19.2554.
15. Kleist P. Composite Endpoints for Clinical Trials. Int J Pharm Med. 2007; 21(3):187-98. doi:10.2165/00124363-200721030-00001.
16. Neaton JD, Gray G, Zuckerman BD, et al. Key issues in end point selection for heart failure trials: composite end points. J Card Fail. 2005;11(8):567-75. doi:10.1016/j.cardfail.2005.08.350.
17. Bethel MA, Holman R, Haffner SM, et al. Determining the most appropriate components for a composite clinical trial outcome. Am Heart J. 2008;156(4):633-40. doi:10.1016/j.ahj.2008.05.018.
18. Dormandy JA, Charbonnel B, Eckland DJ, et al. Secondary prevention of macrovascular events in patients with type 2 diabetes in the PROactive Study (PROspective pioglitAzone Clinical Trial in macroVascular Events): a randomised controlled trial. Lancet. 2005;366(9493):1279-89. doi:10.1016/S01406736(05)67528-9.
19. Raskob GE, Büller HR, Segers A. Edoxaban for CancerAssociated Venous Thromboembolism. N Engl J Med. 2018;379(1):95-6. doi:10.1056/NEJMc1806646.
20. Echt DS, Liebson PR, Mitchell LB, et al. Mortality and morbidity in patients receiving encainide, flecainide, or placebo. The Cardiac Arrhythmia Suppression Trial. N Engl J Med.1991;324(12):781-8. doi:10.1056/NEJM199103213241201.
21. Hatzizacharias A, Makris T, Krespi P, et al. Intermittent milrinone effect on long-term hemodynamic profile in patients with severe congestive heart failure. Am Heart J. 1999;138(2 Pt 1):241-6. doi:10.1016/s0002-8703(99)70107-9.
22. Uretsky BF, Jessup M, Konstam MA, et al. Multicenter trial of oral enoximone in patients with moderate to moderately severe congestive heart failure. Lack of benefit compared with placebo. Enoximone Multicenter Trial Group. Circulation. 1990;82(3):77480. doi:10.1161/01.cir.82.3.774.
23. Elis A, Bental T, Kimchi O, et al. Intermittent dobutamine treatment in patients with chronic refractory congestive heart failure: a randomized, double-blind, placebo-controlled study. Clin Pharmacol Ther. 1998;63(6):682-5. doi:10.1016/S0009-9236(98)90092-3.
24. Агеев Ф. Т., Арутюнов Г. П., Беграмбекова Ю. Л. и др. Хроническая сердечная недостаточность. Клинические рекомендации 2020. Российский кардиологический журнал. 2020;25(11):4083. doi:10.15829/1560-4071-2020-4083.
25. Ridker PM, Everett BM, Thuren T, et al. Antiinflammatory Therapy with Canakinumab for Atherosclerotic Disease. N Engl J Med. 2017;377(12):1119-31. doi:10.1056/NEJMoa1707914.
26. Соловьева А. Е., Кобалава Ж. Д. Перспективы противовоспалительной терапии атеросклероза. Клин фармакол тер. 2014;23(3):28-38.
27. Psaty BM, Lumley T. Surrogate end points and FDA approval: a tale of 2 lipid-altering drugs. JAMA. 2008;299(12):1474-6. doi:10.1001/jama.299.12.1474.
28. Duivenvoorden R, de Groot E, Stroes ES, et al. Surrogate markers in clinical trials–challenges and opportunities. Atherosclerosis. 2009;206(1):8-16. doi:10.1016/j.atherosclerosis.2008.12.009.
29. Biomarkers Definitions Working Group. Biomarkers and surrogate endpoints: preferred definitions and conceptual framework. Clin Pharmacol Ther. 2001;69(3):89-95. doi:10.1067/mcp.2001.113989.
30. D’Agostino RB Jr. Debate: The slippery slope of surrogate outcomes. Curr Control Trials Cardiovasc Med. 2000;1(2):76-8. doi:10.1186/cvm-1-2-076.
31. Gofman JW, Jones HB, Lindgren FT, et al. Blood lipids and human atherosclerosis. Circulation. 1950;2(2):161-78. doi:10.1161/01.cir.2.2.161.
32. Oliver M. The clofibrate saga: a retrospective commentary. Br J Clin Pharmacol. 2012;74(6):907-10. doi:10.1111/j.13652125.2012.04282x.
33. Freedman LS, Graubard BI, Schatzkin A. Statistical validation of intermediate endpoints for chronic diseases. Stat Med. 1992;11(2):167-78. doi:10.1002/sim.4780110204.
34. Lin DY, Fleming TR, De Gruttola V. Estimating the proportion of treatment effect explained by a surrogate marker. Stat Med. 1997;16(13):1515-27. doi:10.1002/(sici)10970258(19970715)16:13<1515::aid-sim572>3.0.co;2-1.
35. Ferrari R, Perindopril and Remodeling in Elderly with Acute Myocardial Infarction Investigators. Effects of angiotensinconverting enzyme inhibition with perindopril on left ventricular remodeling and clinical outcome: results of the randomized Perindopril and Remodeling in Elderly with Acute Myocardial Infarction (PREAMI) Study. Arch Intern Med. 2006;166(6):659-66. doi:10.1001/archinte.166.6.659.
36. Patel RB, Vaduganathan M, Samman-Tahhan A, et al. Trends in Utilization of Surrogate Endpoints in Contemporary Cardiovascular Clinical Trials. Am J Cardiol. 2016;117(11):184550. doi:10.1016/j.amjcard.2016.03.021.
37. Teerlink JR, Cotter G, Davison BA, et al. Serelaxin, recombinant human relaxin-2, for treatment of acute heart failure (RELAX-AHF): a randomised, placebo-controlled trial. Lancet. 2013;381(9860):29-39. doi:10.1016/S01406736(12)61855-8.
38. Metra M, Teerlink JR, Cotter G, et al. Effects of Serelaxin in Patients with Acute Heart Failure. N Engl J Med. 2019;381(8):71626. doi:10.1056/NEJMoa1801291.
39. Pitt B, Segal R, Martinez FA, et al. Randomised trial of losartan versus captopril in patients over 65 with heart failure (Evaluation of Losartan in the Elderly Study, ELITE). Lancet. 1997;349(9054):747-52. doi:10.1016/s0140-6736(97)01187-2.
40. Pitt B, Poole-Wilson P, Segal R, et al. Effects of losartan versus captopril on mortality in patients with symptomatic heart failure: rationale, design, and baseline characteristics of patients in the Losartan Heart Failure Survival Study-ELITE II. J Card Fail. 1999;5(2):146-54. doi:10.1016/s1071-9164(99)90037-4.
41. Pitt B, Poole-Wilson PA, Segal R, et al. Effect of losartan compared with captopril on mortality in patients with symptomatic heart failure: randomised trial-the Losartan Heart Failure Survival Study ELITE II. Lancet. 2000;355(9215):1582-7. doi:10.1016/s0140-6736(00)02213-3.
42. Марцевич С. Ю. И вновь продолжается спор: какой прямой антикоагулянт более эффективен и безопасен при назначении больным с фибрилляцией предсердий. Рациональная Фармакотерапия в Кардиологии. 2020;16(4):635-7. doi:10.20996/1819-64462020-08-09.
43. Cao B, Wang Y, Wen D, et al. Trial of Lopinavir-Ritonavir in Adults Hospitalized with Severe Covid-19. N Engl J Med. 2020;382(19):1787-99. doi:10.1056/NEJMoa2001282.
44. Явелов И. С. Применение антикоагулянтов после выписки больных COVID-19: что мы знаем к концу 2021 года. Рациональная Фармакотерапия в Кардиологии. 2021;17(6):908-15. doi:10.20996/1819-6446-2021-12-07.
45. Колбин А. С. Ранняя оценка эффективности лекарственных средств при лечении больных с COVID-19. Инфекция и иммунитет. 2020;10(2):277-86. doi:10.15789/2220-7619-AEA-1458.
46. Навасардян А. Р., Марцевич С. Ю., Габай П. Г. Назначение лекарственных препаратов не в соответствии с официальной инструкцией по медицинскому применению (off-label), клинические рекомендации, стандарты оказания медицинской помощи и правовое регулирование в Российской Федерации. Часть 2. Рациональная Фармакотерапия в Кардиологии. 2021;17(2):286-93. doi:10.20996/1819-6446-2021-04-01.
47. Martsevich SYu, Lukina YV, Zharkova ED, et al. Treatment Adherence to Drug Therapy in Patients with Stable Coronary Artery Disease During the COVID-19 Pandemic. Rational Pharmacotherapy in Cardiology. 2021;17(1):99-104. doi:10.20996/1819-6446-2021-01-06.
48. Лукина Ю. В., Кутишенко Н. П., Марцевич С. Ю., Драпкина О. М. Разработка и валидизация новых опросников в медицине на примере шкалы приверженности лекарственной терапии. Рациональная Фармакотерапия в Кардиологии. 2021;17(4):576-83. doi:10.20996/1819-6446-2021-08-02.
49. Марцевич С. Ю., Навасардян А. Р., Захарова Н. А., Лукьянов М. М. Новые оральные антикоагулянты: можно ли результаты международных контролируемых исследований с этими препаратами переносить на российских больных? Кардиоваскулярная терапия и профилактика. 2015;14:48-52. doi:10.15829/1728-8800-2015-548-52.
50. Лукина Ю. В., Кутишенко Н. П., Марцевич С. Ю., Драпкина О. М. Опросники и шкалы для оценки приверженности к лечению — преимущества и недостатки диагностического метода в научных исследованиях и реальной клинической практике. Кардиоваскулярная терапия и профилактика. 2020;19(3):2562. doi:10.15829/1728-8800-2020-2562.
Об авторах
А. Р. НавасардянРоссия
Артур Рубенович Навасардян — кандидат медицинских наук, руководитель группы региональных медицинских советников компании.
Москва, Тел.: +7 (926) 558-38-81
С. Ю. Марцевич
Россия
Сергей Юрьевич Марцевич — доктор медицинских наук, профессор, руководитель отдела профилактической фармакотерапии.
Москва
Дополнительные файлы
Рецензия
Для цитирования:
Навасардян А.Р., Марцевич С.Ю. Конечные точки: виды, особенности выбора, интерпретация полученных результатов на примере кардиологических исследований. Кардиоваскулярная терапия и профилактика. 2022;21(5):3243. https://doi.org/10.15829/1728-8800-2022-3243
For citation:
Navasardyan A.R., Martsevich S.Yu. Endpoints: types, selection, interpretation of the results obtained on the example of cardiology studies. Cardiovascular Therapy and Prevention. 2022;21(5):3243. (In Russ.) https://doi.org/10.15829/1728-8800-2022-3243