<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">cardiovascular</journal-id><journal-title-group><journal-title xml:lang="ru">Кардиоваскулярная терапия и профилактика</journal-title><trans-title-group xml:lang="en"><trans-title>Cardiovascular Therapy and Prevention</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1728-8800</issn><issn pub-type="epub">2619-0125</issn><publisher><publisher-name>«SILICEA-POLIGRAF» LLC</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.15829/1728-8800-2025-4597</article-id><article-id custom-type="edn" pub-id-type="custom">CUZOEV</article-id><article-id custom-type="elpub" pub-id-type="custom">cardiovascular-4597</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ФАКТОРЫ РИСКА СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>RISK FACTORS FOR CARDIOVASCULAR DISEASES</subject></subj-group></article-categories><title-group><article-title>Анализ инделов без сдвига рамки считывания в белках, ассоциированных с сердечно-сосудистыми заболеваниями</article-title><trans-title-group xml:lang="en"><trans-title>Analysis of inframe indels in cardiovascular disease-­associated proteins</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-7867-9509</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Раменский</surname><given-names>В. Е.</given-names></name><name name-style="western" xml:lang="en"><surname>Ramenskiy</surname><given-names>V. E.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Раменский Василий Евгеньевич — к.ф.м.н., доцент, руководитель лаборатории геномной и медицинской биоинформатики, в.н.с., руководитель научной группы "ИИ в биоинформатике и медицине" Института перспективных исследований проблем искусственного интеллекта и интеллектуальных систем, факультет биоинженерии и биоинформатики</p><p>Петроверигский пер., д. 10, стр.3, Москва, 101990, </p><p>Ленинские горы, д.1, Москва, 119991</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990, </p><p>Leninskie gory, 1, Moscow, 119991</p></bio><email xlink:type="simple">ramensky@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-2798-9811</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Зайченока</surname><given-names>М.</given-names></name><name name-style="western" xml:lang="en"><surname>Zaychenoka</surname><given-names>M.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Зайченока Мария — аспирант</p><p>Петроверигский пер., д. 10, стр.3, Москва, 101990, </p><p>Институтский переулок, д. 9, г. Долгопрудный, Московская область, 141701</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990,</p><p>Institutsky Ln., 9, Dolgoprudny, Moscow region, 141701</p></bio><email xlink:type="simple">marija.zaicenoka@gmail.com</email><xref ref-type="aff" rid="aff-2"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-4765-8021</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Киселева</surname><given-names>А. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Kiseleva</surname><given-names>A. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Киселева Анна Витальевна — к.б.н., руководитель лаборатории молекулярной генетики, в.н.с.</p><p>Петроверигский пер., д. 10, стр.3, Москва, 10199</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990</p></bio><email xlink:type="simple">sanyutabe@gmail.com</email><xref ref-type="aff" rid="aff-3"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-5932-1744</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Букаева</surname><given-names>А. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Bukaeva</surname><given-names>А. А.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Букаева Анна Александровна — н.с. лаборатории клиномики</p><p>Петроверигский пер., д. 10, стр.3, Москва, 10199</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990</p></bio><email xlink:type="simple">annbukaeva@gmail.com</email><xref ref-type="aff" rid="aff-3"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-7989-0760</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Ершова</surname><given-names>А. И.</given-names></name><name name-style="western" xml:lang="en"><surname>Ershova</surname><given-names>A. I.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Ершова Александра Игоревна — д.м.н., руководитель лаборатории клиномики, зам. директора по фундаментальной науке</p><p>Петроверигский пер., д. 10, стр.3, Москва, 10199</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990</p></bio><email xlink:type="simple">alersh@mail.ru</email><xref ref-type="aff" rid="aff-3"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-5989-6233</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Мешков</surname><given-names>А. Н.</given-names></name><name name-style="western" xml:lang="en"><surname>Meshkov</surname><given-names>A. N.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Мешков Алексей Николаевич — д.м.н., руководитель Института персонализированной терапии и профилактики</p><p>Петроверигский пер., д. 10, стр.3, Москва, 10199</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990</p></bio><email xlink:type="simple">ANMeshkov@cardio.ru</email><xref ref-type="aff" rid="aff-3"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-4453-8430</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Драпкина</surname><given-names>О. М.</given-names></name><name name-style="western" xml:lang="en"><surname>Drapkina</surname><given-names>O. M.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Драпкина Оксана Михайловна — д.м.н., профессор, академик РАН, директор</p><p>Петроверигский пер., д. 10, стр.3, Москва, 10199</p></bio><bio xml:lang="en"><p>Petroverigsky, 10, bld. 3, Moscow, 101990</p></bio><email xlink:type="simple">ODrapkina@gnicpm.ru</email><xref ref-type="aff" rid="aff-3"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России;&#13;
ФГБОУ ВО "Московский государственный университет им. М. В. Ломоносова"</institution></aff><aff xml:lang="en"><institution>National Medical Research Center for Therapy and Preventive Medicine;&#13;
Lomonosov Moscow State University</institution></aff></aff-alternatives><aff-alternatives id="aff-2"><aff xml:lang="ru"><institution>ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России;&#13;
ФГАОУ ВО "Московский физико-технический институт (национальный исследовательский университет)"</institution></aff><aff xml:lang="en"><institution>National Medical Research Center for Therapy and Preventive Medicine;&#13;
Moscow Institute of Physics and Technology (National Research University)</institution></aff></aff-alternatives><aff-alternatives id="aff-3"><aff xml:lang="ru"><institution>ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России</institution></aff><aff xml:lang="en"><institution>National Medical Research Center for Therapy and Preventive Medicine</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2025</year></pub-date><pub-date pub-type="epub"><day>08</day><month>02</month><year>2026</year></pub-date><volume>24</volume><issue>12</issue><fpage>4597</fpage><lpage>4597</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Раменский В.Е., Зайченока М., Киселева А.В., Букаева А.А., Ершова А.И., Мешков А.Н., Драпкина О.М., 2026</copyright-statement><copyright-year>2026</copyright-year><copyright-holder xml:lang="ru">Раменский В.Е., Зайченока М., Киселева А.В., Букаева А.А., Ершова А.И., Мешков А.Н., Драпкина О.М.</copyright-holder><copyright-holder xml:lang="en">Ramenskiy V.E., Zaychenoka M., Kiseleva A.V., Bukaeva А.А., Ershova A.I., Meshkov A.N., Drapkina O.M.</copyright-holder><license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://cardiovascular.elpub.ru/jour/article/view/4597">https://cardiovascular.elpub.ru/jour/article/view/4597</self-uri><abstract><sec><title>Цель</title><p>Цель. Описание распространенности и локализации, а также патогенности и пенетрантности инделов без сдвига рамки считывания в клинически значимых генах, ассоциированных с сердечнососудистыми заболеваниями (ССЗ).</p></sec><sec><title>Материал и методы</title><p>Материал и методы. Использовались базы данных ClinVar, dbSNP, а также результаты секвенирования образцов из различных российских когорт. Аннотация вариантов генома проводилась с помощью программы ENSEMBL VEP.</p></sec><sec><title>Результаты</title><p>Результаты. Отобраны 42 гена, ассоциированные с 22 ССЗ, проанализированы описанные в базе ClinVar инделы в генах из этой выборки. Наблюдается большой разброс числа инделов в этих генах и их распределения по типам клинической значимости. Инделы значительно менее распространены, но при этом более патогенны, чем несинонимичные варианты (миссенсы). В случае кардиомиопатий, миопатий и сосудистых заболеваний инделы, как каузальные варианты, наиболее редки, а в случае аритмий и гиперхолестеринемии, напротив, встречаются чаще. Показано, что патогенные инделы редко наблюдаются в повторах последовательности или в участках низкой сложности, а доброкачественные инделы реже попадают в участки последовательности, аннотированные как функциональные домены Pfam. На основе анализа &gt;6800 секвенированных образцов из различных российских когорт был сделан вывод о достаточно высокой пенетрантности исследованных патогенных инделов, описаны потенциально специфичные для российской популяции примеры патогенных инделов.</p></sec><sec><title>Заключение</title><p>Заключение. Впервые систематически описаны свойства определенного типа вариантов генома — инделов без сдвига рамки считывания — в ключевых генах ССЗ. Полученные результаты подчеркивают клиническую важность инделов в белках с точки зрения их каузальности и пенетрантности, несмотря на их меньшую распространенность по сравнению с несинонимичными вариантами.</p></sec></abstract><trans-abstract xml:lang="en"><sec><title>Aim</title><p>Aim. To describe the prevalence, location, pathogenicity, and penetrance of inframe indels in clinically significant genes associated with cardiovascular diseases (CVD).</p></sec><sec><title>Material and methods</title><p>Material and methods. We used the ClinVar and dbSNP databases, as well as sequencing data from samples from various Russian cohorts. Genome variant annotation was performed using the ENSEMBL VEP program.</p></sec><sec><title>Results</title><p>Results. Forty-two genes associated with 22 CVDs were selected, and indels in the genes from this sample, described in the ClinVar database, were analyzed. A wide range of indel numbers and their distribution by type of clinical significance was observed. Indels are significantly less common, but are more pathogenic than non-synonymous variants (missenses). Indels, as causal variants, are the rarest in cardiomyopathies, myopathies, and vascular diseases, while they are more common in arrhythmias and hypercholesterolemia. Pathogenic indels were shown to be rarely observed in sequence repeats or low-complexity regions, while benign indels were less frequently observed in sequence regions annotated as Pfam functional domains. Based on the analysis of &gt;6800 sequenced samples from various Russian cohorts, we revealed that the studied pathogenic indels have a relatively high penetrance. Examples of pathogenic indels potentially specific to the Russian population are described.</p></sec><sec><title>Conclusion</title><p>Conclusion. For the first time, the characteristics of a certain type of genomic variant (inframe indels) in key CVD genes have been systematically described. The obtained results highlight the clinical importance of causality and penetrance of protein indels, despite their lower prevalence compared to nonsynonymous variants.</p></sec></trans-abstract><kwd-group xml:lang="ru"><kwd>варианты генома человека</kwd><kwd>инделы</kwd><kwd>сердечнососудистые заболевания</kwd><kwd>пенетрантность</kwd></kwd-group><kwd-group xml:lang="en"><kwd>human genome variants</kwd><kwd>indels</kwd><kwd>cardiovascular diseases</kwd><kwd>penetrance</kwd></kwd-group><funding-group><funding-statement xml:lang="ru">Государственное задание "Разработка модели предсказания пенетрантности и экспрессивности причинных вариантов наследственных моногенных заболеваний сердечно-сосудистой системы".</funding-statement><funding-statement xml:lang="en">State assignment "Development of a Model for Predicting the Penetrance and Expressivity of Causal Variants in Hereditary Monogenic Cardiovascular Diseases"</funding-statement></funding-group></article-meta></front><body><sec><title>Введение</title><p>Термином "инделы" (англ. insertions and deletions) традиционно называют вставки (инсерции) и удаления (делеции) коротких участков генома, которые неизбежно происходят при репликации или репарации геномной дезоксирибонуклеиновой кислоты (ДНК) [<xref ref-type="bibr" rid="cit1">1</xref>]. Инделы являются наиболее распространенным после однонуклеотидных вариантов типом полиморфизма генома [<xref ref-type="bibr" rid="cit2">2</xref>]. В экзоме (совокупности всех участков генома, кодирующих белки) эффект инделов определяется в первую очередь их длиной: если она не кратна трем, происходит сдвиг рамки считывания гена, что сопровождается появлением раннего стоп-кодона, укорачивает белок и приводит к его деградации. В большинстве случаев такие инделы вызывают полную или частичную потерю белка [<xref ref-type="bibr" rid="cit3">3</xref>].</p><p>Предмет настоящего исследования составляют вставки или удаления участков экзонов с длиной, кратной трем нуклеотидам, что сохраняет рамку считывания гена и удаляет или добавляет несколько аминокислотных остатков в последовательность белка. Такие варианты генома (inframe indels, далее просто "инделы") представляют большой интерес ввиду широты их функциональных и фенотипических проявлений [<xref ref-type="bibr" rid="cit4">4</xref>]. В базе ClinVar, которая содержит информацию о вариантах генома человека, в первую очередь в связи с моногенными заболеваниями, в марте 2024г было описано примерно по 3 тыс. патогенных и доброкачественных инделов и ~18 тыс. инделов с неизвестной или противоречивой клинической значимостью [<xref ref-type="bibr" rid="cit5">5</xref>]. В качестве "классического" примера безусловно патогенного индела можно привести удаление единственного остатка фенилаланина ΔF508 в белке CFTR, являющееся наиболее частой причиной муковисцидоза [<xref ref-type="bibr" rid="cit6">6</xref>]. В то же время, в последние годы в геномной базе gnomAD v.4.1.0 описано &gt;300 тыс. инделов, подавляющее большинство из которых функционально и эволюционно нейтральны [<xref ref-type="bibr" rid="cit2">2</xref>].</p><p>Функциональная роль инделов, таким образом, весьма разнообразна и аналогична таковой у несинонимичных вариантов (миссенсов). Однако, если последним в клинических рекомендациях по интерпретации данных секвенирования Американской коллегии медицинской генетики и геномики (American College of Medical Genetics, или ACMG) [<xref ref-type="bibr" rid="cit7">7</xref>] отводится, как минимум, девять достаточно развернутых критериев для классификации их клинической значимости, то в случае инделов основные рекомендации сводятся к тому, что, с одной стороны, вероятность патогенности растет по мере увеличения эволюционной консервативности изменяемого участка белка, а также увеличения его длины, а с другой, короткие инделы в повторяющихся участках последовательности белка или в участках с низкой консервативностью (и, тем самым, предположительно без известной функции) будут патогенными с меньшей степенью вероятности. В отечественном "Руководстве по интерпретации данных, полученных методами массового параллельного секвенирования" [<xref ref-type="bibr" rid="cit8">8</xref>], критерием патогенности предлагается считать уже сам факт расположения индела в неповторяющемся участке белка, без учета степени его консервативности.</p><p>Можно предложить несколько причин, почему инделы часто оказываются "в тени" миссенсов и остаются за рамками исследований [9-11]. Во-первых, это их меньшая распространенность: по данным UK Biobank (Биобанка Великобритании), экзом представителя европейской популяции содержит, в среднем, 115 инделов vs 9292 несинонимичных вариантов [<xref ref-type="bibr" rid="cit12">12</xref>]. Во-вторых, для последних существуют методологии экспериментального анализа, в частности, с помощью глубокого мутационного сканирования (ГМС) [<xref ref-type="bibr" rid="cit13">13</xref>], а также многочисленные вычислительные методы для предсказания эффекта [<xref ref-type="bibr" rid="cit14">14</xref>]. Полученные этими методами результаты используются как дополнительные критерии при клинической интерпретации [<xref ref-type="bibr" rid="cit7">7</xref>][<xref ref-type="bibr" rid="cit8">8</xref>]. Возможность использовать ГМС для описания функционального эффекта инделов появилась совсем недавно [<xref ref-type="bibr" rid="cit15">15</xref>]. Вычислительные методы для предсказания эффекта инделов не так многочисленны, как для миссенсов, однако в последние годы по мере развития методов глубокого обучения в этой области наблюдается определенный прогресс [<xref ref-type="bibr" rid="cit16">16</xref>][<xref ref-type="bibr" rid="cit17">17</xref>]. Так, на портале ProteinGym производится систематизация и единообразная оценка эффективности различных предсказательных методов как для миссенсов, так и для инделов1. В-третьих, существуют определенные сложности при определении (коллинге) инделов по данным высокопроизводительного секвенирования, в результате чего различные методы могут по-разному определять инделы в одном и том же образце [<xref ref-type="bibr" rid="cit9">9</xref>][<xref ref-type="bibr" rid="cit18">18</xref>], а в базах данных может быть неполная информация об их частоте в популяциях [<xref ref-type="bibr" rid="cit8">8</xref>]. Наконец, возможны определенные трудности при компактном, удобном и однозначном описании индела как изменения последовательности белка и соотнесения его с изменением геномной ДНК [<xref ref-type="bibr" rid="cit19">19</xref>]. Как одно из следствий, различные вычислительные методы для предсказания или аннотации инделов требуют отдельной подготовки входных данных. Также затрудняется сравнение обнаруженного индела с описанными ранее в литературе или в базах данных. Отчасти эти трудности преодолеваются строгим соблюдением номенклатуры Human Genome Variation Society (HGVS) при описании вариантов последовательностей белков и ДНК [<xref ref-type="bibr" rid="cit20">20</xref>].</p><p>Систематический поиск в базе данных PubMed термина "in-frame indels" или "inframe indels" дает 53 публикации, в части из которых описывается роль инделов в генах, ассоциированных, в частности, с раком молочной железы, эндометриальной карциномой, педиатрической хордомой и др. видах онкологических и нейродегенеративных заболеваний; а также с синдромами Нунан, Фанкони-Бикеля, семейной почечной глюкозурией, заболеваниями глаз, в т.ч. ретинальной дистрофией. При этом не удалось обнаружить какие-либо исследования, относящиеся к роли инделов в этиологии наиболее значимых и распространенных сердечно-сосудистых заболеваний (ССЗ).</p><p>Целью настоящего исследования было описание распространенности и локализации, а также патогенности и пенетрантности инделов без сдвига рамки считывания в клинически значимых генах, ассоциированных с ССЗ. Для этого были решены следующие две основные задачи: анализ клинико-генетической базы данных ClinVar, содержащей информацию о связи вариантов генома с моногенными заболеваниями, а также исследование &gt;6800 секвенированных в ФГБУ "НМИЦ ТПМ" Минздрава России (далее — НМИЦ ТПМ) образцов из различных российских когорт [21-23].</p></sec><sec><title>Материал и методы</title><p>Для выбора группы генов, достоверно ассоциированных с ССЗ, использовался предложенный коллегией ACMG список генов, содержащих так называемые вторичные находки, т.е. патогенные или потенциально патогенные варианты, о наличии которых носителю предлагается сообщать вне зависимости от первоначальных причин прохождения генетического тестирования [<xref ref-type="bibr" rid="cit24">24</xref>]. В нашей работе была использована предложенная совместно ACMG и консорциумом ClinGen современная версия списка 3.3, которая содержит 84 гена, ассоциированных с 85 заболеваниями преимущественно с доминантным типом наследования2. В основном, это различные виды наследственных опухолевых синдромов или ССЗ; некоторые гены ассоциированы более чем с одним заболеванием. Было отобрано 42 гена, образующих 61 пары с 22 ССЗ, которые можно условно разбить на четыре группы: кардиомиопатии или миопатии; гиперхолестеринемия; аритмии; сосудистые нарушения (таблица 1). Для описания заболеваний также используются идентификаторы MONDO (Mondo Disease Ontology) [<xref ref-type="bibr" rid="cit25">25</xref>].</p><table-wrap id="table-1"><caption><p>Таблица 1</p><p>Отобранные для анализа 42 гена и 22 ассоциированных с ними заболевания</p><p>Примечание: приведены идентификаторы заболеваний в базе MONDO (Mondo Disease Ontology).</p></caption><table><tbody><tr><td>Гены</td><td>Заболевание</td></tr><tr><td>Кардиомиопатии, миопатии</td></tr><tr><td>ACTC1, KCNQ1, MYBPC3, MYH7, MYL2, MYL3, TNNC1, TNNI3, TNNT2, TPM1</td><td>MONDO:0005045 Гипертрофическая кардиомиопатия</td></tr><tr><td>ACTC1, BAG3, DES, FLNC, LMNA, MYH7, RBM20, SCN5A, TNNC1, TNNI3, TNNT2, TPM1, TTN</td><td>MONDO:0005021 Дилатационная кардиомиопатия</td></tr><tr><td>PLN</td><td>MONDO:0000591 Внутренняя кардиомиопатия</td></tr><tr><td>PRKAG2</td><td>MONDO:0800484 Кардиомиопатия, связанная с геном PRKAG2</td></tr><tr><td>DES, DSG2, PKP2, PLN</td><td>MONDO:0016587 Аритмогенная кардиомиопатия правого желудочка</td></tr><tr><td>DSP</td><td>MONDO:0011581 Аритмогенная кардиомиопатия с шерстистыми волосами и кератодермией</td></tr><tr><td>FLNC</td><td>MONDO:0018943 Миофибриллярная миопатия</td></tr><tr><td>Гиперхолестеринемия</td></tr><tr><td>LDLR</td><td>MONDO:0007750 Гиперхолестеринемия, семейная, 1 типа</td></tr><tr><td>PCSK9</td><td>MONDO:0011369 Гиперхолестеринемия, аутосомно-доминантная, 3 типа</td></tr><tr><td>APOB</td><td>MONDO:0007751 Гиперхолестеринемия, аутосомно-доминантная, тип Б</td></tr><tr><td>Аритмии</td></tr><tr><td>CALM1, CALM2, CALM3, KCNH2, KCNQ1, TRDN</td><td>MONDO:0002442 Синдром удлиненного интервала QT</td></tr><tr><td>KCNH2, KCNQ1</td><td>MONDO:0000453 Синдром короткого интервала QT</td></tr><tr><td>SCN5A</td><td>MONDO:0015263 Синдром Бругада</td></tr><tr><td>SCN5A</td><td>MONDO:0019171 Семейный синдром удлиненного интервала QT</td></tr><tr><td>CALM1, CALM2, CALM3, CASQ2, RYR2, TRDN</td><td>MONDO:0017990 Катехоламинергическая полиморфная желудочковая тахикардия</td></tr><tr><td>KCNQ1</td><td>MONDO:0002441 Синдром Джервелла и Ланге-Нильсена</td></tr><tr><td>DSC2</td><td>MONDO:0016342 Семейная изолированная аритмогенная дисплазия правого желудочка</td></tr><tr><td>TMEM43</td><td>MONDO:0011459 Аритмогенная дисплазия правого желудочка 5</td></tr><tr><td>Сосудистые заболевания</td></tr><tr><td>SMAD3</td><td>MONDO:0013426 Синдром аневризмы-остеоартрита</td></tr><tr><td>FBN1, MYH11, SMAD3, TGFBR1, TGFBR2</td><td>MONDO:0019625 Семейная аневризма грудной аорты и расслоение аорты</td></tr><tr><td>ACVRL1</td><td>MONDO:0008535 Телеангиэктазия, наследственная геморрагическая, тип 1</td></tr><tr><td>ENG</td><td>MONDO:0010880 Телеангиэктазия, наследственная геморрагическая, тип 2</td></tr></tbody></table></table-wrap><p>В качестве источника патогенных и прочих вариантов в этих генах была использована база данных ClinVar (версия от 06/25), из нее извлекались пары "вариант-заболевание" с клинической значимостью в контексте данного заболевания (патогенный, доброкачественный и т.д.) и уникальным идентификатором RCVnnnnnn. Тем самым разрешаются потенциальные противоречия, когда один и тот же вариант классифицируется по-разному в связке с различными заболеваниями. Для описания вариантов без привязки к тому или иному заболеванию в ClinVar также используются идентификаторы VCVnnnnnn.</p><p>Для аннотации вариантов использовалась программа ENSEMBL VEP (Variant Effect Predictor), с помощью которой варианты картировались на репрезентативные и качественные транскрипты генов из набора MANE (Matched Annotation from NCBI and EBI) Select [<xref ref-type="bibr" rid="cit26">26</xref>]. Тем самым однозначно фиксируются координаты индела в белке, что особенно существенно для альтернативно сплайсируемых генов. Интересующие нас в рамках данной работы инделы описываются в файлах аннотации как inframe_deletion (делеция), inframe_insertion (вставка), а также inframe_indel (крайне редкий случай одновременного удаления и вставки нескольких аминокислот).</p><p>С помощью информации из ENSEMBL была также выполнена разметка последовательностей белков на следующие участки: (1) консервативные фрагменты, соответствующие функциональным доменам, аннотированным в базе данных Pfam [<xref ref-type="bibr" rid="cit27">27</xref>]; (2) участки низкой сложности, в которых возможны повторы аминокислот; (3) предсказанные в базе данных MobiDB [<xref ref-type="bibr" rid="cit28">28</xref>] участки с неупорядоченной пространственной структурой. Два последних типа — участки низкой сложности и неупорядоченные участки структуры белка, как принято считать, наиболее терпимы к вставкам и удалениям аминокислот [<xref ref-type="bibr" rid="cit4">4</xref>][<xref ref-type="bibr" rid="cit29">29</xref>]. Для участков, представляющих собой домены Pfam, напротив, характерна эволюционная консервативность последовательности, обеспечивающая функциональность этих доменов. Пересечение координат индела с размеченным участком последовательности одного из описанных типов позволяет отнести его к этому типу и, тем самым, провести анализ локализации инделов различных классов клинической значимости.</p><p>В настоящем исследовании были также использованы результаты секвенирования образцов, собранных в Биобанке НМИЦ ТПМ (далее Биобанк) за все время его работы: пациентов и их родственников [<xref ref-type="bibr" rid="cit21">21</xref>][<xref ref-type="bibr" rid="cit22">22</xref>] и представителей популяционной выборки из исследования ЭССЕ-РФ (Эпидемиология сердечно-сосудистых заболеваний в регионах Российской Федерации) [<xref ref-type="bibr" rid="cit30">30</xref>]. Протокол обработки результатов секвенирования подробно описан в работе [<xref ref-type="bibr" rid="cit23">23</xref>]. Все исследованные образцы могут быть разбиты на четыре группы по принципу целевых участков секвенирования: три различных панели генов, содержащих 13, 34 и 35 генов из исходной группы 42 генов, и полные геномы. В общей сложности объем выборки составил 6837 человек. При анализе результатов секвенирования мы не рассматривали варианты в гене TTN ввиду его большой длины.</p><p>Сбор и хранение биоматериала осуществляли по регламенту биобанкирования в Биобанке [<xref ref-type="bibr" rid="cit31">31</xref>]. Исследования были одобрены Независимым Этическим Комитетом НМИЦ ТПМ (номера протоколов 07-03/12 от 03.07.2012, 04-04/17 от 06.06.2017). От всех участников исследования было получено информированное согласие на их участие.</p></sec><sec><title>Результаты</title></sec><sec><title>Общая характеристика инделов по данным ClinVar</title><p>В отобранных 42 генах в базе ClinVar описано в общей сложности 43313 вариантов генома различной клинической значимости (таблица 2). Несинонимичные варианты (миссенсы) составляют из них ~ половину (49,7%), из которых, в свою очередь, 14,2% являются патогенными. В этих генах в ClinVar описано 525 инделов без сдвига рамки считывания, что составляет лишь 1,2% от общего числа вариантов, при этом 155 инделов классифицированы как патогенные, что соответствует 29,5% от общего числа вариантов данного типа (рисунок 1). Неизвестная или противоречивая значимость приписана 65,5% инделов, а доброкачественные составляют самую небольшую группу (5,0%). Поскольку среди инделов доля патогенных (29,5%) примерно вдвое больше, чем среди миссенсов (14,2%), отношение шансов (OR — odds ratio) быть патогенным для инделов составляет 2,52 (95% доверительный интервал (ДИ): 2,08-3,05, p=0) по сравнению с миссенсами, что может указывать на более высокую каузальность и/или пенетрантность вариантов первого типа.</p><table-wrap id="table-2"><caption><p>Таблица 2</p><p>Варианты генома в 42 генах ССЗ, описанные в ClinVar (колонка 2) и обнаруженные в секвенированных выборках НМИЦ ТПМ (колонка 3)</p><p>Примечание: для всех вариантов в скобках указана доля в процентах от общего числа (последняя строка), для патогенных указана доля от числа вариантов данного типа. Инделы — без сдвига рамки считывания. ССЗ — сердечно-сосудистые заболевания.</p></caption><table><tbody><tr><td>Варианты</td><td>ClinVar</td><td>Секвенированные выборки</td></tr><tr><td>Все</td><td>43313</td><td>69487</td></tr><tr><td>Миссенсы</td><td>21505 (49,7%)</td><td>1960 (2,8%)</td></tr><tr><td>Патогенные миссенсы</td><td>3064 (14,2%)</td><td>115 (5,9%)</td></tr><tr><td>Инделы</td><td>525 (1,2%)</td><td>60 (0,1%)</td></tr><tr><td>Патогенные инделы</td><td>155 (29,5%)</td><td>4 (6,7%)</td></tr></tbody></table></table-wrap><fig id="fig-1"><caption><p>Рис. 1 Число инделов в базе ClinVar с различной клинической значимостью в целевых генах, ассоциированных с ССЗ.</p><p>Примечание: ССЗ — сердечно-сосудистые заболевания.</p></caption><graphic xlink:href="cardiovascular-24-12-g001.jpeg"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/12/CY2BOHVIJumqzWskLPSROtZbOYPj3ER80Q7k6yqe.jpeg</uri></graphic></fig><p>В отобранных генах ССЗ на один патогенный индел в среднем приходится 19,8 патогенных миссенсов (=3064/155), что близко к соответствующему значению по всем генам в ClinVar (18,8). Группы ССЗ различаются по этому соотношению, которое составляет 47,1 в случае кардиомиопатий и миопатий, 34,9 для сосудистых заболеваний, а также 10,2 (гиперхолестеринемия) и 7,5 (аритмии). Таким образом, в первых двух случаях инделы, как каузальные варианты, наиболее редки, а в случае аритмий и гиперхолестеринемии, напротив, встречаются чаще.</p><p>Как можно было ожидать, гены различаются по общему числу описанных в ClinVar инделов: от 1-2 (например, CASQ2, TPM1) до 91 в гене LDLR (рисунок 1). Заметно различаются также распределения по типам клинической значимости: так, наибольшее число патогенных инделов (70 и 27, соответственно) содержат гены LDLR (MONDO:0007750, семейная гиперхолестеринемия 1 типа) и FBN1 (MONDO:0019625, семейная аневризма грудной аорты и расслоение аорты), что сочетается с полным отсутствием доброкачественных инделов в этих генах. Интересно, что в этих генах часть миссенсов является доброкачественной: 4,2 и 10,3%, соответственно. Интересным примером является ген SCN5A (MONDO:0015263, синдром Бругада), в котором среди 5 описанных инделов все классифицированы как патогенные.</p><p>При рассмотрении отдельно вставок и удалений без сдвига рамки считывания обращает на себя внимание то, что последние составляют большинство инделов: 382 из 525, что составляет 72,8%; при этом в 203 случаях из 328 удаляется один аминокислотный остаток. При этом вставки от 2 до 5 аминокислотных остатков (90 случаев из 143) более распространены, чем вставки единичной длины (53 случая). Распределение по типам клинической значимости в зависимости от длины инделов дано на рисунке 2. Видно, что доброкачественных вставок и удалений с длиной &gt;5 аминокислотных остатков не наблюдается. OR быть патогенным среди удалений длиной &gt;1 составило 1,57 (95% ДИ: 1,02-2,38, p=0,040) по сравнению с удалениями единичной длины. В случае вставок OR=1,42 (95% ДИ: 0,54-3,72), однако ввиду малого объема выборки в данном случае разница не является статистически значимой (p=0,47).</p><fig id="fig-2"><caption><p>Рис. 2 Распределение длины вставок и удалений в инделах (в остатках аминокислот) в целевых генах в базе ClinVar.</p></caption><graphic xlink:href="cardiovascular-24-12-g002.jpeg"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/12/SRHU6kdhhW3CVBznLK2w2DczKEdgEBnDR6njfzAN.jpeg</uri></graphic></fig></sec><sec><title>Локализация инделов в участках белков</title><p>Для выбранных 42 белков ССЗ в целом характерно достаточно высокое (63,3%) покрытие последовательностей фрагментами, соответствующими доменам Pfam. В базе белков UniProtKB в целом 53% остатков всех белков принадлежат фрагментам последовательности, аннотированным как тот или иной домен [<xref ref-type="bibr" rid="cit32">32</xref>]; наблюдаемое увеличение этого значения в нашей небольшой выборке белков можно объяснить как ее размером, так и лучшей изученностью этих клинически важных белков. Участки низкой сложности и неупорядоченной структуры в белках ССЗ составляют 9,2 и 5,2%, соответственно.</p><p>На рисунке 3 показано распределение инделов различной клинической значимости по различным участкам белков. Видно, что патогенные инделы наиболее редко находятся в участках низкой сложности и неупорядоченной структуры (суммарно лишь 4,0%), при этом около четверти (24,1%) попадают в домены Pfam. Доброкачественные инделы, напротив, избегают доменов Pfam (4,8%), при этом почти четверть из них (23,8%) находится в участках низкой сложности. С учетом малой численности этой группы (21 индел) полученные результаты могут быть не вполне репрезентативными: так, во всей базе ClinVar в участках низкой сложности и неупорядоченной структуры находятся 52,1 и 43,4% всех 3064 доброкачественных удалений и вставок, при этом только 7,2% попадают в домены Pfam. Для инделов неизвестной клинической значимости характерна бóльшая представленность в участках низкой сложности и неупорядоченной структуры (14,1 и 12,6%) и близкая к патогенным доля в доменах Pfam (23,1%). В силу последнего обстоятельства локализация в домене Pfam, во всяком случае в исследованных белках ССЗ, не может являться надежным признаком для классификации индела как патогенного.</p><fig id="fig-3"><caption><p>Рис. 3 Расположение инделов с описанной клинической значимостью в различных участках белков, в процентах.</p><p>Примечание: в скобках указано число инделов в выборке. Все белки — представленность участков в целевых белках. ССЗ — сердечно-сосудистые заболевания.</p></caption><graphic xlink:href="cardiovascular-24-12-g003.jpeg"><uri content-type="original_file">https://cdn.elpub.ru/assets/journals/cardiovascular/2025/12/GaVOulkn6Z9QrSkldk5MNRknDOcUdagByi9tXSHv.jpeg</uri></graphic></fig></sec><sec><title>Инделы в российских выборках</title><p>В секвенированных выборках в 42 целевых генах было обнаружено в общей сложности 69,487 вариантов нуклеотидных последовательностей (таблица 2), только 60 из которых являются инделами без сдвига рамки считывания. Из них 22 индела классифицированы в ClinVar как доброкачественные, а также доброкачественные или неизвестной значимости (конфликтующие интерпретации значимости). Для некоторых из них характерны высокие частоты в популяции: например, 30,3% для удаления APOB:p. Leu12_Leu14del или 14,1% в случае вставки PCSK9:p. Leu22dup, что объясняет их высокую встречаемость, наблюдаемую в наших образцах.</p><p>С точки зрения связи с фенотипом наибольший интерес представляют 38 остальных обнаруженных в исследованных образцах инделов, среди которых четыре описаны в ClinVar как патогенные (один в гене TNNT2 и три в LDLR), 13 как инделы неизвестной значимости, а 21 вовсе отсутствуют в ClinVar. В таблице 3 приведены сведения о 12 инделах из числа этих 38, для которых по имеющимся клиническим данным можно было бы сделать вывод о наличии или отсутствии соответствующего диагноза. У 24 из 32 носителей мутантных аллелей генов с инделами ассоциации с клиническими проявлениями были подтверждены в результате медицинского обследования в НМИЦ ТПМ.</p><table-wrap id="table-3"><caption><p>Таблица 3</p><p>Инделы в секвенированных образцах из Биобанка НМИЦ ТПМ, для которых доступна информация о диагнозе</p><p>Примечание: приведены идентификаторы в номенклатуре HGVS (Human Genome Variation Society), идентификаторы в базах dbSNP (rsNNNNNN) и ClinVar (VCV000nnnnn), информация о клинической значимости в ClinVar (если есть): B (Benign, доброкачественный), LB (Likely Benign, вероятно доброкачественный), LP (Likely Pathogenic, вероятно патогенный), P (Pathogenic, патогенный), VUS (Variant of Unknown Significance, неизвестная значимость). В скобках указано число носителей вариантного аллеля и число подтвержденных диагнозов у носителей. DLCN — Dutch Lipid Clinic Network (критерии диагностики семейной гиперхолестеринемии).</p></caption><table><tbody><tr><td>Вариант</td><td>ClinVar</td><td>Носители</td><td>Диагноз</td></tr><tr><td>Кардиомиопатии</td></tr><tr><td>DSP:p. Ser957del</td><td>–</td><td>3</td><td>Пароксизмальная форма фибрилляции предсердий (1/3)</td></tr><tr><td>RBM20:p. Gln55_Ala56delinsPro rs2134793276</td><td>–</td><td>5</td><td>Некомпактный миокард левого желудочка (1/5)</td></tr><tr><td>TNNT2:p. Lys220del
rs45578238</td><td>VCV000043659
P/LP</td><td>2</td><td>Кардиомиопатия (2/2)</td></tr><tr><td>Гиперхолестеринемия</td></tr><tr><td>APOB:p. Leu22dup
rs745520533</td><td>VCV000993131
VUS</td><td>2</td><td>Гиперхолестеринемия (2/2)</td></tr><tr><td>APOB:p. Trp2554_Thr2555delinsCys</td><td>–</td><td>1</td><td>Предположительно гиперхолестеринемия: 3 балла по шкале DLCN (1/1)</td></tr><tr><td>LDLR:p. Asp224_Glu228del rs1555803439</td><td>VCV000441189 P/LP</td><td>2</td><td>Гиперхолестеринемия (2/2)</td></tr><tr><td>LDLR:p. Gly219del
rs121908027</td><td>VCV000226329
P</td><td>9</td><td>Гиперхолестеринемия (8/9)</td></tr><tr><td>LDLR:p. Leu571del
rs772492150</td><td>VCV002971852 VUS</td><td>2</td><td>Гиперхолестеринемия (2/2)</td></tr><tr><td>LDLR:p. Lys225_Asp227dup rs1555803425</td><td>VCV000251377 LP</td><td>2</td><td>Гиперхолестеринемия (2/2)</td></tr><tr><td>LDLR:p. Thr67_Cys68delinsSer</td><td>–</td><td>2</td><td>Гиперхолестеринемия (2/2)</td></tr><tr><td>PCSK9:p. Glu49del</td><td>–</td><td>1</td><td>Гиперхолестеринемия (1/1)</td></tr><tr><td>PCSK9:p. Leu22_Leu23del rs35574083</td><td>VCV000627764 VUS, LB</td><td>1</td><td>Нет (0/1)</td></tr></tbody></table></table-wrap><p>Большинство инделов наблюдается в 1-5 секвенированных образцах, за исключением удаления LDLR:p. Gly219del, обнаруженного у 9 участников исследования, у которых диагноз гиперхолестеринемия был подтвержден в 8 случаях, что соответствует значению пенетрантности 88,8%. Для трех других патогенных инделов (TNNT2:p. Lys220del — кардиомиопатия, LDLR:p. Asp224_Glu228del и LDLR:p. Leu571del — гиперхолестеринемия) характерна полная пенетрантность. Для двух инделов, охарактеризованных в ClinVar как варианты с неизвестной значимостью (APOB:p. Leu22dup и LDLR:p. Leu571del), также наблюдается полная пенетрантность; противоположный пример дает удаление PCSK9:p. Leu22_Leu23del, для которого диагноз не подтвердился.</p></sec><sec><title>Обсуждение</title><p>Инделы без сдвига рамки считывания — варианты генома, приводящие к удалению или вставке небольшого числа остатков в белке — представляют интерес в различных контекстах, в первую очередь с точки зрения оценки их каузальности в различных моногенных заболеваниях [<xref ref-type="bibr" rid="cit33">33</xref>]. Возможности массовой оценки функционального эффекта инделов in vitro с помощью технологии ГМС появились совсем недавно [<xref ref-type="bibr" rid="cit15">15</xref>], но вряд ли эти результаты смогут в ближайшем будущем дать исчерпывающие ответы на вопросы о патогенности тех или иных инделов, ввиду очевидной разницы между функциональным и клиническим эффектом. То же самое можно сказать про вычислительные методы предсказания эффекта инделов, которые переживают своего рода "второе рождение" в эпоху быстрого развития методов глубокого обучения (нейронных сетей) [<xref ref-type="bibr" rid="cit17">17</xref>][<xref ref-type="bibr" rid="cit34">34</xref>]. Накопление данных секвенирования и их интерпретация в клиническом контексте позволяют делать наиболее достоверные выводы о патогенности и пенетрантности различных вариантов генома. Настоящее исследование ставит своей целью собрать наиболее значимые гены, ассоциируемые с ССЗ, и описать свойства встречающихся в них коротких инделов, в частности, их распространенность и локализацию, а также патогенность и пенетрантность. Тем самым, среди прочего, мы надеемся привлечь внимание врачей-генетиков к этим вариантам генома, которые иногда оказываются на периферии внимания исследователей в клинических или научных проектах [<xref ref-type="bibr" rid="cit10">10</xref>][<xref ref-type="bibr" rid="cit11">11</xref>].</p><p>В настоящей работе были отобраны 42 гена, ассоциированные с 22 ССЗ, проанализированы описанные в базе ClinVar [<xref ref-type="bibr" rid="cit5">5</xref>] инделы в генах из этой выборки. Обнаружен большой разброс числа инделов в этих генах: от 1 до 91 в гене, что в, первую очередь, объясняется разницей в длине и нуклеотидном составе генов, а также в общей степени их изученности. Также в ряде случаев в одних и тех же генах наблюдается разница в соотношении различных типов клинической значимости при сравнении инделов и миссенсов. Например, в случае LDLR и FBN1 полное отсутствие доброкачественных инделов статистически значимо, что может свидетельствовать о низкой толерантности данных генов в такому типу варианта. В SCN5A все известные инделы патогенные, а среди миссенсов таких вариантов лишь ~12,8%. Можно ожидать, что особенности этого гена станут понятнее по мере накопления клинических данных. Разброс количества инделов и их патогенности в различных генах отмечался ранее [<xref ref-type="bibr" rid="cit14">14</xref>]. Полученные нами результаты позволяют сделать вывод, что инделы более редки, чем миссенсы, но более патогенны. Наиболее сильно это тенденция проявляется в кардиомиопатиях, миопатиях и сосудистых заболеваниях, в случае же аритмий и гиперхолестеринемии инделы, напротив, встречаются чаще.</p><p>Показано, что для локализации в различных участках белков доброкачественных и патогенных инделов из исследованной выборки в 30 генов характерны определенные тенденции, соответствующие описанным в рекомендациях ACMG по клинической интерпретации [<xref ref-type="bibr" rid="cit7">7</xref>], в частности, увеличение вероятности индела быть патогенным по мере роста его длины. В работе [<xref ref-type="bibr" rid="cit14">14</xref>] авторы наблюдают обратный эффект: некоторое увеличение доли доброкачественных вариантов по мере роста длины индела, однако в обоих случаях тенденция не является сильной. Патогенные инделы редко наблюдаются в повторах последовательности или в участках низкой сложности (суммарно 4%), а доброкачественные попадают в домены Pfam менее, чем в 5% случаев. Таким образом, можно сделать вывод о том, что короткие инделы в повторах последовательности или в участках без известной функции будут патогенны с меньшей степенью вероятности, однако сами по себе особенности локализации инделов в том или ином белке вряд ли могут приводить к однозначной интерпретации их эффекта.</p><p>В ходе анализа 42 целевых генов в &gt;6800 секвенированных образцах из различных российских когорт были обнаружены описанные ранее инделы различной клинической значимости, а также 19 инделов, не описанных в базах данных ClinVar и dbSNP. Инделы, отсутствующие в этих базах (например, DSP:p. Ser957del или RBM20:p. Gln55_Ala56delinsPro), представляют интерес как потенциально специфичные для российской популяции [<xref ref-type="bibr" rid="cit23">23</xref>]. Имеющиеся для части инделов данные о клинических проявлениях с установленным диагнозом позволяют сделать вывод об их достаточно высокой пенетрантности: так, у 24 из 32 носителей мутантных аллелей были подтверждены диагнозы, в первую очередь гиперхолестеринемия и кардиомиопатия (таблица 2), что позволяет оценить среднюю пенетрантность исследованных инделов в этих генах как 75%. Более точная ее оценка будет возможна по мере накопления данных секвенирования.</p></sec><sec><title>Заключение</title><p>Впервые был проанализирован спектр инделов без сдвига рамки считывания в группе генов, достоверно ассоциированных с ССЗ. Было показано, что инделы значительно менее распространены, но при этом более патогенны, чем несинонимичные варианты (миссенсы). В случае кардиомиопатий, миопатий и сосудистых заболеваний инделы как каузальные варианты наиболее редки, а в случае аритмий и гиперхолестеринемии, напротив, встречаются чаще. Патогенные инделы реже всего встречаются в участках низкой сложности (повторах) или в участках неупорядоченной структуры белков, а доброкачественные инделы избегают доменов, аннотированных в базе данных Pfam, для которых, как правило, характерна консервативность и функциональная значимость. Наиболее распространены делеции длиной один остаток и вставки (инсерции) с длинами от двух до пяти остатков. На основе анализа целевых генов в &gt;6800 секвенированных образцах из различных российских когорт был сделан вывод о достаточно высокой пенетрантности исследованных патогенных инделов, описаны потенциально специфичные для российской популяции примеры патогенных инделов. В настоящей работе впервые выполнен систематический анализ инделов в генах ССЗ, который подчеркивают их клиническую важность с точки зрения каузальности и пенетрантности, несмотря на меньшую распространенность по сравнению с несинонимичными вариантами.</p><p>Отношения и деятельность. Государственное задание "Разработка модели предсказания пенетрантности и экспрессивности причинных вариантов наследственных моногенных заболеваний сердечно-сосудистой системы".</p><p>1. Notin P. ProteinGym: Large-Scale Benchmarks for Protein Fitness Prediction and Design. Advances in Neural Information Processing Systems. https://proceedings.neurips.cc/paper_files/paper/2023/file/cac723e5ff29f65e3fcbb0739ae91bee-Paper-Datasets_and_Benchmarks.pdf.
2. ACMG Secondary Findings Genes and Diseases. https://search.clinicalgenome.org/kb/genes/acmgsf.
</p></sec></body><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Garcia-­Diaz M, Kunkel TA. Mechanism of a genetic glissando: structural biology of indel mutations. Trends Biochem Sci. 2006;31(4):206-14. doi:10.1016/j.tibs.2006.02.004.</mixed-citation><mixed-citation xml:lang="en">Garcia-­Diaz M, Kunkel TA. Mechanism of a genetic glissando: structural biology of indel mutations. Trends Biochem Sci. 2006;31(4):206-14. doi:10.1016/j.tibs.2006.02.004.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Chen S, Francioli LC, Goodrich JK, et al. A genomic mutational constraint map using variation in 76,156 human genomes. Nature. 2024;625(7993):92-100. doi:10.1038/s41586-023-06045-0.</mixed-citation><mixed-citation xml:lang="en">Chen S, Francioli LC, Goodrich JK, et al. A genomic mutational constraint map using variation in 76,156 human genomes. Nature. 2024;625(7993):92-100. doi:10.1038/s41586-023-06045-0.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Karczewski KJ, Francioli LC, Tiao G, et al. The mutational con­straint spectrum quantified from variation in 141,456 humans. Na­ture. 2020;581(7809):434-43. doi:10.1038/s41586-020-2308-7.</mixed-citation><mixed-citation xml:lang="en">Karczewski KJ, Francioli LC, Tiao G, et al. The mutational con­straint spectrum quantified from variation in 141,456 humans. Na­ture. 2020;581(7809):434-43. doi:10.1038/s41586-020-2308-7.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Pagel KA, Antaki D, Lian A, et al. Pathogenicity and functional impact of non-frameshifting insertion/deletion variation in the human genome. PLOS Comput Biol. 2019;15(6):e1007112. doi:10.1371/journal.pcbi.1007112.</mixed-citation><mixed-citation xml:lang="en">Pagel KA, Antaki D, Lian A, et al. Pathogenicity and functional impact of non-frameshifting insertion/deletion variation in the human genome. PLOS Comput Biol. 2019;15(6):e1007112. doi:10.1371/journal.pcbi.1007112.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Landrum MJ, Lee JM, Benson M, et al. ClinVar: public archive of inter­pretations of clinically relevant variants. Nucleic Acids Res. 2016;44(D1):D862-8. doi:10.1093/nar/gkv1222.</mixed-citation><mixed-citation xml:lang="en">Landrum MJ, Lee JM, Benson M, et al. ClinVar: public archive of inter­pretations of clinically relevant variants. Nucleic Acids Res. 2016;44(D1):D862-8. doi:10.1093/nar/gkv1222.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Sotnikova EA, Kiseleva AV, Kutsenko VA, et al. Identification of Pa­thogenic Variant Burden and Selection of Optimal Diagnostic Me­thod Is a Way to Improve Carrier Screening for Autosomal Re­ces­sive Diseases. J Pers Med. 2022;12(7):1132. doi:10.3390/jpm12071132.</mixed-citation><mixed-citation xml:lang="en">Sotnikova EA, Kiseleva AV, Kutsenko VA, et al. Identification of Pa­thogenic Variant Burden and Selection of Optimal Diagnostic Me­thod Is a Way to Improve Carrier Screening for Autosomal Re­ces­sive Diseases. J Pers Med. 2022;12(7):1132. doi:10.3390/jpm12071132.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Richards S, Aziz N, Bale S, et al. Standards and Guidelines for the Interpretation of Sequence Variants: A Joint Consensus Recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015;17(5):405-24. doi:10.1038/gim.2015.30.</mixed-citation><mixed-citation xml:lang="en">Richards S, Aziz N, Bale S, et al. Standards and Guidelines for the Interpretation of Sequence Variants: A Joint Consensus Recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015;17(5):405-24. doi:10.1038/gim.2015.30.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Рыж­кова О. П., Кардымон О. Л., Прохорчук Е. Б. и др. Руко­водство по интерпретации данных последовательности ДНК человека, полученных методами массового параллельного секвенирования (MPS) (редакция 2018, версия 2). Меди­цинская генетика. 2019;18(2):3-23. doi:10.25557/2073-7998.2019.02.3-23.</mixed-citation><mixed-citation xml:lang="en">Ryzhkova OP, Kardymon OL, Prohorchuk EB, et al. Guidelines for the interpretation of massive parallel sequencing variants (update 2018, v2). Medical Genetics. 2019;18(2):3-23. (In Russ.) doi:10.25557/2073-7998.2019.02.3-23.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Jiang Y, Turinsky AL, Brudno M. The missing indels: an estimate of indel variation in a human genome and analysis of factors that impede detection. Nucleic Acids Res. 2015;43(15):7217-28. doi:10.1093/nar/gkv677.</mixed-citation><mixed-citation xml:lang="en">Jiang Y, Turinsky AL, Brudno M. The missing indels: an estimate of indel variation in a human genome and analysis of factors that impede detection. Nucleic Acids Res. 2015;43(15):7217-28. doi:10.1093/nar/gkv677.</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Savino S, Desmet T, Franceus J. Insertions and deletions in pro­tein evolution and engineering. Biotechnol Adv. 2022;60:108010. doi:10.1016/j.biotechadv.2022.108010.</mixed-citation><mixed-citation xml:lang="en">Savino S, Desmet T, Franceus J. Insertions and deletions in pro­tein evolution and engineering. Biotechnol Adv. 2022;60:108010. doi:10.1016/j.biotechadv.2022.108010.</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Miton CM, Tokuriki N. Insertions and Deletions (Indels): A Mis­sing Piece of the Protein Engineering Jigsaw. Biochemistry. 2023; 62(2):148-57. doi:10.1021/acs.biochem.2c00188.</mixed-citation><mixed-citation xml:lang="en">Miton CM, Tokuriki N. Insertions and Deletions (Indels): A Mis­sing Piece of the Protein Engineering Jigsaw. Biochemistry. 2023; 62(2):148-57. doi:10.1021/acs.biochem.2c00188.</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Van Hout CV, Tachmazidou I, Backman JD, et al. Exome sequen­cing and characterization of 49,960 individuals in the UK Biobank. Na­ture. 2020;586(7831):749-56. doi:10.1038/s41586-020-2853-0.</mixed-citation><mixed-citation xml:lang="en">Van Hout CV, Tachmazidou I, Backman JD, et al. Exome sequen­cing and characterization of 49,960 individuals in the UK Biobank. Na­ture. 2020;586(7831):749-56. doi:10.1038/s41586-020-2853-0.</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Fowler DM, Fields S. Deep mutational scanning: a new style of protein science. Nat Methods. 2014;11(8):801-7. doi:10.1038/nmeth.3027.</mixed-citation><mixed-citation xml:lang="en">Fowler DM, Fields S. Deep mutational scanning: a new style of protein science. Nat Methods. 2014;11(8):801-7. doi:10.1038/nmeth.3027.</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Cannon S, Williams M, Gunning AC, Wright CF. Evaluation of in silico pathogenicity prediction tools for the classification of small in-frame indels. BMC Med Genomics. 2023;16(1):36. doi:10.1186/s12920-023-01454-6.</mixed-citation><mixed-citation xml:lang="en">Cannon S, Williams M, Gunning AC, Wright CF. Evaluation of in silico pathogenicity prediction tools for the classification of small in-frame indels. BMC Med Genomics. 2023;16(1):36. doi:10.1186/s12920-023-01454-6.</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Macdonald CB, Nedrud D, Grimes PR, et al. DIMPLE: deep insertion, deletion, and missense mutation libraries for exploring protein variation in evolution, disease, and biology. Genome Biol. 2023;24(1):36. doi:10.1186/s13059-023-02880-6.</mixed-citation><mixed-citation xml:lang="en">Macdonald CB, Nedrud D, Grimes PR, et al. DIMPLE: deep insertion, deletion, and missense mutation libraries for exploring protein variation in evolution, disease, and biology. Genome Biol. 2023;24(1):36. doi:10.1186/s13059-023-02880-6.</mixed-citation></citation-alternatives></ref><ref id="cit16"><label>16</label><citation-alternatives><mixed-citation xml:lang="ru">Shin JE, Riesselman AJ, Kollasch AW, et al. Protein design and variant prediction using autoregressive generative models. Nat Commun. 2021;12(1):2403. doi:10.1038/s41467-021-22732-w.</mixed-citation><mixed-citation xml:lang="en">Shin JE, Riesselman AJ, Kollasch AW, et al. Protein design and variant prediction using autoregressive generative models. Nat Commun. 2021;12(1):2403. doi:10.1038/s41467-021-22732-w.</mixed-citation></citation-alternatives></ref><ref id="cit17"><label>17</label><citation-alternatives><mixed-citation xml:lang="ru">Fan X, Pan H, Tian A, et al. SHINE: protein language model-­based pathogenicity prediction for short inframe insertion and deletion variants. Brief Bioinform. 2023;24(1):bbac584. doi:10.1093/bib/bbac584.</mixed-citation><mixed-citation xml:lang="en">Fan X, Pan H, Tian A, et al. SHINE: protein language model-­based pathogenicity prediction for short inframe insertion and deletion variants. Brief Bioinform. 2023;24(1):bbac584. doi:10.1093/bib/bbac584.</mixed-citation></citation-alternatives></ref><ref id="cit18"><label>18</label><citation-alternatives><mixed-citation xml:lang="ru">Barbitoff YA, Abasov R, Tvorogova VE, et al. Systematic benchmark of state-of-the-art variant calling pipelines identifies major factors affecting accuracy of coding sequence variant discovery. BMC Genomics. 2022;23(1):155. doi:10.1186/s12864-022-08365-3.</mixed-citation><mixed-citation xml:lang="en">Barbitoff YA, Abasov R, Tvorogova VE, et al. Systematic benchmark of state-of-the-art variant calling pipelines identifies major factors affecting accuracy of coding sequence variant discovery. BMC Genomics. 2022;23(1):155. doi:10.1186/s12864-022-08365-3.</mixed-citation></citation-alternatives></ref><ref id="cit19"><label>19</label><citation-alternatives><mixed-citation xml:lang="ru">Yen JL, Garcia S, Montana A, et al. A variant by any name: quantifying annotation discordance across tools and clinical databases. Genome Med. 2017;9. doi:10.1186/s13073-016-0396-7.</mixed-citation><mixed-citation xml:lang="en">Yen JL, Garcia S, Montana A, et al. A variant by any name: quantifying annotation discordance across tools and clinical databases. Genome Med. 2017;9. doi:10.1186/s13073-016-0396-7.</mixed-citation></citation-alternatives></ref><ref id="cit20"><label>20</label><citation-alternatives><mixed-citation xml:lang="ru">den Dunnen JT, Dalgleish R, Maglott DR, et al. HGVS Recom­mendations for the Description of Sequence Variants: 2016 Update. Hum Mutat. 2016;37(6):564-9. doi:10.1002/humu.22981.</mixed-citation><mixed-citation xml:lang="en">den Dunnen JT, Dalgleish R, Maglott DR, et al. HGVS Recom­mendations for the Description of Sequence Variants: 2016 Update. Hum Mutat. 2016;37(6):564-9. doi:10.1002/humu.22981.</mixed-citation></citation-alternatives></ref><ref id="cit21"><label>21</label><citation-alternatives><mixed-citation xml:lang="ru">Meshkov A, Ershova A, Kiseleva A, et al. The LDLR, APOB, and PCSK9 Variants of Index Patients with Familial Hyper­cholesterolemia in Russia. Genes. 2021;12(1):66. doi:10.3390/genes12010066.</mixed-citation><mixed-citation xml:lang="en">Meshkov A, Ershova A, Kiseleva A, et al. The LDLR, APOB, and PCSK9 Variants of Index Patients with Familial Hyper­cholesterolemia in Russia. Genes. 2021;12(1):66. doi:10.3390/genes12010066.</mixed-citation></citation-alternatives></ref><ref id="cit22"><label>22</label><citation-alternatives><mixed-citation xml:lang="ru">Мешков А. И., Киселева А. В., Ершова А. И. и др. Варианты Генов ANGPTL3, ANGPTL4, APOA5, APOB, APOC2, APOC3, LDLR, PCSK9, LPL и риск ишемической болезни сердца. Российский кардиологический журнал. 2022;27(10):5232. doi:10.15829/1560-4071-2022-5232.</mixed-citation><mixed-citation xml:lang="en">Meshkov AN, Kiseleva AV, Ershova AI, et al. ANGPTL3, ANGPTL4, APOA5, APOB, APOC2, APOC3, LDLR, PCSK9, LPL gene variants and coronary artery disease risk. Russian Journal of Cardiology. 2022;27(10):5232. (In Russ.) doi:10.15829/1560-4071-2022-5232.</mixed-citation></citation-alternatives></ref><ref id="cit23"><label>23</label><citation-alternatives><mixed-citation xml:lang="ru">Ramensky VE, Ershova AI, Zaicenoka M, et al. Targeted Se­quen­cing of 242 Clinically Important Genes in the Russian Popu­la­tion From the Ivanovo Region. Front Genet. 2021;12:1782. doi:10.3389/fgene.2021.709419.</mixed-citation><mixed-citation xml:lang="en">Ramensky VE, Ershova AI, Zaicenoka M, et al. Targeted Se­quen­cing of 242 Clinically Important Genes in the Russian Popu­la­tion From the Ivanovo Region. Front Genet. 2021;12:1782. doi:10.3389/fgene.2021.709419.</mixed-citation></citation-alternatives></ref><ref id="cit24"><label>24</label><citation-alternatives><mixed-citation xml:lang="ru">Miller DT, Lee K, Chung WK, et al. ACMG SF v3.0 list for reporting of secondary findings in clinical exome and genome sequencing: a policy statement of the American College of Medical Genetics and Genomics (ACMG). Genet Med. 2021;23(8):1381-90. doi: 10.1038/s41436-021-01172-3.</mixed-citation><mixed-citation xml:lang="en">Miller DT, Lee K, Chung WK, et al. ACMG SF v3.0 list for reporting of secondary findings in clinical exome and genome sequencing: a policy statement of the American College of Medical Genetics and Genomics (ACMG). Genet Med. 2021;23(8):1381-90. doi: 10.1038/s41436-021-01172-3.</mixed-citation></citation-alternatives></ref><ref id="cit25"><label>25</label><citation-alternatives><mixed-citation xml:lang="ru">Vasilevsky NA, Toro S, Matentzoglu N, et al. Mondo: Integrating Disease Terminology Across Communities. Genetics. Published online October 6, 2025:iyaf215. doi:10.1093/genetics/iyaf215.</mixed-citation><mixed-citation xml:lang="en">Vasilevsky NA, Toro S, Matentzoglu N, et al. Mondo: Integrating Disease Terminology Across Communities. Genetics. Published online October 6, 2025:iyaf215. doi:10.1093/genetics/iyaf215.</mixed-citation></citation-alternatives></ref><ref id="cit26"><label>26</label><citation-alternatives><mixed-citation xml:lang="ru">Morales J, Pujar S, Loveland JE, et al. A joint NCBI and EMBL-EBI transcript set for clinical genomics and research. Nature. 2022;604(7905):310-15. doi:10.1038/s41586-022-04558-8.</mixed-citation><mixed-citation xml:lang="en">Morales J, Pujar S, Loveland JE, et al. A joint NCBI and EMBL-EBI transcript set for clinical genomics and research. Nature. 2022;604(7905):310-15. doi:10.1038/s41586-022-04558-8.</mixed-citation></citation-alternatives></ref><ref id="cit27"><label>27</label><citation-alternatives><mixed-citation xml:lang="ru">Paysan-­Lafosse T, Andreeva A, Blum M, et al. The Pfam protein families database: embracing AI/ML. Nucleic Acids Res. 2025;53(D1):D523-34. doi:10.1093/nar/gkae997.</mixed-citation><mixed-citation xml:lang="en">Paysan-­Lafosse T, Andreeva A, Blum M, et al. The Pfam protein families database: embracing AI/ML. Nucleic Acids Res. 2025;53(D1):D523-34. doi:10.1093/nar/gkae997.</mixed-citation></citation-alternatives></ref><ref id="cit28"><label>28</label><citation-alternatives><mixed-citation xml:lang="ru">Piovesan D, Del Conte A, Clementel D, et al. MobiDB: 10 years of intrinsically disordered proteins. Nucleic Acids Res. 2023; 51(D1):D438-44. doi:10.1093/nar/gkac1065.</mixed-citation><mixed-citation xml:lang="en">Piovesan D, Del Conte A, Clementel D, et al. MobiDB: 10 years of intrinsically disordered proteins. Nucleic Acids Res. 2023; 51(D1):D438-44. doi:10.1093/nar/gkac1065.</mixed-citation></citation-alternatives></ref><ref id="cit29"><label>29</label><citation-alternatives><mixed-citation xml:lang="ru">Lin M, Whitmire S, Chen J, et al. Effects of short indels on protein structure and function in human genomes. Sci Rep. 2017;7. doi:10.1038/s41598-017-09287-x.</mixed-citation><mixed-citation xml:lang="en">Lin M, Whitmire S, Chen J, et al. Effects of short indels on protein structure and function in human genomes. Sci Rep. 2017;7. doi:10.1038/s41598-017-09287-x.</mixed-citation></citation-alternatives></ref><ref id="cit30"><label>30</label><citation-alternatives><mixed-citation xml:lang="ru">Бойцов С. А., Драпкина О. М., Шляхто Е. В. и др. Ис­следование ЭССЕ-РФ (Эпидемиология сердечно-сосу­дистых заболеваний и их факторов риска в регионах Рос­сийской Федерации). Десять лет спустя. Кардиоваску­ляр­ная терапия и профилактика. 2021;20(5):3007. doi:10.15829/1728-8800-2021-3007.</mixed-citation><mixed-citation xml:lang="en">Boytsov SA, Drapkina OM, Shlyakhto EV, et al. Epidemiology of Cardiovascular Diseases and their Risk Factors in Regions of Russian Federation (ESSE-RF) study. Ten years later. Car­dio­vas­cular Therapy and Prevention. 2021;20(5):3007. (In Russ.) doi:10.15829/1728-8800-2021-3007.</mixed-citation></citation-alternatives></ref><ref id="cit31"><label>31</label><citation-alternatives><mixed-citation xml:lang="ru">Копылова О. В., Ершова А. И., Покровская М. С. и др. Популяционно-нозологический исследовательский биобанк "НМИЦ ТПМ": анализ коллекций биообразцов, принципы сбора и хранения информации. Кардиоваскулярная терапия и профилактика. 2021;20(8):3119. doi:10.15829/1728-8800-2021-3119.</mixed-citation><mixed-citation xml:lang="en">Kopylova OV, Ershova AI, Pokrovskaya MS, et al. Population-­nosological research biobank of the National Medical Research Center for Therapy and Preventive Medicine: analysis of biosamples, principles of collecting and storing information. Cardiovascular Therapy and Prevention. 2021;20(8):3119. (In Russ.) doi:10.15829/1728-8800-2021-3119.</mixed-citation></citation-alternatives></ref><ref id="cit32"><label>32</label><citation-alternatives><mixed-citation xml:lang="ru">Mistry J, Chuguransky S, Williams L, et al. Pfam: The protein families database in 2021. Nucleic Acids Res. 2021;49(D1):D412- 9. doi:10.1093/nar/gkaa913.</mixed-citation><mixed-citation xml:lang="en">Mistry J, Chuguransky S, Williams L, et al. Pfam: The protein families database in 2021. Nucleic Acids Res. 2021;49(D1):D412- 9. doi:10.1093/nar/gkaa913.</mixed-citation></citation-alternatives></ref><ref id="cit33"><label>33</label><citation-alternatives><mixed-citation xml:lang="ru">Montgomery SB, Goode DL, Kvikstad E, et al. The origin, evo­lution, and functional impact of short insertion-­deletion variants identified in 179 human genomes. Genome Res. 2013;23(5):749-61. doi:10.1101/gr.148718.112.</mixed-citation><mixed-citation xml:lang="en">Montgomery SB, Goode DL, Kvikstad E, et al. The origin, evo­lution, and functional impact of short insertion-­deletion variants identified in 179 human genomes. Genome Res. 2013;23(5):749-61. doi:10.1101/gr.148718.112.</mixed-citation></citation-alternatives></ref><ref id="cit34"><label>34</label><citation-alternatives><mixed-citation xml:lang="ru">Yue Z, Xiang Y, Chen G, et al. PredinID: predicting pathogenic in­frame indels in human through graph convolution neural network with graph sampling technique. In: IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2023;20(5):3226-33. doi:10.1109/TCBB.2023.3266232.</mixed-citation><mixed-citation xml:lang="en">Yue Z, Xiang Y, Chen G, et al. PredinID: predicting pathogenic in­frame indels in human through graph convolution neural network with graph sampling technique. In: IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2023;20(5):3226-33. doi:10.1109/TCBB.2023.3266232.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
