Перейти к:
Популяционный биобанк как основа для выявления пространственной изменчивости клинически значимых фармакогенетических биомаркеров сердечно-сосудистых заболеваний
https://doi.org/10.15829/1728-8800-2022-3430
Аннотация
Внедрение фармакогенетических тестов среди населения России сталкивается с фундаментальным ограничением — выраженными генетическими различиями между популяциями. Снять эти ограничения помогает геногеография фармакогенетических маркеров дезоксирибонуклеиновой кислоты (ДНК-маркеров).
Цель. Выявить пространственную изменчивость генофондов коренного населения европейской части России по ДНК-маркерам, значимым для фармакотерапии сердечно-сосудистых заболеваний (ССЗ), используя коллекции популяционного биобанка.
Материал и методы. 3170 образцов 61 популяции "Биобанка Северной Евразии", репрезентативно представляющих генофонды коренного населения Восточной Европы, изучены по двум массивам фармакогенетических ДНК-маркеров: 60 наиболее значимым маркерам и 24, связанным с сердечно-сосудистой патологией. Методами многомерной статистики и геногеографии проведено сравнение изменчивости генофонда по двум указанным массивам ДНК-маркеров.
Результаты. Создан картографический атлас, включающий карты распространения среди народонаселения Восточной Европы 24 фармакогенетических маркеров ССЗ. Картографические модели атласа, благодаря невербальному представлению большого объема информации, позволяют специалистам разного профиля анализировать закономерности в распространении фармакогенетических маркеров. Общие закономерности дополнены региональными исследованиями на Северном Кавказе, в Приуралье и Русской равнине, выявляющими группы населения со сходным фармакогенетическим статусом. Для каждого региона проведено сравнение изменчивости генофонда по двум массивам фармакогенетических ДНК-маркеров — общему и ССЗ.
Заключение. Созданный картографический атлас является основой для развития фармакогенетических исследований, проводимых методами геногеографии по единой панели фарма-маркеров и по репрезентативным выборкам, обеспеченным популяционными биобанками. Надежность результатов обеспечена подробной генеалогической и популяционной аннотацией каждого образца биобанка и репрезентативными выборками из популяций.
Ключевые слова
Для цитирования:
Пылёв В.Ю., Агджоян А.Т., Горин И.О., Петрушенко В.С., Почешхова Э.А., Мирзаев К.Б., Балановская Е.В. Популяционный биобанк как основа для выявления пространственной изменчивости клинически значимых фармакогенетических биомаркеров сердечно-сосудистых заболеваний. Кардиоваскулярная терапия и профилактика. 2022;21(11):3430. https://doi.org/10.15829/1728-8800-2022-3430
For citation:
Pylev V.Yu., Agdzhoyan A.T., Gorin I.O., Petrushenko V.S., Pocheshkhova E.A., Mirzaev K.B., Balanovskaya E.V. Population biobank as a basis for determining spatial variation of clinically relevant pharmacogenetic biomarkers of cardiovascular diseases. Cardiovascular Therapy and Prevention. 2022;21(11):3430. (In Russ.) https://doi.org/10.15829/1728-8800-2022-3430
Введение
Биобанки, осуществляя сбор и систематизацию биологических материалов, нацелены на анализ данных для решения научных и практических задач. Для такого популярного объекта, как человек, известны два основных типа биобанков.
Первый тип — биобанки образцов пациентов — хранят образцы людей с известным медицинским диагнозом и служат для разработки методов профилактики, диагностики, выявления предрасположенности к заболеваниям и лечения в русле персонализированной медицины.
Биобанки второго типа — популяционные — хранят образцы, представляющие группы населения, неассоциированные с заболеваниями. Обычно популяционные биобанки нацелены на проблемы фундаментальной науки: междисциплинарного изучения путей формирования генофонда в широком контексте современного и древнего населения. Они имеют непреходящее значение, поскольку хранят информацию о генетическом разнообразии человека: в эпоху глобализации генофонды многих народов исчезают с лица земли или утрачивают генетическую память под давлением миграционных потоков.
К популяционному биобанку, кроме общих требований биобанкирования, предъявляются высокие требования к популяционной репрезентативности коллекций. Ключевое значение имеет первичный этап — корректное формирование выборок из популяций. По мере развития технологий генотипирования этот этап становится все более критичным. Ошибка в формировании выборки может обернуться ложными результатами на всех последующих этапах: её не устранят самые эффективные методы биоинформатики. Поэтому кроме общих правил (письменное информированное согласие, конфиденциальность, этика), при создании популяционных биобанков руководствуются рядом особых правил [1]. Правило "коренное население" следует общепринятому в мировой популяционной генетике требованию изучать именно коренное население региона. Правило "максимум разнообразия" указывает на необходимость формирования выборки из разных подразделений популяции, позволяя охватить ее генетическое разнообразие. Правило "три поколения" означает включение в выборку только тех индивидов, все предки которых относили себя к данной популяции на протяжении, как минимум, 3-х поколений. Правило "не родственники" — исключение родства до 3-го поколения — обеспечивает нескоррелированность генотипов.
Использование популяционных биобанков не исчерпывается проблемами фундаментальной науки. Постоянно расширяется сфера их практического использования для судебно-медицинской экспертизы (формирование референсных баз данных для идентификации дезоксирибонуклеиновой кислоты (ДНК)-идентификации, определение вероятного этногеографического происхождения, поиск генов, определяющих внешность человека) и здравоохранения.
По мере развития персонализированного подхода в медицине и перехода к геномной медицине, популяционно-генетические исследования играют все более важную роль в сфере здравоохранения: популяционная генетика представляет данные о генетических маркерах, ассоциированных с заболеваниями, но с разной частотой распространенных в популяциях, что важно учитывать при планировании и эффективной организации здравоохранения. Каталог ассоциаций с заболеваниями проекта "1000 геномов" показал, что 35% геномных вариаций не являются общими для населения даже в пределах одного континента. Поэтому необходимо создание региональных биобанков коренного населения, обеспечивающих случай-контроль, непараллельный контроль, когортные исследования, GWAS (genome-wide association studies), EWAS (epigenomewide association studies) и важных для поиска ассоциаций с заболеваниями, прогноза заболеваемости и планирования их лечения. Кроме решения таких уже ставших традиционными задач, как формирование контрольных выборок, прогноз и мониторинг груза наследственной патологии, анализ географического распространения отдельных генов, ассоциированных с заболеваниями, новым перспективным направлением является фармакогеномика и районирование генофонда.
Коллекции Биобанка Северной Евразии1, созданного под руководством О. П. Балановского и Е. В. Балановской, на протяжении четверти века используются в многочисленных работах о происхождении генофондов как коренного населения региона, так и всего мира (обобщены в монографиях [2-5]). Наряду с решением задач фундаментальной науки данные Биобанка используются в таких областях как криминалистика и медицина: генетический контроль пигментации [6-8], выявление маркеров этногеографического происхождения индивида [9][10], геногеография фармакогенетических маркеров (фарма-маркеров) [11-14], геногеографии онкогенов [15][16], трегалазы [17] и маркеров, связанных с тяжелым протеканием COVID-19 (COronaVIrus Disease) [18][19].
Фармакогенетика становится важным инструментом персонифицированной медицины. Однако для населения России внедрение фармакогенетических тестов сталкивается с фундаментальным ограничением — выраженными генетическими различиями между популяциями. Для снятия этих ограничений необходимо детальное исследование геногеографической изменчивости фармакогенетически значимых ДНК-маркеров, обеспеченное созданием популяционных биобанков.
Важность изучения фарма-маркеров сердечнососудистых заболеваний (ССЗ) обусловлена их лидирующим местом среди причин смерти: по данным Всемирной организации здравоохранения2 ежегодно в мире от ССЗ умирает 17,5 млн человек с наиболее высокими показателями смертности в Восточной Европе и Центральной Азии [20]. В Европе ССЗ составляют 45% смертей: в странах-членах Евросоюза на ССЗ приходится 3,1 млн летальных исходов в год [21][22], причем ишемическая болезнь сердца и инсульт являются причиной смерти, соответственно, 44 и 21% мужчин, 38 и 26% женщин [22]. Согласно данным Росстата, суммарная смертность от ССЗ в России составляет 856,1 тыс. человек в год, достигая 46,8% от смерти от всех причин [23].
Показано, что геногеографический ландшафт фарма-маркеров отличается [11-14] от паттерна селективно-нейтральных ДНК-маркеров, однако анализ геногеографических закономерностей для конкретных групп заболеваний не проводился.
Цель настоящей работы — выявить пространственную изменчивость генофондов коренного населения европейской части России по панели полиморфизмов, значимых для фармакотерапии ССЗ.
Для этого необходимо создать на основе коллекций Биобанка Северной Евразии картографический атлас пространственной изменчивости 24 SNP (Single Nucleotide Polymorphism)-маркеров ССЗ; оценить положение генофондов народонаселения европейской части России в многомерном генетическом пространстве как 24 SNP-маркеров ССЗ, так и по спектру 60 основных фарма-маркеров; сравнить паттерны генетического сходства популяций по кардиологическим маркерам (кардио-маркерам) с паттерном по всей панели фарма-маркеров для трех региональных популяций Восточной Европы.
Материал и методы
Изучены 3170 образцов ДНК индивидов из 61 популяции коренных народов Восточной Европы (Приложение, таблица 1), сформированных в ходе экспедиционных обследований коренного населения по единой технологии [1] и предоставленных Биобанком Северной Евразии (Москва). В выборки включены образцы неродственных между собой индивидов, предки которых на глубину не <3-х поколений относили себя к данному этносу и популяции. Обследование проведено на добровольной основе с письменным информированным согласием, одобренным Этическим комитетом ФГБНУ "МГНЦ" (Заключение от 29.06.2020г).
Генотипирование проведено методом полимеразной цепной реакции в реальном времени с использованием TaqMan-зондов и технологии OpenArray на амплификаторе QuantStudio 12 Flex по кастомной панели 60 SNPмаркеров, информативных для фармакогенетики (Приложение, таблица 2) и включающих 24 SNP-маркера, значимых при ССЗ (таблица 1). Наибольшее клиническое значение для персонализации терапии ССЗ имеют фармакокинетические и фармакодинамические генетические биомаркеры, кодирующие транспортеры лекарственных средств и ксенобиотиков (ABCB1, ABCG2, SLCO1B1), изоферменты семейства цитохрома Р-450 и другие ферменты метаболизма (CYP2C19, CYP2C9, CYP2C8, CYP2D6, CYP3A4, CYP3A5, CYP4F2, CES1, PON1), фармакодинамические мишени и рецепторы (VKORC1, ADRB1, P2RY12), а также другие компоненты метаболических путей3.
Таблица 1
Изученные 24 SNP-маркера, значимые при персонализации лечения сердечно-сосудистых заболеваний (ССЗ)
Примечания: * — цифры 1-3 указывают на степень значимости в ССЗ по 3-балльной шкале; НПВС — нестероидные противовоспалительные средства.
Картографический анализ проведен с помощью оригинального картографического программного обеспечения GeneGeo [24] аналогично описанному в [11-14]. Карты построены методом средневзвешенной интерполяции со степенной функцией k=3 по данным о популяциях (Приложение, таблица 1) в радиусе R (для Восточной Европы R=800 км).
Карты генетических расстояний для трех регионов (Восточной Европы — от удмуртов и бесермян, Центральной России — от рязанских русских, Северного Кавказа — от осетин) созданы по единому алгоритму. Для популяций каждого региона получена матрица частот по каждому ССЗ-маркеру, по которой рассчитаны генетические расстояния Нея от реперной популяции (удмурты, осетины или рязанские русские) до остальных популяций региона и созданы региональные карты генетических расстояний. Их усреднением получена карта средних генетических расстояний от реперной популяции. Аналогично созданы региональные карты по частотам 60 фарма-маркеров.
Статистический анализ проведен методом главных компонент по частотам SNP-маркеров (Приложение, таблица 2) в 13 метапопуляциях Восточной Европы (Приложение, таблица 1) с помощью программного обеспечения PLINK 1.94 и библиотеки scikit-learn5 для языка программирования Python 3.
Результаты
1. Картографический атлас изменчивости в народонаселении Восточной Европы частот ДНК-маркеров, связанных с сердечно-сосудистой патологией
Для каждого из 24 ССЗ-маркеров создана карта его распространения в коренном населении Восточной Европы. На рисунках 1-4 приведены карты 16 наиболее значимых кардио-маркеров (таблица 1), остальные 8 приведены в (Приложение, рисунки 1, 2).
Основной особенностью в изменчивости кардио-маркеров оказалось сходство генетических ландшафтов Кавказа и Восточно-Европейской равнины (за исключением паттернов CYP4F2, CES1, ADRB1). Поскольку и селективно-нейтральный генетический ландшафт [3], и ДНК-маркеры, ассоциированные с тяжелым течением COVID-19 [19], фиксируют отличие генофонда Кавказа от остального населения Восточной Европы, важно подчеркнуть выявленное своеобразие в распределении кардиомаркеров.
Генетический ландшафт распространения маркеров CYP2D6 и CYP3A5
Маркеры гена CYP2D6 (рисунки 1 А-В) относятся к β-блокаторам и характеризуются сходным паттерном распространения в населении Восточной Европы. Пространственное распределение rs776746_T гена CYP3A5 (рисунок 1 Г), функционально связанного с остановкой кровотечений, имеет похожий паттерн. В целом их генетический ландшафт сглажен. При небольшом диапазоне частот географически близкие популяции отличаются друг от друга, маскируя слабо выраженную клинальную изменчивость с вектором "запад-восток".
rs3892097 (T) гена CYP2D6 (рисунок 1 А) при слабо выраженном тренде падения частоты с запада на восток обнаруживает максимумы частоты не только в русских популяциях (в Рязанской и Калужской областях 28%, в Ярославской, Новгородской и Псковской — 22%), но и в Приуралье у коми-пермяков (19-21%). На Кавказе также немало максимумов: на Восточном Кавказе — 20%, Западном — 18%, Центральном — 16%. Минимумы (0-5%) сосредоточены не только в Волго-Уральском регионе и южном Урале, но и на северо-востоке у северных русских, ненцев и манси.
rs1065852 (A) гена CYP2D6 (рисунок 1 Б) по своему генетическому ландшафту почти идентичен предыдущему. Можно отметить повышение частоты у белорусов (21%), казаков (30%) и лезгин (33%).
rs28371725 (T) гена CYP2D6 (рисунок 1 В) обладает иным паттерном, хотя и крайне слабо выраженном из-за малого диапазона частоты и средней частоты почти в 3 раза меньшей, чем на предыдущей карте. Максимумы сосредоточены на западе (украинцы 21%) и на юге (17-18% у народов Западного Кавказа, крымских и астраханских татар), но коридор минимумов тянется от карел до Центрального Кавказа и калмыков, захватывая многие русские популяции, мордву, коми-пермяков. Однако в Волго-Уральском регионе частота выше, чем в окружающем поясе низких частот.
rs776746 (T) гена CYP3A5 (рисунок 1 Г) обнаруживает нечеткий градиент увеличения частоты в обратном направлении: с запада на восток. Низкие частоты (2-4%) характерны для рязанцев, коми-пермяков, украинцев. Повышенные частоты обнаруживаются и на северо-западе (у финнов — 21%, у северных русских и манси — 15%), и на юге (в Молдавии — 20%, у калмыков — 15%), и в популяциях Кавказа.
Рис. 1 Генетический ландшафт распространения маркеров CYP2D6 и CYP3A5: А) маркера rs3892097 (T) гена CYP2D6; Б) маркера rs1065852 (A) гена CYP2D6; В) маркера rs28371725 (T) гена CYP2D6; Г ) маркера rs776746 (T) гена CYP3A5.
Примечание: на каждой карте в легенде слева дана шкала цветовых интервалов: красно-фиолетовые тона — высокая частота (≥50%), желто-оранжевые — средний диапазон (20-50%), зеленые и салатовые — низкие значения (1-20%), серый цвет <1%. Изученные популяции на картах обозначены темно-синими кружками и сопровождаются номером согласно таблице 1 Приложения.
Генетический ландшафт распространения маркеров CYP2C19 и CYP3A4
Рассматриваемые маркеры гена CYP2C19 относятся к антиагрегантам и ингибиторам протонной помпы, но их генетические ландшафты при отсутствии клинальной изменчивости и сходстве многих очертаний альтернативны — с повышением частоты одного маркера соотносится падение частоты другого.
rs 12248560 (T) гена CYP2C19 (рисунок 2 А) имеет в картографируемом ареале при диапазоне частот 8-38% обширный ареал средних частот (≈23%). Общий паттерн без клинальной изменчивости: высокие частоты сосредоточены в центре с неравномерным снижением к окраинам. Однако максимумы встречены и в Украине, и на Русском Севере. Поэтому на севере снижение частоты зафиксировано лишь на западной периферии у северных карел и саамов, а на восточной периферии у манси. В славянских популяциях частота маркера велика — в среднем, 29%. У финно-угров при средней частоте 24% размах различий очень велик — от 11 до 35%. На Кавказе максимумы обнаруживаются и на западе у адыгов, и на востоке у азербайджанцев.
rs4244285 (A) гена CYP2C19 (рисунок 2 Б) со средней частотой 15% обладает более сглаженным генетическим рельефом. Но теперь в центре сосредоточены минимумы, а на периферии разбросаны популяции с повышенными частотами — 26% у калмыков, 24% у степных тюрок и северных карел. В славянских популяциях средняя частота всего 12%. У западных финно-угров средняя частота (16%) и размах различий (10-24%) больше, чем у приуральских (12%, 6-15%). Для Кавказа характерны невысокие частоты, лишь у чеченцев и ингушей поднимающиеся до 19%.
rs4986893 (A) гена CYP2C19 (рисунок 2 В) крайне редок. Но и области нулевой частоты, и наличия маркера являются сплошными, а не случайными пятнами, поэтому ландшафт нельзя объяснить ошибками выборки. Регионы, в которых маркер встречен, вновь находятся на периферии: с максимумом на севере у манси (12%), на юге вновь у тюрок степи (8%), на Кавказе вновь у чеченцев и ингушей (7%).
rs2242480 (Т) гена CYP3A4 (рисунок 2 Г) функционально связан с остановкой кровотечений. В его ландшафте вновь отсутствует клинальная изменчивость. Область низких частот тянется от запада до востока. А всплески частоты обнаруживаются на периферии: и на севере у финнов (24%) и в Архангельской области (16%); на юге в Молдавии (25%) и у башкир (21%). У славян и западных финно-угров частота, в среднем (12%), выше, чем у поволжских финно-угров (8%).
Рис. 2 Генетический ландшафт распространения маркеров CYP2C19 и CYP3A4: А) маркера rs 12248560 (T) гена CYP2C194; Б) маркера rs4244285 (A) гена CYP2C19; В) маркера rs4986893 (A) гена CYP2C19; Г ) маркера rs2242480 (T) гена CYP3A4.
Примечание: см. рисунок 1.
Генетический ландшафт распространения маркеров CYP2C9, CYP4F2, CES1
Все картографированные маркеры этих генов относятся к различным антикоагулянтам: CYP2C9 — к нестероидным противовоспалительным, CYP4F2 — к непрямым антикоагулянтам, антиагрегантам; CES1 — к прямым оральным, антиагрегантам. Их генетические ландшафты различаются: у CYP2C9 клинальная изменчивость практически отсутствует, а у CYP4F2 и CES1 выражена весьма убедительно.
rs1057910 (С) гена CYP2C9 (рисунок 3 А) вновь являет сглаженный генетический рельеф с экстремумами на периферии: на севере падение частоты до нуля у ненцев и всплеск у северных карел до 19%, на юге — падение частоты до нуля у калмыков и всплеск частоты у адыгов (26%), и на Кавказе средняя частота (15%) выше среднерегиональной (8%). На остальном пространстве Восточной Европы встречаются лишь локальные невыразительные колебания частоты.
rs1799853 (Т) гена CYP2C9 (рисунок 3 Б) хотя имеет в 2 раза больший диапазон частоты (0-50%), но его генетический ландшафт почти столь же невыразителен. Дело в том, что максимальная частота 50% обнаружена лишь у фарсиязычных народов Закавказья. Но на Кавказе средняя частота (9%) такая же, как и в регионе, варьирует в тех же пределах: от 0 до 18% в Дагестане. Хотя просматривается тенденция клинальной изменчивости (снижение частоты с запада на восток), но она скрыта локальными колебаниями частоты.
rs2108622 (Т) гена CYP4F2 (рисунок 3 В) демонстрирует четко выраженную клинальную изменчивость увеличения частоты с северо-запада (9%) на восток и юго-восток (46%), нарушенную коридором повышенных частот (20-27%), тянущимся от белорусов через Рязань до юга Архангельской области. Высокие частоты сосредоточены на северо-востоке (поморы, ненцы, манси), левобережье Волги и юге региона, включая Крым и Кавказ.
rs2244613 (G) гена CES1 (рисунок 3 Г) характеризуется выраженным вектором увеличения частоты с северо-запада (18% у карел) на восток (46-54% у ненцев, манси, башкир) и юг (46% у калмыков и в Дагестане). Область высоких частот охватывает популяции правобережья Волги (35-44% у марийцев и чувашей), многие народы Северного Кавказа (33-45%) и Закавказья (33-38%).
Рис. 3 Генетический ландшафт распространения маркеров CYP2C9, CYP4F2, CES1: А) маркера rs1057910 (C) гена CYP2C9; Б) маркера rs1799853 (T) гена CYP2C9; В) маркера rs2108622 (T) гена CYP4F2; Г ) маркера rs2244613 (G) гена CES1.
Примечание: см. рисунок 1.
Генетический ландшафт распространения маркеров VKORC1 и SLCO1B1
Маркеры гена VKORC1 влияют на эффективность применения антикоагулянтов непрямого действия, например, варфарина. Ген SLCO1B1 кодирует полипептид-переносчик органических анионов, участвующий в транспорте статинов. В их изменчивости проявляется тенденция падения частоты с северо-запада на юго-восток.
rs7294 (T) гена VKORC1 (рисунок 4 А) характеризуется повышенными частотами на северо-западе (44% у вепсов, 45% у белорусов). Средняя частота маркера одинакова у западных финно-угров и славян (37%). У южных русских ~42%, в Калужской и Рязанской областях поднимается до 50%. Минимумы обнаруживаются на севере у ненцев (9%) и манси (15%), в Приуралье у удмуртов (16%), на юге у калмыков (7%). Но в целом низкие частоты сосредоточены на юго-востоке, формируя вектор падения частоты с северо-запада на юго-восток. На Кавказе обнаружены локальные максимумы (46% у чеченцев и ингушей, 42-44% у армян и грузин).
rs9923231 (С) гена VKORC1 (рисунок 4 Б) полностью вторит предыдущему генетическому ландшафту, но отличается не только в два раза большей средней частотой (62%) но и намного большим разбросом частот (73 вместо 43%). При этом становятся заметнее перепады частоты у русских Архангельской области (48-64%).
rs9934438 (G) гена VKORC1 (рисунок 4 В) обладает генетическим ландшафтом, практически неотличимым от предыдущего.
rs4149056 (С) гена SLCO1B1 (рисунок 4 Г) характеризуется тем же вектором снижения частоты с северо-запада (33% у карел и вепсов) на юг (6-10% в Крыму и на Кавказе) и юго-восток (14-15% у башкир и калмыков). Полоса повышенных частот (2830%) тянется от нижегородцев к казакам, а с юга ее огибает полоса низких частот (10-14% в Молдавии, у степных тюрков и калмыков). Локальный минимум у манси (5%) соседствует с повышенными частотами (24-27%) на Русском Севере и у ненцев.
Рис. 4 Генетический ландшафт распространения маркеров VKORC1 и SLCO1B1: А) маркера rs7294 (T) гена VKORC1; Б) маркера rs9923231 (C) гена VKORC1; В) маркера rs9934438 (G) гена VKORC1; Г) маркера rs4149056 (C) гена SLCO1B1.
Примечание: см. рисунок 1.
2. Положение популяций Восточной Европы в генетическом пространстве изменчивости фармакогенетических ДНК-маркеров
Созданный картографический атлас позволяет выявлять и сравнивать пространственную изменчивость каждого из 24 кардио-маркеров. Но для того, чтобы получить общую картину, необходимы методы многомерной статистики. Из них наиболее подходящим является метод главных компонент, учитывающий скоррелированность маркеров. Для большей репрезентативности анализа были отобраны популяции, для которых проведено генотипирование по единой панели 60 фарма-маркеров, объединены популяции одного этноса и анализ проведен дважды — как для 24 кардио-ДНК-маркеров, так и для общей фарма-панели, включающей кроме кардио-маркеров еще 36 фарма-маркеров (Приложение, таблица 1). В итоге в оба вида анализа включены 13 метапопуляций (рисунок 5) со средней выборкой 158 человек.
В генетическом пространстве главных компонент изменчивости 60 фарма-маркеров выделились три кластера (рисунок 5 А), условно названные "Северный", "Западный" и "Восточный", поскольку согласовываются с географическим пространством (но положение популяций в кластере не всегда соответствует географии). "Северный" кластер включил западные финноязычные популяции (вепсов, водь, ижору, карел, саамов) и русских Архангельской области. "Западный" кластер включил все остальные русские популяции, украинцев и субэтносы мордвы, для которых выявлен значительный вклад в геномы широкого круга русских популяций [13]. "Восточный" кластер включил все тюркои финноязычные популяции Приуралья, за исключением самых северных коми-пермяков, приближающихся к "Северному" кластеру. Иными словами, кластеры, выделившееся при использовании общей фарма-панели, не противоречат географии и приближаются к селективно-нейтральному паттерну [3], но противоречат лингвистике — каждый кластер включает народы, говорящие на языках разных лингвистических семей — индоевропейской (русские, украинцы), уральской (вепсы, карелы, коми-пермяки, марийцы, удмурты) и алтайской (татары, чуваши).
При выделении из широкой фарма-панели только кардио-маркеров (рисунок 5 Б) сохраняются все три кластера, но есть и перемены. "Северный" кластер становится очень "рыхлым" за счет больших отличий карел. "Западный" кластер, напротив, уплотняется. Но оба кластера не меняют состав в отличие от "Восточного", в который вошли коми-пермяки, но ушли "на север" марийцы и чуваши.
Рис. 5 Положение изученных популяций Восточной Европы в генетическом пространстве 1 и 2 главных компонент: А) по общей панели 60 фармакогенетических маркеров; Б) по панели 24 кардиологических маркеров.
Примечание: на обоих графиках зеленым цветом отмечены метапопуляции славянских народов, красным — финноязычных, фиолетовым — тюркоязычных. Названия метапопуляций расшифрованы в таблице 1 Приложения.
Обсуждение
В генетическом пространстве главных компонент кластеры кардио-панели вступают в противоречие не только с лингвистикой, но и с географией, и с селективно-нейтральным паттерном, хотя сами кластеры и их положение сохраняются такими же, как и при всей фарма"-панели. И такое противоречие не удивительно — мы видели его на картах атласа. В чем причина своеобразия кардио-панели? Само сокращение числа маркеров с 60 до 24 вряд ли сказалось, но могло проявить действие отбора изза функциональной системности кардио-панели. В общую фарма-панель включены маркеры разной направленности, которые, работая как лебедь, рак и щука, не могут отодвинуть "воз" от селективно-нейтрального паттерна ("Из кожи лезут вон, а возу все нет ходу!"6). При более гармоничном действии "специализированных" кардио-маркеров эффект отбора может стать более зримым.
С помощью картографирования можно своими глазами увидеть, насколько отличается изменчивость популяций по маркерам кардио-панели от общей фарма-панели. В работах [12-14] приведены карты генетических расстояний от разных народов (удмуртов, русских и осетин) до окружающих популяций по фарма-панели и проведено сравнение с селективно-нейтральным генетическим ландшафтом. Увеличение фарма-панели (с 45 до 60 маркеров) и средней выборки из популяции (до 145 человек), позволяет теперь сравнить с ней генетический ландшафт по 24 кардио-маркерам (рисунок 6).
На Кавказе по кардио-панели (рисунок 6 Б) все народы генетически сходны — Кавказ окрашен в зеленые тона малых генетических расстояний (небольшие отличия обнаруживаются лишь у степных ногайцев). Но по "общей" фарма-панели (рисунок 6 А) область сходства с генофондом осетин крайне мала — почти все генофонды Кавказа от них резко отличаются. Относительно близкими к осетинам (0,06<d<0,07, желтые тона) оказались только адыги, грузины, ингуши, чеченцы.
Для русских популяций обнаруживаем противоположную картину. Различий по "общей" фармапанели почти нет (рисунок 6 В) — весь ландшафт окрашен в зеленые тона генетического сходства, охватывающее и русское, и финноязычное, и тюркоязычное население региона (лишь чуваши Татарстана ненамного отличаются от рязанцев). Однако по кардио-панели (рисунок 6 Г) число популяций, генетически несходных с рязанцами, уже заметно больше: и чуваши отличаются значительней, и к ним присоединяются удмурты, бесермяне и горные марийцы (d≥0,08).
Но еще более яркую метаморфозу демонстрируют карты генетических различий между удмуртами и народами Восточной Европы. Если по "общей" фарма-панели генетически сходные популяции расположены на западе (рисунок 6 Д), то по кардио-панели вектор меняется на противоположный (рисунок 6 Е): западные популяции резко отличны от удмуртов, а область генетического сходства тянется на восток.
Рис. 6 Карты генетических расстояний по частотам общей фармакогенетической панели 60 ДНК-маркеров (слева) и 24 кардиологических ДНК-маркеров (справа): А, Б — от осетин до популяций Центрального Кавказа; В, Г — от русских Рязанской и Калужской областей до популяций Центральной России; Д, Е — от удмуртов и бесермян до популяций Восточной Европы.
Примечание: звездой обозначены реперные популяции (русские, удмурты, осетины), от которых рассчитаны генетические расстояния Нея до каждой из групп сравнения (обозначены кружками). Минимальные генетические расстояния (сходство с генофондом реперной популяции) обозначены зелеными тонами; максимальные генетические расстояния (несходство с генофондом реперной популяции) обозначены красно-бордовыми тонами; шкала переходов приведена в легенде каждой карты.
Визуализация генетического сходства показывает, что для разных регионов нет единого правила при переходе от совокупности фарма-маркеров к ДНК-маркерам отдельной группы заболеваний. Совокупность результатов позволяет предполагать, что действие отбора различно и по разным группам заболеваний, и по разным факторам воздействия на организм в рамках одной группы заболеваний, и в разных регионах. Поэтому основной стратегией должно быть массовое генотипирование по единой обширной панели фарма-маркеров репрезентативных выборок народонаселения России, которое обеспечивается популяционными биобанками.
Создание картографического атласа распространения ДНК-маркеров, связанных с сердечно-сосудистой патологией, позволяет специалисту любого профиля, не прибегая к понятийному аппарату популяционной генетики и фармакогенетики, получить ответы на многие вопросы. Можно извлечь информацию о степени распространения любого из 24 ДНК-маркеров в любой части Восточной Европы, выявить регионы с его наибольшей частотой, определить закономерности в изменчивости и многое другое. Важное преимущество атласа — создание всех карт по единой технологии, единым параметрам и в одной шкале — позволяет корректно сравнивать любые карты друг с другом, получая некое многомерное пространство изменчивости изучаемых ДНК-маркеров.
Однако, для полноценного использования атласа важно обсудить две проблемы.
Во-первых, проблема соотношения коренного и "тотального" населения. Популяционная генетика во всем мире работает с коренным населением, и именно его частоты представлены на картах. Медицина обычно работает с "тотальным" населением, не оценивая его этническую разнородность. Как разрешить это противоречие? С помощью данных демографии, которая указывает, какую долю составляют разные этносы в "тотальной" популяции: зная частоту ДНК-маркера в каждом из этносов и взяв как вес долю этого этноса в тотальной популяции, с легкостью оцениваем искомую частоту в "тотальном" населении.
Вторая проблема связана с надежностью исходных данных, используемых для построения карт. В отличие от статистического анализа, для картографирования важно иметь как можно больше дробных популяций, покрывающих пространство карты. Но при таком дроблении снижается размер выборки и растет случайная ошибка. Отчасти она компенсируется за счет интерполяционной процедуры построения карты — соседние популяции как бы "корректируют" эту случайную ошибку. Но основным выходом служит увеличение объема выборки, что обеспечивается развитием популяционных биобанков.
Заключение
Изучение частоты носительства полиморфных генов является важным этапом внедрения фармакогенетического тестирования в клиническую практику. Решение о необходимости фармакогенетического тестирования для персонализации терапии может приниматься в зависимости от этнической принадлежности пациента, что исключает необходимость избыточного необоснованного назначения тестирования пациентов. Проведение широких популяционных фармакогенетических исследований необходимо для выявления частоты носительства клинически значимых полиморфных генов и определения этнических групп, в которых проведение фармакогенетического тестирования может применяться для снижения нежелательных реакций и/или увеличения эффективности фармакотерапии и будет экономически обоснованно.
Созданный картографический атлас изменчивости кардиологических маркеров в населении Восточной Европы является стартовой площадкой для развития геногеографических исследований разных групп населения в разных регионах, которые должны базироваться на изучении популяций по единой панели фармакогенетических маркеров и по репрезентативным выборкам народонаселения, которое обеспечивается популяционными биобанками.
Благодарности. Авторы благодарят АНО "Биобанк Северной Евразии" за предоставление коллекций ДНК. Исследование выполнено при поддержке гранта РНФ № 21-14-00363 (биоинформатический и картографический анализ) и Государственного задания Минобрнауки России для ФГБНУ "МГНЦ" (статистический анализ, интерпретация результатов).
Отношения и деятельность. Исследование выполнено при поддержке гранта РНФ № 21-14-00363 (биоинформатический анализ, картографический анализ) и Государственного задания Министерства науки и высшего образования РФ для Медико-генетического научного центра им. академика Н. П. Бочкова (статистический анализ, интерпретация результатов, написание статьи).
Приложение
Приложение. Рис. 1 Генетический ландшафт распространения маркеров ABCB1, P2RY12 и PON1: А) маркера rs1045642 (G) гена ABCB1; Б) маркера rs4148738 (С) гена ABCB1; В) маркера rs2046934 (G) гена P2RY12; Г) маркера rs662 (C) гена PON1.
Примечание: на каждой карте в легенде слева дана шкала цветовых интервалов: красно-фиолетовые тона — высокая частота (≥50%), желто-оранжевые — средний диапазон (20-50%), зеленые и салатовые — низкие значения (1-20%), серый цвет <1%. Изученные популяции на картах обозначены темно-синими кружками и сопровождаются номером согласно таблице 1 Приложения.
Приложение. Рис. 2 Генетический ландшафт распространения маркеров ABCG2, ADRB1 и CYP2C8: А) маркера rs2231142 (T) гена ABCG2; Б) маркера rs2231137 (T) гена ABCG2; В) маркера rs1801252 (G) гена ADRB1; Г) маркера rs10509681 (C) гена CYP2C8.
Примечание: см. рисунок 1 Приложения.
Приложение. Таблица 1
Изученные популяции
Примечания: * — номер популяции на картах рисунков 1-5 статьи, рисунков 1 и 2 Приложения; ** — метапопуляции на графиках главных компонент на рисунке 5 статьи.
Приложение. Таблица 2
Состав общей фармакогенетической панели ("фарма"-панели)
1. https://биобанк.рф/.
2. https://www.who.int/en/news-room/fact-sheets/detail/cardiovasculardiseases-(cvds)/.
3. https://www.pharmgkb.org/.
4. https://www.cog-genomics.org/plink/.
5. http://jmlr.csail.mit.edu/papers/v12/pedregosa11a.html/.
6. И. А. Крылов. "Лебедь, Щука и Рак".
Список литературы
1. Балановская Е.В., Жабагин М. К., Агджоян А. Т. и др. Популяционные биобанки: принципы организации и перспективы применения в геногеографии и персонализированной медицине. Генетика. 2016;52(12):1371-87. doi:10.7868/S001667581612002X.
2. Балановская Е.В., Балановский О.П. Русский генофонд на Русской равнине. М.: Луч, 2007. 412 с. ISBN: 978-5-87140-267-2.
3. Балановский О. П. Генофонд Европы. М.: Товарищество научных изданий КМК, 2015. 354 с. ISBN: 978-5-9907157-0-7.
4. Balanovsky O, Dibirova K, Dybo A, et al. Parallel evolution of genes and languages in the Caucasus region. Mol Biol Evol. 2011;28(10):2905-20. doi:10.1093/molbev/msr126.
5. Популяционная генетика человека. В кн: Медицинская генетика: национальное руководство. М.: ГЭОТАР-Медиа, 2022:216-54. doi:10.33029/9704-6307-9-GEN-2022-1-896. ISBN: 978-5-9704-6307-9.
6. Balanovska E, Lukianova E, Kagazezheva J, et al. Optimizing the genetic prediction of the eye and hair color for North Eurasian populations. ВМС Genomics. 2020;21(Suppl 7):527. doi:10.1186/s12864-020-06923-1.
7. Балановский О.П., Петрушенко В.С., Горин И.О. и др. Точность предикции пигментации волос и глаз по генетическим маркерам для популяций России. Вестник РГМУ. 2019;5:25-41. doi:10.24075/vrgmu.2019.069.
8. Балановская Е.В., Горин И.О., Кошель С.М. и др. Геногеографический атлас ДНК-маркеров, контролирующих цвет глаз и волос человека. Генетика. 2021;57(12):1356-75. doi:10.31857/S0016675821120031.
9. Горин И. О., Петрушенко В. С., Записецкая Ю. С. и др. Применение популяционного биобанка для анализа распространенности клинически значимых ДНК-маркеров в населении России: биоинформатические аспекты. Кардиоваскулярная терапия и профилактика. 2020;19(6):2732. doi:10.15829/1728-8800-2020-2732.
10. Gorin IO, Balanovsky OP, Kozlov OV, et al. Determining the area of ancestral origin for individuals from North Eurasia based on 5,000 SNP markers. Front. Genet. 2022;13:902309. doi:10.3389/fgene.2022.902309.
11. Балановская Е.В., Петрушенко В.С., Кошель С. М. и др. Картографический атлас распространения 45 фармакогенетических маркеров в народонаселении России и сопредельных стран. Вестник РГМУ. 2020;(6):39-52. doi:10.24075/vrgmu.2020.080.
12. Балановская Е. В., Напольских В. В., Чураков В. С. и др. Генофонды удмуртов и бесермян в контексте финно-угорских и других окружающих народов: полногеномные и фармакогенетические данные. Ежегодник финно-угорских исследований. 2022;16(2):328-46. doi:10.35634/2224-9443-2022-16-2-328-346.
13. Балановская Е.В., Горин И.О., Пономарев Г.Ю. и др. Следы взаимодействия финноязычного, славянского и тюркоязычного населения в современном генофонде и их отражение в фармакогенетике. Вестник РГМУ. 2022;2:20-9. doi:10.24075/vrgmu.2022.019.
14. Балановская Е.В., Агджоян А.Т., Горин И. О. и др. В поисках аланского следа: генетическая история Северного Кавказа по полногеномным данным об аутосомном генофонде. Вестник Московского университета. Серия XXIII. Антропология. 2022;3(2022):48-62. doi:10.32521/2074-8132.2022.3.048-062.
15. Олькова М. В., Петрушенко В. С., Пономарев Г. Ю. Анализ частот 13 полиморфизмов в генах ТР53 и WRAP53 в российских популяциях. Вестник РГМУ. 2021;(1):33-42. doi:10.24075/vrgmu.2021.001.
16. Олькова М.В., Балановский О.П. Исследование частот 10 полиморфных маркеров генов CDKN2A и RB1 в российских популяциях. Бюллетень экспериментальной биологии и медицины. 2021;172(9):347-55. doi:10.47056/0365-9615-2021-172-9-347-355.
17. Козлов А. И., Балановский О. П., Вершубская Г. Г. и др. Генетически детерминированная недостаточность трегалазы в различных группах населения России и сопредельных стран. Вопросы питания. 2021;90(5):96-103. doi:10.33029/0042-8833-2021-90-5-96-103.
18. Balanovsky О, Petrushenko V, Mirzaev K, et al. The variation of genome sites associated with severe COVID-19 across populations the worldwide and national patterns. Pharmgenomoc Pers Med. 2021;14:1391-402. doi:10.2147/PGPM.S320609.
19. Балановская Е.В., Горин И.О., Петрушенко В.С. и др. Геногеография в России и мире SNP-маркеров гена LZTFL1, ассоциированных с тяжелым течением COVID-19. Вестник РГМУ. 2022;(5):31-40. doi:10.24075/vrgmu.2022.047.
20. Vos T, Lim S S, Abbafati C, et al. Global burden of 369 diseases and injuries in 204 countries and territories, 1990-2019: a systematic analysis for the Global Burden of Disease Study 2019. Lancet. 2020;396(10258):1204-22. doi:10.1016/S0140-6736(20)30925-9.
21. Piepoli MF, Abreu A, Albus C, et al. Update on cardiovascular prevention in clinical practice: A position paper of the European Association of Preventive Cardiology of the European Society of Cardiology. Eur J Prev Cardiol. 2020;27(2):181-205. doi:10.1177/2047487319893035.
22. Timmis A, Townsend N, Gale CP, et al. European Society of Cardiology: Cardiovascular Disease Statistics 2019. Eur Heart J. 2020;41(1):12-85. doi:10.1093/eurheartj/ehz859.
23. Здравоохранение в России. 2019: Статистический сборник. Москва. 2019. 170 с. ISBN: 978-5-89476-470-2.
24. Кошель С.М. Геоинформационные технологии в геногеографии. В кн: Современная географическая картография. М.: Дата+. 2012;158-66. ISBN: 978-5-94559-012-0. EDN: TBEVEF.
Об авторах
В. Ю. ПылёвРоссия
Пылёв Вадимир Юрьевич — научный сотрудник лаборатории популяционной генетики человека ФГБНУ «Медико-генетический научный центр им. академика Н. П. Бочкова»; генеральный директор АНО «Биобанк Северной Евразии»
Москва
А. Т. Агджоян
Россия
Агджоян Анастасия Торосовна — кандидат биологических наук, ведущий научный сотрудник лаборатории популяционной генетики человека ФГБНУ «Медико-генетический научный центр им. академика Н. П. Бочкова»; научный сотрудник АНО «Биобанк Северной Евразии»
Москва
И. О. Горин
Россия
Горин Игорь Олегович — научный сотрудник лаборатории популяционной генетики человека
Москва
В. С. Петрушенко
Россия
Петрушенко Валерия Сергеевна — научный сотрудник лаборатории популяционной генетики человека
Москва
Э. А. Почешхова
Россия
Почешхова Эльвира Аслановна — учредитель, доктор медицинских наук, доцент, профессор кафедры биологии с курсом медицинской генетики
Москва, Краснодар
К. Б. Мирзаев
Россия
Мирзаев Карин Бадавиевич — старший научный сотрудник лаборатории популяционной генетики человека ФГБНУ «Медико-генетический научный центр им. академика Н. П. Бочкова»; заведующий лабораторией геномных предикторов нежелательных лекарственных реакций (НИЛ ГПНЛР), проректор по научной работе и инновациям ФГБОУ ДПО РМАНПО Минздрава России
Москва
Е. В. Балановская
Россия
Балановская Елена Владимировна — главный научный сотрудник, заведующая лабораторией популяционной генетики человека ФГБНУ «Медико-генетический научный центр им. академика Н. П. Бочкова»; учредитель АНО «Биобанк Северной Евразии»
Москва
Дополнительные файлы
Рецензия
Для цитирования:
Пылёв В.Ю., Агджоян А.Т., Горин И.О., Петрушенко В.С., Почешхова Э.А., Мирзаев К.Б., Балановская Е.В. Популяционный биобанк как основа для выявления пространственной изменчивости клинически значимых фармакогенетических биомаркеров сердечно-сосудистых заболеваний. Кардиоваскулярная терапия и профилактика. 2022;21(11):3430. https://doi.org/10.15829/1728-8800-2022-3430
For citation:
Pylev V.Yu., Agdzhoyan A.T., Gorin I.O., Petrushenko V.S., Pocheshkhova E.A., Mirzaev K.B., Balanovskaya E.V. Population biobank as a basis for determining spatial variation of clinically relevant pharmacogenetic biomarkers of cardiovascular diseases. Cardiovascular Therapy and Prevention. 2022;21(11):3430. (In Russ.) https://doi.org/10.15829/1728-8800-2022-3430