<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">cardiovascular</journal-id><journal-title-group><journal-title xml:lang="ru">Кардиоваскулярная терапия и профилактика</journal-title><trans-title-group xml:lang="en"><trans-title>Cardiovascular Therapy and Prevention</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1728-8800</issn><issn pub-type="epub">2619-0125</issn><publisher><publisher-name>«SILICEA-POLIGRAF» LLC</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.15829/1728-8800-2020-2732</article-id><article-id custom-type="elpub" pub-id-type="custom">cardiovascular-2732</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>БИОБАНКИРОВАНИЕ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>BIOBANKING</subject></subj-group></article-categories><title-group><article-title>Применение популяционного биобанка для анализа распространенности клинически значимых ДНК-маркеров в населении России: биоинформатические аспекты</article-title><trans-title-group xml:lang="en"><trans-title>Population-based biobank for analyzing the frequencies of clinically relevant DNA markers in the Russian population: bioinformatic aspects</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-9532-8954</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Горин</surname><given-names>И. О.</given-names></name><name name-style="western" xml:lang="en"><surname>Gorin</surname><given-names>I. O.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Игорь Олегович Горин — младший научный сотрудник лаборатории геномной географии</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">gorin.io@phystech.edu</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-5763-5280</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Петрушенко</surname><given-names>В. С.</given-names></name><name name-style="western" xml:lang="en"><surname>Petrushenko</surname><given-names>V. S.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Валерия Сергеевна Петрушенко — младший научный сотрудник лаборатории геномной географии</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">valeriya1296@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-8696-6302</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Записецкая</surname><given-names>Ю. С.</given-names></name><name name-style="western" xml:lang="en"><surname>Zapisetskaya</surname><given-names>Yu. S.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Юлия Сергеевна Записецкая — младший научный сотрудник лаборатории геномной географии</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">zapisetskaya.yus@phystech.edu</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-4540-2922</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Кошель</surname><given-names>С. М.</given-names></name><name name-style="western" xml:lang="en"><surname>Koshel</surname><given-names>S. M.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Сергей Михайлович Кошель — ведущий научный сотрудник лаборатории популяционной генетики человека, к.г.н., ведущий научный сотрудник кафедры картографии и геоинформатики</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">skoshel@mail.ru</email><xref ref-type="aff" rid="aff-2"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-4218-6889</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Балановский</surname><given-names>О. П.</given-names></name><name name-style="western" xml:lang="en"><surname>Balanovsky</surname><given-names>O. P.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Олег Павлович Балановский — доктор биологических наук, профессор РАН, ведущий научный сотрудник, зав. лабораторией геномной географии, главный научный сотрудник лаборатории популяционной генетики человека,  учредитель</p><p>Москва</p></bio><bio xml:lang="en"><p>Moscow</p></bio><email xlink:type="simple">balanovsky@inbox.ru</email><xref ref-type="aff" rid="aff-3"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>ФГБУН Институт общей генетики имени Н. И. Вавилова</institution></aff><aff xml:lang="en"><institution>Vavilov Institute of General Genetics</institution></aff></aff-alternatives><aff-alternatives id="aff-2"><aff xml:lang="ru"><institution>ФГБНУ Медико-генетический научный центр им. академика Н. П. Бочкова; &#13;
ФГБОУ ВО Московский государственный университет им. М. В. Ломоносова</institution></aff><aff xml:lang="en"><institution>N. P. Bochkov Research Center of Medical Genetics; &#13;
Lomonosov Moscow State University</institution></aff></aff-alternatives><aff-alternatives id="aff-3"><aff xml:lang="ru"><institution>ФГБУН Институт общей генетики им. Н. И. Вавилова;&#13;
ФГБНУ Медико-генетический научный центр им. академика Н. П. Бочкова; &#13;
НО Биобанк Северной Евразии</institution></aff><aff xml:lang="en"><institution>Vavilov Institute of General Genetics;&#13;
N. P. Bochkov Research Center of Medical Genetics; &#13;
Lomonosov Moscow State University; &#13;
Biobank of Northern Eurasia</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2020</year></pub-date><pub-date pub-type="epub"><day>24</day><month>12</month><year>2020</year></pub-date><volume>19</volume><issue>6</issue><fpage>2732</fpage><lpage>2732</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Горин И.О., Петрушенко В.С., Записецкая Ю.С., Кошель С.М., Балановский О.П., 2020</copyright-statement><copyright-year>2020</copyright-year><copyright-holder xml:lang="ru">Горин И.О., Петрушенко В.С., Записецкая Ю.С., Кошель С.М., Балановский О.П.</copyright-holder><copyright-holder xml:lang="en">Gorin I.O., Petrushenko V.S., Zapisetskaya Y.S., Koshel S.M., Balanovsky O.P.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://cardiovascular.elpub.ru/jour/article/view/2732">https://cardiovascular.elpub.ru/jour/article/view/2732</self-uri><abstract><p>Одной из задач популяционных биобанков является определение частот клинически значимых генетических полиморфизмов у населения. Население России характеризуется исключительно высокой гетерогенностью как в этническом, так и в генетическом плане, поэтому частоты генетических маркеров востребованы не в одной выборке, а в серии выборок, отражающих основное разнообразие генофонда различных народов и регионов.</p><sec><title>Цель</title><p>Цель. Разделение народонаселения России и сопредельных стран на группы популяций, удовлетворяющие определенным условиям, а также имеющие репрезентативную выборку в существующих данных и биобанках.</p></sec><sec><title>Материал и методы</title><p>Материал и методы. Разработан метод объединения популяций в более крупные группы с сохранением гомогенности внутри этих групп на основе главных компонент с кластеризацией К-средних, с последующей доработкой кластеризации для большей гомогенности и более равномерного распределения размеров групп с применением FST расстояний. Технология отлажена на примере Биобанка Северной Евразии, поэтому материалом для исследования послужили массивы широкогеномных данных по 4,5 млн генетических маркеров для 1883 образцов, представляющих 247 популяций России и сопредельных стран из выборок данного биобанка. Разработанный подход, результирующий набор популяций и их карта могут применяться при использовании других коллекций биоматериалов из российских популяций.</p></sec><sec><title>Результаты</title><p>Результаты. Применение этого подхода позволило разделить все население России и сопредельных стран на 29 этногеографических групп (ЭГГ), характеризующихся относительной генетической гомогенностью. Этот набор популяций рекомендуется как базовый для популяционных скринингов на выявление частоты любых генетических маркеров среди населения России. Построена карта, демонстрирующая деление народонаселения на 29 территорий — ареалов ЭГГ.</p></sec><sec><title>Заключение</title><p>Заключение. На основе надежного массива полногеномных данных проведено районирование генофонда населения России: выделены ЭГГ, обладающие контрастными частотами аллелей при сравнении друг с другом, но при этом относительно гомогенные внутри себя. Результирующая карта и реестр групп могут применяться в популяционно-генетических, медико-генетических и фармакогенетических исследованиях.</p></sec></abstract><trans-abstract xml:lang="en"><p>One of the tasks of population-based biobanks is to determine the frequencies of clinically relevant genetic polymorphisms in the population. The population of Russia is very heterogeneous both ethnically and genetically. Therefore, the frequencies of genetic markers are in demand not in one sample, but in a series of samples reflecting the heterogeneity of the gene pool of different peoples and regions.</p><sec><title>Aim</title><p>Aim. To divide the population of Russia and neighboring countries into population groups meeting certain conditions, as well as having a representative sample in existing data and biobanks.</p></sec><sec><title>Material and methods</title><p>Material and methods. We developed a method for combining populations into larger groups with maintaining intragroup homogeneity based on the principal components analysis with K-means clustering, followed by refinement of clustering for higher homogeneity and a more equal distribution of group sizes using FST distances. The technology has been adjusted using the example of the Biobank of Northern Eurasia. Therefore, the material was the genome-wide data on 4.5 million genetic markers for 1,883 samples representing 247 populations of Russia and neighboring countries from this biobank. The developed approach, the resulting set of populations and related map can be applied for other collections of biomaterials from Russian populations.</p></sec><sec><title>Results</title><p>Results. Application of this approach made it possible to divide the entire population of Russia and neighboring countries into 29 ethnogeographic groups, characterized by relative genetic homogeneity. This set of populations is recommended as a baseline for population screenings to identify the frequency of any genetic markers among the population of Russia. A map has been constructed showing the division of population into 29 ethnogeographic areas.</p></sec><sec><title>Conclusion</title><p>Conclusion. On the basis of a reliable genome-wide data, the zoning of gene pool of the Russian population was carried out. We identified ethnogeographic groups with intergroup contrasting allele frequencies, but at the same time with relatively homogeneous intragroup parameters. The resulting map and register of groups can be used in population genetic, medical genetic and pharmacogenetic studies.</p></sec></trans-abstract><kwd-group xml:lang="ru"><kwd>ДНК-маркеры</kwd><kwd>биоинформатика</kwd><kwd>популяционный биобанк</kwd><kwd>население</kwd><kwd>генофонд</kwd><kwd>районирование</kwd></kwd-group><kwd-group xml:lang="en"><kwd>DNA markers</kwd><kwd>bioinformatics</kwd><kwd>population-based biobank</kwd><kwd>population</kwd><kwd>gene pool</kwd><kwd>zoning.</kwd></kwd-group><funding-group><funding-statement xml:lang="ru">Исследование выполнено в рамках Государственного задания Министерства науки и высшего образования РФ для Медико-генетического научного центра им. академика Н. П. Бочкова и для Института общей генетики РАН им. Н. И. Вавилова.</funding-statement><funding-statement xml:lang="en">The study was carried out within the State assignment of the Ministry of Science and Higher Education of the Russian Federation for the N. P. Bochkov Research Center of Medical Genetics and Vavilov Institute of General Genetics.</funding-statement></funding-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Balanovskaya EV, Zhabagin MK, Agdzhoyan AT, et al. Population biobanks: Organizational models and prospects of application in gene geography and personalized medicine. Russian Journal of Genetics. 2016;52(12):1371-87. (In Russ.) Б doi:10.7868/S001667581612002X.</mixed-citation><mixed-citation xml:lang="en">Balanovskaya EV, Zhabagin MK, Agdzhoyan AT, et al. Population biobanks: Organizational models and prospects of application in gene geography and personalized medicine. Russian Journal of Genetics. 2016;52(12):1371-87. (In Russ.) doi:10.7868/S001667581612002X.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Jing L, Haiyi L, Xiong Y, et al. Genetic architectures of ADME genes in five Eurasian admixed populations and implications for drug safety and efficacy. J Med Genet. 2014;51(9):614-22. doi:10.1136/jmedgenet-2014-102530.</mixed-citation><mixed-citation xml:lang="en">Jing L, Haiyi L, Xiong Y, et al. Genetic architectures of ADME genes in five Eurasian admixed populations and implications for drug safety and efficacy. J Med Genet. 2014;51(9):614-22. doi:10.1136/jmedgenet-2014-102530.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Mirzaev KB, Fedorinov DS, Ivashchenko DV, et al. ADME pharmacogenetics: future outlook for Russia. Pharmacogenomics. 2019;20(11):847-65. doi: 10.2217/pgs2019-0013.</mixed-citation><mixed-citation xml:lang="en">Mirzaev KB, Fedorinov DS, Ivashchenko DV, et al. ADME pharmacogenetics: future outlook for Russia. Pharmacogenomics. 2019;20(11):847-65. doi: 10.2217/pgs2019-0013.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Triska P, Chekanov N, Stepanov V, et al. Between Lake Baikal and the Baltic Sea: genomic history of the gateway to Europe. BMC Genet. 2017;18(Suppl 1):110. doi:10.1186/s12863-0170578-3.</mixed-citation><mixed-citation xml:lang="en">Triska P, Chekanov N, Stepanov V, et al. Between Lake Baikal and the Baltic Sea: genomic history of the gateway to Europe. BMC Genet. 2017;18(Suppl 1):110. doi:10.1186/s12863-0170578-3.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Jeong C, Balanovsky O, Lukianova E, et al. The genetic history of admixture across inner Eurasia. Nat Ecol Evol. 2019;3:966-76. doi:10.1038/s41559-019-0878-2.</mixed-citation><mixed-citation xml:lang="en">Jeong C, Balanovsky O, Lukianova E, et al. The genetic history of admixture across inner Eurasia. Nat Ecol Evol. 2019;3:966-76. doi:10.1038/s41559-019-0878-2.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Balanovsky OP, Gorin IO, Zapisetskaya YS, et al. Interaction of the gene pools of the Russian and Finnish-speaking population of the Tver region: analysis of 4 million SNP markers. Vestnik RSMU. 2020;(6). (In Russ.) doi:10.24075/vrgmu.2020.072.</mixed-citation><mixed-citation xml:lang="en">Balanovsky OP, Gorin IO, Zapisetskaya YS, et al. Interaction of the gene pools of the Russian and Finnish-speaking population of the Tver region: analysis of 4 million SNP markers. Vestnik RSMU. 2020;(6). (In Russ.) doi:10.24075/vrgmu.2020.072.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Alhusain L, Hafez AM. Nonparametric approaches for population structure analysis. Hum Genomics. 2018;12(1):25. doi:10.1186/ s40246-018-0156-4.</mixed-citation><mixed-citation xml:lang="en">Alhusain L, Hafez AM. Nonparametric approaches for population structure analysis. Hum Genomics. 2018;12(1):25. doi:10.1186/ s40246-018-0156-4.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Liu N, Zhao H. A non-parametric approach to population structure inference using multilocus genotypes. Hum Genomics. 2006;2(6):353-64. doi:10.1186/1479-7364-2-6-353.</mixed-citation><mixed-citation xml:lang="en">Liu N, Zhao H. A non-parametric approach to population structure inference using multilocus genotypes. Hum Genomics. 2006;2(6):353-64. doi:10.1186/1479-7364-2-6-353.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Patterson N, Price AL, Reich D. Population Structure and Eigenanalysis. PLoS Genet. 2006;2(12):e190. doi:10.1371/journal.pgen.0020190.</mixed-citation><mixed-citation xml:lang="en">Patterson N, Price AL, Reich D. Population Structure and Eigenanalysis. PLoS Genet. 2006;2(12):e190. doi:10.1371/journal.pgen.0020190.</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Hartigan JA, Wong MA. Algorithm AS 136: A K-Means Clustering Algorithm. J R Stat Soc. 1979;28:100-8. doi:10.2307/2346830.</mixed-citation><mixed-citation xml:lang="en">Hartigan JA, Wong MA. Algorithm AS 136: A K-Means Clustering Algorithm. J R Stat Soc. 1979;28:100-8. doi:10.2307/2346830.</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Lee C, Abdool A, Huang C. PCA-based population structure inference with generic clustering algorithms. BMC Bioinformatics. 2009;10 Suppl 1(Suppl 1):S73. doi:10.1186/1471-2105-10S1-S73.</mixed-citation><mixed-citation xml:lang="en">Lee C, Abdool A, Huang C. PCA-based population structure inference with generic clustering algorithms. BMC Bioinformatics. 2009;10 Suppl 1(Suppl 1):S73. doi:10.1186/1471-2105-10S1-S73.</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Chang CC, Chow CC, Tellier LC, et al. Second-generation PLINK: rising to the challenge of larger and richer datasets. Gigascience. 2015;4:7. doi:10.1186/s13742-015-0047-8.</mixed-citation><mixed-citation xml:lang="en">Chang CC, Chow CC, Tellier LC, et al. Second-generation PLINK: rising to the challenge of larger and richer datasets. Gigascience. 2015;4:7. doi:10.1186/s13742-015-0047-8.</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Manichaikul A, Mychaleckyj JC, Rich SS, et al. Robust relationship inference in genome-wide association studies. Bioinformatics. 2010;26:2867-73. doi:10.1093/bioinformatics/btq559.</mixed-citation><mixed-citation xml:lang="en">Manichaikul A, Mychaleckyj JC, Rich SS, et al. Robust relationship inference in genome-wide association studies. Bioinformatics. 2010;26:2867-73. doi:10.1093/bioinformatics/btq559.</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Pedregosa F, Varoquaux G, Gramfort A, et al. Scikit-learn: Machine Learning in Python. J Mach Learn Res. 2011;12:2825-30. https://www.researchgate.net/publication/51969319_Scikit-learn_Machine_Learning_in_Python.</mixed-citation><mixed-citation xml:lang="en">Pedregosa F, Varoquaux G, Gramfort A, et al. Scikit-learn: Machine Learning in Python. J Mach Learn Res. 2011;12:2825-30. https://www.researchgate.net/publication/51969319_Scikit-learn_Machine_Learning_in_Python.</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Koshel SM. Geoinformation technologies in genogeography. Modern geographic cartography. 2012;158-66. (In Russ.) Кошель С. М. Геоинформационные технологии в геногеографии. Современная географическая картография. 2012;158-166. https://www.researchgate.net/publication/294848419_Geoinformacionnye_tehnologii_v_genogeografii.</mixed-citation><mixed-citation xml:lang="en">Koshel SM. Geoinformation technologies in genogeography. Modern geographic cartography. 2012;158-66. (In Russ.) Кошель С. М. Геоинформационные технологии в геногеографии. Современная географическая картография. 2012;158-166. https://www.researchgate.net/publication/294848419_Geoinformacionnye_tehnologii_v_genogeografii.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
