12 – 22
13 – 2715
14 – 19
15 – 5
Вопрос 64: Как связаны между собой индивидуальные константы скорости отдельных маркеров, и суммарная (кумулятивная) константа скорости мутации по всему гаплотипу?
Выше мы рассматривали константы скоростей мутаций в отдельных маркерах, как 0.00059 мутаций на условное поколение в маркере DYS393, или 0.00220 мутаций на условное поколение в маркере DYS390. И здесь вступает в силу важное правило химической кинетики: константы скоростей в параллельных реакциях (в данном случае – мутациях) суммируются, если регистрируется расходование исходного вещества или образование суммарного продукта реакции, и изучается скорость этого суммарного процесса. Простой пример – если из бассейна вода вытекает по нескольким трубам разной толщины, то можно изучать скорость вытекания воды по каждой трубе отдельно, но если интересует общая потеря воды, то суммируется потеря воды по всем трубам. Это практически полная аналогия с расходованием предкового гаплотипа и с накоплением гаплотипов потомков. Этот процесс можно изучать по каждому маркеру в отдельности, а можно – по всему гаплотипу, то есть по сумме маркеров.
Рассмотрим простой случай – 12-маркерный гаплотип, состоящий из маркеров DYS 393, 390, 19, 391, 385a, 385b, 426, 388, 439, 389-1, 392, 389-2. Пример – гаплотип гаплогруппы I2a, а именно ее ветви L147.2, к которой относятся почти все восточноевропейские носители этой гаплогруппы, общий предок которых жил примерно 2300 лет назад:
13 24 16 11 14 15 11 13 13 13 11 31
Константы скоростей индивидуальных маркеров следующие:
DYS393 0.00059
DYS390 0.00220
DYS19 0.00179
DYS391 0.00220
DYS385a 0.00280
DYS385a 0.00360
DYS426 0.00009
DYS388 0.00022
DYS439 0.00300
DYS389-1 0.00080
DYS392 0.00040
DYS389-2 0.00231
Но поскольку мутации во всех этих маркерах происходят независимо и неупорядоченно, и мы, как правило, заинтересованы в скорости мутации всего гаплотипа, а не его отдельных маркеров (многочисленные примеры будут даны ниже), то суммарная константа скорости мутаций во всем гаплотипе равна сумме индивидуальных констант скоростей, которая равна 0.0200 мутаций на условное поколение (25 лет).
Так же рассчитываются суммарные константы скорости мутаций в гаплотипах, которые приведены ниже.
Надо сказать, что здесь даются упрощенные примеры, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам, сотням и тысячам гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых числах, и т. д. В таких случаях погрешности расчетов приближаются к плюс-минус 10 % от определяемой величины, поскольку именно такой определена погрешность вычисления константы скорости мутации. Здесь только иллюстрируется принцип расчета.
Ясно, что у протяженных 111-маркерных гаплотипов разрешение лучше (400-маркерные гаплотипы пока крайняя редкость). Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Протяженные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно[62 - http://r1a.org/irakaz-v03.xls, http://r1a.org/, / Интернет-сайт «R1a»; http://www.ysearch.org/, http://www.smgf.org/pages/ydatabase.jspx / Интернет-сайт «A Free Public Service from Family Tree DNA». http://www.familytreedna.com/public/R1 aY-Haplogroup/default.aspx?section=yresults, http:// www.familytreedna.com/public/R1a/default.aspx?section=yresults, / Интернет-сайт «Family Tree DNA»; Klyosov A. A., Rozhanskii I. L. Re-Examining the «Out of Africa» Theory and the Origin of Europeoids (Caucasoids) in Light of DNA Genealogy (2012). Advances in Anthropology, 2, No.2, 80–86 http://dx.doi. org/10.4236/aa.2012.22009 (список баз данных дан в конце статьи)].
Вопрос 65: Какие значения имеют все 111 маркеров, применяемые в ДНК-генеалогии?
Таблица приведена ниже. Числа 0.02, 0.046 и 0.09 справа – значения констант скоростей мутаций для 12-, 25-, и 37-маркерных гаплотипов, выраженных в мутациях на гаплотип на условное поколение (в 25 лет). Для 67-маркерных гаплотипов, которые заканчиваются маркером DYS565 константа скорости равна 0.12 мутаций на гаплотип на условное поколение. Самое последнее число, 0.198 – константа скорости мутаций на 111-маркерный гаплотип на условное поколение. Эти величины приведены и обоснованы в статье[63 - Клёсов, А.А., Килин, В.В. (2015) Калькулятор Килина-Клёсова для расчета времен до общих предков (TMRCA): новое издание. Вестник Академии ДНК-генеалогии, т. 8, № 3, стр. 321–375.] Клёсова и Килина (2015). Обоснование велось по восьми направлениям:
1) Сопоставление датировок, полученных с помощью линейного метода (ЛМ) по 67- и 111-маркерным гаплотипам. Это – наиболее достоверные форматы гаплотипов.
2) Сопоставление датировок, полученных с помощью ЛМ по п.1, и 37-, 25-, 17-, 12 и 6 – маркерным гаплотипам. При этом надо принимать во внимание, что чем меньше число маркеров, тем выше разброс. Поэтому разброс – это нормально, но систематическое (или постоянное) завышение или занижение результатов по сравнению с 67/111 маркерными расчетами – это ненормально. В каждом случае причины соответствующих отклонений анализировались.
3) ЛМ по п.1 и 22-маркерным (медленным) гаплотипам.
4) ЛМ по п.1 в применении к документальным генеалогиям, и тем, для чего известны расчеты другими достоверными методами (например, по снипам). Правда, по снипам надо принимать во внимание, что там нет «бутылочных горлышек популяции», поэтому результаты расчетов по снипам будут или равны результатам расчетов по ЛМ, или давать завышенные результаты. Если есть и то, и другое, то это нормально.
5) ЛМ по 67- и 111-маркерным гаплотипам, и ККК (квадратичный по индивидуальным константам) по ним же.
6) ЛМ по 22-маркерным гаплотипам, и ККК по ним же.
7) «Медленные» 22-маркерные гаплотипы в сопоставлении с известными древними датировками.
8) Сопоставление расчетов по 111- и 67-маркерным гаплотипам с данными документальной генеалогии.
Рис. 9. Значения индивидуальных констант скоростей мутаций для 111 маркеров
Вопрос 66: Почему датировки по мутациям в гаплотипах и по снипам часто не совпадают?
Строго говоря, это разные датировки. Расчеты по мутациям в гаплотипах наших современников дают временное расстояние до общего предка выборки. Если выборка малая, нерепрезентативная, то она может дать заниженное или завышенное расстояние до общего предка. С увеличением размера выборки, или числа выборок по изучаемой территории (вплоть до всего континента или всей планеты) датировка постепенно стабилизируется, приходя к значению, которое можно принять за наиболее особно-ванное. По аналогии, если бросать монету всего немного раз, то усредненное значение «вероятности» выпадения орла или решки может быть завышенным или заниженным по сравнению с известной вероятностью 0.5, но при увеличении числа бросков это усредненное значение стабилизируется, приближаясь к 0.5.
Важно, что время жизни общего предка выборки современников из определенной и выбранной гаплогруппы вовсе не обязательно покажет датировку образования данной гаплогруппы. Популяция данной гаплогруппы могла пройти «бутылочное горлышко», при котором могли выжить только некоторые, и потомство могло выжить и дожить до наших дней только от одного человека, пережившего бутылочное горлышко. Тогда, разумеется, датировка общего предка будет более недавней, чем датировка образования рассматриваемой гаплогруппы.
В отличие от этого, датировка по снипам не ограничена вымираниями древних популяций, если остался хотя бы один мужчина, прямое потомство от которого дожило до наших дней. Тогда цепочка снипов проходит в его Y-хромосоме до общего предка с шимпанзе и древнее. В этом причина, почему «датировка общего предка выборки» или «датировка общего предка региона», даже обширного, часто не совпадают друг с другом.
Пример – субклад V13 гаплогруппы E1b. Датировка образования субклада по снипам (компания YFull) – примерно 7600 лет назад, с учетом погрешности, приведенной YFull – 7600±1300 лет назад. С этим согласуется археологическая датировка ископаемого субклада E1b-V13, обнаруженный на севере Испании – примерно 7000 лет назад. Для вычисления датировки общего предка выборки современных гаплотипов собрали 193 гаплотипа в 67-маркерном формате по всей Европе, и их дерево гаплотипов оказалось почти идеально симметричным:
Рис. 10. Дерево 193 гаплотипов в 67-маркерном формате субклада E1b-V13
Все 193 гаплотипа содержат 2857 мутаций, что дает 2857/193/0.12 = 123 ? 141 условных поколений до общего предка, то есть общий предок всей выборки жил 3525±360 лет назад[64 - Discussions. The mutation rate constants in DNA genealogy and related issues. Вестник Российской Академии ДНК-генеалогии (2011), том 4, № 11,2108–2195.]’ [65 - Клёсов, А.А., Пензев, К.А. (2015) Арийские народы на просторах Евразии. М., Книжный мир, стр. 196–199.]. Мы столь подробно на этом останавливаемся, чтобы показать разрыв во времени между датировкой ископаемого гаплотипа группы E1b-V13, и датировкой общего предка современных носителей той же группы. Разрыв – почти четыре тысячи лет. На самом деле, разрыв, скорее всего, начался примерно 4500 лет назад, в ходе заселения континентальной Европы эрбинами, носителями гаплогруппы R1b, и продолжался тысячу лет. Это было время выживания ДНК-генеалогической линии E1b-V13, пока выживание не состоялось окончательно, то есть критический размер популяции был преодолен.
Теперь проверим, как ископаемый гаплотип соотносится с современными гаплотипами субкладаVl3. Ископаемый имеет вид
13 24 13 10 16 19 11 13 11 31 16 14 20 10 22
(ископаемый E1b-V13, Испания)
Предковый гаплотип, к которому сходится дерево, показанное выше, в 67-маркерном формате имеет вид
13 24 13 10 16 18 11 12 12 13 11 30–15 9 9 11 11 26 14 20 32 14 16
17 17 – 9 11 19 21 17 12 17 20 31 34 11 10–10 8 15 15 8 11 10 8 12 10
0 23 24 18 11 12 12 17 7 12 22 18 12 13 12 14 11 11 11 11