4161±421 по 6-маркерным гаплотипам, линейный метод
Как видим, расчеты дали вполне удовлетворительное совпадение в пределах погрешности измерений, даже для коротких 12- и 6-маркерных гаплотипов.
Человек сторонний, не очень знакомый со статистикой, скажет – как же так, расчеты по одному маркеру, DYS390, дали примерно 4580 лет со времени жизни общего предка субклада R1b-L21, а расчеты по всем 111-маркерным гаплотипам, с общим числом аллелей 384728, дали 3810±381 или 4197±274 лет, по линейному и квадратичному методам, то есть заметно ниже. Но в этом статистика и заключается, что мутации неупорядоченные, по отдельности различаются, но все они группируются вокруг некого «центра», «ядра», и при усреднении математический аппарат дает среднюю величину и величину погрешности расчетов, или среднее квадратичное отклонение при определенных доверительных интервалах. В данном случае DYS390 – это всего один маркер, а их сто одиннадцать. Но даже в 6-маркерных гаплотипах, куда DYS390 входит, усреднение по всем шести дает датировку 4161±421 лет, то есть датировка по одному DYS390 входит в диапазон погрешностей. А датировка по 6-маркерному гаплотипу входит в диапазон погрешностей для серии 111-маркерных гаплотипов.
Вопрос 63: Как проводились расчеты констант индивидуальных скоростей мутаций для всех 111 маркеров?
Это – результат большой работы, которая проводилась с 24 сериями 111-маркерных гаплотипов практически всех гаплогрупп, для которых в базах данных эти гаплотипы были числом хотя бы в несколько десятков. Для большинства гаплогрупп расчетные серии содержали сотни гаплотипов – помимо упомянутых ранее 3466 гаплотипов субклада R1b-L21, были 859 и 976 111-маркерных гаплотипов гаплогруппы R1a (разные серии), 829 гаплотипов гаплогруппы R1b-Uio6, 968 гаплотипов гаплогруппы I1, 661 гаплотипов гаплогруппы J, 1417 гаплотипов гаплогруппы J2, и так далее, общим числом П850 гаплотипов в 111-маркерном формате. При этом проверялась сходимость расчетов гаплотипов разных форматов и расчетов разными методами. Результаты этой работы опубликованы в Вестнике Академии ДНК-генеалогии в 2015 году[59 - Клёсов, А.А., Килин, В.В. (2015) Калькулятор Килина-Клёсова для расчета времен до общих предков (TMRCA): новое издание. Вестник Академии ДНК-генеалогии, т. 8, № 3, стр. 321–375.].
Расчеты констант скоростей мутаций в маркерах производятся на основании их распределений в больших сериях гаплотипов. Чем меньше константа скорости мутации данного маркера, тем, естественно, меньше мутаций за определенное время, в качестве которого обычно рассматривается время, прошедшее от общего предка. Если взять, например, серию из 3466 гаплотипов субклада R1b-L21, к которой мы здесь неоднократно обращались именно потому, что она одна из наиболее репрезентативных по численности гаплотипов, то маркере DYS472 там всего пять мутаций:
7 – 1 (то есть аллель 7 встречается в 3466 маркерах DYS472 всего один раз)
8 – 3461 раз
9 – 4 раз
В маркере DYS393 в той же серии уже 232 мутации:
11 – 2
12 – 81
13 – 3237
14 – 145
15 – 1
В маркере DYS390 – 1165 мутаций:
21 – 3
22 – 22
23 – 228
24 – 2364
25 – 815
26 – 33
27 – 1
Поскольку время от общего предка во всех трех случаях одно и то же, то даже не зная его, уже можно заключить, что константы скорости мутаций должны отличаться друг от друга в пропорции 5: 232: 1165 (числа – количества мутаций от базового маркера для трех маркеров), или, пропорционально, 1: 46: 233 Это – тогда, когда нет осложняющих факторов, которые, впрочем, есть всегда. Среди этих факторов – примесь посторонних гаплотипов, почти неизбежная при массовых тестированиях, перекошенная серия гаплотипов, когда одних родственников (даже отдаленных) в серии больше, чем других, когда в серии присутствуют представители нижестоящих субкладов, причем одних субкладов больше, чем других, и так далее. Вывод такой, что одной серией гаплотипов при расчетах констант скоростей мутаций ограничиваться нельзя, надо проводить рассмотрение многих серий гаплотипов из разных гаплогрупп, выяснять по возможности причины различий, и усреднять полученные константы скоростей мутаций по разным сериям. В некоторых сериях отклонения буквально гипертрофированные – например, в той же серии R1b-L21 оказалось несколько сотен гаплотипов дочернего субклада R1b-M222, у которого характерная величина аллели DYS392=14 вместо обычной DYS392=13. Если этого не знать или не заметить, то число мутаций в медленном маркере DYS392 окажется завышенным на сотни мутаций, и формально рассчитанная «константа скорости» окажется несуразно высокой.
При сопоставлении расчетных констант по большой серии гаплогрупп такие искажения должны быть заметны, проанализированы, и если причина выяснена и действительно показано, что это искажения, то эти выпадающие величины должны быть приняты во внимание. Таким образом видно, что это кропотливая и большая работа. Дилетанты или прочие любители обычно выхватывают одну серию гаплотипов, делят одно на другое, без всяких перекрестных проверок и размышлений, и вуаля, ответ готов. Он часто такой – «расчеты по мутациям смысла не имеют». Пример такой дилетантской (в данном отношении) статьи Busby et al (2011)[60 - Busby, Brisighelli, F., Sanchez-Diz, P., Ramos-Luis, E., Martinez-Cadenas, C., Thomas, M.G., Bradley, D.G., Gusmao, L., Winney, B., Bodmer, W., Vennemann, M., Coia, V., Scarnicci, F., Tofanelli, S., Vona, G., Ploski, R., Vecchiotti, C., Zemunik, T., Rudan, I., Karachanak, S., Toncheva, D., Anagnostou, P., Ferri, G., Rapone, C., Hervig, T., Moen, T., Wilson, J.F., Capelli, C. (2011) The peopling of Europe and the cautionary tale of Y chromosome lineage R-M269. Proc. Royal Soc. B, published online, doi:10.1098/rspb.2011.1044.], сюда же относятся неквалифицированные рассуждения Dienekes Pontikos[61 - Klyosov, A.A. (2011) The recent infamous (and fa1led) attempt to discredit the mutation rate constants. An overview of Busby et al. (2011) article in Proc. Of the Royal Soc. (B) and Dienekes Ponticos “essay” in his Anthropology Blog. Proc. Of the Russian Academy of DNA Genealogy, vol. 4. No. 9, 18311892.], и прочих. Они основывались именно на выхватывании отдельных величин, которые оказались искаженными, и отсюда делались «глобальные» негативные выводы. По аналогии, можно бросить монету три раза, и на основании полученного результата объявить теорию вероятности «псевдонаукой».
Проще с протяженными гаплотипами, в первую очередь 67- и 111-маркерными, в которых искажения в индивидуальных маркерах, которые (искажения) также имеют статистический характер, уравновешиваются, компенсируются на множестве маркеров, и в итоге дают взаимно согласованные данные. Примеры (показаны датировки протяженных серий 111-маркерных гаплотипов, первая колонка – 67-маркерные гаплотипы, вторая – 111-маркерные), датировки без округления:
Часто спрашивают, а сохраняются ли константы скоростей мутаций в других гаплогруппах и субкладах? Ответ – естественно, сохраняются, так как откуда, например, маркер DYS393 «знает», какая там снип-мутация имеется на другом конце Y-хромосомы, и которая определяет носителя Y-хромосомы в определенный субклад? Маркер есть маркер, это обычно три- или тетра-нуклеотид, повторяющийся определенное количество раз в Y-хромосоме. Раз в несколько тысяч лет он удлиняется или укорачивается на одно (обычно) звено, и что ему до удаленной снип-мутации? Но люди интересуются, обычно не задумываясь о таких деталях, им представляется, что гаплогруппа – это что-то большое и материальное, вляющее на скорости мутации во всей Y-хромосоме каким-то чудодейственным образом.
Еще пример – субклад R1b-M222, в котором 818 аллелей маркера DYS393 распределяются следующим образом:
12 – 5
13 – 791
14 – 22
Число мутаций (от базового значения маркера) равно 27, что дает 27/818/0.00059 = 56 ? 57 условных поколений, или 1425±310 лет до общего предка. По данным расчета по снипам субклад R1b-M222 образовался 4300 лет назад (http://www.yfull. com/tree/R1b/), но популяция прошла бутылочное горлышко, и общий предок современных носителей R1b-M222 жил на три тысячи лет позже. Такое бывало довольно часто.
Еще один непростой пример – гаплогруппа J2. Пример непростой, потому что гаплогруппа древняя, и состоит из многих обрывков ДНК-генеалогических линий, которые усложняют расчеты. Посмотрим, насколько однородный там набор из 587 аллелей маркера DYS393, которые распределяются следующим образом:
9 – 1
10 – 0
11 – 5
12 – 510
13 – 65
14 – 5
15 – 1
Всего – 86 одношаговых мутаций. Мы видим опять несимметричное распределение аллелей, идущих «на понижение» и «на повышение». Но если это пока отложить на последующее рассмотрение, то 86 мутаций для 587 аллелей – это при равном «возрасте» общего предка соответствует 508 мутациям для 3466 аллелям (в субкладе R1b-L21), а там – только 232 мутации, то есть в 2.19 раз меньше. В идеальном случае (без осложняющих факторов) это соответствует датировке общего предка для выборки J2 примерно 3810x2.19 = 8300 лет. Определение датировки по 417 гаплотипам (другая выборка) гаплогруппы J2 дало 8993±903 и 9914±993 лет до общего предка (по 67- и 111-маркерным гаплотипам). Разница заметная (8 % и 19 %, соответственно), но район датировок тот же, тем более с учетом, что мы сравниваем датировку по одному маркеру с датировками по 67 и 111 маркерам.
Еще одна илюстрация, как примеси сторонних субкладов искажают датировки. В субкладе R1b-L21 3466 аллелей DYS392 распределяются следующим образом:
11 – 8
12 – 22
13 – 2715
14 – 675
15 – 30
16 – 16
Здесь перекос в распределении (по маркеру DYS392=14) вызван тем, что подавляющая часть аллелей «14» относится к нижестоящему субкладу R1b-M222, в котором данная аллель является предковой, и закрепилась в последующих поколениях. В итоге из 821 мутаций 675 относится к отдельному субкладу, со своим общим предком. Для правильного расчета надо инородные аллели снимать, например, путем построения дерева гаплотипов, в котором субклад М222 уйдет в отдельную ветвь, и соответствующие гаплотипы из счета надо также снимать. При этом снятыми окажутся 655 аллелей «14», 24 аллели «15» и все 16 аллелей «16», и распределение окажется вполне симметричным:
11 – 8