Оценить:
 Рейтинг: 3.5

Кому мешает ДНК-генеалогия? Ложь, инсинуации, и русофобия в современной российской науке

Год написания книги
2016
<< 1 ... 18 19 20 21 22 23 24 >>
На страницу:
22 из 24
Настройки чтения
Размер шрифта
Высота строк
Поля

39 – 17

40 – 1 раз

Видно, что картина мутаций значительно более «размазанная» по сравнению с медленными константами скоростей. Считая, что все мутации одношаговые, получаем 3594 мутации на 3466 аллелей DYS710 за те же 152 условных поколения, прошедших со времени жизни общего предка этих гаплотипов. Мы видим, как высокие скорости мутаций «размазывают» распределение мутированных аллелей в широком диапазоне. Если при минимальной скорости мутаций в DYS472 сохранились неизменными 3461 предковые аллели в гаплотипах 3466 потомков (константа скорости мутации 0.000008 на условное поколение), и в DYS617 сохранились неизменными 2921 предковые аллели в гаплотипах 3466 потомков (константа скорости мутации на в 63 раза выше, 0.0005 на условное поколение), то в случае самого «быстрого» маркера сохранились всего 1058 предковые (базовые) аллели, и число мутаций равно 3594 вместо 5 в DYS472, то есть в 700 с лишним раз больше. Константа скорости мутации была бы равна 3594/3466/152 (без учета поправки на возвратные мутации), то есть была бы равна примерно 0.0068 мутаций на условное поколение. Но из-за высокой скорости мутаций настолько много, что отношение числа мутированных аллелей к общему числу аллелей превышает единицу (3594/3466 = 1.037), и поправки на возвратные мутации «захлебываются», дают заниженные показатели, и в целом перестают работать. Формальный расчет по формуле, приведенной выше, показывает, что число возвратных мутаций здесь практически равно числу «прямых» мутаций, и полученную величину 0.0055 нужно удвоить. В действительности усредненная контанта скорости мутации этого маркера по разным гаплогруппам равна 0.0073 на условное поколение (25 лет), и она приведена в таблице выше.

Еще пример относительно «быстрого маркера» – это DYS534. В том же списке из 3466 гаплотипов (и, соответственно, аллелях данного маркера) наблюдается следующая картина распределений:

12 – 3 раза

13 – 48

14 – 524

15 – 1574

16 – 1043

17 – 229

18 – 43

19 – 2

Считая, как обычно, что все мутации одношаговые, получаем 2267 мутаций на 3466 аллелей DYS534 за те же 152 условных поколений, прошедших со времени жизни общего предка этих гаплотипов. Мы видим, что по сравнению с самым «быстрым» маркером DYS710 (в котором сохранились всего 1058 предковых (базовых) аллелей, и число мутаций равно было 3594, в случае DYS534 сохранилось 1574 предковых аллелей, и общее число мутаций равно 2267. Давайте посмотрим, что получится в этом случае. Константа скорости мутации, получаемая из экспериментальных данных, равна 2267/3466/152 (без учета поправки на возвратные мутации), то есть равна примерно 0.00430 мутаций на условное поколение. Моделирование дает среднюю константу скорости 0.00315 мутаций на условное поколение по разным гаплогруппам.

Таким образом можно проводить расчет констант скоростей мутаций, используя большие серии гаплотипов. Но работа на этом не заканчивается, потому что серии гаплотипов могут быть искаженными, включать примеси из других серий, с другим общим предком, включать другие субклады, с другим распределением аллелей по частотам, и так далее. Поэтому получаемые значения констант скоростей мутаций необходимо калибровать по известным документальным генеалогиям, опять желательно по нескольким. Как это делается, мы увидим в следующем разделе.

Вопрос 69: Насколько константы скоростей мутаций, определенные в разных регионах мира, надежны для проведений расчетов в ДНК-генеалогии? Что такое «калибровка» констант скоростей мутаций?

Приведу некоторую аналогию – а насколько надежны расчетные скорости (на самом деле – константы скоростей) радиоактивного распада соответствующих веществ? Влияют ли на них регионы планеты, где проводятся измерения? Любой образованный человек ответит – конечно, нет, не влияют. Скорость распада радиоактивных материалов определяется исключительно «внутренними» свойствами вещества, а не внешними воздействиями. Это – фундаментальные показатели. Вот так же должен отвечать каждый образованный человек на соответствующий вопрос о константах скоростей мутаций в гаплотипах. Это – фундаментальные показатели. Никакие регионы, питание, физические упражнения, национальность, гражданство или партийная принадлежность на них не влияют. Естественно, речь здесь идет о нормальных условиях, а не, скажем, в условиях солнечного ядра, или при смертельных уровнях радиации.

Итак, мутации в гаплотипах потомков расходятся от предкового гаплотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где n – число мутаций в серии из N гаплотипов, k – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации[75 - Klyosov, A.A. (2009) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. I. Basic principles and the method. J. Genetic Genealogy, 5, 186–216; Klyosov, A.A. (2012) Ancient history of the Arbins, bearers of haplogroup R1b, from Central Asia to Europe, 16,000 to 1500 years before present. Advances in Anthropology, 2, No. 2, 87-105.]. На сотнях и тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов. Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы рассмотрим ниже.

Теперь вопрос – насколько надежны величины констант скоростей мутации в соответствующих маркерах Y-хромосомы? Они надежны настолько, насколько надежно их определяют, калибруют, проверяют исследователи. Когда это делают популяционные генетики – совершенно ненадежны, они это показали последними двадцатью годами их так называемых «исследований». Они до сих пор так и не знают, какие значения эти константы имеют. Они до сих пор, в академических статьях 2015 года, продолжают использовать «скорости Животовского»[76 - Karmin, M….J?rve, M….Tishkoff, S…. Pocheshkhova, E., Sabitov, Z., Yepiskoposyan, L…. Behar, D., Balanovska, E., Derenko, M., Malyarchuk, B., Hammer, M., Balanovsky, O., Tyler-Smith, C., Underhill, P.A., Willerslev, E., Kivisild, T. (2015) Genome Research, doi/10.1101/gr.186684.114.]. Причем «на полном серьезе» обсуждают, что на временах до 5 тысяч лет эти «скорости» сильно завышают датировки, и вот на временах 40–60 тысяч лет подходят в самый раз. Они так и не поняли, что 23-маркерные гаплотипы на временах 40–60 тысяч лет вообще не применимы, там больше половины столь «быстрых констант скоростей», что они вообще не работают, потому что мечутся как белка в колесе. Это все равно, что секундомером измерять астрономические явления продолжительностью в тысячи и миллионы лет. И попгенетики этого так еще и не поняли!

Иногда принцип датировки «разбега» мутаций в гаплотипах с течением времени называют «принципом молекулярных часов». Смысл в этом есть, но примитивный. Дело не в том, что часы, а в том, чтобы правильно ходили. Любая реакция в химических или биологических системах, описываемая константой скорости первого порядка, есть «обычные молекулярные часы», поскольку связана с хронологией процесса на молекулярном уровне. Динамика любого такого процесса связана с временем согласно формуле с = с

е

, где c

– исходное состояние системы (например, начальное количество или концентрация изучаемого вещества; количество гаплотипов Y-хромосомы в изучаемой выборке, и т. д.), с – состояние системы в определенный момент времени t (где t – время прошедшее с начала реакции, t-t

), или количество базовых, то есть исходных гаплотипов в изучаемой выборке в настоящее время, спустя время t, прошедшее со времени жизни общего предка изучаемой серии гаплотипов), k – константа скорости реакции (мутаций, в данном случае). Эту же формулу можно переписать в виде ln(c

/c) = kt, и она становится выражением логарифмического метода анализа выборок гаплотипов в ДНК-генеалогии. Берем, скажем, сто или тысячу гаплотипов, или любое другое их число, делим на число базовых (то есть одинаковых, идентичных друг другу гаплотипов, суть предковых гаплотипов, которые не успели мутировать за время t, прошедшее со времени жизни общего предка), берем натуральный логарифм (ln), и получаем произведение kt, то есть константу скорости мутации, помноженную на число лет, прошедшее со времени жизни общего предка, или на число условных поколений, опять же прошедших после общего предка – в зависимости от того, выражали константу скорости в годах, или в поколениях.

Логарифмический метод будет обсуждаться в следующем разделе, а пока обратим внимание, что результаты расчетов в ДНК-генеалогии обычно получаются в виде произведения kt. Это относится и к логарифмическому методу (см. выше), и к так называемому линейному методу, в котором считают число мутаций в серии гаплотипов, происходящих от одного общего предка, и делят их на число гаплотипов и на константу скорости мутаций в гаплотипе.

Отсюда уже видно, что неважно, сколько лет положить на условное поколение – 20, 25, 30, 35 или любое другое число лет, поскольку константа скорости мутации тут же подстроится, они завязаны друг на друга, произведение-то одно. В ДНК-генеалогии, как отмечалось выше, берется 25 лет на условное поколение, и, соответственно, константы скорости мутации приобретают определенные значения, получаемые по калибровке (см. ниже). Например -

для 12-маркерных гаплотипов константа равна 0.02 мутаций на гаплотип на условное поколение,

для 25-маркерных 0.046 мутаций на гаплотип на условное поколение,

для 37-маркерных – 0.09,

для 67-маркерных – 0.12,

для 111-маркерных – 0.198 мутаций на гаплотип на условное поколение.

Если это пересчитать в расчете не на гаплотип, а на маркер, то получим соответствующие константы скорости 0.00167, 0.00184, 0.00243, 0.00179, 0.00178 мутаций на маркер на условное поколение. Уже видно, что константы скорости разные для разных гаплотипов, и различаются, например, для 37-маркерных и 12-маркерных гаплотипов в 1.46 раз, то есть на 46 %. А если сравнить с 6-маркерными гаплотипами (константа скорости мутации на гаплотип равна 0.0074, на маркер 0.00123), то диапазон различий в константах в зависимости от длины маркера расходится на уже на 1.98, или на 98 %. Вывод – никак нельзя принимать константы скорости мутации на маркер за постоянные величины, одинаковые для всех гаплотипов, как делают в своих расчетах популяционные генетики. 98 % ошибки в расчетах только за это допущение – цена такого неумного (или неквалифицированного, или некомпетентного) предположения. Иначе говоря, иметь часы – дело нехитрое, но надо, чтобы они были отрегулированы. Это означает, что к ним должны прилагаться корректные константы скоростей мутаций, а корректные величины получаются корректной калибровкой.

Подходим к вопросу о калибровке констант скоростей мутаций.

Данные по калибровке были опубликованы в 2011 году в журнале Advances in Anthropology[77 - Rozhanskii, I.L., Klyosov, A.A. (2011) Mutation rate constants in DNA genealogy (Y chromosome). Advances in Anthropology, 1, No. 2, 26–34.], и недавно изложены в популярном виде на Переформате (http://pereformat.ru/2014/11/dna-calibration/). Суть в том, что были взяты генеалогические данные для 13 семей, удовлетворяющие сформулированным жестким критериям. Эти 13 семей (или «Проектов») были отобраны из сотен других, которые были менее многочисленны или датировки которых были менее достоверны, или гаплотипы были короткими, то есть низкого разрешения.

В указанной статье[78 - Там же] приведены многочисленные графики для гаплотипов разной протяженности, и каждый график иллюстрировал надежность калибровки, доверительные интервалы и прочее. Статья – редкая по глубине обоснований и достоверности полученных данных, результаты калибровок выверены на 3160 гаплотипах из 55 гаплогрупп и субкладов, из них 2489 гаплотипов были 67-маркерными.

Не будем приводить все калибровочные графики, дадим только калибровочную диаграмму для 37- и 67-маркерных гаплотипов. На рис. 12 на горизонтальной оси – число лет до общего предка каждой из документированных ДНК-генеалогических «семей», на вертикальной оси – среднее число мутаций на маркер (поскольку гаплотипы разные – 37- и 67-маркерные) в гаплотипах, принадлежащих этим семьям.

Рис. 12. Калибровочные взаимоотношения между временем, прошедшим от общих предков генеалогических серий гаплотипов в каждой группе («генеалогической семье»), и числом мутаций, накопившхся с того времени, в расчете на маркер в гаплотипах в 37- и 67-маркерном формате. Данные и принцип подхода опубликованы в журнале Advances in Anthropology (2011, Rozhanskii & Klyosov) и приведены в дополненном виде И.Л. Рожанским на Переформате (http://pereformat.ru/2014/11/dna-calibration/ (http://pereformat.ru/2014/11/dna-calibration/)).

Видно, что есть четкая линейная зависимость между «возрастом» ДНК-линии и числом мутаций на маркер. Так и должно быть, поскольку мутации в гаплотипах (и маркерах) происходят случайным образом и описываются кинетикой первого порядка. Угол наклона корреляционной прямой для 37-маркерных гаплотипов выше, чем у 67-маркерных, поскольку мутации в 37 маркерах (где большая доля «быстрых» по мутациям маркеров) в совокупности происходят чаще, чем в 67-маркерных (где, напротив, маркеры с 38 до 67-го по порядку содержат высокую долю «медленных» маркеров). Отсюда и получились те константы скоростей мутаций, приведенные выше в данной статье: для 37-маркерных гаплотипов 0.00243 мутаций на маркер (0.09 мутаций на гаплотип) за условное поколение, для 67-маркерных гаплотипов 0.00179 мутаций на маркер (0.12 мутаций на гаплотип) за условное поколение. Для 67-маркерных гаплотипов точность калибровки больше, и соответствует погрешности в определении константы скорости мутаций ±2.5 %[79 - http://pereformat.ru/2014/11/dna-calibration/]. Рассмотрение тех нескольких тысяч гаплотипов, упомянутых выше, из 55 гаплогрупп и субкладов позволило заключить, что использованная калибровка и метод расчета дают точность в определении времени жизни предка с точностью ±10 % или меньше в интервале от 500 до 6000 лет назад.

Вопрос 70: Могло ли быть так, что мутации в ДНК в одном регионе планеты возникали с большей частотой, чем в другой (скажем, в местах, где радиоактивность была выше или по каким-то климатическим причинам и т. п.)?

Нет, не могло, если речь идет об обратимых мутациях в гаплотипах.

Часто слово «мутации» люди понимают ограниченно, как поломка чего-то в живых организмах под влиянием внешних воздействий, обычно радиации. Но в гаплотипах – это не поломка. Это процесс филигранной перестройки, перемещения блоков нуклеотидов в ДНК. Выше в этой книге был уже приведен пример строения маркера DYS393, в котором четверка нуклеотидов AGAT, то есть аденин-гуанин-аденин-тимин, повторяется определенное количество раз. Например, 13 раз, как у большинства носителей разных гаплогрупп:

и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше. И вот «мутация» приводит к тому, что вместо 13 раз эта четверка стала повторяться у потомков 12 или 14 раз, в результате однократной ошибки копирующей ДНК-полимеразной системы. Ну как радиация это сможет сделать? В любом случае, этого никто не показал, поэтому и вопроса как такового нет. Мы же не спрашиваем, могут ли на скорость мутации повлиять инопланетяне? Спросим, когда к такому вопросу появятся основания. Пока их нет.

Но выше шла речь в основном о мутациях в гаплотипах, с их филигранными перестройками, с вопроизводимыми константами скоростей. А вот в случае снипов картина может быть значительно более сложной и намного менее воспроизводимой. Там мутации не филигранны, там часто просто «поломки», простые превращения одного нуклеотида в другой, делеции (то есть просто выпадения нуклеотидов, иногда сразу нескольких) и прочие повреждения. Вот там внешняя среда может и влиять на мутации и частоту их появления, просто это пока мало изучено. Возможно, это поставит определенные и немалые ограничения для датировок по снип-мутациям. Иногда это видно даже простым глазом – например, выявляются десяток снип-мутаций там, где должны быть просто одна-две, чтобы было соответствие с уже выявленными закономерностями. Поэтому по снип-мутациям ошибки пока очень велики, возможно, такими и останутся.

Вопрос 71: Как производят расчет времен до общего предка серии гаплотипов?

По определению, чтобы рассчитать время до общего предка серии гаплотипов, необходимо, чтобы данная серия происходила от одного общего предка. Другими словами, чтобы современные носители этих гаплотипов все происходили от одного общего предка, в отношении которого производятся расчеты. Это, казалось бы, совершенно очевидное правило, игнорировалось популяционными генетиками на протяжении последних 20 лет, то есть практически всегда.

Давайте посмотрим, к чему это приводило и продолжает приводить попгенетиков.

Начиная с 1997 года время от времени выходят статьи израильских (в основном) популяционных генетиков, которые раз за разом утверждают, что они идентифицировали предковый гаплотип прародителя «ветхозаветных первосвященников», коэнов, который по их расчетам по мутациям в гаплотипах жил по разным расчетам между 3000 и 2600 лет назад. Он якобы имел следующий 6-маркерный гаплотип (маркеры DYS19, DYS388, DYS390, DYS391, DYS392, DYS393), который получил название «модального гаплотипа коэнов» (МГК):

14 16 23 10 11 12

В статье[80 - Thomas, M.G., Skorecki, K., Ben-Ami, H., Parfitt T., Bradman N., Goldstein D.B. (1998) Origins of Old Testament priests. Nature, 394, 138–140.] рассматривали 306 гаплотипов евреев из Израиля, Канады и Англии, и нашли 112 вариантов гаплотипов. Из них отобрали те, которые близки к «модальному гаплотипу коэнов», исключили из рассмотрения DYS388, и в оставленных 5-маркерных гаплотипах нашли, что среднее отклонение их от усеченного МГК равно 0.226 мутаций на маркер. Поскольку авторы принимали, что средняя скорость мутаций в этих 5-маркерных гаплотипах равна 0.0021 на маркер на поколение (продолжительность поколения не была определена), то общий предок всех отобранных гаплотипов жил, по мнению авторов, 0.226/0.0021 = 108 поколений назад. У авторов при этом делении получилось 106 поколений назад, но это уже несущественно. Авторы написали, что если брать 25 лет на поколение, то общий предок жил 106х25 = 2650 лет назад, а если брать 30 лет на поколение, то он жил 3180 лет назад. Можно было бы и не упоминать, но со средней скоростью мутаций на маркер в данных гаплотипах авторы тоже ошиблись, она равна 0.00171, а не 0.0021 мутаций на маркер, и общий предок тогда жил якобы 132 поколения, или 3300 лет назад (при 25 годах на поколение) или 3960 лет назад (при 30 годах на поколение). Действительно, можно было бы не упоминать, потому что основная ошибка авторов не в делениях одного на другое, а в том, что ими постулировалось, что все рассматриваемые гаплотипы происходят от одного общего предка, хотя это оказалось, как мы покажем ниже, не так. Авторы по сути просто усреднили «отклонения величины аллелей от средней», а там были гаплотипы по меньшей мере от двух разных предков, один из которых, самый основной по количеству гаплотипов в выборке, жил всего тысячу лет назад. Никаким «ветхозаветным священником» он не был. Авторы на самом деле рассматривали разные ДНК-генеалогические линии, усредняя их, как берут хрестоматийную «среднюю температуру по больнице». Так работает популяционная генетика.

Следующая статья по гаплотипам евреев[81 - Behar, D.M., Thomas, M.G., Skorecki, K., Hammer, M.F., Bulygina, E., Rosengarten, D., Jones, A.L., Held, K., Moses, V., Goldstein, D., Bradman, N., Weale, M.E. (2003) Multiple origins of Ashkenazi Levites: Y chromosome evidence for both Near Eastern and European ancestries. Am. Hum. Genet. 73, 768–779.] могла бы прояснить ситуацию, но для попгенетиков не прояснила. В статье были опубликованы 194 гаплотипа в 6-маркерном формате, из которых 91 гаплотип были идентичны друг другу, и соответствовали «модальному гаплотипу коэнов» (см. выше). Авторам должно было быть ясно, что когда половина гаплотипов представляют собой предковый гаплотип, то предок явно не древний, и не мог жить больше 3 тыс лет назад, раз половина гаплотипов не успела мутировать. Но ясно бывает тогда, когда есть соответствующие знания, «ощущение ситуации». У авторов этого, очевидно, не было. А в другой половине (точнее, в 103 гаплотипах из 194) имелось 263 мутаций от «модального гаплотипа коэнов». Если бездумно разделить общее число мутаций на общее число гаплотипов и на константу скорости мутации 0.0074 на 6-маркерный гаплотип на поколение, 263/194/0.0074, то получим 183 ^224 условных поколений (стрелка показывает поправку на возвратные мутации), или 5600±660 лет до общего предка «гаплотипов коэнов». Это неразумно высокая величина, намного превышающяя времени жизни библейского Аарона по любым библейским интерпретациям, который по толкованию Библии жил примерно 3600 лет назад, но это все «лирика». Проблема в том, что так вести расчеты, постулируя, что гаплотипы происходят от одного общего предка, вообще нельзя. Вот как выглядит ДНК-генеалогическое дерево этих 194 гаплотипов (рис 13.).
<< 1 ... 18 19 20 21 22 23 24 >>
На страницу:
22 из 24