Как построить самое большое семейное древо и зачем вообще оно нужно

4 716

Как построить самое большое семейное древо и зачем вообще оно нужно

4 716

Как построить самое большое семейное древо и зачем вообще оно нужно

4 716

Генеалогия — это наука, которая не только увлекает пожилых дядюшек, но и может помочь в поимке преступников. Она же может рассказать, как шла миграция населения и как далеко от дома уезжают женщины, чтобы выйти замуж. Специалист по вычислительной генетике Янив Эрлих, который помог построить самое большое семейное древо из 13 миллионов людей, рассказывает о чудесах этой науки.

Люди заходят в интернет по разным причинам. Одна из самых популярных категорий веб-сайтов — та, которой люди пользуются наедине. Она связана с любопытством, немалой долей самолюбования и сосредоточена вокруг записей репродуктивной активности других людей. Конечно, я имею в виду генеалогию — науку об истории семьи.

Когда дело доходит до подробного изложения фамильной истории, в каждой семье появляется человек, который ею одержим. Давайте назовём его дядей Берни. Его можно легко узнать: он точно последний человек, с которым вам хочется сидеть рядом на праздничном семейном обеде. Он утомит вас до смерти странными подробностями жизни некоторых ваших общих предков. Но, как вы знаете, во всём есть научный аспект, и мы обнаружили, что в рассказах дяди Берни есть огромный потенциал для биомедицинских исследований.

Поэтому мы даём возможность ему и его коллегам-генеалогам вносить данные о родных на специальном сайте о генеалогии. Когда пользователи загружают свои семейные древа, он сканирует всех внесённых людей и, если находит совпадения с существующими древами, объединяет два в одно. В результате создаются большие генеалогические древа, которые просто не под силу составить. Повторив этот процесс с миллионами людей по всему миру, мы можем создать древо для всего человечества.

С помощью сайта мы можем объединить 125 миллионов человек в одно семейное древо. Я не могу вывести его на экран, потому что у них попросту меньше пикселей, чем числа людей в этом древе.

Вот пример подмножества на 6 тысяч человек. Каждый зелёный центр переплетения — это человек. Красные узлы показывают браки, а соединения — родителей. В середине этого древа вы видите предков. Передвигаясь по периферии, вы видите потомков. В этом древе примерно семь поколений.
Вот что происходит, когда мы увеличиваем число индивидуумов до 70 тысяч человек — всё ещё крошечное подмножество всех имеющихся у нас данных. Несмотря на это, уже сейчас вы можете увидеть формирование гигантских генеалогических древ с большим числом очень дальних родственников.

Благодаря усердной работе наших генеалогов мы можем вернуться в прошлое на сотни лет назад. Например, сейчас перед нами Александр Гамильтон, который родился в 1755 году.

Он был первым министром финансов США, но сегодня известен в основном благодаря популярному бродвейскому мюзиклу. А мы обнаружили, что у Александра есть более глубокие связи в индустрии шоу-бизнеса. На самом деле он кровный родственник актёра Кевина Бейкона!

Они оба потомки некоей леди из Шотландии, жившей в XIII веке. Поэтому можно сказать, что Александр Гамильтон — это 35-е колено в генеалогии Кевина Бейкона.

И наше древо имеет миллионы аналогичных историй. Мы приложили значительные усилия, чтобы проверить качество этих данных. Используя ДНК, мы обнаружили, что 0,3% связей между матерью и ребёнком в наших данных неверны, что можно соотнести с уровнем усыновления в США до Второй мировой войны.

C отцовской стороны новости не так хороши: 1,9% связей между отцом и ребёнком в наших данных неверны. Я вижу, как некоторые люди здесь ухмыляются. Но эти ошибочные цифры в мужской линии обнаружили не только мы. Предыдущие исследования выявили аналогичную частоту ошибок, используя клинико-генеалогический анализ. Так что качество наших сведений высокое, и это не должно никого удивлять. Генеалоги-энтузиасты заинтересованы в том, чтобы правильно документировать историю своей семьи.

Мы можем использовать эти данные и для получения количественной информации о людях, например в вопросах демографии. Вот взгляд на все наши профили на карте мира.

Каждый пиксель — это человек, который жил в какой-то момент. С таким количеством данных вы можете увидеть контуры многих стран, особенно в Западной Европе и Америке.

В этом ролике мы систематизировали карту, которую я вам показал, учитывая людей, которые родились с 1400 по 1900 год, и сравнили её с известными миграционными событиями. Ролик показывает, что старейшие известные нам родословные тянутся аж до Великобритании, где лучше велась их запись. А затем они расходятся по маршрутам западного колониализма. Давайте посмотрим его.

1492 — Колумб плывёт по Атлантическому океану;
1620 — «Мэйфлауэр» приплывает в Массачусетс;
1652 — голландцы селятся в Южной Африке;
1788 — Великобритания начинает ссылать уголовных преступников в Австралию;
1836 — первые мигранты идут по Орегонской тропе.

Теперь, когда миграция показывает родовые особенности, мы можем задать следующий вопрос: каково среднее расстояние между местом рождения мужей и жен? Оно играет ключевую роль в демографии: то, как люди мигрируют, чтобы создать семью, определяет, как гены распространяются в регионах.

С помощью наших данных мы проанализировали это расстояние и обнаружили, что раньше людям жилось очень легко. Они выбирали себе пару из соседней деревни. Но промышленная революция действительно осложнила нашу личную жизнь. Сегодня благодаря доступным авиабилетам и социальным сетям люди обычно мигрируют более чем на 100 километров от места рождения, чтобы найти свою вторую половинку.

Сейчас вы можете спросить: хорошо, но кто так усложняет себе жизнь, мигрируя с места на место, чтобы создать семью? Это мужчины или женщины? Мы использовали наши данные и обнаружили, что, по крайней мере в последние 300 лет, именно женщины перемещаются с места на место, чтобы сформировать семью. Эти результаты имеют статистическое значение, так что вы можете считать научным фактом, что мужчины ленивы.

Мы можем отойти от вопросов демографии и заняться здоровьем человека. Например, спросить, до какой степени генетические вариации влияют на продолжительность жизни. Предыдущие исследования анализировали её у близнецов, чтобы ответить на этот вопрос. Они указывали, что генетические вариации объясняют около четверти различий в продолжительности жизни людей. Но близнецы могут быть связаны рядом многих причин, в том числе разными экологическими факторами или жизнью внутри общего домашнего хозяйства.

Большие генеалогические древа дают возможность анализировать как близких родственников, например близнецов, так и дальних — даже четвероюродных братьев и сестёр.

Таким образом, мы можем построить устойчивые модели, которые отделяют вклад генетики от факторов окружающей среды. Мы провели анализ и обнаружили, что генетические вариации объясняют только 15% различий в продолжительности жизни, то есть в среднем это пять лет. Оказывается, гены играют в этом гораздо меньшую роль, чем нам казалось раньше. Я думаю, это отличная новость: получается, то, как мы ведём себя, имеет большее значение.

Курение, например, определяет 10 лет жизни — это в два раза больше, чем генетика

Мы можем получить даже более удивительные результаты, если учитываем не только генеалогические древа, но и даём нашим генеалогам возможность документально подтвердить свои ДНК и получить информацию о других. Возможно, это трудно себе представить, но дядя Берни и его друзья могли бы дать криминалистам столько данных о ДНК, сколько нет даже у ФБР.

Когда вы переносите эти сведения на большое семейное древо, вы фактически создаёте маяк, который проливает свет на сотни родственников, имеющих связь с человеком, от которого берёт начало ваша общая ДНК. Разместив несколько маяков на большом генеалогическом древе, вы можете вычислить ДНК неизвестного человека точно так, как система GPS использует несколько спутников для поиска местоположения.

Наглядным примером эффективности этого метода служит поимка убийцы из Калифорнии, одного из самых известных преступников в истории США. ФБР разыскивало этого человека более 40 лет. У них была его ДНК, но информации о нём не было ни в одной полицейской базе данных.

Около года назад ФБР консультировалось со специалистом по генетической генеалогии, и она предложила передать его ДНК в службу генеалогии, которая сможет найти его дальних родственников. Они сделали это. И нашли троюродного брата убийцы из Калифорнии.

Они построили большое семейное древо и сканировали разные его ветви, пока не нашли профиль, который точно соответствовал тому, что они знали об убийце из Калифорнии. Они получили ДНК этого человека, и оно идеально совпало с той ДНК, которая была у них в руках. Они арестовали его и отдали под суд. С тех пор специалисты по генетической генеалогии начали сотрудничать с местными правоохранительными органами США, чтобы использовать эту тактику для поимки преступников. Только за последние полгода они смогли раскрыть более 20 дел с помощью этой методики.

Так что мы должны радоваться, что у нас есть такие люди, как дядя Берни и его собратья-генеалоги. Это не просто любители, которые используют своё хобби для личных целей. Это гражданские учёные, страстно желающие рассказать нам, кто мы такие. И они знают, что прошлое может хранить ключ к будущему.