В повседневной жизни мы делим людей на группы по внешности или языку общения. Большинство датчан похожи друг на друга больше, чем каждый из них — на итальянца (
вот классная визуализация с усредненными портретами разных народностей). Датчане и итальянцы куда ближе между собой, чем каждый из них — к жителям суб-сахарской Африки: человеческие фенотипы кластеризованы по географическому паттерну. Распределение генотипов имеет похожую структуру: члены локальной группы, как правило, имеют более тесные родственные связи, чем жители отдаленных областей, а популяции, населяющие один регион, более близки, чем те, чьи места обитания разделены географическими барьерами (например, горной грядой или водным массивом).
При этом генетическое разнообразие человеческой популяции ниже, чем у многих биологических видов. Объясняют это тем, что человечество — вид молодой: у отдельных групп было относительно немного времени, чтобы аккумулировать отличия. Два случайно выбранных человека отличаются друг от друга каждым из ~1000 нуклеотидов, тогда как два шимпанзе не совпадают раз в ~500 «букв». И, тем не менее, в сумме в человеческом геноме есть около 3 миллионов потенциальных «точек расхождения». Большинство таких несоответствий, называемых однонуклеотидными полиморфизмами (single nucleotide polymorphism, SNP), нейтрально или практически нейтрально, однако часть из них и отвечает за фенотипические отличия между людьми.
Распределение нейтральных полиморфизмов (так как они не несут биологического смысла, то и направленному эволюционному отбору не подвергаются, разносятся ветром миграций) в мировой популяции отражает демографическую историю нашего вида. Генетические и археологические данные указывают на то, что в последние 100 000 лет размер человеческой популяции значительно вырос. Люди расселялись за пределы Африки, колонизируя остальной мир. Процесс расселения влиял на географическое распределение аллелей двумя путями: во-первых, сказывался «эффект основателя» — в популяции переселенцев, как правило, была представлена только часть генетических вариантов из всего пула разнообразия их в предковой популяции; во-вторых, происходило так называемое «ассортативное скрещивание», т.е. пары образовывались преимущественно внутри своей группы, что ограничивало распространение существующих и возникающих de novo полиморфизмов среди особей, населявших различные географические области. Эти процессы вели к постепенному накоплению генетических различий.
В контексте популяционных групп геномные маркеры начали изучать в 70-х — 80-х годах, в 90-е их стали использовать для выявления популяционной принадлежности конкретного человека. Исследователи снова и снова демонстрировали, что генетические полиморфизмы позволяют успешно выделить популяционные группы и определить групповую принадлежность индивидуума. Тогда же показали, что люди, живущие на одном континенте, как правило, ближе друг к другу генетически, чем люди с различных континентов. Поначалу в таких исследованиях информация о месте рождения, расе, этнической группе была известна с самого начала и использовалась совместно с генетическими данными; если же испытуемые распределялись по кластерам «вслепую», исключительно на основе генетических признаков, соответствие между географическим происхождением, этнической принадлежностью и популяционной структурой было менее явным. Как показали дальнейшие исследования, успех зависел от используемых генетических маркеров и их количества (больше — лучше), корректного выбора референсных популяций и других факторов (
11).
К 2004 году в США генетическое определение популяционной принадлежности применялось не только в биомедицинских исследованиях, но и в расследованиях преступлений: вот
эта статья из Nature содержит захватывающую историю о том, как полицейские, отчаявшись найти преступника, заказали ДНК-тест в коммерческой компании, определились с цветом кожи подозреваемого и раскрыли дело. Предложения по анализу генетического происхождения удачно попали в волну повального интереса людей к собственному прошлому. «Roots mania», так назвали это увлечение в статье в Time, посвященной «America's latest obsession» — генеалогическим исследованиям.
Активно применяют геномные методы специалисты, изучающие происхождение и эволюцию народов. Например, в 2013 году международная команда исследователей использовала генетический анализ для опровержения гипотезы происхождения евреев-ашкеназов от хазар (
12). Набор геномных данных, использованный авторами, находится в открытом доступе: в нем представлено более 100 мировых популяций. Предлагаем вместе с нами смоделировать небольшое исследование: определить место клиентов Genotek в этой выборке, а заодно разобраться в технических деталях определения популяционной принадлежности.