Подведены итоги масштабного исследования генетического материала и лексики балтийских и славянских народов. Как складывались отношения славян с древним населением Евразии? Пятнадцатилетний труд международного коллектива генетиков и лингвистов показал, что славяне, стремительно расселяясь по Восточной Европе в I тысячелетии нашей эры, распространяли свой язык, но вбирали в себя генофонд других народов. Ученые также подтвердили предполагавшееся по языковым данным близкое родство между славянами и балтами.

Латыш русскому — родственник

Вряд ли кто-либо, хоть однажды слышавший украинскую, белорусскую и русскую речь, сомневается, что русские, белорусы и украинцы — близкие родственники. То же самое касается и прочих славянских языков вроде польского или чешского, — все иллюзии на этот счет пропадают при первом же с ними знакомстве. Гораздо сложнее принять идею, что ближе всего к славянским языкам балтийские — латышский и литовский. У них там все не так — тоны, долгота гласных… Да и генетически, кажется, прибалты от славян отличаются. Однако же, как ни странно, с точки зрения языка литовцы и латыши родственны именно славянам, а не, допустим, своим соседям эстонцам. Гипотеза балтославянского родства, в настоящее время поддерживаемая большинством лингвистов, гласит, что некогда существовал единый балтославянский праязык, который отделился в незапамятные времена от праиндоевропейского языка и потом распался на общебалтийский и общеславянский праязыки. А те уже, в свою очередь, дали нам современные балтийские и славянские языки.

Языковое родство

Что значит «язык отделился»? Представим, что одно племя земледельцев живет в деревне, и время от времени молодые и активные группы из этой деревни уходят и селятся где-нибудь неподалеку. Образуется новая деревня. Через некоторое время на довольно большой территории живут люди, которые говорят на одном и том же языке, но на разных диалектах — потому что в разных деревнях язык развивается немного по-разному. Соседи еще понимают друг друга, а вот те, кто живет совсем далеко, начинают терять языковое единство. Когда носители диалектов перестают понимать друг друга, можно считать, что языки разошлись. Чем меньше у них сохранилось общей базовой лексики (таких слов как «собака», «кровь», «кость», названия частей тела, личные местоимения, глаголы «умирать», «кусать», «пить» и так далее.), тем больше времени назад это случилось. На подсчетах совпадений в такой базисной лексике основывается лексикостатистика — наука, позволяющая вычислять степень родства между языками и сроки их расхождения.

Изображение: exitum.org Народы Восточной Европы в IX веке нашей эры.

Для полноты картины можно вкратце напомнить теорию: русский язык, на котором написана эта заметка, входит в восточно-славянскую группу языков, которая, в свою очередь, наряду с южно- и западнославянскими представляет собой славянские языки, распавшиеся на отдельные диалекты примерно в V веке нашей эры. Время разделения общеславянского языка на три ветви (восточную, западную и южную) — это примерно до I века. Распад балтославянского праязыка лингвисты относят примерно к 1500 году до нашей эры, а от праиндоевропейского языка (общего предка для таких языков, как русский, английский и армянский) балтославянский отделился в промежутке от 7000 до 4500 лет назад. Такую картину дают лексико-статистические расчеты, и они хорошо соотносятся с общим представлением о быстром распространении славян по Восточной Европе в первом тысячелетии нашей эры, подтвержденным археологическими данными.

На стыке дисциплин

Впрочем, близость между славянскими и балтийскими языками, о которой мы говорили выше, может быть связана и с территориальными контактами — все-таки славяне с латышами и литовцами много столетий жили практически на одной территории. Ареальные (соседские) контакты или родственные связи — вечный вопрос исторического языкознания, на который не так просто получить ответ.

Раньше в распоряжении ученых были только лингвистические и археологические данные, которые далеко не всегда можно сопоставить друг с другом. Прогресс в области исследований генома человека в последние десятилетия открывает совершенно новые горизонты. Анализ генетического материала позволяет, в частности, получить представление о том, в каких направлениях и с какой скоростью передвигались носители этих генов. Не менее интересно и то, насколько гены соседних народов совпадают между собой, — в частности, это позволяет понять, какие популяции были поглощены при распространении славян.

Следствие ведут генетики

На прошлой неделе в журнале PLoS One появилась статья, подводящая итог эпохальному 15-летнему исследованию генофонда славянских и прибалтийских народов. Провела его международная группа под руководством доктора биологических наук Олега Балановского (Институт общей генетики и Медико-генетический научный центр РАН) и академика Рихарда Виллемса из Тартусского университета (Эстония).

Суть работы — анализ трех видов генетического материала: митохондриальной ДНК (мтДНК), которая передается только по материнской линии (рассмотрено 6876 мтДНК); Y-хромосомы, наследуемой по отцовской линии (6079 Y-хромосом), и однонуклеотидных полиморфизмов (SNP, рассмотрено 296 профилей) — это точечные мутации, по которым можно определять примерное время расхождения геномов их носителей.

Один из методов, который использовался в работе, называется IBD (identical by descent, идентичные по происхождению). Как рассказал «Ленте.ру» Олег Балановский, это происходит так: «Ищутся фрагменты генома, которые у людей из разных популяций (например, болгарина и поляка) идентичны по происхождению, то есть унаследованы от общего предка. Чем больше таких общих сегментов между популяциями, тем они роднее друг другу. Но если поколений от общего предка прошло много, то фрагменты будут короткие (разбиты многократно произошедшими рекомбинациями), а если предок был совсем недавно (братья-сестры), то фрагменты будут длинными, чуть ли не в четверть хромосомы».

Изображение: Kushniarevich et al Карта популяций балто-славян. Зеленым фоном показаны восточные славяне, розовым — западные славяне, бежевым — южные славяне, голубым — балтийские народы. Значки обозначают местоположение популяций, в которых собраны образцы: проанализированные по мтДНК (белые кружки), проанализированные по Y-хромосоме (черные точки), проанализированные по SNP в аутосомах (красные треугольники). Расчеты с помощью языка

Ценность исследования в том, что результаты генетических исследований были сопоставлены с данными лексико-статистических расчетов, о которых мы говорили выше и которые позволяют рассчитать время расхождения языков. Один из авторов статьи, научный сотрудник Института языкознания РАН Алексей Касьян, рассказал «Ленте.ру», что «работа по подготовке лексических списков велась отечественными лингвистами несколько лет в рамках международного проекта Global Lexicostatistical Database (GLD)».

Проект GLD — это то, что уже много лет делают в Москве лингвисты-компаративисты, занимающиеся реконструкцией праязыков. Они поставили перед собой задачу подготовить тщательно выверенные списки базисной лексики разных языков. Это не так просто, как кажется на первый взгляд. В подобном списке, к примеру, не должно быть заимствованной лексики — только исконная, унаследованная от праязыка. Нужно также определить, какое именно слово в языке соответствует значению, считающемуся базисным, то есть наиболее трудно вытесняемому из языка. К примеру, одно из таких значений обозначается английским словом dog. А что ему соответствует в русском языке — «собака» или «пес»? С ходу и не ответишь. Однако существует ряд параметров, помогающих формализовать выбор верного слова и увеличить тем самым точность списка.

Для каждого языка таких слов в базе GLD — 110. Это и есть те самые выверенные данные, которые значительно уменьшают возможность ошибки при применении лексико-статистических методов — в том числе при расчете времени разделения языков. По словам Касьяна, GLD — это «одно из первых крупных междисциплинарных исследований, где основной упор в лингвистической части сделан на подготовку качественных входных данных, а не на их рутинную обработку». От качества обрабатываемого материала сильно зависит адекватность результатов всех подобных исследований — и биологических, и лингвистических.

Изображение: Kushniarevich et al Генеалогическое древо балто-славянских языков

Как объясняют авторы лингвистической части исследования, их анализ вполне ожидаемо показал, что славянская языковая семья разделилась на три группы — западную, восточную и южную. «Далее три ветви распадаются в V-VI веках на таксоны следующего уровня, что связано с быстрым распространением славян по Европе и Балканам. Словенский язык пришлось исключить из анализа, так как, похоже, он представляет собой западнославянский язык, отрезанный венграми и другими народами от своего ареала и подвергавшийся последнюю тысячу лет влиянию южнославянских языков. Хорошие лексикографические описания словенских диалектов отсутствуют, поэтому без специальных полевых исследований прояснить вопрос происхождения словенского нельзя», — комментирует Алексей Касьян.

Олег Балановский отмечает, что идея подключить лингвистов к работе генетиков возникла уже на первом этапе — близость балтийских и славянских языков была очевидна. Было ясно, что данные относительно того, как именно генетически связаны между собой языки, следует сравнивать с генетическим анализом их носителей.

Несколько лет назад соавторы исследования уже проводили похожую работу, изучая генофонд кавказских народов. Тогда лингвистические данные тоже сравнивали с генетическими — и выяснилось, что они совпадают. Однако, как поясняет ведущий автор работы, на Кавказе не было массовых внешних миграций. Древняя популяция постепенно дробилась на современные народы, и данные языковых соответствий точно накладываются на данные географического расположения народов. Другими словами, чем ближе друг к другу отдельные народы, тем ближе их языки на языковом генетическом древе.

В случае с балтославянскими языками соответствие между языком и генетикой не настолько впечатляющее, хотя тоже довольно большое. Дело в том, что славяне, стремительно распространяясь по территории Европы, активно ассимилировали неславянское население, поэтому связь языка с генетическими данными оказывается меньше, чем связь генетики с географическим расположением народов.

Пришельцы-славяне поглотили аборигенов

Результаты генетических исследований можно вкратце представить следующим образом. Во-первых, полученные данные подтвердили, что современные носители балтских и славянских языков (вернее, западные и восточные славяне) — близкие родственники. Во-вторых, стало ясно, что с генетической точки зрения восточные славяне юга и центра территории обитания (то есть русские центральных и южных областей, украинцы и белорусы) очень близки, то есть представляют собой фактически одну популяцию. При этом они отличаются от восточных славян севера России. На севере же обитают те славяне, которые вобрали в себя генофонд финно-угорских народов (как поясняет Касьян, это субстрат, который сегодня соотносится с носителями финского, вепского, карельского языков). По словам Касьяна, смешение славянских и финно-угорских популяций в северной зоне произошло во второй половине I тысячелетия нашей эры.

Относительно однородный генетический материал имеют западные славяне, часть которых (поляки) при этом оказываются довольно близки к восточным славянам. В статье генофонд и западных, и восточных славян возводится к субстратному генофонду — то есть те, кто пришел на эту территорию во второй половине I тысячелетия, вступали в браки с теми, кто жил в Европе до них, и сохраняли тем самым в поколениях «неславянские» гены. Впрочем, лингвисты, участвовавшие в исследовании, обсуждая результаты работы, говорят, что общий набор генов можно также сопоставлять с праславянским языковым наследием и считать доставшимся западным и восточным славянам от их общих предков начала I тысячелетия.

Изображение: Kushniarevich et al Генетическая структура балто-славянских популяций в сравнении с другими народами Европы, по трем генетическим системам: по аутосомным SNP-маркерам (A), Y-хромосоме (B), митохондриальной ДНК (C).

А вот южные славяне, как отмечают генетики, по своему генетическому материалу на западных и восточных славян не похожи — скорее напоминают по набору генетических маркеров прочие (неславянские) народы балканского ареала. Небольшой след от общеславянской популяции указывает на миграцию через Карпаты на Балканы (или же в обратном направлении). Возможно, хотя в статье такого вывода и не сделано, этот след представляет собой сигнал о перемещении предков южных славян с праславянской прародины, помещаемой обычно на территории Украины.

Во время большой волны расселения славян во второй половине I тысячелетия нашей эры генетическая структура населения практически не изменилась. Переселение народов было масштабным, славяне начали доминировать на карте Восточной Европы, так что они вполне могли бы изрядно смешать структуру генофонда Европы. Но этого не произошло — с генетической точки зрения славяне почти не отличаются от тех народов, рядом с которыми обитают, как на севере, так и на юге. Другими словами, они вобрали в себя генетический материал «дославянских» обитателей Европы.

Еще один соавтор статьи — Елена Кушнеревич (Эстонский биоцентр, Тарту) — так прокомментировала «Ленте.ру» эти результаты: «Судя по всему, генетический ландшафт Европы и, в частности, Восточной Европы сформировался задолго до великого переселения народов, поэтому сравнительно недавние миграции, пусть даже и массовые, уже не могли серьезно перестроить региональные генетические структуры: плотность населения была уже слишком высокой, и чтобы оставить свой хорошо различимый след, мигрантам нужно было бы уничтожить слишком много автохтонного населения».

Зачем доказывать известное?

Казалось бы, зачем нам знать, кто из славян насколько кому родственник и в каких мы отношениях с балтийскими народами? Для ученых это означает представление о формировании генофонда половины населения Европы и о том, какие факторы влияют на этот процесс. Также важно было понять на материале генетики, археологии и лингвистики Восточной Европы и Прибалтики, насколько совпадают показатели трех разных инструментов —
Y-хромосомы, митохондриальной ДНК и полногеномных маркеров. Этими инструментами, говорит Балановский, генетики пользуются для изучения всех остальных народов мира, «но до исследования балтославян не было такой хорошей возможности «сверить часы»». В этом смысле хорошо, что «время на всех трех часах (генетических, лингвистических, археологических — прим. «Ленты.ру») почти совпало».