Шрифт:
Интервал:
Закладка:
Геномы, состоящие из ДНК, содержат четыре разных нуклеотида, в основе каждого из которых лежит одно из азотистых оснований: аденин (A), гуанин (G), цитозин (C) или тимин (T). Нуклеотиды связаны вместе вдоль каркаса из фосфорилированного сахара, формируя нуклеиновые кислоты, к примеру дезоксирибонуклеиновую кислоту, или ДНК. ДНК в геноме состоит из двух нитей, и это означает, что в стабильном состоянии нуклеотид из одной нити связан с комплементарным ему нуклеотидом из второй нити. Нуклеотид, связанный с комплементарным нуклеотидом, называется спаренным основанием (или парой оснований). Размер генома обычно выражается в парах оснований, что составляет половину числа нуклеотидов в геноме.
Геномы очень сильно отличаются друг от друга по количеству спаренных оснований и хромосом, по которым эти основания распределены. Человеческий геном заключает в себе около 3,2 миллиарда пар оснований, расположенных в 23 парах хромосом. Геном сосны ладанной содержит 22,2 миллиарда пар оснований, но хромосомных пар в нем всего 12. В геноме карпа 1,7 миллиарда спаренных оснований расположены в 100 парах хромосом. Колоссальные различия в геномах животных и растений не связаны ни со сложностью организма, ни с количеством генов, закодированных в их геномах.
Хромосомы имеют слишком большую длину, чтобы мы смогли секвенировать их целиком с помощью современных технологий. Поэтому, когда ученые секвенируют ДНК, они начинают с того, что разрезают хромосомы на более мелкие фрагменты. Эти фрагменты состоят из двух нитей, поэтому их длина также указывается в количестве спаренных оснований. В зависимости от используемого метода секвенирования размеры этих фрагментов могут варьировать от нескольких десятков до нескольких тысяч пар оснований. После того как ДНК разделили на части и секвенировали, ее фрагменты собираются заново в хромосомы. Вкратце процесс секвенирования генома выглядит так: сначала разрежьте, потом склейте заново.
Теперь, когда мы немного разобрались со сленгом, давайте набросаем в общих чертах этапы секвенирования и сборки генома вымершего вида. Вначале мы собираем останки представителей вида, который собираемся вернуть к жизни, – кости, зубы, шкуру, шерсть, – всё, что удается найти. После этого мы выделяем из них все фрагменты ДНК, которые сможем. Затем мы секвенируем эту ДНК. Наконец, мы бережно собираем вместе крошечные кусочки ДНК, делая их все больше и больше, и в итоге получаем хромосомы.
Если вы были внимательны, то могли заметить, что мы пропустили этап, на котором разрезали ДНК на более мелкие фрагменты. При работе с древней ДНК он не нужен. ДНК поступает к нам уже разделенной на кусочки. Правильнее даже будет сказать слишком разделенной. Слишком сильная фрагментация для нас плоха: чем короче фрагмент ДНК, тем сложнее разобраться, где он должен находиться в геноме.
Но это еще не все. Эти короткие фрагменты ДНК к тому же находятся в довольно плохом состоянии. Благодаря химическим веществам, а также другим биомолекулам, содержащимся в окружающей среде, отдельные нуклеотиды могут повредиться или разрушиться, так что их молекулярная структура будет отличаться от изначальной. Молекулы с измененными структурами будут неправильно считываться в процессе секвенирования, что приведет к ошибкам в геномной последовательности. В некоторых средах ДНК распадается медленнее, чем в других (к примеру, в Арктике, где жили мамонты, ДНК сохраняется лучше, чем в тропиках, где жили дронты). Это означает, что виды, не обитавшие в областях, где у их останков была высокая вероятность сохраниться, скорее всего, не очень хорошо подходят для восстановления.
Наконец, мы сталкиваемся с так называемой контаминацией. В наиболее широком смысле под контаминацией имеется в виду любая ДНК, извлеченная из кости или другой ткани и не принадлежащая организму, геном которого мы пытаемся секвенировать. Это может быть ДНК микроорганизмов, поселившихся в этой кости после того, как она была погребена в земле, или растений, корни которых росли рядом с этой костью. Это также может быть ДНК, попавшая в кость во время ее извлечения из земли или пребывания в лаборатории. Одна кость может содержать огромное количество хорошо сохранившейся ДНК, лишь малая часть которой будет представлять для нас интерес.
Профессор Сванте Паабо руководит исследовательской группой в Институте эволюционной антропологии Общества Макса Планка, расположенном в немецком городе Лейпциге, и не так давно его группа секвенировала и собрала геном неандертальца. Группу Паабо очень интересует вопрос, что же это значит – быть человеком. Один из способов приблизиться к ответу – сравнить геном человека с геномами наших ближайших родственников, человекообразных обезьян, и выяснить, как изменилась наша геномная последовательность с тех пор, как мы разошлись с другими человекообразными обезьянами. Наш ближайший живущий ныне родственник – это шимпанзе. Геномы человека и шимпанзе совпадают на 98–99 %, следовательно, отличия человека от шимпанзе должны быть обусловлены оставшимися 2 % генов. Но 2 % из 3,2 миллиарда пар оснований – это все еще слишком большая часть ДНК, чтобы разобраться. Неандертальцы состоят в намного более близком родстве с людьми, чем шимпанзе. Секвенировав геном неандертальца, Паабо может более детально разобраться в генетических особенностях нашего вида.
Первый полный геном неандертальца, опубликованный группой Паабо, представлял собой объединенные данные ДНК, секвенированной из трех различных костей неандертальца. Менее 5 % ДНК, обнаруженной в каждой кости, принадлежало неандертальцу, остальные 95 % приходились в основном на ДНК, попавшую из окружающей среды, – ДНК бактерий почвы и болезнетворных организмов, растений и т. д. Средняя длина фрагмента секвенированной ДНК неандертальца, извлеченной из этих костей, составляла 47 пар оснований. Человеческий геном содержит 3,2 миллиарда пар оснований, так что это похоже на сборку пазла, состоящего из 68 миллионов кусочков. Разумеется, вследствие разрушения и контаминации у исследователей было намного больше кусочков, чем нужно, при этом некоторые из них относились к тому же пазлу, но иначе разрезанному, а некоторые вообще к другому.
Чтобы облегчить сборку, группа Паабо использовала в качестве шаблона человеческий геном, уже секвенированный и собранный. Продолжая аналогию с пазлом, если фрагменты ДНК неандертальца, состоящие из 47 пар оснований, – это кусочки головоломки, то человеческий геном – картинка на крышке коробки. Вот только картинка и пазл различались (потому что это был геном человека, а не неандертальца). Совсем немного, как если бы картинка имела другой цвет или часть ее была скрыта надписью «Содержит мелкие детали».
Сборка генома неандертальца оказалась непростой задачей. Но все же менее сложной, чем будущая сборка многих других древних геномов. Во-первых, на сегодня код человеческой ДНК расшифрован лучше, чем код ДНК любого другого вида, так что картинка на крышке коробки пазла была практически полной. Количество и разнообразие секвенированных геномов продолжает расти, однако для большинства видов они все еще секвенированы и собраны лишь отчасти. Во-вторых, люди и неандертальцы имели общего предка, жившего в пределах последнего миллиона лет, возможно, даже около половины миллиона лет назад. Это означает, что между людьми и неандертальцами не успело накопиться слишком много различий. Картинка на крышке коробки довольно точно отражает то, как должен выглядеть законченный пазл.