Шрифт:
Интервал:
Закладка:
EcoRI узнает GAATTC и никакую другую (расщеплять ДНК она будет в среднем один раз на 46 = 4096 нуклеотидов), BamHI узнает GGATTC. Предположим, что у нас есть клонированный фрагмент ДНК, длиной 13000 нуклеотидов, и мы расщепили его рестриктазой BamHI, получив два фрагмента по 9 и 4 тысячи нуклеотидов. Затем если мы расщепим EcoRI, получим фрагменты по 8, 3 и 2 kb. Когда мы посмотрим двойное расщепление, получим фрагменты размерами 7, 3, 2, 1 kb. Размеры известны, потому что рядом есть дорожка, в которой идет фракционирование молекул стандартного размера, что позволяет создать калибровочную кривую. Если мы проведем второе расщепление, то увидим, что фрагмент в 9kb расщепился на фрагменты по 7 и 2kb. Эта специфическая последовательность сайтов и специфическое расстояние между ними является портретом молекулы (см. рис. ниже). По этим портретам мы можем сопоставлять молекулы друг с другом, независимо от того, что они кодируют, и что в них находится. Это очень типичная процедура. Расщепление фрагмента ДНК каждой рестриктазой по отдельности и их смесью позволяет создать рестрикционную карту фрагмента.
Структура фрагмента ДНК выявляется по положению участков расщепления специфическими ферментами — рестрикционными эндонуклеазами (рестриктазами). Каждая рестриктаза узнает последовательность нуклеотидов определенной длины и состава. Например, рестриктаза EcoRI узнает последовательность GAATTC, а рестриктаза BamHI — GGATTC
Размер получившихся фрагментов устанавливают, разделяя их в геле под действием электрического тока — чем меньше фрагмент, тем быстрее он движется (слева — результат такого разделения).
Расщепление фрагмента ДНК каждой рестриктазой по отдельности и их смесью позволяет создать рестрикционную карту фрагмента.
Итак, мы расставили молекулы методом генетического и физического картирования. Вернемся к методу секвенирования. Использовалась примесь дидезоксинуклеотидов — ddNTP (на рисунке — справа; у них нет ОН-группы у 3'-атома углерода), которая добавлялась к обычным дезоксинуклеотидам (на рисунке слева). И при синтезе ДНК in vitro это приводило к прекращению синтеза цепи в позиции, в которой вставился ddNTP. Через позицию 3' идет присоединение нуклеотида к строящейся молекуле ДНК. Но если на 3'-конце не будет гидроксильной группы, а водород, то синтез дальше не пойдет — он будет терминирован.
Примесь дидезоксинуклеотидов (справа, нет ОН-группы у 3'-атома углерода) к дезоксинуклеотидам (слева) при синтезе ДНК in vitro приводит к прекращению синтеза цепи в позиции, в которой ставился ddNTP
Это используется следующим образом. У нас есть матрица (нить ДНК), которую надо секвенировать. Если идет синтез, и в первой позиции матрицы стоит А (см. рис. ниже), то может встроиться обычный Т и синтез пойдет дальше, а может встроиться ddTTP и синтез дальше не пойдет. Произойдет обрыв цепи, а полученный синтезированный огрызок займет при фракционировании определенную позицию согласно своему размеру. Следующий обрыв будет соответствовать второй букве секвенируемой нити, и также займет свою позицию согласно длине при фракционировании на электрофорезе и т. д. И так по каждому нуклеотиду. Так мы восстановим последовательность нуклеотидов в секвенируемой нити ДНК. Этот метод предложил Фрэд Сэнгер, за что получил свою вторую Нобелевскую премию.
Метод секвенирования ДНК, основанный на терминации синтеза дидезоксинукпеотидтрифосфатами
Рассмотрим определение последовательности нуклеотидов в клонированном фрагменте ДНК. Клонированный фрагмент находится в так называемой векторной молекуле ДНК — молекуле, которая позволяет ввести его в клетку (обычно это клетка бактериальная, но иногда используются и дрожжевые клетки). Все работы по секвенированию генома человека прошли при участии бактериальных векторных молекул. Участок вектора, прилежащий к вставке, содержит последовательность нуклеотидов, комплементарную универсальному секвенирующему праймеру. С этого праймера инициируется синтез ДНК in vitro, который с первого нуклеотида будет идти по матрице клонированного фрагмента ДНК человека. Универсальных праймеров используется два, один к последовательности вектора прилежащей к одному концу вставки, другой праймер к последовательности вектора прилежащей к другому концу вставки. С одного из праймеров клонированный фрагмент секвенируется с одной стороны, а с другого праймера — с другой стороны.
Участки молекулы ДНК распознаваемые праймерами для секвенирования, присоединены к исследуемому фрагменту ДНК путем. Исследуемый фрагмент ДНК вставляют в векторную молекулу ДНК. Участки вектора, прилежащие к вставке, содержат последовательности нуклеотидов, комплементарные универсальным секвенирующим праймерам — левому и правому. С этих праймеров инициируется синтез ДНк in vitro
Вектор у нас один и тот же, а вставок — миллионы, но все они секвенировались с одной и той же пары праймеров. Основная часть генома была секвенирована при клонировании фрагментов в 2 тысячи пар нуклеотидов, потому что тысяча читалась с одной стороны и тысяча — с другой. Каждая точка генома человека была просеквенирована несколько десятков раз в составе разных клонированных молекул ДНК. То есть расстояние в геноме между концами клонированных и секвенированных фрагментов ДНК составляло меньше 200 пар нуклеотидов. От каждой точки старта было прочитано около 1000 нуклеотидов. Из всего этого набора «текстов» воспроизводилась структура генома человека. Но собрать эти 1000-буквенные сиквенсы в контиги длинной в миллионы букв удалось лишь на основе того, что большая часть фрагментов была предварительно картирована относительно хромосом человека. Без картирования сиквенс мог попасть в повторяющийся участок генома, а продолжение сиквенса из такого участка имеет столько вариантов продолжений, сколько раз повтор присутствует в геноме человека (некоторые повторы — миллион раз). Поэтому сначала устанавливали последовательность расположения клонированных фрагментов в геноме. Это было сделано для фрагментов размером около 200 тыс пар нуклеотидов, а уже затем их секвенировали.
Процесс секвенирования по методу Сенгера может быть автоматизирован. Механизм представлен на следующем слайде.
Ha слайде виден праймер, синтез с которого идет влево. У нас есть дидезоксинуклеотидфосфаты Т, А,С и G. Каждый из них занимает свою позицию во фрагменте синтезируемом по исследуемой матричной нити. На предыдущем слайде каждой букве соответствовала отдельная дорожка геля, их всего четыре. Если каждую из букв терминирующих синтез пометить в свой цвет, то все терминаторы можно объединить в одной пробирке и фракционировать продукты в одной дорожке. Обрыв синтеза в позиции данной буквы даст фрагмент со своим положением в геле после фракционирования. Каждое положение обрыва будет характеризоваться цветом той буквы терминатора, на которой произошел обрыв. В ходе фракционирования терминированных фрагментов лазер будет