Онлайн
библиотека книг
Книги онлайн » Разная литература » Интернет-журнал "Домашняя лаборатория", 2008 №5 - Журнал «Домашняя лаборатория»

Шрифт:

-
+

Закладка:

Сделать
1 ... 36 37 38 39 40 41 42 43 44 ... 137
Перейти на страницу:
фиксировать на детекторе последовательные пики — какая прошла полоса по счету, и какого она цвета. Далее эта последовательность пиков дешифруется в последовательность нуклеотидов в молекуле ДНК. Точность сиквенса (установления того, какая именно буква терминировала синтез в данной позиции) определяется соотношением высот пиков соответствующих разным буквам в одной и той же позиции секвенируемого фрагмента. Между двумя пиками разных цветов в одной позиции было заданное дискриминирующее значение. Техника отрабатывалась так, что буква считалась достоверно установленной для данной позиции, если основной пик в этой позиции был выше других в заданное количество раз.

Бактерия Н. influenzae была первым свободно живущим организмом, геном которого был полностью секвенирован. Поскольку геном бактерии маленький, около тысячи нуклеотидов, и повторов нем мало (да и короткие они), то предварительное картирование клонированных фрагментов ДНК не понадобилось — эти фрагменты сразу сиквенировались.

Бактерия Н. influenzae была первым свободно живущим организмом, геном которого был секвенирован (TIGR, США)

Такая работа была проведена в институте генетических исследований TIGR под началом Крега Вентера. Вентер затем организовал фирму Селера, секвенировавшую геном человека, где он применил ту же схему секвенирования что и для бактерии. Причем деньги он взял у частных фирм, так как государство не верило, что у него что-нибудь получится.

Мировое сообщество предварительно использовало генетическую и физическую карты, относительно которой была выстроена последовательность перекрывающихся фрагментов клонированной ДНК (контиг), предназначенной для секвенирования. То есть сиквенс генома человека был собран из фрагментов правило благодаря использованию упорядоченного набора клонов и установлению последовательности нуклеотидов картированных клонов.

Вентер же, в отличие от мирового сообщества, использовал случайный набор клонов и попытался восстановить полную последовательность нуклеотидов прямо из сравнения сиквенсов всей кучи фрагментов. На бактерии у него это удалось, но на человеке это сработало лишь потому, что он использовал публично доступные данные от мирового сообщества о том, какие молекулы, где расположены в геноме человека.

Секвенирование всего генома может быть основано на детальной генетической и физической карте, относительно которой выстроена последовательность перекрывающихся фрагментов клонированной ДНК (контиг), предназначенной для секвенирования

Вентер опубликовал свою работу на месяц раньше, чем мировое сообщество, потому что он ничего не картировал, а использовал секвенирование совсем коротких рекомбинантных молекул. Общую длина секвенированных фрагментов ДНК была у Вентера в пять раз больше, чем сделало все мировое сообщество. Используя данные мирового сообщества о картированных фрагментах, Вентер смог восстановить в единую последовательность нуклеотидов все то, что он насеквенировал. Если бы данных мирового сообщества не было бы, то вся его работа была представлена короткими отрезками, которые бы разветвлялись, из-за того, что в геноме находятся повторы.

В результате проделанной работы вышло две статьи: статья Вентера в журнале Science и статья Лэндера — лидера мирового сообщества — в журнале Nature.

Проект генома человека начат в 1990 г. Первая (черновая) версия последовательности нуклеотидов была закончена в 2000 г. Конечная версия, которая больше не будет совершенствоваться (названная Build35) — закончена в 2004 г.

Последняя версия последовательности содержит 2,85 миллиардов пар нуклеотидов с 341 брешью, то есть в этих местах по каким-то причинам секвенировать геномную ДНК не удалось. Сиквенс покрывает около 99 % той части генома человека, которая представлены в некомпактизированной форме — эухроматине. Аккуратность сиквенса в конечной версии — 1 ошибка на 100 тысяч позиций подряд.

Еще точнее секвенировать весь геном уже никто не будет. Напомню, что папин геном отличается у вас от маминого генома примерно в 1 позиции на тысячу.

Предсказанное число генов у человека теперь 20–25 тысяч, что немного меньше, чем предсказывалось раньше.

Кроме данных о последовательности нуклеотидов геномной ДНК человека (референтная последовательность) созданы также базы данных:

1) о последовательности нуклеотидов транскрибируемых участков ДНК (EST database, EST = Expressed Sequence Tags), которая характеризует не геномную ДНК, а то, транскрибировалось с ДНК.

2) о положении и содержании отличий (полиморфизмов, то есть нуклеотидных замен) других известных последовательностей ДНК человека от референтной последовательности (SNP database, SNP = Single Nucleotide Polymorphism)

Геномика (часть 2)

Лекция № 20

Геномика — недавно возникшее направление науки, объектом изучения которой являются геномы всех организмов, не только человека. Одно из направлений геномики — воссоздание суммарной карты метаболических путей живого, состоящей из частных метаболических карт, характерных для каждого организма.

Выявление в разных геномах определенных наборов генов метаболических функций позволяет предположить, функциональную связь генов этого набора в едином участке метаболической цепи. В частности, один из подходов такой. Исследуют ряд видов (рисунок ниже), к примеру, бактерий. У первых трех видов есть гены для белков 1, 3 и 6. Остальные белки у некоторых есть, а у некоторых нет.

Этот набор генов (1, 3 и 6) отсутствует у четвертого вида. Такого рода присутствие-отсутствие цельного набора генов позволяет сделать предположение о том, что кодируемые ими белки каким-то образом связаны в метаболическом цикле. Гены такого набора необязательно располагаются рядом в геноме.

Филогенетический профиль белков — основа гипотез об их функциях белки Р1, Р3 и Р6 присутствуют у трех разных видов бактерий. У четвертого вида весь набор этих белков отсутствует.

Еще один критерий функциональной связи между генами, особо хорошо работающий на бактериях, основан на сохранении соседства одних и тех же (по сиквенсу) генов у разных видов бактерий. У бактерий нередко бывает, что группа генов, расположенных вместе, отвечает за группу последовательных этапов метаболизма. Такая группа генов регулируется на уровне транскрипции единым образом и называется оперон (единица операции). Часто последовательность расположения генов в опероне совпадает с последовательностью метаболических этапов. Для эукариот соседнее расположение функционально связанных генов не типично, но, хоть такие гены и разбросаны у них по геному, скоординированная регуляция транскрипции есть и эукариот.

Геномы четырех бактерий.

Гены 1 и 8, а также гены 4 и 5 соседствуют в разных геномах, хотя положение этого блока относительно других генов в каждом из геномов различается.

На данный момент просеквенировано несколько сотен геномов бактерий и геномы нескольких эукариот. Теперь мы знаем, что у бактерий размеры генома не бывают меньше 0,5 миллионов пар нуклеотидов, а максимальный размер генома около 10 миллионов п.н., у дрожжей (эукариотический организм) — порядка 12 миллионов, у червя нематоды — 97 млн., а у человека — 3 миллиарда пар нуклеотидов. А число генов у про-

1 ... 36 37 38 39 40 41 42 43 44 ... 137
Перейти на страницу: