Шрифт:
Закладка:
Общая структура генома такова. Напомню, что размер генома человека 3200 Mb. Гены занимают всего 1200 Mb. Основная часть этого пространства приходится на псевдогены (нефункциональные гены, инактивированные мутациями), различные фрагменты генов и интроны. А на экзоны функциональных генов (суммарная длина зрелых РНК) приходится 48 Mb. Здесь есть некоторое лукавство, так как на одну пре-мРНК в среднем приходится 1,4 зрелых РНК. А из одной зрелой мРНК в некоторых случаях может получиться до тысячи белков. Межгенная ДНК занимает 2000 Mb, она представлена главным образом короткими рассеянными по всему геному повторяющимися последовательностями, которые занимают 1400 Mb. Один из таких повторов — Alu-повтор, длиной около 300 п.н., повторен в геноме миллион раз. Другой примечательный тип рассеянных повторов — длинные концевые повторы (LTR, long terminal repeat). Эти элементы являются молекулярными свидетельствами перескока фрагмента ДНК внутри генома. Общая протяженность таких участков на молекуле ДНК-250 Mb.
Геном человека: размеры областей занятых элементами известной структуры
Число генов у человека оценено в 20–25 тысяч, (оценка 2001 г. — 35–40 тыс.).
Основная часть генома человека занята не генами: 63–74 % длины — межгенные пространства, половина из них — повторы. Ген человека внутри «пустой»: 95 % внутригенной ДНК вырезается (интроны). Общая длина белок кодирующих областей около 1 % от геномной ДНК человека. Это лишь в 3 раза больше длины генома бактерий.
От 26383 до 39114 генов человека были предсказаны компьютером (в 2001 г.), но лишь менее 7000 были подтверждены на человеке. И более чем для 80 % генов, хоть в чем-то была пересмотрена структура в период с 2001 по 2003 г и продолжает уточняться на микрочипах.
Сейчас предсказанное число генов у человека 20–25 тысяч и существование около 19 000 из них экспериментально подтверждено — с них образуются транскрипты.
Имеющееся на данный момент определение гена (ген — это фрагмент геномной ДНК с котранскрибируемыми субфрагментами) — не полное. Например, возможна транскрипция с двух цепей. Плохо выявляются короткие гены и белок-некодирующие гены. Их, по крайней мере, под тысячу, но точное число не известно. Такие гены — тоже гены, хоть белок они и не кодируют. Они — гены, потому что с них образуется РНК. Причем РНК некоторых белкнекодирующих генов состоит из нескольких экзонов. То есть, клетке эти РНК зачем-то нужны, но мы пока не понимаем, зачем.
Альтернативный сплайсинг, биологическая роль и механизмы
Предположим, образовался транскрипт зрелой мРНК, и он может содержать экзоны 1, 2, 3. Это вовсе не означает, что он обязательно будет содержать их все. У нас может появиться РНК, которая будет содержать экзоны 1 и 2 или экзоны 1 и 3, ив результате с них будут образовываться разные белки. Такой способ процессинга (обработки) генетической информации называется альтернативный сплайсинг.
Одному гену соответствует с среднем 14 зрелых мРНК Альтернативный сплайсинг — различные комбинации экзонов остающееся в зрелой мРНК получаемой из одной и той же пре-мРНК
У человека есть ген slo. Он «работает» во внутреннем ухе, в частности, этот белок присутствует в ворсинках, которые отвечают за распознавание высоты звука. Он состоит из 35 экзонов (на рисунке — прямоугольники), 8 из которых (синие) могут или присутствовать, или отсутствовать в зрелой мРНК. Возможны 8! = 40 320 вариантов сплайсинга, но только около 500 из них обнаружены. Других, может быть, и нет, то есть природа не должна, вообще говоря, реализовывать все возможные варианты.
Биологическая роль множественного сплайсинга заключается в следующем. Разные типы волосяных клеток внутреннего уха реагируют на звуки разных частот от 20 до 20 000 герц. Различия клеток в восприятии частоты частично определяются свойствами альтернативных сплайс-форм белка Slo. Как определяется выбор между вариантами сплайсинга неизвестно.
Ген slo человека,
Состоит из 35 экзонов (прямоугольники), 8 из которых (синие) могут или присутствовать или отсутствовать в зрелой мРНК Возможны 8! = 40 320 вариантов сплайсинга, но только около 500 из них обнаружены экспериментально.
Биологическая роль множественного спланснгта.
Разные типы волосяных клеток внутренне по уха реагируют на звуки разных частот от 20 до 20 000 герц. Различия клеток в восприятии частоты частично определяются свойствами ал тернатмвных сплайс-форм белка Slo.
Как определяется выбор между вариантами сплайсинга неизвестно
Известны случаи, когда с одного локуса образуются тысячи разных белков. К ним, в частности, относятся белки, которые образуются на поверхности нервных клеток. Таким образом, они, видимо, как-то участвуют в распознавании друг друга, и в формировании нейронных сетей. В этом случае происходит выбрасывание не только экзонов или интронов, но и может реализовываться и альтернативный участок инициации транскрипции. Такие случаи известны, в частности, для человека, когда у разных генов есть несколько разных промоторов, каждый из которых дает свою РНК, в которой, в зависимости от того, где он начался, будет дополнительный экзон, связанной с различной длиной транскрипта на 5' — конце.
Механизм сплайсинга
Процесс соединения одного экзона с другим происходит в участках определенной последовательности нуклеотидов. Донорный сайт сплайсинга всегда заканчивается одним из двух динуклеотидов, обычно — AG.
Консенсусная последовательность донорного и акцепторного участков сплайсинга в интронах и экзонах эукариот
В начале происходит нуклеофильная атака донорного экзона, затем происходит разрезание, кусочек GU заворачивается и присоединяется к А. Затем разрезается вторая часть, первый экзон соединяется со вторым, и образуется интрон.
Если посмотреть, какую долю гена составляют экзоны, то самый большой известный транскрипт (у гена миодистрофина) имеет длину около 2,5 миллионов нуклеотидов. У него в зрелую часть РНК переходит 14 тыс нуклеотидов (0,6 %), а остальные 99,4 % от первичного транскрипта выкидывается (интроны).
С ростом размеров гена в хромосоме его белок-кодирующая часть увеличивается незначительно, а количество интронов в гене растет. С ростом числа интронов растет число сайтов сплайсинга и вероятность их повреждения. Поэтому для генов с большим числом интронов потеря функции при мутации может быть связана не с белок-кодирующей частью ДНК, а с регуляторными элементами сплайсинга.
Секвенирование генома человека показало, что некоторые экзоны многократно повторены в геноме. Это могут повторы экзонов в составе одного гена, или присутствие одного и того же экзона в составе нескольких разных генов. Получается, что экзоны, основные элементы структуры РНК, то есть белок-кодирующие элементы, в процессе