Структура и экспрессия генов эукариот

Структура и экспрессия генов эукариот

По мере развития генетики представления о гене постоянно совершенствовались. Напомним, что впервые термин ген был введен для обозначения дискретных наследственных факторов, существование которых было постулировано Менделем. В процессе развития хромосомной теории наследственности было показано, что гены это хромосомные локусы, которые одновременно являются единицами мутации, рекомбинации и функции. С возникновением молекулярной генетики появилось представление о гене, как единице транскрипции. С этой точки зрения гены – это транскрибируемые участки молекулы ДНК. Какова же их структура?

 

 

Рисунок   21. Структура генов эукариот

Напомним, что  многие гены эукариот, включая человека, имеют прерывистую структуру – рис. 21. Кодирующие участки гена — экзоны, соседствуют с протяженными некодирующими участками – интронами, которые вырезаются при  процессинге преРНК и, таким образом, не участвуют в трансляции. Некоторые экзоны, локализованные на концах гена, транскрибируются, но также не транслируются.  Экзоны относятся к числу смысловых последовательностей, так как в них, в отличие от интронов или каких-то других последовательностей ДНК, нет стоп-кодонов, то есть они составляют открытые рамки считывания. На границах между экзонами и интронами локализованы важные канонические последовательности,  так называемые сайты сплайсинга, необходимые для правильного вырезания интронов.

Заметим, что открытие мозаичной структуры генов эукариот оказалось совершенно неожиданным и относится к разряду мини-революции в генетике. Термины экзон и интрон были введены Уолтером Гилбертом в 1978 году и сразу были приняты научным сообществом, хотя до сих пор нет удовлетворительных объяснений, зачем нужна прерывистость структуры генов, почему она появляется у высших организмов и какие преимущества она им дает. С другой стороны, очевидно, что эволюционный прогресс эукариот в значительной степени ассоциирован с появлением мозаичных генов. В отличие от белок-кодирующих последовательностей численность и протяженность интронов прямо коррелируют со сложностью организации жизни. У одноклеточных эукариот, таких, например, как дрожжи, интроны занимают от 10 до 20% преРНК, их средняя длина менее 100 нуклеотидов и они распределены с плотностью 1-3 на 1000  нуклеотидов экзонов. В генах высших растений от 2 до 4 интронов, их длина составляет около 250 нуклеотидов и они занимают до 50% пре-РНК. У животных  средняя длина интронов увеличивается до 500 пар оснований у дрозофилы  или нематоды и до 3400 нуклеотидов у человека, в среднем, их 6-7 на ген, и они занимают более 95% от общей длины первичного РНК-транскрипта.

В понятие ген входят также 5’- и  3’-нетранслируемые области. В 5’-нетранслируемой области находится основной регулятор работы гена – промотор. Промотор – это место взаимодействия ДНК с ферментом РНК-полимеразой, осуществляющим комплементарный синтез РНК по матрице ДНК в процессе транскрипции. Промотор определяет правильное начало транскрипции с первого инициирущего ATG-кодона и влияет на ее скорость. Промоторы, обеспечивающие высокую скорость синтеза преРНК, называются сильными, а низкую – слабыми. Есть промоторы, которые для своей работы требуют присутствия какой-то другой молекулы, они называются индуцибильными. Транскрипция заканчивается при достижении определенных терминирующих сигналов. В 3’-нетранслируемой области гена локализованы последовательности, участвующие в регуляции процессинга мРНК и трансляции.

Транскрипция и трансляция с образованием конечного продукта (белка или РНК) вместе называются экспрессией или работой гена. Все гены присутствуют в ядрах клеток разных специализированных тканей организма, так как в них содержится одинаковая молекула ДНК. Однако далеко не все гены экспрессируются в разных тканях. Существует определенный набор генов, которые экспрессируются в любых типах клеток. Эти гены, получившие название генов домашнего хозяйства, обеспечивают энергетику, дыхание и другие процессы, без которых клетки жить не могут. Но основная масса генов – это тканеспецифические гены, которые работают только в определенных клетках и на определенных стадиях их развития. Нарушение экспрессии генов, как правило, ассоциировано с развитием патологических процессов, лежащих в основе  развития многих наследственных заболеваний. Отклонением от нормы является не только снижение экспрессии какого-то гена или ее полное отсутствие, но и гиперэкспрессия – образование аномально большого количества продукта гена – а также эктопическая экспрессия – работа гена в несвойственном типе клеток или в несвойственный момент онтогенетического развития.

Считается, что, в среднем, в специализированных клетках одновременно работают не более 20% всех генов. Процесс  дифференцировки непосредственно зависит от набора экспрессирующихся генов. Важную роль в этом играют транскрипционные факторы – регуляторные элементы, способные активировать или репрессировать целую группу других генов, так называемую «генную сеть». Многие гены транскрипционных факторов экспрессируются в раннем эмбриогенезе и активируют «генные сети», ответственные за морфогенез отдельных органов и тканей, формирование метаболических цепей и тому подобные процессы. Генную сеть составляют также группы генов, полиморфные функционально значимые аллели которых формируют наследственную предрасположенность к мультифакториальной патологии, такой, например, как атеросклероз, язвенная болезнь, бронхиальная астма, рак молочной железы или простаты и др. У высших кроме промотора имеются дополнительные системы регуляции, усиливающие или ослабляющие экспрессию генов и обеспечивающие ее тканаспецифичность. Эти регуляторные последовательности, так называемые энхансеры и сайленсеры, могут находиться как в самом гене, так и на значительном расстоянии от него.

Современным интегральным методом оценки молекулярно-генетических параметров различных типов тканей и культивируемых линий клеток, является анализ экспрессионного профиля генов, основанный  на биочиповой технологии. Подобная методология позволяет одновременно следить за работой тысяч, а иногда до десятка тысяч генов. В результате могут быть выявлены группы генов, характер экспрессии которых определяет тканеспецифичность – комплекс морфологических, гистологических и функциональных особенностей, специфичных для определенных тканей или клеток.

Большинство генов эукариот представлено одной или несколькими копиями. Наряду с этим, некоторые гены повторены в геноме от десятка и более раз, и образуют мультигенные семейства. Эти гены обычно сгруппированы в кластеры в определенных районах одной или нескольких хромосом и часто находятся под общим регуляторным контролем. Примерами мультигенных семейств могут служить гены рибосомальных и транспортных РНК, гены α- и β-глобинов, тубулина, миоглобина, интерферона и многих других. Особое место среди мультигенных семейств занимают супергены – очень большие кластеры из сотен функционально и структурно родственных генов.  Классическим примером супергена служит HLA-комплекс, контролирующий главные антигены гистосовместимости. Он занимает район более 6000 тыс. п.о. на коротком плече хромосомы 6 и состоит из серии тесно сцепленных генов, ответственных за синтез множества белков, включающих клеточные поверхностные антигены, молекулы иммунного ответа и некоторые компоненты комплемента. К супергенам относятся три комплекса расположенных на разных хромосомах генов, контролирующих синтез тяжелых и легких цепей иммуноглобулинов.  Интересно, что в процессе дифференцировки В-лимфоцитов, продуцирующих иммуноглобулины, происходит структурная перестройка этих семейств. При этом отдельные последовательности ДНК элиминируются, тогда как другие сливаются. В итоге структура генов иммуноглобулинов в зрелых В-лимфоцитах значительно отличается от исходной, то есть той, которая наблюдается в зародышевых клетках.

Основными функциями мультигенных семейств является производство большого количества белков или РНК в ограниченный момент времени или обеспечение разнообразного ответа, как в случае HLA-комплексов или генов иммуноглобулинов. Полиморфные аллели этих генов часто являются генетическими факторами риска, предрасполагающими к широкому спектру мультифакториальных заболеваний, таких как сахарный диабет,  анкилозирующий и псориатический спондилиты, псориаз, ревматоидный артрит, рассеянный склероз  и др.

Завершая разговор, необходимо упомянуть, что в кодирующих областях  разных генов эукариот наряду с уникальными последовательностями могут присутствовать высоко гомологичные  фрагменты нуклеотидных последовательностей. Это значит, что в кодируемых такими генами белках присутствуют гомологичные фрагменты аминокислотных последовательностей, ассоциированные с определенными специализированными  функциями. При этом в разных генах (а значит и в разных белках)  эти гомологичные  фрагменты могут встречаться в различных комбинациях.

Примером являются гены  коллагенов, являющихся основными компонентами внеклеточного матрикса, на долю которых  приходится более 30% общей массы белков млекопитающих. В  настоящее время идентифицировано 27 типов коллагенов. Все они состоят из трех равномерно скрученных полипептидных α-цепей, в каждой из которых присутствует специфический коллагеновый домен.  На всем протяжении этого домена каждая третья аминокислота является глицином. Этот домен совершенно необходим для правильной организации коллагеновых молекул и фибрилл коллагена. Наследственные дефекты, нарушающие структуру коллагена, приводят к широкому спектру заболеваний, получивших общее название наследственных коллагенопатий. В то же время и в других белках имеются коллагеновые домены, в частности, в сурфактант-ассоциированных белках,  дефектная структура которых  является причиной  развития таких тяжелых бронхолегочных заболеваний, как респираторный дистресс-синдром, врожденный альвеолярный  протеиноз или интерстициальный альвеолит.

Другие примеры. Молекулы клеточной адгезии относятся к суперсемейству иммуноглобулинов и содержат в различных сочетаниях и количестве тандемно расположенные специфические последовательности, так называемые Ig-подобные повторы. Однако Ig-повторы выполняют функции связывания лигандов и присутствуют в экстраклеточных доменах многих других белков, таких, например, как рецепторы фибробластных факторов роста, протеогликаны, фибулины и др. Во многих белках присутствуют последовательности, впервые идентифицированные в эпидермальном факторе роста –  EGF-подобные домены. В частности, самый крупный домен фибриллина, занимающий около 75% всего белка, состоит из 46 EGF-подобных повторов, формирующих последовательности для связывания кальция и осуществления белок-белковых взаимодействий. Напомним, что фибриллин является основным структурным компонентом эластических волокон внеклеточного матрикса, и мутации в гене фибриллина приводят к синдрому Марфана. EGF-подобные повторы присутствуют в рецепторе трансформирующего фактора роста β, тромбоспондинахCa2+-связывающих гликопротеинах внеклеточного матрикса и во многих других мультидоменных  белках.

Подчеркнем еще раз, что в разных белках гомологичные домены встречаются в разных комбинациях.  Так, в молекуле  адгезии нейронов 5 тандемных Ig-повторов сочетаются с 6 повторами, подобными фибронектину. А фибулин – белок, располагающейся на поверхности эластических волокон – содержит  44 тандемных Ig-подобных повторов, 8 EGF-подобных повторов и 6 тромбоспондин-подобных модулей. В фибриллине, наряду с EGF-подобными повторами содержатся мотивы для связывания интегринов и трансформирующих факторов роста. Список подобных примеров может быть значительно расширен. Таким образом, блочная или модульная структура характерна для очень многих белков человека, а значит и для кодирующих эти белки генов.

Модульный  принцип организации регуляторных и кодирующих последовательностей, общих для всего генома, дает широкие возможности для регуляции ансамблей генов, организованных в иерархические структуры во главе с главным геном-переключателем. При этом соподчиненные гены функционируют в разные периоды развития и могут быть интегрированы в различные «генные сети». Этот же принцип значительно облегчает создание в процессе эволюции новых генетических конструкций. При этом важнейшими эволюционными инструментами  являются дупликации, разделения, перемещения и слияния различных фрагментов ДНК с какими-то другими структурными и регуляторными элементами. Такая перетасовка кубиками! В результате этих перестановок может меняться не только структура отдельных генов и мультигенных семейств, но и характер регуляции их экспрессии, что, безусловно,  является  определяющим в процессе эволюционных преобразований.