Эпигено́мика (англ. Epigenomics) — раздел молекулярной биологии, изучающий всю совокупность эпигенетических модификаций генетического материала клетки (эпигеном[en]). Эпигеномика аналогична геномике и протеомике, которые изучают геном и протеом клетки соответственно[1]. Эпигенетические модификации — это обратимые модификации клеточной ДНК и гистонов, которые влияют на экспрессию генов, не изменяя нуклеотидную последовательность ДНК[2]. Клетка поддерживает свой эпигеном на протяжении всей жизни, поскольку стабильность эпигенома непосредственно связана со стабильностью генома, так как эпигеном вовлечён в важнейшие клеточные процессы, например, репарацию ДНК[3][4]. Изменения эпигенома клетки могут привести к превращению её в злокачественную[5][6][7]. Изменения эпигенома могут быть связаны с развитием и других заболеваний человека, помимо разных видов рака, таких как сахарный диабет 2-го типа, болезнь Альцгеймера, болезнь Паркинсона, синдром ломкой X-хромосомы и синдром Прадера — Вилли[8]. Самые изученные эпигенетические модификации — это метилирование ДНК и модификации гистонов. Изучение эпигенома на глобальном уровне стало возможно лишь относительно недавно в связи с развитием высокопроизводительных методов изучения генома[9][6].
Термин «эпигеномика» был предложен в 1997 году[10], и в 2000-х началась работа по составлению карты эпигенома человека (англ. Human Epigenome Project)[11].
Модификации генома, которые изменяют экспрессию генов, но не связаны с изменением первичной последовательности ДНК (нуклеотидной последовательности) и передаются при митотическом и мейотическом делении клетки, называют эпигенетическими модификациями. Наиболее изучены такие эпигенетические модификации, как метилирование ДНК и модификации гистонов[2].
Первой открытой эпигенетической модификацией стало метилирование ДНК. Метилирование ДНК заключается в присоединении метильной группы к нуклеотидам в составе ДНК. Ферменты, катализирующие эту реакцию, известны как ДНК-метилтрансферазы. Хотя метилирование ДНК — это стабильная и наследуемая модификация, существуют ферменты, удаляющие метильные метки с ДНК (ДНК-деметилазы[en]). У эукариот метильная группа чаще всего присоединяется к пятому атому углерода азотистого основания цитозина в составе ДНК с образованием 5-метилцитозина[en], или 5mC (как правило, в составе CpG-островков[en], в которых остатки цитозина соседствуют с остатками гуанина)[9][12].
Нуклеотидные позиции, подвергающиеся метилированию, значительно различаются у разных видов и даже среди клеток одного организма. Животные используют метилирование ДНК по-разному; так, уровень метилирования ДНК у позвоночных очень высок, а у беспозвоночных он имеет средние значения. У некоторых организмов, таких как нематода Caenorhabditis elegans, 5mC и ДНК-метилтрансферазы полностью отсутствуют. Вероятно, в этих случаях роль метилирования ДНК выполняют иные механизмы[13].
В пределах одного организма уровень метилирования ДНК может значительно различаться на разных стадиях развития и в зависимости от участка генома. Например, у мыши примордиальные клетки зародышевой линии претерпевают полногеномное деметилирование, но на стадии имплантации зародыша метильные метки возвращаются на позиции, в которых они присутствовали у соматических клеток[13]. Когда метилирование ДНК затрагивает промоторную область, то транскрипция соответствующего гена подавляется. Напротив, активно экспрессируемые гены, как правило, имеют неметилированные промоторы[9].
Механизм репрессии экспрессии генов через метилирование ДНК включает несколько этапов. С метилированными и неметилированными остатками цитозина взаимодействуют разные ДНК-связывающие белки[en]. Через них к участкам с 5mC привлекаются гистондеацетилазы, которые запускают ремоделирование хроматина, в результате которого ДНК становится недоступной для взаимодействия с компонентами аппарата транскрипции, такими как РНК-полимераза, что приводит к эффективной репрессии экспрессии генов[14].
У эукариот геномная ДНК связана с белками, образуя хроматин. Самые многочисленные белки хроматина — гистоны, на которые намотана двойная спираль ДНК[en]. Гистоны обогащены положительно заряженными аминокислотами, что облегчает их связывание с отрицательно заряженным сахарофосфатным[en] остовом ДНК за счёт электростатических взаимодействий. Основные повторяющиеся структурные единицы хроматина — нуклеосомы — представляют собой октамер, включающий по две молекулы коровых гистонов H2A[en], H2B[en], H3[en] и H4[en], на который намотана нить ДНК длиной 146 пар оснований (п. о.). Нуклеосомы и намотанная на них ДНК формируют хроматиновую фибриллу диаметром 10 нм, которая может подвергаться дальнейшей конденсации[15][16].
Степень компактизации хроматина зависит от стадии клеточного цикла и может быть различной в разных участках генома[17]. Степень конденсации хроматина связана с его транскрипционной активностью. Неконденсированный хроматин более транскрипционно-активен, чем плотно упакованный хроматин, так как он более доступен для аппарата транскрипции. Поэтому экспрессию гену можно модулировать за счёт ремоделирования хроматина и регулирования плотности его упаковки[16].
Ремоделирование хроматина осуществляется при помощи внесения посттрансляционных модификаций на N-концевые хвосты коровых гистонов[18]. Совокупность модификаций гистонов в данной клетке называется гистоновым кодом[en]. Известно множество видов модификаций гистонов: ацетилирование, метилирование, фосфорилирование, убиквитинилирование, SUMOилирование[en], АДФ-рибозилирование, дезаминирование и изомеризация пролина[en]. Ацетилирование, метилирование, фосфорилирование и убиквитинилирование часто связаны с активацией экспрессии генов, а метилирование, убиквитинилирование, SUMOилирование, дезаминирование и изомеризация пролина могут приводить к репрессии гена. Стоит отметить, что некоторые модификации, такие как метилирование, фосфорилирование и убиквинитилирование могут влиять на транскрипционную активность генов в зависимости от специфических аминокислотных остатков модифицируемых геномов. Кроме того, свой вклад вносит и модифицируемый участок генома. Так, метилирование лизина 36 гистона H3 (H3K36me) в кодирующей области гена приводит к его активации, а в промоторе — напротив, к инактивации[16].
Модификации гистонов влияют на экспрессию генов при помощи двух основных механизмов: за счёт разрушения контактов между нуклеосомами и за счёт привлечения АТФаз, ремоделирующих хроматин. Первый механизм реализуется при ацетилировании остатков лизина на хвостах гистонов, которое катализируется гистонацетилтрансферазами. Гистонацетилтрансферазы входят в состав мультибелковых комплексов, которые привлекаются к хроматину при связывании с ДНК белков-активаторов. Ацетилирование нивелирует положительный заряд остатка лизина, который стабилизирует взаимодействие нуклеосом с отрицательно заряженным остовом ДНК. Ацетилированные остатки лизина в составе гистонов способствуют диссоциации нуклеосом и декомпактизации хроматина. В декомпактизованном хроматине ДНК более доступна для аппарата транскрипции, поэтому ген становится более активным. Деацетилазы[en] могут удалять ацетильные группы с хвостов гистонов[16][18].
Второй механизм включает привлечение комплексов ремоделирования хроматина через связывание белков-активаторов с соответствующими энхансерами. Комплексы ремоделирования хроматина меняют положение нуклеосом несколькими способами, что может как повышать, так и понижать доступность ДНК для аппарата транскрипции. Примером комплекса ремоделирования хроматина может служить комплекс SWI/SNF[en] дрожжей; он регулирует экспрессию нескольких генов через перестройки хроматина[16][19].
Целью эпигеномики является поиск и описание эпигенетических меток на глобальном уровне, подобно тому, как геномика изучает всю совокупность генетического материала клетки, а протеомика — совокупность всех клеточных белков[1]. Подобно геномике и протеомике, важнейшую методологическую часть эпигеномики составляют биоинформатические подходы[20].
Процессы транскрипции, репликации и репарации ДНК требуют взаимодействия геномной ДНК с ядерными белками. Известно, что некоторые участки генома особенно чувствительны к действию ДНКазы I, которая неспецифично расщепляет ДНК, не защищённую белками. Такие гиперчувствительные сайты считались транскрипционно активными участками генома, что подтвердилось их ассоциацией с РНК-полимеразой, а также топоизомеразами I[en]* и II[en][21]. В гиперчувствительных сайтах плотность упаковки ДНК понижена. Чаще всего гиперчувствительные сайты соответствуют промоторам, в которых ДНК должна быть открытой, чтобы с ней могли связаться компоненты аппарата транскрипции[22].
Полногеномный поиск эпигенетических модификаций впервые был выполнен с помощью метода иммунопреципитации хроматина[en] (англ. Chromatin immunoprecipitation, ChIP) вместе с ДНК-микрочипами (эта технология известна как ChIP-on-chip[en])[15]. В случае ChIP-on-chip с помощью иммунопреципитации хроматина выделяют не транскрипционные факторы и ДНК-связывающие белки-активаторы, а модифицированные гистоны. Сначала гистоны in vivo ковалентно сшивают с ДНК при помощи обработки клеток формальдегидом. Далее клетки подвергают лизису, что делает возможным экстракцию и фрагментацию хроматина. Фрагментацию хроматина проводят с помощью обработки ультразвуком или эндонуклеазой рестрикции. В ходе такой обработки участки хроматина, не связанные с белками, разрушается, так что остаются только комплексы ДНК с белками. Далее с помощью антител, специфичным к гистонам с определёнными модификациями, осуществляют иммунопреципитацию комплексов ДНК с такими гистонами[16]. После иммунопреципитации ДНК и гистоны разделяют, фрагменты ДНК амплифицируют с помощью полимеразной цепной реакции и метят флуоресцентной меткой[en] (например, Cy3[en] или Cy5). На финальной стадии флуоресцентно-меченную ДНК гибридизуют с фрагментами геномной ДНК, иммобилизованными на ДНК-микрочипе. По интенсивности сигнала, соответствующему каждому фрагменту, делают вывод о том, с какими из них взаимодействуют гистоны с интересующей эпигенетической меткой[23][24].
С помощью ChIP-on-chip был изучен эпигеном дрожжей. На основании данных, полученных на дрожжах, были сделаны выводы о функциях определённых модификаций гистонов. Было показано, с какими эпигенетическими метками связаны репрессия или активация транскрипции и в каких участках генома они происходят. Хотя с помощью ChIP-on-chip удалось изучить эпигеном дрожжей с почти полным покрытием, применение этого метода для организмов с более крупными геномами, таких как человек, ограничено[15][16].
Для полногеномного изучения эпигенетических меток на больших геномах вместе с иммунопреципитацией хроматина используют высокопрозводительные методы, такие как SAGE[en] (от англ. Serial Analysis of Gene Expression), секвенирование спаренных концов (PET от англ. Paired-end tag) и высокопроизводительное секвенирование (этот метод известен как ChIP-seq). ChIP-seq включает стандартный протокол иммунопреципитации хроматина, однако вместо амплификации выделенной ДНК и её гибридизации на микрочипе её секвенируют с помощью высокопроизводительных методов. ChIP-seq показал себя как эффективный метод для анализа модификаций гистонов на глобальном уровне, выявления сайтов связывания белков, взаимодействующих с ДНК, причём с большим разрешением, чем дают другие методы[15][23].
Методы определения нуклеотидной последовательности ДНК не подходят для обнаружения в ней метилированных нуклеотидов. В частности, при проведении полимеразной цепной реакции (ПЦР) или бактериального клонирования метильные метки не сохраняются при удвоении ДНК, и эпигенетическая информация теряется. Методы гибридизации ДНК, в которых для определения последовательности исследуемых фрагментов ДНК и их положения в геноме используются радиоактивные пробы, также не подходят, поскольку они не различают метилированную и неметилированную ДНК[25][9].
Первый разработанный метод детекции метилированных нуклеотидов основан на применении эндонуклеаз рестрикции (рестриктаз). В этом методе геномную ДНК обрабатывают двумя рестриктазами, которые распознают одну и ту же последовательность, но одна из них чувствительна к метилированию, а вторая — нет. Идея метода заключается в том, что метилированный сайт может быть распознан и разрезан только рестриктазой, не чувствительной к метилированию. Сравнивая фрагменты, полученные при обработке ДНК рестриктазой, чувствительной к метилированию и не чувствительной к нему, можно выявить участки, подвергающиеся метилированию. Этот этап включает амплификацию фрагментов, полученных в результате обработки рестриктазами, с помощью ПЦР, разделение их с помощью гель-электрофореза и анализ с помощью саузерн-блота[25][9].
Описанный выше метод был использован для анализа метилирования ДНК в локусе гемоглобинов человека. Различные гены этого локуса (γ-, δ- и β-глобины) экспрессируются на разных стадиях развития организма[26]. Исследование подтвердило, что те гены, которые не экспрессировались, были обогащены 5mC[27].
Метод, основанный на применении рестриктаз, не позволяет изучить метилирование на уровне целого генома, то есть метилом. Даже в пределах локуса он не даёт полного представления о количестве и расположении метильных меток, так как информацию о метилировании можно получить только с тех участков, которые содержат сайты узнавания используемых рестриктаз. В связи с этим метод даёт большое количество ложноотрицательных результатов[9].
Впервые метилирование на уровне всего генома было изучено с помощью метода, известного как Restriction landmark genomic scanning[en] (RLGS, дословно «сканирование генома на предмет сайтов рестрикции»). В этом методе также используются ферменты, расщепляющие ДНК и чувствительные к её метилированию, однако разделение фрагментов происходит в ходе двумерного гель-электрофореза, что позволяет изучить расположение метильных меток детальнее[9].
Однако получить полное представление о метилировании геномной ДНК с высоким разрешением стало возможным только с появлением ДНК-микрочипов и методов секвенирования нового поколения[28]. Как и в RLGS, новые подходы включают расщепление ДНК эндонуклеазами. В случае гибридизации с дифференциальным метилированием (англ. differential methylation hybridization, DMH) одна проба геномной ДНК обрабатывается рестриктазами, чувствительными к метилированию, а другая — не чувствительными к метилированию ферментами. Далее фрагменты обеих проб амплифицируют и метят различными флуоресцентными метками, после чего наносят фрагменты из обеих проб на один микрочип. Уровень метилирования ДНК в данном локусе определяют как разность относительной интенсивности свечения двух красителей. Использование высокопроизводительного секвенирования позволяет добиться большего разрешения, чем применение ДНК-микрочипов. Микрочип для данного метода должен быть отнормирован в соответствии с плотностью CpG-островков, чтобы давать достоверные результаты. В частности, с помощью секвенирования можно выявить аллель-специфичное метилирование, кроме того, этот подход позволяет работать с более крупными геномами и не требует создания отнормированных микрочипов[9].
Бисульфитное секвенирование включает химическое превращение неметилированных остатков цитозина, поэтому далее их удаётся выявить с помощью обычного секвенирования. При обработке бисульфитом натрия и щёлочью неметилированный цитозин превращается в урацил, а метилированный цитозин остаётся интактным. Дальнейшая амплификация и секвенирование ДНК, не обработанной бисульфитом натрия, и ДНК, подвергшейся обработке, позволяет идентифицировать сайты метилирования. Подобно классическим методам, основанным на применении чувствительных к метилированию рестриктаз, бисульфитное секвенирование сначала применяли для изучения метилирования в пределах отдельных локусов, однако появление методов полногеномного секвенирования[en] позволило использовать его для анализа метилирования на уровне целого генома. Однако в отличие от методов, основанных на применении рестриктаз, бисульфитное секвенирование даёт возможность выявить сайт метилирования с точностью до одного нуклеотида. К числу ограничений бисульфитного метода можно отнести неполное превращение метилированного цитозина в урацил, которое приводит к появлению ложноположительных результатов. Кроме того, при бисульфитном секвенировании может происходить разрушение ДНК, и протокол метода включает стадию удаления бисульфита натрия[25][9][9].
Для полногеномного анализа метилирования в паре с бисульфитным секвенированием используют технологии секвенирования нового поколения. Сочетание этих методов позволяет установить сайты метилирования с наибольшим метилированием из возможных, однако на этапе сборки прочтений в геном возникает много сложностей, связанных с пониженной сложностью последовательности ДНК, обработанной бисульфитом. Для борьбы с этим эффектом можно увеличивать длину прочтений; на таком подходе основано полногеномное секвенирование методом дробовика (англ. whole genome shotgun bisulphite sequencing, WGBS). Метод WGBS, использующий платформу Illumina Genome Analyzer, уже был применён для анализа метилома растения Arabidopsis thaliana[9]. Существуют также варианты бисульфитного секвенирования с ограниченной представленностью[29][30], которые особенно актуальны в случае организмов с большими геномами[31].
Под доступностью хроматина понимают меру того, насколько соответствующий ему участок генома открыт для взаимодействия с транскрипционными факторами и другими компонентами аппарата транскрипции. Недоступные участки, плотно упакованные с помощью нуклеосом, не подвергаются активной транскрипции, в отличие от открытых участков[32]. Изменение доступности хроматина — это важный эпигенетический регуляторный процесс, благодаря которому достигается контекстоспецифичный или клеткоспецифичный уровень экспрессии определённых генов[33]. Для изучения доступности хроматина в клетке применяются различные методы, такие как MNase-seq[en], DNase-seq, ATAC-seq и FAIRE-seq. Ключевой особенностью этих подходов является их способность к отделению ДНК, связанной с гистонами, от свободной ДНК. Эти последовательности затем выравниваются на референсный геном[en], что позволяет установить их расположение[34].
MNase-seq и DNase-seq основаны на одном и том же принципе, а именно, расщеплении нуклеазами свободной ДНК, не связанной с гистонами или другими белками. В то же время фрагменты ДНК, взаимодействующие с белками, остаются нетронутыми, так что их можно отделить от белков и анализировать далее. Поскольку эти методы предполагают разрушение активных участков генома, их позицию можно установить лишь косвенно с помощью секвенирования уцелевших фрагментов ДНК и их выравнивания на референсный геном. В методе MNase-seq используется микрококковая нуклеаза, которая вносит одноцепочечный разрыв в цепь, комплементарную последовательности-мишени[35]. В методе DNase-seq используется ДНКаза I, которая неспецифично вносит двуцепочечные разрывы[en] в ДНК[36]. DNase-seq получил такое широкое распространение, что свободные от нуклеосом участки стали называть DHSs (от англ. Nase I hypersensitive sites)[37], а консорциум ENCODE выбрал этот метод для полногеномного анализа доступности хроматина[38]. Главная проблема DNase-seq заключается в том, что разрывы могут вноситься неслучайно, что снижает качество получаемых результатов[39].
Метод FAIRE-seq (англ. Formaldehyde-Assisted Isolation of Regulatory Elements) начинается с сшивания ДНК с нуклеосомами и последующего расщепления ДНК с помощью ультразвука. Свободные и связанные фрагменты выделяют с помощью стандартной фенол-хлороформной экстракции, при этом фракция белков образует вязкую интерфазу, а свободная ДНК оказывается в водной фазе, откуда её можно взять для дальнейшего анализа[40]. Обработка ультразвуком вносит случайные разрывы, поэтому фактор неслучайности здесь полностью исключён, а фрагменты, получающиеся после воздействия ультразвука, имеют большую длину, чем при ферментативной обработке (200—700 п. о.)[34]. Благодаря этому FAIRE-seq может быть использован для анализа больших участков генома, однако он не даёт разрешения в одну нуклеосому. В отличие от методов, использующих нуклеазы, FAIRE-seq позволяет идентифицировать активные участки генома напрямую и включает более простую стадию пробоподготовки[41].
Метод ATAC-seq основан на применении транспозазы Tn5. Транспозаза вставляет в геном адаптеры[en] для секвенирования, причём с большей частотой в те участки генома, которые свободны от белков. Вставленные транспозазой адаптеры далее используются в ПЦР и последующем секвенировании[42].
Чувствительность ДНК-полимеразы, использующейся при одномолекулярном секвенировании в реальном времени, делает возможным непосредственно выявлять эпигенетические метки, такие как метильные группы, по мере перемещения полимеразы по секвенируемой молекуле ДНК[43]. В нескольких проектах была показана применимость этого подхода для получения полногеномной эпигенетической информации у бактерий[44][45][46][47].
Нанопоровое секвенирование основано на выявлении изменений силы электрического тока при встрече с модифицированными нуклеотидами (например, метилированными). ДНК-полимераза обеспечивает погрузку одноцепочечной ДНК в пору миниатюрной камеры, заполненной раствором электролита, в которой из-за приложенного напряжения возникает электрический ток. Прохождение определённых нуклеотидов через пору уменьшает её сечение, доступное для ионов электролита, что приводит к уменьшению силы тока[48]. Фиксируя такие изменения силы тока, можно выявить CpG-островки в ДНК, пропускаемой через пору. С помощью нанопорового секвенирования можно даже различить гидроксиметилирование и метилирование. Секвенатор MinION, разработанный Oxford Nanopore Technologies[en], позволяет отличить неметилированный цитозин от метилированного без предварительной химической обработки[49]. Технология нанопорового секвенирования также реализована в приборах Nanopolish и SignaAlign: первый позволяет оценить частоту метилирования в прочтениях[en], а второй — его вероятность[50].
Одномолекулярное секвенирование в реальном времени включает использование нулевого световода[en] (англ. Zero-mode waveguide). С нижней частью световода связана единственная молекула ДНК-полимеразы, матрицей для которой служит также единственная молекула ДНК. Каждый из четырёх нуклеотидов ДНК метят одним из четырёх различных флуоресцентных красителей. Когда ДНК-полимераза присоединяет очередной нуклеотид, с него удаляется флуоресцентная метка, а её световой сигнал регистрируется детектором. Когда в ходе секвенирования ДНК-полимераза встречается в модифицированным нуклеотидом в матрице, её кинетика изменяется: она ускоряется или замедляется уникальным для данной модификации способом. В ходе секвенирования флуоресцентные вспышки оцениваются не только по их спектрам эмиссии, а также длительности и интервалам между вспышками. Эти параметры, известные как ширина пульса и межпульсовый интервал, позволяют оценить кинетику ДНК-полимеразы в данный момент времени. Ширина пульса есть функция всех кинетических этапов от присоединения нуклеотида до высвобождения флуорофора, а межпульсовый интервал определяется кинетикой связывания нуклеотидов и перемещением ДНК-полимеразы. В 2010 году было показано, что одномолекулярное секвенирование в реальном времени позволяет выявить такие модифицированные нуклеотиды, как N6-метиладенозин[en], 5-метилцитозин и 5-гидроксилцитозин. Эти модификации по-разному изменяют кинетику ДНК-полимеразы, что и позволяет отличать их друг от друга[51].
В 2017 году был предложен комбинированный метод, включающий бисульфитное превращение неметилированных остатков цитозина и одномолекулярное секвенирование в реальном времени. Этот подход известен как одномолекулярное бисульфитное секвенирование в реальном времени (англ. single-molecule real-time bisulfite sequencing, SMRT-BS) и представляет собой метод для прицельного анализа метилирования CpG-островков[52].
Первые математические модели для различных состояний нуклеосом, влияющих на экспрессию генов, были предложены в 1980-х годах. В дальнейшем эти идеи были почти полностью забыты, пока не появились экспериментальные данные о ковалентных модификациях гистонов и гистоновом коде[53]. В последующем высокопроизводительные методы показали широкое распространение эпигенетических модификаций, что способствовало разработке новых теоретических моделей, описывающих появление, поддержание и изменение этих меток[54]. Большинство из предложенных моделей описывают эпигенетические модификации в терминах одномерной решётки[55].
Существует множество исследовательских методов, направленных на редактирование эпигенома. Изменения в эпигеноме происходят и при классических генетических экспериментах, приводящих к нокауту или нокдауну гена-мишени, делеции доменов белка, появлению точечных мутаций, мутаций приобретения или утраты функции. На эпигеном влияет и введение в геном искусственных последовательностей с индуцибельной экспрессией[en]*, а также введение в клетку эктопически экспрессируемых[en] векторов. Эпигеном может изменяться под действием биологически активных малых молекул, ингибирующих ферменты, которые отвечают за включение или удаление эпигенетических меток. Примером могут служить азацитидин и децитабин[en], необратимо ингибирующие ДНК-метилтрансферазы 1 и 3, а также ромидепсин[en], ингибирующий гистондеацетилазы. Направленное редактирование эпигенома связано с применением методов направленного редактирования генома, в которых используются нуклеазы, содержащие цинковые пальцы[en], нуклеазы TALEN[en], а также система CRISPR/Cas9. Редактирующий эффект связан с воздействием на ферменты, которые прямо или опосредованно вовлечены в удаление или внесение эпигенетических меток[8].
Статья является кандидатом в избранные статьи с 27 февраля 2020.
|