Super enhancer

Super enhancer的提出是一篇2013年Richard Young实验室的Cell文章,原文地址:cell.com/cell/pdfExtended/S0092-8674(13)00392-9

Super enhancer的定义和特点

在murine胚胎干细胞(ESC)中,ESC state的基因表达程序的建立有两个关键的贡献者。

第一是,依靠少数的”master transcription factors”,如Oct4, Sox2, Nanog(OSN)等。

第二是,依靠”mediator coactivator complex”增强结合在enhancer上的TFs募集Pol II的能力。

在实验中,不管是loss of Oct4这样的Master TF,还是loss of Mediator,都能使ESC-specific gene的表达快速下降。

有文献表明,同时被Oct4, Sox3, Nanog三者结合的DNA区域大概率是enhancer。所以作者根据这个在ESC中鉴定出8794个enhancer。对这八千多个enhancers观察,他们发现这些enhancer并不是完全随机的分布在基因组上的,在某些区域,会集中出现若干个enhancers密集堆积在一起,形成clusters. 一般的enhance的长度也就几百个碱基对,而这些clusters里的enhancer连起来可以长达50kb. 举个直观的例子,下图上面的Gck里最尖的那个峰是一个enhancer,一枝独秀。而下面miR-290-295附近的enhancer连成了clusters,连绵不绝几十kb。

图1

因为enhancer区域总是富集着Master TFs和Mediator (上图用OSN和Med1的ChIP-seq表征)。所以它们就用Med1的信号强度来定义这种特别长的enhancer.

图2

可以看到,如果把Med1 signal做累计曲线,绝大多数的enhancers只有很少的Med1 signal,而最后的231个”enhancer domains”占据了绝大多数的Med1,这种231个”enhancer domains”,作者起了一个新的名字,就叫”super enhancers”, 与之对应的不这么长的就叫”typical enhancers”.

图3

从上图可以直观的对比typical enhancers和super enhancers,后者数量少,但长度长,Med1更多,enhancer上通常有的H3K27ac和H3K4me1也更多,DNaseI signal也高,表示染色质开放程度高。

那既然经典的enhancer信号(H3K27ac, H3K4me1, DNase I)都和Med1有着相同的趋势,都在super enhancer更富集,除了用Med1,能不能也用它们几个来定义super enhancers呢?作者绘制了跟图2类似的累计曲线(图4),发现虽然趋势相同,但用Med1是效果最好的。

图4

到这里,作者提出了super enhancer这个概念,但读者自然会想。这样一个概念有没有提出的必要?有没有可能就是恰好一堆typical enhancer在某些地方扎堆就形成了super enhancer呢?它跟typical enhancer相比,除了更长之外,有没有更加独特的地方区分呢?

为了确定这一点,作者做了一大堆的ChIP-seq,包括TFs, histone modifications, chromatin regulators等等。最终他们发现,有两个TFs确实在typical和super enhancer中表现出显著差异,它们是Klf4和Esrrb.

图5

下一步,作者探究super enhancer的形成原因。因为enhancer跟TFs结合发挥作用,所以自然想到来研究super enhancer上有没有特定的TFs结合motif. 他们发现,super enhancers上有Oct4, Sox2, Nanog, Klf4, Esrrb的结合motif,但没有其他转录因子如CTCF和c-Myc的结合motif (图6)。

图6

进一步对比typical和super enhancers中这些motif出现的数量,发现Oct4, Sox2, Nanog的数量差不多,而Klf4和Esrrb在super enhancers中有更多的结合motif,这解释了为什么在图5中观察到super enhancers含有比typical enhancers更多的Klf4和Esrrb.

总结:

ESC super-enhancers are large clusters of enhancers that can be distinguished from typical enhancers by the presence of the transcription factors Klf4 and Esrrb and exceptional levels of Mediator. These domains are formed as a consequence of binding of specific master transcription factors to dense clusters of their binding site sequences.

Super enhancer的功能

enhancer的靶基因通常在染色质上也临近enhancers本身,用这个原理,作者对ESC中的super enhancers的靶基因进行电脑预测,鉴定到一批”super-enhancer-associated genes”。对这一批gene list进行观察,发现它包含了几乎所有的对ESC细胞命运控制相关的基因,其中就包括前面用到的Oct4, Sox2, Nanog. 下图是Oct4和Sox2基因座位上的Nanog和Med1的ChIP profiles,可以发现确实距离super enhancers相当近。

图7

为了证明”super-enhancer-associated genes”确实参与ESC state的调控,他们找了一个数据集做GSEA,发现确实富集在那些shRNA knockdown后破坏ESC state(low Oct4)的一端,GO还富集到”Transcription factor activity”的条目。

图8

提出一个model: Oct4, Sox2, Nanog, Klf4, Esrrb这几个TFs通过结合super enhancers正反馈地激活自身的表达。同时,super enhancers也增强其他与ESC state相关基因的表达。

图9

统计所有基因,发现super enhancers确实比typical enhancers拥有更强的激活转录的能力(图10)。

图10

并且,由于super enhancer相比typical enhancers含有更丰富的TF结合的motifs,super-enhancer-associated genes的基因表达水平受Oct4 knockdown的影响更显著(图11)。

图11

super enhancer同样存在于已分化细胞

图12

Super enhancer是cell-specific的

图13

Super enhancer标记关键的Cell Identity基因

这是top10 GO富集的biological process条目

图14

总结

Super enhancer由一群富集master regulator和mediator的enhancers组成,拥有更强的增强转录能力,也对TF perturbation更敏感。super enhancers是cell-specific的,且特异性地增强与cell identity相关基因的表达。上面实验都在哺乳动物中做的。