Super enhancer
Super enhancer的提出是一篇2013年Richard Young实验室的Cell文章,原文地址:cell.com/cell/pdfExtended/S0092-8674(13)00392-9
Super enhancer的定义和特点
在murine胚胎干细胞(ESC)中,ESC state的基因表达程序的建立有两个关键的贡献者。
第一是,依靠少数的”master transcription factors”,如Oct4, Sox2, Nanog(OSN)等。
第二是,依靠”mediator coactivator complex”增强结合在enhancer上的TFs募集Pol II的能力。
在实验中,不管是loss of Oct4这样的Master TF,还是loss of Mediator,都能使ESC-specific gene的表达快速下降。
有文献表明,同时被Oct4, Sox3, Nanog三者结合的DNA区域大概率是enhancer。所以作者根据这个在ESC中鉴定出8794个enhancer。对这八千多个enhancers观察,他们发现这些enhancer并不是完全随机的分布在基因组上的,在某些区域,会集中出现若干个enhancers密集堆积在一起,形成clusters. 一般的enhance的长度也就几百个碱基对,而这些clusters里的enhancer连起来可以长达50kb. 举个直观的例子,下图上面的Gck里最尖的那个峰是一个enhancer,一枝独秀。而下面miR-290-295附近的enhancer连成了clusters,连绵不绝几十kb。
图1
因为enhancer区域总是富集着Master TFs和Mediator (上图用OSN和Med1的ChIP-seq表征)。所以它们就用Med1的信号强度来定义这种特别长的enhancer.
图2
可以看到,如果把Med1 signal做累计曲线,绝大多数的enhancers只有很少的Med1 signal,而最后的231个”enhancer domains”占据了绝大多数的Med1,这种231个”enhancer domains”,作者起了一个新的名字,就叫”super enhancers”, 与之对应的不这么长的就叫”typical enhancers”.
图3
从上图可以直观的对比typical enhancers和super enhancers,后者数量少,但长度长,Med1更多,enhancer上通常有的H3K27ac和H3K4me1也更多,DNaseI signal也高,表示染色质开放程度高。
那既然经典的enhancer信号(H3K27ac, H3K4me1, DNase I)都和Med1有着相同的趋势,都在super enhancer更富集,除了用Med1,能不能也用它们几个来定义super enhancers呢?作者绘制了跟图2类似的累计曲线(图4),发现虽然趋势相同,但用Med1是效果最好的。
图4
到这里,作者提出了super enhancer这个概念,但读者自然会想。这样一个概念有没有提出的必要?有没有可能就是恰好一堆typical enhancer在某些地方扎堆就形成了super enhancer呢?它跟typical enhancer相比,除了更长之外,有没有更加独特的地方区分呢?
为了确定这一点,作者做了一大堆的ChIP-seq,包括TFs, histone modifications, chromatin regulators等等。最终他们发现,有两个TFs确实在typical和super enhancer中表现出显著差异,它们是Klf4和Esrrb.
图5
下一步,作者探究super enhancer的形成原因。因为enhancer跟TFs结合发挥作用,所以自然想到来研究super enhancer上有没有特定的TFs结合motif. 他们发现,super enhancers上有Oct4, Sox2, Nanog, Klf4, Esrrb的结合motif,但没有其他转录因子如CTCF和c-Myc的结合motif (图6)。
图6
进一步对比typical和super enhancers中这些motif出现的数量,发现Oct4, Sox2, Nanog的数量差不多,而Klf4和Esrrb在super enhancers中有更多的结合motif,这解释了为什么在图5中观察到super enhancers含有比typical enhancers更多的Klf4和Esrrb.
总结:
Super enhancer的功能
enhancer的靶基因通常在染色质上也临近enhancers本身,用这个原理,作者对ESC中的super enhancers的靶基因进行电脑预测,鉴定到一批”super-enhancer-associated genes”。对这一批gene list进行观察,发现它包含了几乎所有的对ESC细胞命运控制相关的基因,其中就包括前面用到的Oct4, Sox2, Nanog. 下图是Oct4和Sox2基因座位上的Nanog和Med1的ChIP profiles,可以发现确实距离super enhancers相当近。
图7
为了证明”super-enhancer-associated genes”确实参与ESC state的调控,他们找了一个数据集做GSEA,发现确实富集在那些shRNA knockdown后破坏ESC state(low Oct4)的一端,GO还富集到”Transcription factor activity”的条目。
图8
提出一个model: Oct4, Sox2, Nanog, Klf4, Esrrb这几个TFs通过结合super enhancers正反馈地激活自身的表达。同时,super enhancers也增强其他与ESC state相关基因的表达。
图9
统计所有基因,发现super enhancers确实比typical enhancers拥有更强的激活转录的能力(图10)。
图10
并且,由于super enhancer相比typical enhancers含有更丰富的TF结合的motifs,super-enhancer-associated genes的基因表达水平受Oct4 knockdown的影响更显著(图11)。
图11
super enhancer同样存在于已分化细胞
图12
Super enhancer是cell-specific的
图13
Super enhancer标记关键的Cell Identity基因
这是top10 GO富集的biological process条目
图14