着丝粒是染色体的重要组成部分,对染色体的正确分离起着重要作用。着丝粒区域重复序列的组成和排布在着丝粒结构和功能中的作用是着丝粒研究领域的难点和热点,也是基因组测序组装最难完成的染色体区域,最近人类两条染色体着丝粒的详细解析对我们植物染色体研究有很好的借鉴,如何精细进行植物着丝粒的序列和功能解析是我们的长期目标。

植物中不同物种双着丝粒染色体和新着丝粒染色体的不断发现,说明着丝粒区域大量的重复序列既不是其功能的充分条件也不是必要条件(Birchler and Han 2018; Liu et al., 2015)。以前认为着丝粒的重复序列不进行转录,但越来越多的研究表明着丝粒区的转录产物参与调控基因组空间构象和细胞分裂等重要的生物学功能。在植物中,着丝粒区域存在丰富的反转座子(Retrotransposon)和串联重复序列(Satellite),这些序列的组成和排布方式不同,其产生的转录产物就会有差异,调控过程也更复杂,因此,系统揭示着丝粒结合RNA在基因组进化和染色质组装中的潜在功能,具有重要的科学意义。

中国科学院遗传与发育生物学研究所韩方普研究组长期从事植物染色体生物学的研究。前期在玉米着丝粒区特异反转座子CRM1中鉴定到了3类环状 RNA。功能研究发现CRM1来源的环状RNA通过R-loop结构结合在着丝粒区域,来调节染色质构象,从而影响着丝粒区特异组蛋白CENH3定位。(Liu etal 2020. pLOS Biology)。

为了进一步理解R-loop结构在着丝粒区重复序列上的分布特征,该研究组利用ssDRIp-seq技术首次开展了玉米全基因组R-loop图谱的绘制。从基因和染色体水平揭示了玉米 R-loop 的分布特征:(1) 从基因水平来看,正义R-loop主要集中在基因的启动子和转录终止位点,而反义R-loop主要集中在基因的转录起始位点。R-loop与RNA-seq关联分析发现,含有反义R-loop基因的表达量要显著高于不含有R-loop的基因以及只含有正义R-loop基因的表达量。(2)在染色体水平上,R-loop呈现着丝粒和近着丝粒区富集的分布特征,推测 R-loop 可能在维持着丝粒功能和近着丝粒区异染色质化方面发挥重要作用。为了进一步明确着丝粒区介导R-loop形成的序列,分析了着丝粒区特异反转座子CRM1和CRM2上R-loop的分布,结果表明:CRM1和CRM2上靠近5’LTR下游区域极易形成 R-loop,通过比较表达序列标签(EST)在CRM1和CRM2上的分布模式,发现R-loop能够与EST共定位,说明CRM1和CRM2在着丝粒区活跃转录,并且在转录起始位点形成丰富的R-loop结构。此外通过体外转录结合原子力显微镜成像,观察到了CRM1和CRM2上形成的R-loop结构。进一步分析着丝粒区的R-loop与CENH3核小体的分布关系,结果显示R-loop倾向在CENH3核小体的位置形成,推测 R-loop 结构可能作为一种表观标记介导CENH3 在着丝粒区的定位。这些结果为着丝粒结构和功能研究提供了新的视角。

该论文于2021年7月9日在线发表于Genome Research(DOI:10.1101/gr.275270.121),韩方普研究组已毕业博士研究生刘阳、博士研究生刘倩和苏汉东博士为该文章的共同第一作者,韩方普研究员为通讯作者。本项工作得到了中科院物理所李伟实验室在原子力显微镜成像以及清华大学孙前文实验室在ssDRIp-seq实验方面的帮助。该研究得到国家自然科学基金重点国际合作项目和基金委重点项目的资助。

图:原子力显微镜观察CRM1和CRM2上形成的R-loop结构