动植物的遗传信息储存在DNA中,细胞通过将DNA转录成紧密相关的分子(即RNA)来使用遗传信息。许多RNA被继续翻译成蛋白质,近几十年来,科学家们不得不思考这样一个事实:只有不到2%的基因组是如此使用的。大部分DNA被转录为不编码蛋白质的RNA,这些RNA被称为非编码RNA,长度超过200个核苷酸的被归类为长非编码RNA(lncRNAs)。
长非编码RNA通常被描述为“基因组的暗物质”,但到目前为止,科学家们还没有合适的方法来鉴定人类细胞中数万种不同lncRNAs的功能和角色。
来自南方医科大学生物信息学系的研究人员发表了题为“pipelines for cross-species and genome-wide prediction of long noncoding RNA binding”的文章,指出分析大量lncRNA的DNA结合域和结合位点对揭示表观遗传调控机制具有重要意义,并由此介绍了一个依托国家超算广州中心开发的哺乳动物全基因组lncRNA/DNA结合计算分析平台。
这些内容发表在Nature protocols上,南方医科大学生物信息学系朱浩、网络中心张海是论文的共同通讯作者。
论文指出,大量研究表明基因组修饰对基因表达具有重要调控作用。能够与DNA结合并把DNA和组蛋白修饰酶(如DNMT和pRC家族蛋白)招募到特定基因组位点的lncRNA是重要的基因组修饰调控分子。
哺乳动物基因组有逾万个lncRNA基因,许多lncRNA能结合到许多基因组位点,且许多基因组位点可被许多lncRNA结合,lncRNA的DNA结合位点相当程度决定了它们的表观遗传调控靶基因,因此分析大量lncRNA的DNA结合域和结合位点对揭示表观遗传调控机制具有重要意义。
原文标题:
pipelines for cross-species and genome-wide prediction of long noncoding RNA binding