猕猴(Macaca mulatta)是生物医学研究中最广泛使用的非人灵长类动物之一,通常会被开发成各种疾病模型用于人类疾病的研究。构建一个高质量的猕猴基因组是开展相关研究的重要基础。
近期,美国多家研究团队共同组装出猕猴的最新参考基因组,并发布在《Science》上。研究人员将其基因组组装序列连续性提高了120倍,这一最新的猕猴参考基因组和研究群体的遗传特征,为研究基因功能、遗传变异提供更完整的数据支持,并为研究人类疾病提供线索。
作者通过pacBio Iso-Seq方法,利用650万条全长转录本对基因组进行注释,建立了一套完整的蛋白质编码和非编码基因模型。提供对基因内容、异构体多样性和重复结构的重要信息,能完成新的猕猴亚型和候选基因的鉴定。
作者写道:“随着片段重复的组装得到改善,我们发现了新的谱系特异性基因和扩展的基因家族,这些基因家族在进化和疾病易感性的研究中具有潜在的信息价值。”
在新组装的猕猴基因组中发现了一个与细胞色素p450家族同源的新基因模型。
有来自多个组织的Iso-Seq数据为该位点表达的isoform和预测的蛋白质序列提供了直接证据。
猕猴的遗传多样性
研究小组对850只来自美国圈养和3只中国野生猕猴进行全基因组测序。与千人基因组计划项目类似,研究人员想要对物种内部的基因变异进行分类,他们最终发现了8570万个单核苷酸变异(SNVs)和1050万个插入缺失(Indel)变异,这是非人类灵长类动物物种中最广泛的分类基因变异的集合。
研究人员发现,平均每个猕猴携带970万个SNVs,即每个猕猴个体的多样性是人类的两倍多。他们计划利用这些变异信息更好地研究种群的遗传多样性及各方面基因组功能,如基因调控,并开发成新的疾病遗传模型。
例如,通过研究变异的核苷酸可能会对与自闭症谱系障碍有关的基因产生何种影响,并预测可能的基因破坏( LGD )突变。猕猴的遗传变异数据可能为通常的异质遗传条件提供线索。
这些自发的突变可能为开发人类疾病非侵入性诊断模型提供了机会,而不必对胚胎进行基因编辑(CRISpR),这对于在非灵长类敲除模型中不易重现的表型,以及在人体实验前评估基因变异治疗效果的影响,尤为有用。
作者总结道:“这一新的猕猴参考基因组和研究群体的遗传特征将大大推进灵长类动物基因组进化及生物医学研究。”可见,高质量的参考基因组将有助于研究人员找到各种疾病的原因,并开发出治疗方法。
来自多种组织的Iso-Seq数据表明,与人类基因相比,猕猴的弹性蛋白基因(ELN)编码另外两个外显子,
其中一个外显子为选择性剪接。其他灵长类动物和小鼠中也存在此附加序列。
pacBio Iso-Seq是高准确度全长转录本测序的方法,无需进行组装,可确认新的isoform,能够帮助科学家们更深入的了解与探索人类疾病。
参考文献:Warren WC, Harris RA, Haukness M,et al. Sequence diversity analyses of an improved rhesus macaque genome enhance its biomedical utility. Science. 2020 Dec 18;370(6523):eabc6617.
扫码关注我们
为了更好的向您推送pacBio SMRT测序技术的最新进展,基因有限公司开辟了专门的企业微信账号,实时解读最新pacBio研究进展。
基因有限公司作为pacBio公司在中国区的独家代理商,自2011年以来将pacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的pacBio用户。