许多研究采用pacBio HiFi测序来生成参考质量的基因组,包括人类基因组。如今,人类泛基因组参考联盟(HpRC)正在生成300多个参考级基因组,以便全面捕获人类群体的遗传多样性。
同时,这种生成更精确、更完整的参考基因组的范式转变也发生在其他物种上。最近,加州大学伯克利分校的研究人员及其合作者在预印本网站发表文章,利用pacBio HiFi基因组测序和Iso-Seq方法对单细胞绿藻莱茵衣藻的参考基因组进行了重大升级。
莱茵衣藻(Chlamydomonas reinhardtii)是植物生物学中主要的模式生物之一,用于多个基本生物过程的研究,包括光合作用、细胞周期和有性繁殖等。它也应用在藻类生物技术的多个领域。它还是第一个参与基因组计划的藻类。
在过去的25年中,科学家已经生成了五个版本的莱茵衣藻参考基因组。在新的预印本中,研究人员提出了第六版。他们认为,新版本“在组装质量和结构注释方面带来了重大进步”。具体包括:
▪两种实验室菌株的染色体水平组装,为两种交配型等位基因提供了单独的参考质量基因组
▪修正了以前版本中的主要错误组装
▪连续性增加十倍以上
▪>80%的填补空白在基因内
▪改进了结构注释,更新了基因符号
他们总结道:“总的来说,这里提供的资源预示着衣藻基因组学的新时代,并将为这一重要参照物的后续研究打下基础。”
研究人员警告说,所有实验室菌株都可能含有破坏基因的突变,“在解释和比较不同实验室和不同时间的实验结果时应该考虑到这一点”。此外,单个菌株并不能代表衣藻实验室菌株之间的基因组多样性,因为两个单倍型在约2%的位点上存在差异。
出于这个原因,研究人员已经启动了泛基因组计划,“旨在生成其他几种实验室菌株和野外分离株的基因组”。作者指出,“许多信息只有通过比较不同菌株的基因组才能获得,我们期待对更多菌株和分离株的测序能够带来更大收益”。
pacBio表示,参考泛基因组的新时代正在开启,这主要得益于HiFi测序的精确性和读取长度,以及高效的组装方法。如果你想了解某种生物的完整基因组序列,以及实验室中的不同菌株在基因组范围内有何差异,欢迎迈入参考泛基因组时代。
###
The Chlamydomonas Genome project, version 6: reference assemblies for mating type plus and minus strains reveal extensive structural mutation in the laboratory