研究人员在SARS-CoV-2中发现了一种新的“隐藏”基因,这种基因可能是导致SARS-CoV-19独特的生物学特性和大流行的潜在因素。
在一个总共只有大约15个基因的病毒中,更多地了解这个基因和其他重叠基因者(基因中的基因)可能会对我们如何抗击病毒产生重大影响。这一新基因于11月10日发布在了《eLife》杂志。
“重叠基因可能是冠状病毒进化成高效复制、阻碍宿主免疫或自我传播的一个方法,”主要作者、台湾中央研究院博士后研究员、美国自然历史博物馆访问学者Chase Nelson说。“了解到重叠基因的存在以及它们如何发挥作用,可能会为冠状病毒的控制提供新的途径,例如通过抗病毒药物。”
研究小组发现了SARS-CoV-2中的一个新的重叠基因ORF3d,它有可能编码一种比预期更长的蛋白质。他们发现,这种基因也存在于先前发现的穿山甲冠状病毒中,这可能反映了在SARS-CoV-2和相关病毒进化过程中该基因的反复丢失或获得。此外,ORF3d已被独立鉴定并显示在COVID-19患者中能引起强烈的抗体反应,证明新基因的蛋白质是在人类感染过程中产生的。
“我们还不知道它的功能或是否有临床意义,”Nelson说。“但我们预测,与抗体反应相比,这种基因不太可能被T细胞反应检测到。也许这与基因是如何产生的有关。”
乍一看,基因看起来像书面语言,因为它们是由传递信息的字母串(在RNA病毒中,是核苷酸A、U、G和C)组成的。但是,虽然语言(单词)的单位是离散的和不重叠的,基因可能是重叠的和多功能的,信息的编码方式是根据你开始“阅读”的地方而定的。重叠基因很难被发现,而且大多数科学的计算机程序都不是为了找到它们而设计的。然而,它们在病毒中却很常见。这在一定程度上是因为RNA病毒具有很高的突变率,所以它们倾向于保持较低的基因数以防止大量的突变。因此,病毒进化出了一种数据压缩系统,在这种系统中,基因组中的一个字母可以产生两个甚至三个不同的基因。
Nelson说:“遗落重叠基因会使我们处于忽视病毒生物学重要方面的危险之中。就基因组大小而言,SARS-CoV-2及其近亲是现存最长的RNA病毒之一。因此,它们可能比其他RNA病毒更容易出现‘基因组骗术’。”
在疫情之前,Nelson在博物馆工作时主要研究生物信息学和计算生物学,他开发了一个计算机程序,用以筛选基因组中重叠基因特有的基因变化模式。在这项研究中,Nelson与慕尼黑技术大学和加州大学伯克利分校等机构的同事合作,将该软件和其他方法应用于SARS-CoV-2的大量新序列数据。该组织希望其他科学家能够研究他们在实验室中发现的基因,以确定它的功能,并可能确定它在大流行病毒的出现中可能扮演的角色。
原文检索:Dynamically evolving novel overlapping gene as a factor in the SARS-CoV-2 pandemic
(生物通:伍松)