为了满足这一需求,西奈山伊坎医学院(Icahn School of Medicine at Mount Sinai)的研究人员分析了存储在两个大型生物库中的数千个人的DNA序列和电子健康记录数据。总的来说,他们发现致病性基因变异实际上导致疾病的几率相对较低——约为7%。尽管如此,他们也发现一些变异,如与乳腺癌相关的变异,与各种疾病风险有关。发表在《美国医学会杂志》(JAMA)上的研究结果,可能会改变与这些变异相关的风险的报告方式,有朝一日,还会帮助指导医生解读基因检测结果的方式。
“这项研究的一个主要目标是产生有用的高级统计数据,以定量评估已知的致病基因变异可能对个人患病风险的影响。”遗传学和基因组科学副教授、伊坎山西奈山查尔斯布朗夫曼个性化医学研究所成员罗恩·多(Ron Do)博士说。
在过去的20年里,科学家们已经发现了数十万种可能导致各种疾病的基因变异。然而,由于这些发现的性质,很难估计——或提供统计数据——每个基因变异发生这种情况的真正风险。到目前为止,大多数估计都是基于涉及少数受试者的研究,这些受试者要么是有疾病史的家庭成员,要么是被特定疾病诊所招募来的。但是,像这样的研究如果没有使用随机选择的大量人群,可能会高估变异带来的风险。
在这项研究中,研究人员通过搜索72434个个体的大规模DNA测序数据,找到37780个已知的变异,然后扫描每个个体的健康记录,以获得相应的疾病诊断,从而解决了这个问题。这项广泛的搜索涉及西奈山生物样本库项目的29039名参与者和英国生物样本库项目的43395名参与者。
初步结果显示,他们的数据集中有157种疾病可能与5360种变异有关,这些变异要么被广泛引用、NIH支持的公共图书馆ClinVar定义为“致病性”,要么被生物信息算法预测为“功能丧失”。平均而言,变异与疾病诊断相关的“外显率”或几率很低,具体为6.9%。同样,平均风险差异也很低,它描述的是患有该变异的个体比未患有该变异的个体患病风险的增加。
“一开始,我对结果感到非常惊讶。我们发现的风险比我预期的要低,”Do博士说。“这些结果提出了我们应该如何对这些变异的风险进行分类的问题。”
尽管有这些结果,与某些遗传变异相关的风险仍然很高。例如,乳腺癌基因BRCA1和BRCA2的致病变异的外显率均为38%,个别变异的外显率在零到100%之间。
进一步的研究结果显示了利用生物库数据的其他优点。在一个例子中,研究人员能够计算出与年龄相关疾病(如某些形式的2型糖尿病、乳腺癌和前列腺癌)相关的个体变异的风险。平均而言,这些变异的外显率在70岁以上的人群中约为10%,而在20岁以上的人群中约为8%。
该团队还发现,某些变异的存在可能取决于个人的种族,并确定了100多种变异,这些变异专门在非欧洲血统的个体中发现。
最后,作者列出了研究本身可能低估或高估风险的几种可能方式。
“虽然还需要做更多的研究,但我们认为这项研究是很好的第一步,最终为医生和患者提供了准确和微妙的信息,他们需要这些信息来做出更精确的诊断,”Do博士说。
Iain S. Forrest, Kumardeep Chaudhary, Ha My T. Vy, Ben O. petrazzini, Shantanu Bafna, Daniel M. Jordan, Ghislain Rocheleau, Ruth J. F. Loos, Girish N. Nadkarni, Judy H. Cho, Ron Do. population-Based penetrance of Deleterious Clinical Variants. JAMA, 2022; 327 (4): 350