Amgen子公司Decode Genetics的研究人员利用长读长测序技术对冰岛的数千名个体进行测序,然后对详细的结构变异(SV)图谱进行挖掘,确定了与群体的性状和疾病相关的稀有结构变异。

Decode Genetics的创始人兼首席执行官Kari Stefansson说:“我们相信,群体水平上的长读长测序将帮助我们找到许多缺失的序列多样性,由此我们才能充分认识基因组序列的多样性如何解释人类多样性。”

此次研究的对象包括3,600多名冰岛人,包括400多个家系,他们先前已通过短读长测序和基因分型芯片进行了分析。Stefansson及其同事利用Oxford Nanopore Technologies的长读长测序技术对3,524个全血样本和102个心脏组织样本中的DNA进行了测序。

利用由此产生的全基因组序列,他们发现了现有的短读长序列数据遗漏的大片段插入、缺失、倒位、易位及其他结构变异。这项成果于近日发表在《Nature Genetics》杂志上。

Decode Genetics序列分析负责人、雷克雅未克大学的Bjarni Halldorsson说:“我们开发的这项技术和算法让我们能够在群体规模上可靠地鉴定几乎所有结构变异。”

研究人员在这个群体中发现了近13.4万个结构变异等位基因,平均每人带有13,353个插入和近9,500个缺失。接着,他们利用基因分型芯片在另外166,281名冰岛人中进行了结构变异填充,寻找与人类性状和疾病的直接关联。

他们在胆固醇代谢调节因子pCSK9的第一个外显子中发现了一个罕见缺失,跨越14,000个碱基对,这似乎与血液中低密度胆固醇的水平降低相吻合。他们还报道了ACAN基因中的近12个结构变异等位基因,这些基因可能影响冰岛人的身高,具体要取决于基因外显子中重复序列的数量。

利用基于长读长测序的填充策略,研究小组还能够发现结构变异等位基因纯合的个体,这些等位基因与常染色体隐性遗传病有关,如溶酶体贮积症或遗传性克拉伯病。此外,他们还在与牛皮癣、糖尿病、年龄相关性黄斑变性和其他性状或疾病有关的基因座内或周围发现了结构变异等位基因。

这项研究的作者指出,对于影响蛋白质功能的基因组部分,结构变异的数量相对较少,这表明“大规模的结构变异研究对于鉴定其在疾病遗传学中的作用至关重要。”

他们解释说:“长读测序技术及其伴随的数据分析方法仍在开发中,需要加以改进。” 这项研究并未尝试发现所有形式的结构变异。

原文检索

Long-read sequencing of 3,622 Icelanders provides insight into the role of structural variants in human diseases and other traits