癌症中有数百万种突变和其他基因变异。然而,与无害的“乘客”相比,了解这些突变中哪些是有影响的肿瘤“驱动因子”,以及每个驱动因子对癌细胞的作用,一直是一项具有挑战性的任务。许多研究依赖于定制的、耗时的、基因特异性的方法,这种方法提供了对给定突变更广泛的功能影响的一维观点。或者,计算预测可以提供功能性的见解,但这些发现必须通过实验来证实。
现在,在《自然生物技术》上发表的一篇报告中,麻省理工学院和哈佛大学布罗德研究所的一个研究团队公布了一种大规模、高分辨率的方法,可以同时功能性地评估大量蛋白质编码突变,它能提供丰富的表型信息,可以用来研究癌症或其他疾病中的任何基因突变。他们通过对癌细胞进行概念验证实验获得的结果还表明,单个突变不仅会对受影响的基因产生一系列影响,还会对整个分子路径和细胞状态产生影响,此外,将癌症突变分为所谓的“司机”和“乘客”这一长期被接受的做法也有细微差别。
“当你查看患者肿瘤的基因数据时,你会发现,大多数与癌症相关的突变实际上非常罕见,这意味着我们对这些突变的作用知之甚少。”布罗德癌症项目的Jesse Boehm说,他与特拉维夫雷格夫(Aviv Regev)是这项研究的共同高级作者,后者是布罗德中心的核心成员,现在在基因泰克(Genentech),罗氏集团的成员。“癌症精准医疗要成为现实,我们需要对每个突变的功能有明确的理解,但一个主要的挑战是确定一种实验方法,可以在实验室中实施所需的规模。这种新方法可能是我们需要的工具。”
这种新方法被称为基于单细胞表达的变异影响表型(sc-eVIp),建立在perturb-seq的基础上。perturb-seq是Regev和同事在2016年开发的一种方法,用于操纵基因,并利用高通量单细胞RNA测序来探索这些操纵的后果eVIp是2016年由Boehm和同事开发的一种方法,用于利用RNA测量在低尺度上分析癌症变异。虽然perturb-seq化验最初依靠CRISpR引入突变细胞,sc-eVIp团队采取了overexpression-based方法,工程DNA-barcoded基因结构感兴趣的每个突变细胞和将它们引入到池的方式表达的细胞突变基因在高于正常值。
通过使用单细胞RNA测序记录每个受干扰细胞的表达谱,该团队既可以确定给定细胞携带的突变(基于构建物的独特条形码),也可以检查突变对细胞整体表达状态的更广泛影响。这种方法提供了一个非常详细的观点,突变对各种分子路径和回路的影响,而且不需要适应每一个新的基因研究。
“在某种意义上,我们把细胞用作生物传感器,”雷格夫实验室的博士后研究员Oana Ursu说,他以前在布罗德大学的卡拉曼细胞天文台工作,现在在基因泰克大学工作。他和布罗德大学癌症项目的高级小组组长JT Neal是这项研究的第一作者。“通过观察过度表达突变基因时所发生的表达变化,我们可以了解它是否有意义的影响。但是,我们也可以根据它们触发的变化来比较和分类变异,并寻找它们影响的生物学模式。”
“到目前为止,大多数用于解释编码变体的技术都是可扩展的,但它们的读数相对简单,比如细胞生存能力,或者可能只观察单个特征。他们的信息内容一直很低,需要大量的工作来优化他们,”Neal说。“有了sc-eVIp,我们设计了一种全面的方法,具有高吞吐量和丰富的信息,这对大规模的变功能研究来说是一个真正的福音。”
为了测试sc-eVIp的潜力,该团队选择研究癌症中最常见的突变基因Tp53和KRAS, KRAS编码一种导致许多癌症异常生长的关键致癌基因。Neal、Ursu和他们的合作者生成了包含200个已知Tp53和KRAS突变(包括已知的不影响基因功能的癌症相关突变和控制突变)的结构体,并将它们引入30万个肺癌细胞,并捕获每个细胞的个体表达谱。根据这些资料,研究小组将每个突变分为“野生型”(即,在有效功能上与未突变的基因无法区分)或“假定有影响”,然后根据它们是减弱还是增强基因的功能进一步定义突变。
该图谱还揭示了每种突变对细胞状态的更广泛影响,这是基于单个细胞中各种途径的活动如何变化的。例如,sc-eVIp数据揭示了KRAS突变在种群水平上如何影响细胞状态,从没有影响到影响细胞丰度的微妙变化,到在大多数细胞中导致关键通路的直接激活或抑制,它们沿着一个连续体分布。这些发现表明,同一基因的不同突变可以影响细胞的一系列影响。
Boehm指出:“长期以来,癌症学界一直接受‘驱动突变’和‘乘客突变’的二元概念框架,驱动突变促进癌症的发展和发展,而乘客突变完全是惰性的,只是碰巧在过程中出现。”“这些初步的发现表明,从生物学角度来看,这些类别可能过于简单,实际上存在从惰性到完全致瘤的连续功能影响。”
虽然该团队在这项研究中关注的是与癌症相关的基因和突变,但他们指出,sc-eVIp是基因不确定的,具有高度可扩展性,使用单细胞RNA测序作为读出器,提供了一种高效和可推广的方法来产生丰富的表型数据。他们还计算出,只要有20到几百个细胞,就应该有可能彻底描述大多数突变。基于这些数据,sc-eVIp有可能在大约200个已知的癌症基因和7100万个细胞中生成一个超过200万个变异的功能草图。
Boehm说:“如果我们能绘制出每种癌症相关变异在各种癌症和细胞类型影响的连续统一体上的位置,我们就能更好地理解变异如何影响细胞状态,进而影响癌症的发展、生长和反应。”这些知识将代表着癌症精准治疗的真正进步。”
这项研究的支持来自国家癌症研究所、国家人类基因组研究所、马克癌症研究基金会、霍华德·休斯医学研究所、布罗德next10和功能变体项目以及布罗德研究所的克拉曼细胞观察站,以及其他来源。