illustration

图像:不同颜色的酵母蛋白以二元、三元、四元和五元的形式组合在一起,就像3D拼图一样执行细胞功能。西南德克萨斯大学和华盛顿大学的研究人员领导的一个国际团队使用人工智能技术预测了这些结构。

来源:德克萨斯大学西南医学中心

德克萨斯大学西南分校和华盛顿大学的研究人员领导了一个国际团队,使用人工智能(AI)和进化分析来制作真核蛋白质相互作用的3D模型。这项发表在《科学》(Science)杂志上的研究首次确定了100多个可能的蛋白质复合物,并为700多个此前未鉴定的复合物提供了结构模型。对一对对或一组蛋白质组合在一起进行细胞过程的深入了解,可能会带来大量新的药物靶点。

“我们的结果代表了结构生物学新时代的重大进展,计算在其中起着基础性作用,”得克萨斯大学西南医学中心生物医学信息学专家Qian Cong说。

在她被德克萨斯西南大学录取之前,Qian Cong博士与David Baker博士共同领导了这项研究。David Baker博士是生物化学教授,也是Qian Cong博士在华盛顿大学的博士后导师。这项研究有四位共同牵头作者,包括德克萨斯大学西南计算生物学家裴继民博士。

Qian Cong博士解释说,蛋白质通常成对或成对地运作,被称为复合物,以完成维持生物体存活所需的每一项任务。虽然这些相互作用中的一些已经得到了很好的研究,但许多仍然是一个谜。构建全面的相互作用-或描述细胞中完整的分子相互作用-将阐明生物学的许多基本方面,并为研究人员开发鼓励或阻止这些相互作用的药物提供一个新的起点。Qian Cong博士工作于结合生物信息学和生物学的交互组学这一新兴领域。

直到最近,构建相互作用体的一个主要障碍是许多蛋白质结构的不确定性,半个世纪以来,科学家一直在试图解决这个问题。2020年和2021年,DeepMind公司和贝克博士的实验室分别发布了两项人工智能技术,即AlphaFold (AF)和RoseTTAFold (RF)。这两项技术使用不同的策略,根据产生蛋白质的基因序列预测蛋白质结构。

在目前的研究中,Cong博士、Baker博士和他们的同事们通过对许多酵母蛋白复合物建模,扩展了这些人工智能结构预测工具。酵母是基础生物学研究中常见的模式生物。为了找到可能相互作用的蛋白质,科学家们首先在相关真菌的基因组中寻找以一种相互关联的方式获得突变的基因。然后,他们使用这两种人工智能技术来确定这些蛋白质是否可以以3D结构组合在一起。

他们的工作确定了1505个可能的蛋白质复合物。其中699个已经进行了结构表征,验证了他们方法的实用性。然而,只有有限的实验数据支持700种预测的相互作用,另外106种从未被描述过。

为了更好地了解这些特征不明显或未知的复合物,华盛顿大学和德克萨斯大学西南分校的团队与世界各地已经在研究这些或类似蛋白质的同事合作。通过将当前研究中的科学家们所生成的3D模型与来自合作者的信息相结合,研究小组能够对涉及遗传信息的维护和处理、细胞构建和运输系统、新陈代谢、DNA修复等领域的蛋白质复合物获得新的见解。他们还根据新发现的与其他特征明确的蛋白质的相互作用,确定了以前功能未知的蛋白质的作用。

“我们在新论文中描述的工作为人类相互作用的类似研究奠定了基础,最终可能有助于开发人类疾病的新疗法,”Cong博士补充说。

Qian Cong博士指出,在这项研究中生成的预测蛋白复杂结构可以从ModelArchive下载。她说,在未来的研究中,这些结构和其他使用这种技术生成的结构将是未来几年研究问题的丰富来源。

Cong博士是西南医学基金会生物医学研究学者。其他参与这项研究的UTSW研究人员包括Jing Zhang和Josep Rizo博士(Virginia Lazenby O’hara生物化学教授)。

合作机构包括:哈佛大学、韦恩州立大学、康奈尔大学分子生物学MRC实验室、纪念斯隆·凯特琳癌症中心、格斯特纳斯隆·凯特琳生物医学科学研究生院、弗雷德·哈钦森癌症研究中心、哥伦比亚大学、Würzburg德国大学、圣犹大儿童研究医院、意大利米兰的FIRC分子肿瘤学研究所和意大利罗马的分子遗传学研究所的国家研究委员会。