Graphical abstract

使用机器学习技术,科学家从数千个分子中选择最有希望的虚拟化学结构,然后获得或合成它们,然后在试管中测试5个有希望成为未来药物竞争者的分子。所有五种化合物都有活性,但其中一种表现出最有希望的活性。

黄热病是非洲和南美洲人口过多的热带地区的一种致命疾病。受感染的人体温会上升到39-41摄氏度,会发冷,严重头痛,恶心和呕吐。由于肝损伤,患者的面部变得暗淡,眼皮肿胀,皮肤变黄(因此得名)。在黄热病疫苗开发之前,感染夺去了数千人的生命例如在1871年,布宜诺斯艾利斯8%的人口死于流行病。在蚊子猖獗的地区,大多数人口难以获得疫苗接种,感染暴发仍在发生。黄热病病毒及其引起寨卡和登革热的相关黄病毒只能通过对症治疗,因为没有特定的药物。

一个国际科学家团队使用人工智能从大量可能适合这一目的的分子中选择。来自俄罗斯科学院生物技术研究中心的科学家开发了这项技术,并购买或合成了五种最有前途的化合物,并研究了它们的活性。

“我们的团队使用了一种结合了几种机器学习方法的预测计算机模型。对于模型训练,我们依靠体外筛选数据和现有数据库中可用的信息来选择识别理想的分子特征,以达到预期的活性。在这些计算模型的帮助下,我们预测了它们的生物活性,然后利用NIAID资源进行体外测试,”生物技术研究中心生物化学实验室主任Vadim Makarov说。

通常情况下,在5000个通过实验测试的分子中,只有一个有机会到达药房柜台。另一些则毒性太大,难以在体内产生、分解,或者与试管相比,在真实体内活动太少。实验前的筛选更加严格。即使你专注于科学上已知的成千上万的分子它们被用于或用于治疗其他东西,在动物和人类身上测试它们都是不一样的,但即使在体外也几乎是无限的。

为了使第一阶段的实验成本更低、速度更快,科学家们使用计算机模拟,并试图将一些初始测试转换为虚拟测试。在下一阶段,他们还将借助高通量筛选,在此期间,“机器人分配器”自动将微量活性物质分配到含有病毒感染细胞的微皿中。然后研究人员评估哪些化合物可以杀死病毒。

这篇论文的作者创建了可以自我学习的计算机模型,根据特定的结构规则比较化合物。机器学习需要尽可能多的分子基本信息,无论分子是否活跃。为此,科学家们从关于小药物分子的公共数据库中获取信息,并研究了关于细胞上黄热病病毒研究的科学出版物。这些模型帮助提出了五种最有希望在人类细胞中对抗病毒的分子。科学家们随后测试了这些分子,并找到了它们应该发挥作用的最佳浓度。对于最有效的物质,其半最大有效浓度为3.2 uM(等于每升1mol活性物质)。

“我们选择的分子与吡唑磺酰胺的衍生物有关。它与黄热病病毒的活性如此之强以至于我们可以讨论一种潜在的药物。这种分子的结构为进一步修饰提供了充足的机会,这将极大地扩大可能负担得起的黄热病药物的清单。如果测试成功,我们将获得一组全新的药物来对抗这种危险的疾病。

DOI

10.1021/acs.jcim.1c00460