费城-为了回答可应用于广泛患者群体的医学问题,机器学习模型依赖于来自各种机构的庞大而多样的数据集。但是,由于法律,隐私和文化方面的挑战,卫生系统和医院通常难以共享患者数据。
周二发表在《科学报告》杂志上的一项研究表明,一种称为联合学习的新兴技术可以解决这一难题。该研究由资深作者Spyridon Bakas博士领导,该博士是perelman医学院放射学,病理学和实验室医学的讲师。宾夕法尼亚大学。
联合学习-一种由Google首次实现的用于键盘的自动更正功能的方法-跨多个分散的设备或服务器在本地数据样本之间进行算法训练,而无需交换它们。尽管该方法有可能被用来回答许多不同的医学问题,但宾州大学的研究人员表明,联邦学习通过能够分析脑肿瘤患者的磁共振成像(MRI)扫描并进行区分,特别是在脑成像方面取得了成功来自癌变区域的健康大脑组织。
例如,可以在penn Medicine训练的模型可以分发给世界各地的医院。然后,医生可以通过输入自己的患者脑部扫描图,在此共享模型的基础上进行训练。然后,他们的新模型将被转移到中央服务器。该模型最终将被调和为共识模型,该模型已从各家医院获得了知识,因此在临床上很有用。
Bakas说:“计算模型看到的数据越多,就越能很好地了解问题,并且可以更好地解决其旨在回答的问题。”“传统上,机器学习使用的是来自单个机构的数据,然后很明显,这些模型在其他机构的数据上表现不佳或没有很好地推广。”
联邦学习模型必须先获得美国食品和药物管理局的验证和批准,然后才能作为医师的临床工具进行许可和商业化。但是,如果该模型被商业化,它将帮助放射科医生,放射肿瘤学家和神经外科医生做出有关患者护理的重要决定,Bakas说。据美国脑肿瘤协会称,今年将有近80,000人被诊断出患有脑肿瘤。
他说:“研究表明,关于肿瘤边界,不仅不同的医生会有不同的见解,而且同一位医师评估同一扫描可以在一周的某天与另一天看到不同的肿瘤边界。”“人工智能使医生能够获得有关肿瘤在何处结束的更精确信息,而肿瘤在何处直接影响患者的治疗和预后。”
为了测试联合学习的有效性并将其与其他机器学习方法进行比较,Bakas与得克萨斯大学医学博士安德森癌症中心,华盛顿大学和匹兹堡大学希尔曼癌症中心的研究人员合作,而英特尔公司则提供了隐私保护,保护软件到项目中。
这项研究始于一个模型,该模型在来自开放源代码存储库(称为“国际脑肿瘤分割”或“ BraTS”挑战)的多机构数据上进行了预训练。BraTS当前提供了一个数据集,其中包括来自660位患者的2600多次用磁共振成像(MRI)捕获的脑部扫描。接下来,有10家医院通过使用自己的患者数据训练AI模型来参与研究。然后,将联合学习技术用于汇总数据并创建共识模型。
研究人员将联盟学习与由单个机构训练的模型以及其他协作学习方法进行了比较。通过对神经科医生手动注释的扫描进行测试,来评估每种方法的有效性。与使用不保护患者隐私的集中式数据训练的模型相比,联合学习几乎能够(99%)执行相同的操作。研究结果还表明,通过数据私有,多机构协作来增加对数据的访问可以使模型性能受益。