New method gives rapid, objective insight into how cells are changed by disease

图片:Eric A. Vitriol博士

资料来源:迈克尔·霍拉汉,奥古斯塔大学

一种新的“图像分析管道”让科学家们快速了解疾病或损伤如何改变身体,甚至是单个细胞。

它被称为TDAExplore,它获取了显微镜提供的详细成像,并将其与拓扑这一热门数学领域相结合,拓扑提供了对事物如何排列的洞察,以及人工智能的分析能力,例如,乔治亚医学院的细胞生物学家和神经科学家Eric Vitriol博士说,他对肌萎缩性脊髓侧索硬化症引起的细胞变化及其发生部位有了新的看法。

他们在《模式》杂志上报告说,这是一种“可访问的、强大的选择”,可以使用个人电脑从显微图像中生成定量的、可测量的、因此客观的信息,这些信息可能也可以应用于其他标准成像技术,如x射线和pET扫描。

Vitriol说:“我们认为这是一个令人兴奋的进展,通过计算机可以给我们提供关于图像集之间如何不同的新信息。”“正在发生的实际生物学变化是什么,包括那些我可能看不到的变化,因为它们太微小,或者因为我对应该看的地方有某种偏见。”

这位神经学家表示,至少在数据分析部门,计算机比我们的大脑更胜一筹,这不仅体现在它们的客观性上,还体现在它们能够评估的数据量上。计算机视觉,使计算机能够从数字图像中提取信息,是一种已经存在了几十年的机器学习,所以他和他的同事、通信作者彼得·布贝尼克博士,一位佛罗里达大学的数学家和拓扑数据分析专家,决定将显微镜的细节与拓扑学和人工智能的分析能力结合起来。Vitriol说,拓扑学和Bubenik是关键。

拓扑学对于图像分析来说是“完美的”,因为图像由排列在空间中的物体的模式组成,他说,而拓扑学数据分析(TDAExplore中的TDA)也帮助计算机识别土地的布局,在这种情况下,actin -一种蛋白质和纤维(或细丝)的基本组成部分,帮助细胞形成形状和运动——已经移动或改变了密度。这是一个高效的系统,它可以学习20到25张图片,而不是用几百张图片来训练计算机如何识别和分类它们。

部分神奇之处在于,计算机现在正在学习他们称之为“补丁”的图像片段。他们写道,将显微镜图像分解成这些碎片可以实现更精确的分类,减少计算机对“正常”图像的训练,并最终提取有意义的数据。

毫无疑问,显微镜技术能使人们近距离观察肉眼不可见的事物,产生美丽、详细的图像和动态的视频,这是许多科学家的主要支柱。他说:“医学院不可能没有精密的显微镜设备。”

但为了首先了解什么是正常的,以及在疾病状态中发生了什么,Vitriol需要对图像进行详细分析,比如细丝的数量;细丝在细胞中的位置——靠近边缘,中心,散布各处——以及某些细胞区域是否有更多的细丝。

这种情况下出现的模式告诉他肌动蛋白在哪里,它是如何组织的——这是其功能的一个主要因素——以及它在哪里,如何以及是否随着疾病或损伤而改变。

例如,当他观察中枢神经系统细胞边缘周围的肌动蛋白聚集时,这些聚集告诉他,细胞正在扩散,四处移动,并发出成为其前沿的投射物。在这种情况下,本质上处于休眠状态的细胞可以展开并伸展它的腿。

科学家直接分析图像并计算他们看到的东西存在的一些问题包括,这很耗时,而且现实中就连科学家也有偏见。

举个例子,特别是在有这么多动作发生的情况下,他们的眼睛可能会落在熟悉的东西上,在Vitriol的例子中,就是细胞前沿的肌动蛋白。当他再次观察细胞周围的黑色框架时,清楚地表明那里聚集着肌动蛋白,这可能意味着这是主要的作用点。

“我怎么知道,当我决定什么是不同的,这是最不同的东西,或者这只是我想看到的?”他说。“我们希望将计算机客观性引入其中,我们希望将更高程度的模式识别引入图像分析。”

AI是已知的能够“分类”的事情,每次都像认识一只狗或一只猫,即使是模糊的照片,首先学习数百万的变量与每个动物,直到它知道一只狗当它看到一个,但它不能报告为什么它是一只狗。这种方法需要如此多的图像用于训练目的,但仍然不能提供许多图像统计数据,并不能真正满足他的目的,这就是为什么他和他的同事创造了一个新的分类器,该分类器仅限于拓扑数据分析。

他说,最重要的是TDAExplore中使用的独特耦合有效和客观地告诉科学家,受干扰的细胞图像与训练或正常的图像、信息有哪些不同,以及有多少不同,这些信息也提供了新的想法和研究方向。

回到显示肌动蛋白沿其周长聚集的细胞图像,而“前沿”随着摄动而明显不同,TDAExplore显示一些最大的变化实际上是在细胞内部。

Vitriol说:“我的很多工作是试图在图像中找到难以看到的模式,因为我需要识别这些模式,这样我才能找到从这些图像中获取数字的方法。”他的研究成果包括弄清肌动蛋白细胞骨架是如何工作的,以及肌动蛋白细胞骨架在肌萎缩侧索硬化症(ALS)这样的情况下出现了什么问题。肌动蛋白细胞骨架是肌动蛋白丝提供的支架,而肌动蛋白骨架反过来又为神经元提供支持。

研究人员写道,有些机器学习模型需要数百张图像来训练和分类图像,但它们并没有描述图像的哪一部分有助于分类。如此庞大的数据需要分析,可能包括2000万个变量,需要一台超级计算机。新系统只需要相对较少的高分辨率图像,并对导致选择分类的“补丁”进行特征描述。在几分钟内,科学家的标准个人计算机就可以完成新的图像分析管道。

他说,TDAExplore中使用的独特方法客观地告诉科学家,受干扰的图像与训练图像的差异在哪里以及有多大,这些信息也提供了新的想法和研究方向。

从图像中获取更多、更好信息的能力,最终意味着由像Vitriol这样的基础科学家生成的信息,往往最终会改变人们对疾病的看法和治疗方法,更准确。这可能包括能够识别变化,比如新系统在细胞内指出的那些以前被忽视的变化。

他说,目前科学家利用染色技术来获得更好的对比度,然后使用软件来提取他们在图像中看到的信息,比如肌动蛋白是如何组织成更大的结构的。

“我们必须想出一种从图像中获取相关数据的新方法,这也是这篇论文的目的所在。”

文章标题TDAExplore: Quantitative analysis of fluorescence microscopy images through topology-based machine learning