由香港城市大学( CityU)共同领导的一个联合研究小组开发了一种新的计算工具,它可以重建和可视化三维(3D)细胞形状以及细胞的时间变化,将几百小时的手工加速节省至数小时。这一工具彻底改变了生物学家分析图像数据的方式,它可以促进发育和细胞生物学的进一步研究,例如癌细胞的生长。

跨学科研究由计算机工程系的Yan Hong教授、电气工程系Wong Chung Hong教授以及香港浸会大学(HKU)和北京大学的生物学家共同领导。他们的研究结果以“Establishment of a morphological atlas of the Caenorhabditis elegans embryo using deep-learning-based 4D segmentation”为题发表在《Nature Communications》上。

这个团队开发的工具叫做“CShaper”这是一个强大的计算工具,可以在单细胞水平上系统地分割和分析细胞图像,“这是研究细胞分裂、细胞和基因功能所急需的,”Yan教授说。

分析海量细胞分裂数据的瓶颈

生物学家一直在研究动物是如何从一个单一的细胞,一个受精卵,通过无数的细胞分裂,成长为器官和整个身体。特别是,他们想知道基因的功能,比如参与细胞分裂形成不同器官的特定基因,或者是什么导致细胞分裂异常导致肿瘤生长。

找到答案的一种方法是使用基因敲除技术。在所有基因都存在的情况下,研究人员首先获得细胞图像和谱系树。然后他们从DNA序列中“剔除”一个基因,比较两个谱系树,分析细胞的变化,推断基因功能。然后他们在其他基因被敲除的情况下重复实验。

在这项研究中,合作的生物学家团队利用秀丽隐杆线虫(C.elegans)胚胎产生了数兆字节的数据,供Yan教授的团队进行计算分析。线虫是一种与人类具有许多基本生物学特性的蠕虫,为研究人类肿瘤的生长过程提供了有价值的模型。

“估计线虫中有20000个基因,这意味着如果一次敲除一个基因,将需要近20000个实验,必然产生大量数据。因此,有必要使用一个自动化的图像分析系统。这也促使我们开发出一种更高效的方案。”

细胞突破图像的自动分割

细胞图像通常是通过激光扫描获得的。现有的图像分析系统只能很好地检测细胞核,细胞膜图像质量较差,阻碍了细胞形态的重建。同时,对于细胞分裂的时间推移的3D图像(即4D图像)的分割还缺乏可靠的算法。图像分割是计算机视觉中的一个关键过程,它涉及到将视觉输入分割成若干段以简化图像分析。但研究人员不得不花费数百小时手动标记许多细胞图像。

CShaper的突破在于它可以检测细胞膜,在3D中构建细胞形状,更重要的是,它可以在细胞水平上自动分割细胞图像。“使用CShaper,生物学家可以在几个小时内破译这些图像的内容。它可以描述细胞的形状和表面结构,并提供细胞在不同时间点的三维视图,”第一作者之一、Yan教授实验室的博士生Cao Jianfeng说。

为了实现这一目标,该团队开发的基于深度学习的模型DMapNet在CShaper系统中发挥了关键作用。“通过学习捕捉图像像素之间的多个离散距离,DMapNet在提取膜轮廓的同时考虑形状信息,而不仅仅是强度特征。因此,CShaper实现了95.95%的细胞识别准确率,大大优于其他方法,”他解释说。

利用CShaper,研究小组为秀丽隐杆线虫胚胎从4到350个细胞阶段的细胞形态生成了一个延时3D图谱,包括细胞形状、体积、表面积、迁移、细胞核位置和细胞与细胞接触的确认细胞特征。

肿瘤生长研究进展

Cao Jianfeng说:“就我们所知,CShaper是第一个在单细胞水平上系统地分割和分析线虫胚胎图像的计算机系统。通过与生物学家的密切合作,我们自豪地开发了一个有用的计算机工具,用于自动分析大量的细胞图像数据。我们相信它可以促进发育和细胞生物学的进一步研究,特别是在理解癌细胞的起源和生长方面,”Yan教授补充说。

他们还在植物组织细胞上测试了CShaper,而且结果不错。他们相信这个计算机工具可以用于其他生物学研究。

原文检索:Establishment of a morphological atlas of the Caenorhabditis elegans embryo using deep-learning-based 4D segmentation

(生物通:伍松)