利用计算机芯片领域的光刻法操控DNA合成酶,将极大促进DNA的多路写入和储存。

人类和机器产生的数据量正以指数级的速度增长,数字世界的规模每两年翻一番。很有可能,我们所使用的磁性和光学数据存储系统在某个时候将无法再归档这个快速增长的数字1和0。另外,它们不能安全地存储超过一个世纪而不降级。

解决这个悬而未决的全球数据存储问题的一个解决方案是将DNA——生命本身的信息存储系统——发展成数字数据存储介质。研究人员已经在将由数字代码组成的复杂信息编码成由A、T、G和C碱基组成的DNA四字母代码。

DNA是一种理想的存储介质,因为它在数百年或数千年内稳定,具有非凡的信息密度,并且其信息可以通过不断降低成本的先进测序技术再次有效地读取(解码)。

现在落后的是将信息写入(编码)到DNA中的能力。人工合成DNA序列的程序化合成仍然主要采用几十年前的化学程序,即所谓的“磷酰胺法(phosphoramidite method)”,它需要许多步骤,虽然可以进行多重化,但只能最多生成200个核苷酸的DNA序列,并且偶尔会出错。它还会产生与“清洁数据存储技术”不兼容的环境有毒副产品。

哈佛大学Wyss生物启发工程研究所和哈佛医学院(HMS)的George Church团队开发了第一种DNA存储方法,该方法使用末端脱氧核苷酸转移酶(TdT)的DNA合成生物酶,原则上,可以合成更长的DNA序列,错误更少。目前,研究人员已将计算机芯片工业中的光刻技术应用于酶促DNA合成,从而开发出一种新的方法来复合TdT优异的DNA书写能力。在他们发表在《Nature Communications》上的研究中,他们展示了在1.2平方毫米阵列表面平行合成12条不同序列的DNA链。

“这项研究和其他酶法DNA合成进展将推动DNA书写的发展,比化学方法更进一步、更快,”Church说。

他们在新研究中表明,TdT可以由紫外光组成的高能光子来控制。高水平的控制是必要的,因为TdT酶只需要在DNA合成过程的每个周期中,以高精度地向生长中的DNA链中添加由四个A、T、G、C碱基中的一个碱基组成的一个或一个短片段。

研究人员将1985年任天堂娱乐系统(NES)的电子游戏《超级马里奥兄弟》(Super Mario BrothersTM)的“超世界主题”乐谱的前两个小节编码在12条合成DNA链中。他们利用光刻技术将短DNA“引物”序列延伸成3x4模式,在表面仅为1.2平方毫米的阵列矩阵上生成这些链。

像摄影一样,光刻技术利用光将图像转移到基底上,以引起化学变化。计算机芯片工业将这一过程小型化,并用硅代替薄膜作为衬底。Church的团队现在在他们的新DNA书写方法中用含有短DNA引物序列的微流控细胞组成的阵列矩阵来代替硅。为了控制3x4型引物的DNA合成,研究小组将一束紫外线照射到一个动态掩模上(就像在计算机芯片制造中所做的那样)——基本上是激活DNA合成的3x4图案的模板——然后用光学透镜将掩模另一侧的图案光束缩小到阵列矩阵的大小。

“从掩模图案反射出来的紫外光精确地击中引物延伸的靶区,释放出TdT酶需要的钴离子才能发挥作用,”共同一作Daniel Wiegand解释说。“当紫外线灯关闭,TdT酶因过量的笼状分子而再次失活时,此时它已经在生长的引物序列中添加了一个单核苷酸碱基或四个核苷酸碱基中的一个的均聚物块。”

这个循环可以重复多次,在每一轮中,只有四个核苷酸碱基中的一个或一个特定核苷酸碱基的均聚物被添加到阵列矩阵中。此外,通过在每个周期中选择性地覆盖掩模的特定开口,TdT酶只将特定的核苷酸碱基添加到DNA引物中,在那里它被紫外光激活,使得研究人员能够完整地编程每个链中的核苷酸序列。

“在这个新仪器平台上的光子定向复合酶DNA合成技术可以进一步拓展,以实现更高的自动化复用与改进的TdT酶,并最终使基于DNA的数据存储更有效、更快和更便宜,”Wyss合成生物学重点领域的首席高级研究科学家、文章共同通讯作者Richie Kohman博士说。

“Church团队的这种新的酶导向合成DNA的方法是一个巧妙的生物启发工程,它将DNA复制的力量与人类开发的最可控和最强大的制造方法之一——光刻技术结合起来,提供一个解决方案,使我们更接近目标‘建立DNA作为一种可用的数据存储媒介’”Wyss研究所的创始主任Don Ingber说。

Church即将来访中国,在2020年10月25日于武汉举行的第十五届国际基因组学大会(ICG-15)上发表主题演讲。

原文检索:photon-directed multiplexed enzymatic DNA synthesis for molecular digital data storage

(生物通:伍松)