尽管使用CRISpR/Cas9技术用于基因组编辑和基因敲除的日益普及,其性能仍然依赖于精心设计的单向导RNAs(sgRNA)。7月10日,同济大学、哈佛大学公共卫生学院和浙江大学等处的研究人员,在国际权威杂志《Bioinformatics》发表题为“CRISpR-DO for genome-wide CRISpR design and optimization”的学术成果。同济大学讲座教授、哈佛大学公共卫生学院教授、Dana-Farber肿瘤研究所的刘小乐(Xiaole Shirley Liu)博士、同济大学生命科学与技术学院博士生导师刘琦(Qi Liu)教授和哈佛大学公共卫生学院、Dana-Farber肿瘤研究所的Han Xu,是本文共同通讯作者。
在这项研究中,该研究小组提出了一种网络应用程序(CRISpR-DO),用于spCas9 CRISpR系统中引导性序列的设计和优化——在人类、小鼠、斑马鱼、果蝇和线虫基因组中。CRISpR-DO使用一种计算序列模型来预测sgRNA效率,并采用一种特异性的记分函数来评估脱靶效应的可能性。它还提供了关于靶序列功能性保护,以及与外显子、推定调控序列和单核苷酸多态性(SNp)重合的信息。该网络应用程序有一个容易使用的基因组浏览器界面,以方便选择最好的靶DNA序列用于实验设计。目前,CRISpR-DO在以下网站是可用的:http://cistrome.org/crispr/。
刘小乐青年时代就读于天津南开中学, 1992 年考入北京大学生物系。1994 年转学到美国史密斯女子学院 (Smith College) 双修生物化学和计算机科学, 三年后以最高拉丁荣誉毕业 (Summa Cum Laude, 授予全校积分最高的 1% 的毕业生)。2002 年于斯坦福大学取得生物医学信息学博士和计算机科学辅修博士学位后, 被直接聘为哈佛大学终身制助理教授。她目前担任哈佛大学公共卫生学院生物统计与计算生物学系的终身正教授、Dana-Farber 肿瘤研究所功能性癌症表观遗传组学中心主任, 和同济大学生物信息学系教授并****讲座教授。
刘小乐教授带领的研究小组最近在国际著名学术期刊上发表了多项研究成果。今年3月,来自同济大学,Dana-Farber癌症研究所等机构的研究人员,通过综合分析揭示出了前列腺癌中由长链非编码RNA(lncRNA)介导的一个海绵调控网络。这一研究发现发布在《自然通讯》(Nature Communications)杂志上。相关阅读:同济大学Nature子刊解析lncRNAs与癌症;同济大学Nature子刊解析癌症长链非编码RNA调控网络。
高通量实验中的噪音和偏好使高维基因组数据分析成为了一项很大的挑战。Dana-Farber癌症研究所的刘小乐 (Xiaole Shirley Liu) 和德克萨斯大学西南医学中心的Yang Xie领导研究团队对此进行了深入研究。他们开发了一种强大的计算方法——MANCIE,并将其发表在今年四月十三日的Nature Communications杂志上。相关阅读:刘小乐教授Nature子刊解决基因组数据分析难题。
今年五月三十日,刘小乐带领的研究小组在Nature Genetics杂志上发布了一种新的计算方法,该方法可以帮助人们用RNA-seq数据从头组装肿瘤浸润T细胞的CDR3序列。相关阅读:刘小乐教授Nature Genetics发布癌症研究新工具。
(生物通:王英)
生物通推荐原文摘要:
CRISpR-DO for genome-wide CRISpR design and optimization
Abstract
Motivation: Despite the growing popularity in using CRISpR/Cas9 technology for genome editing and gene knockout, its performance still relies on well designed single guide RNAs (sgRNA). In this study, we propose a web application for the Design and Optimization (CRISpR-DO) of guide sequences that target both coding and non-coding regions in spCas9 CRISpR system across human, mouse, zebrafish, fly and worm genomes. CRISpR-DO uses a computational sequence model to predict sgRNA efficiency, and employs a specificity scoring function to evaluate the potential of off-target effect. It also provides information on functional conservation of target sequences, as well as the overlaps with exons, putative regulatory sequences and single nucleotide polymorphisms (SNp). The web application has a user-friendly genome-browser interface to facilitate the selection of the best target DNA sequences for experimental design.