原副标题:我国康坦县合作开发genomes突变SBML,明显提高非肺癌genomes突变检验工作效率
他叫杨星毛,专科和副教授依次大学毕业于北京师范大学和清华。副教授大学毕业后,他走进加利福尼亚大学哈瓦那附属小学、Rady 幼儿生物学科学研究院托马斯·邓恩(Joseph Gleeson)副教授生物医学专门从事副教授后科学研究。
多年来,杨星毛的科学研究路径主要就著眼在借助生物信息学和生物化学方式,科学研究人类文明基因genomes突变(Mosaic variants,MVs)在胚胎生长发育和病症中的促进作用。
2023 年 1 月 2 日,由其出任协力Sivaganga和协力通信译者的学术论文,以《如前所述 DeepMosaic 的非仔细分析genomes单碱基突变检验》(Control-independent mosaic single nucleotide variant detection with DeepMosaic)大篇幅刊登在 Nature Biotechnology 上[1]。
杨星毛和加利福尼亚大学哈瓦那附属小学、Rady 幼儿生物学科学研究院徐歆为学术论文的协力第三译者,杨星毛和托马斯·邓恩副教授为学术论文的协力通信译者。
子代后 MV 主要就是在胚胎生长发育以后发生的突变,只会对一小部分细胞核导致影响。
突变。而在有丝分裂的操作过程中,这些突变又会被传达给NANOG。
常用的 MV 是与肺癌有关的突变,或非肺癌有关的突变科学研究相较较少,相关联的SBML也较为非常有限。
因此,为的是更快地检验非肺癌的 MV,杨星毛所处的团队渐渐合作开发了一些SBML,而此次科学研究中牵涉到的丰硕成果 DeepMosaic,就是一个捷伊检验方式和检验方式。
该辅助工具不但可以为人类文明生长发育和病症科学研究提供更多较好的协助,还有助于有关应用领域的科学人类学家们在Villamblard某种程度上认知人类突变。
据杨星毛介绍,该科学研究始于 2018 年末。当时,他和项目组正在同时开展好几个不同的科学研究项目。
操作过程中,他们发现已有的SBML并不能很好地识别那些在正常 DNA 序列中隐藏的 MV,必须凭借人眼和相应的经验进行判断和确认,这不但大大增加了工作时长,还提高了出错的可能性。
为的是解决这个问题,他们提出合作开发一种如前所述视觉的深度学习方式,能够代替人眼发现 MV。
“最开始我们想从头训练一个视觉处理的模型,但发现这需要借助非常庞大的训练数据。
后来,我们决定采用迁移学习的方式,借用那些已经做得较为好的图像识别模型,并用我们自己的训练数据对其进行重新训练,再从中找到表现最好的模型。
为的是证明通过上述方式找到的突变,的确是真实存在的突变,我们还做了一系列生物学验证实验。”杨星毛解释道。
在此操作过程中诞生的 DeepMosaic,结合了如前所述图像的单碱基 MV 的可视化模块,和如前所述卷积神经网络的、用于不依赖仔细分析样本的 MV 检验的分类模块。
据介绍,该项目组用 18 万个模拟或实验验证过的 MV 对 DeepMosaic 进行了训练,并对来自 16 个基因和 181 个外显子的超过 6 万个模拟 MV 和 530 个独立的实验验证过的 MV 进行了基准测试。
结果表明,与传统的生物数据方式相比,从灵敏度、特异性和阳性预测值来看,DeepMosaic 在非肺癌全基因测序数据上的检验准确率更高。同时,其在全外显子组测序数据上的验证率,也是此前报道最优方式的 2 倍。
借助 DeepMosaic 和其他方式,该项目组在皮质生长发育畸形中发现了大量此前未知的genomes突变,并借助小鼠模型、病理切片染色、单细胞核转录组测序等证实了这些突变的致病性,该科学研究于近日刊登在 Nature Genetics 上[2]。
虽然该项目组合作开发 DeepMosaic 的初衷是提高非肺癌genomes突变的检验工作效率,但仍不免被审稿人问到该辅助工具在检验肺癌genomes突变上的表现。
在此启发下,杨星毛表示:“我们目前已经拿到了很多与肺癌有关的样本和数据,下一步计划继续根据 DeepMosaic 的框架,训练一个特异性的可以检验肺癌genomes突变的深度学习模型。”
另外,由于目前该项目组如前所述 DeepMosaic 检验的数据类型主要就是全基因和全外显子组,所以未来其还将拓展至更多的数据类型。
“因为 DeepMosaic 所有的代码都是开源的,所以它给我们提供更多的不但仅是一个辅助工具,更是一个平台。
并且,我们也提供更多了一些训练代码,和一些已经训练完成或训练了一半的模型,希望该应用领域的所有科学人类学家可以用他们自己手里的数据,去训练自己的 DeepMosaic 模型,这样更有助于促进应用领域内基于图像识别的genomes突变SBML的应用。”杨星毛最后说。
参考资料:
1.Yang, X., Xu, X., Breuss, M.W. et al. Control-independent mosaic single nucleotide variant detection with DeepMosaic. Nature Biotechnology (2023). https://doi.org/10.1038/s41587-022-01559-w
2.Chung, C., Yang X., Bae T., et al. Comprehensive multi-omic profiling of somatic mutations in malformations of cortical development. Nature Genetics (2023). https://doi.org/10.1038/s41588-022-01276-9
https://www.news-medical.net/news/20230102/Deep-learning-tool-identifies-mosaic-mutations-that-cause-disease.aspx