JCIM|机器学习模型识别SARS-CoV-2抑制剂

2023-06-05 0 651

JCIM|机器学习模型识别SARS-CoV-2抑制剂

主要内容近几年来,新型甲型流感病毒SARS-CoV-2在亚洲地区迅速扩散,在不到100天内诊断疑似病例超过150据估计。高肥胖率给亚洲地区农村基层造成了相当大的压力,截至编写本文时,已导致2.04多亿元人感染,430余万人死亡。SARS-CoV-2大流行,促使人们开始在亚洲地区范围内找寻治疗方式,抗生素再借助是加速这一过程的主要策略之一,因为有希望的抗生素可能透过采用已核准的安全抗生素,直接进入II期及以后的临床科学研究。编写该文时(2020年初),大多数SARS-CoV-2导管减缓科学研究倚赖质谱甄选(HTS)科学研究来试验某一FDA核准的抗生素,这些抗生素和氧化物此前对相同的-流感病毒或某一的抗真菌机理表明出减缓作用。此后,已在Huh7细胞核中大规模甄选了1425种氧化物,确定了11种特异性IC50<1 M的大分子。许多氧化物已经展开了导管试验,因而获得了一个不断增长的导管抗真菌特异性大分子统计资料库。机器学习数学模型,可以根据先前公布的数据预估最佳氧化物,从而促进抗生素发现。来自美国Collaborations Pharmaceuticals Inc的Sean Ekins等人采用了几种机器学习方式,从最近的SARS-CoV-2导管减缓数据中开发预估数学模型,并采用它们从人类学家的内部氧化物复本优先选择FDA核准的氧化物展开导管试验。从可计算性机器学习数学模型预估的氧化物中,磺酰脲lummefantrine被选上展开试验,并在如前所述细胞核的检验中表明有限的抗真菌特异性,同时透过微孔径热色谱法表明与刺突蛋白质紧密结合(Kd =259nM)。这种机器学习和导管检验相紧密结合的方式,可以扩展到用交互式甄选来找寻对SARS-CoV-2参考WIV04流感病毒有特异性的氧化物。相关的科学科研成果以“Machine Learning Models Identify Inhibitors of SARS-CoV-2”为题发布在国际著名学术期刊Journal of Chemical Information and Modeling上。与SARS-CoV-2刺突蛋白质交会人类学家借助Discovery Studio (Biovia, San Diego CA),如前所述COVID-2 Spike蛋白质紧密结合域(RBD)和血管紧张素转换酶2(ACE2)间的分子结构介面,优先选择了一个区域展开交会。采用CDOCKER在该介面的蛋白质腔聚合的交会残基(直径为9.7)内,透过连续性交会在该介面聚合lumefantrine的多个构型。交会Tourbe为缺省(保留前10的构型)。在阴离子最轻化后,计算了氧化物与蛋白质间的阴离子相互作用能。最轻演算法为“Smart Minimizer”,最大常量为1000步,最轻均截距势能为0.001,电弧椭圆形截止距离为12。统计数据处理导管SARS-CoV-2统计数据,从5项抗生素再借助科学研究中经过初步重新整理,得到了包含63个大分子的统计数据集,平均值特异性为15.9422.45 M。从相同科学研究中重新整理的内部试验集是30个大分子,平均值特异性为3442 M。采用AC聚合的可计算性数学模型对特异性展开分类的共振频率为6.65 M,最终训练集的特异性氧化物比例为52%,内部试验集为37%。统计数据集的特异性分布如图1所示。

JCIM|机器学习模型识别SARS-CoV-2抑制剂

图1. SA学习演算法的相同预估统计量(表1)。在相同共振频率6.65 M下,AC优于所有其他方式,Rf紧随其后。这些机器学习数学模型可用于内部验证。

JCIM|机器学习模型识别SARS-CoV-2抑制剂

表1.采用ECFP6指纹实现的所有SARS-CoV-2机器学习数学模型的五倍,在召回率和特异性间达到了最佳平衡。

JCIM|机器学习模型识别SARS-CoV-2抑制剂

V-2化学空间分布良好,特异性大分子和非特异性大分子混合良好(图2)。与主要由FDA核准的抗生素组成的Prestwick化学库(PwCL)相比,SARS-CoV-2统计数据属于具有大分子描述符的大聚类,在采用指纹描述符时分布更为广泛(图2C,D)。

JCIM|机器学习模型识别SARS-CoV-2抑制剂

图2.具有大分子描述符(A)和ECFP6的SARS-CoV-2集合的PCA (B)。红色球体有特异性,灰色球体无特异性。SARS-CoV-2集合和PwCL的PCA与大分子描述符ro 76、Calu-3和Caco-2细胞核中展开了试验。与细胞核毒性相比,每个细胞核系的IC50或EC90统计数据并不表明有用的导管特异性(表3)。然而,Vero 76中性红分析统计数据表明,EC50远低于CC50。Budesonide、tiamulin fumarate和tetrabenazine也在Caco-2细胞核中展开了试验,并表明了与细胞核毒性相当的减缓作用。Tiamulin的EC90低于CC50。MST 测量lummefantrine对 SARS-Cov2 Spike RBD 蛋白质的紧密结合亲和力,结果如图3所示。

JCIM|机器学习模型识别SARS-CoV-2抑制剂

表3. Lumefantrine Vero 76、Calu-3和Caco-2的IC50、E

JCIM|机器学习模型识别SARS-CoV-2抑制剂

图3. Spike RBD与lummefantrine相互作用的MST紧密结合分析。图片来自Journal of Chemical Information and Modeling结论总结本文证明了作者提出的机器学习数学模型,在内部交叉验证和内部验证中表现良好。机器学习使人们能够找到自己或他人验证的SARS-CoV-2的特异性大分子。这些机器学习数学模型还可以用来优先考虑未来的氧化物,这些氧化物的预估得分和可靠性都很高。这将有望反馈更可靠的预估,同时紧密结合抗生素发现专业知识便可以帮助确定导管试验的氧化物的优先级。参考文献Victor O. Gawriljuk, Phyo Phyo Kyaw Zin, Ana C. Puhl, Kimberley M. Zorn, Daniel H. Foil, Thomas R. Lane, Brett Hurst, Tatyana Almeida Tavella, Fabio Trindade Maranho Costa, Premkumar Lakshmanane, Jean Bernatchez, Andre S. Godoy, Glaucius Oliva, Jair L. Siqueira-Neto, Peter B. Madrid, and Sean Ekins, Machine Learning Models Identify Inhibitors of SARS-CoV-2, Journal of Chemical Information and Modeling Article ASAP. DOI:10.1021/acs.jcim.1c00683相关文章Nat. Mach. Intell.不考虑共进化信息的如前所述深度学习改进的蛋白质质结构预估数学模型JCTC 传统大分子动力学模拟和新型机器学习相紧密结合揭示耐药性复杂机制Nature Computational Science 如前所述计算的抗生素再借助策略如何应对未来疫情大流行?JCIM 量子机器学习在抗生素发现中的应用Nat. Mach. Intell.如前所述开箱即用的深度学习的抗生素特性预估

JCIM|机器学习模型识别SARS-CoV-2抑制剂

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务