三芳基吡啶酮类新型冠状病毒3CL,蛋白酶抑制剂构效关系研究及分子设计

张继川,何严萍,王月平**

(1.昆明理工大学 理学院 应用化学系,云南 昆明 650500;
2.云南大学 教育部自然资源药物化学重点实验室,化学科学与工程学院,云南 昆明 650091)

新冠肺炎(COVID-19)是在2019 年底由新型冠状病毒(SARS-CoV-2)所导致的在全球流行的传染病[1],对人类健康及公共安全造成极大危害.截止2021 年9 月,全球累计感染人数已超过2 亿,死亡人数已达450 万[2].虽然目前已有多种疫苗上市,但是病毒的变异使得疫苗有效性降低,且依然有相当一部分人口未能接种疫苗[3].因此,研发针对新冠病毒的药物依然迫在眉睫.

SARS-CoV-2 病毒属于套式病毒目冠状病毒科的正链RNA 病毒[4].病毒基因组编码的主要蛋白质有复制酶多聚蛋白pp1a 和pp1b,类木瓜蛋白酶(PLpro),3CL 蛋白酶和S、E、M、N 结构蛋白[5].其中,多聚蛋白被类木瓜蛋白酶和3CL 蛋白酶水解,裁剪出16 个病毒所需的功能蛋白(如RNA 依赖的RNA 聚合酶,解旋酶等),只有在这些功能蛋白的参与下,病毒才能进行转录与复制[6].因此,3CL 蛋白酶对多聚蛋白的成熟起主要作用,是病毒复制与繁殖的关键酶[7].同时,尚未发现3CL 蛋白酶的人类同源蛋白,这使得它成为抗SARS-CoV-2病毒药物的重要靶点[8].

3CL 蛋白酶为半胱氨酸蛋白酶,其催化活性中心由半胱氨酸(Cys145)和组氨酸(His41) 二联体构成.其中,Cys145 为亲核进攻基团,His41 则为酸-碱催化残基[9].基于3CL 酶的催化作用机理,现已设计并发现多种肽类和拟肽类3CL 蛋白酶抑制剂[10],此类抑制剂通常含有一个亲电反应基团,如:醛基[11],卤甲基酮基[12],α-酮酰胺[8],Michael 受体[7],氰基[13]等,它们能和Cys145 残基中的S 原子共价结合而使3CL 酶失活.但是,肽类化合物固有的代谢不稳定性和选择性问题[14],影响了其成药性.因此,研发具有新作用机制的小分子3CL 酶抑制剂成为当前抗SARS-CoV-2 病毒药物研究的热点[15-22].

基于SARS-CoV-2 3CL 蛋白酶的晶体结构,采用多种药物开发策略,现已发现多种能与3CL 酶非共价结合的底物竞争型抑制剂[17,19,23-25].其中,Ghahremanpour 等[26]采用老药新用策略,综合利用分子对接及分子动力学模拟,从3CL 蛋白酶晶体结构出发,对2 000 多个上市药物进行虚拟筛选,发现14 个药物能抑制3CL 蛋白酶活性.随后,他们以抗癫痫药物吡仑帕奈(Perampanel)为先导化合物,采用自由能微扰方法(FEP)指导抑制剂的结构优化,设计合成了系列三芳基吡啶酮类化合物,能在纳摩尔浓度范围抑制3CL 蛋白酶活性及SARS-CoV-2 病毒的复制[27],具有深入研究的价值.

本文采用比较分子力场分析(CoMFA)[28],对此类3CL 蛋白酶抑制剂的构效关系进行了深入研究,建立了具有良好预测能力的定量构效关系模型.并以此为指导,设计了一系列新型三芳基吡啶酮类化合物,经模型预测,所设计化合物对3CL 蛋白酶均有很好的抑制活性.本研究为新型SARSCoV-2 病毒抑制剂的设计和优化提供了参考.

1.1 化合物及活性数据本文构效关系分析所用的38 个三芳基吡啶酮类化合物引自文献[27],活性指标用化合物抑制3CL 蛋白酶活性的半数有效浓度IC50(mol/L)的负对数pIC50(-logIC50)表示.抑制剂分子结构如图1 和表1 所示,其中化合物11和34的结构在表1 末尾单独列出,生物活性数据见表2.其中,随机选取了30 个化合物作为训练集建立模型,其余8 个化合物为测试集(表1 中用*号标注的分子)用于检验模型的预测能力.

表1 三芳基吡啶酮类化合物化学结构Tab.1 Structures of triarylpyridinone derivatives

续表 1

表2 实验活性值与CoMFA 预测值得比较Tab.2 The comparison of experimental and predicted activities of triarylpyridinone derivatives by CoMFA model

图1 三芳基吡啶酮类化合物公共结构Fig.1 The common substructure of the triarylpyridinone derivatives

1.2 分子模型的建立抑制剂分子结构采用SYBYL7.2[29]分子模拟软件的Base/Build 模块构建,计算过程中未明确说明的参数均采用默认值.从化合物32和3CL 酶复合物晶体结构(PDB 代码:7L13)中剥离出小分子抑制剂,以其为模板构建其余各分子的初始构象.随后在MMFF94 力场下,采用Powell 能量梯度法进行分子力学优化,能量梯度收敛标准为0.004 kJ/mol,最大迭代次数为5 000,优化后得到的各个分子的低能构象用于后续构效关系研究.

1.3 分子对接在CoMFA 模型构建过程中,抑制剂分子的活性构象及其叠合方式直接影响着模型的预测能力与等势面图的可靠性.本文采用分子对接软件LeDock[30]获得小分子的活性构象.对接所用的大分子结构来自复合物晶体(PDB 代码:7L13),采用LeDock 中的Lepro 模块进行预处理:加氢,删除配体和水分子后作为3CL 酶的三维结构模型,随后用其活性腔与目标分子对接.最后根据抑制剂与酶相互作用能量大小和几何构型匹配程度确定抑制剂的活性构象.

1.4 CoMFA 模型的建立以活性最好的化合物32 为模板,以其公共骨架(图2(a)加粗部分)为叠合位点,采用Align Database 模块对其余37 个化合物的活性构象进行叠合(图2(b)),由图2(b)可见各化合物和3CL 酶的结合模式很相似,各取代基空间伸展方向几乎一致,表明此类化合物以相同的方式作用于3CL 酶.随后,将叠合好的小分子置于一间距为0.2 nm 的三维网格之中,采用带一个正电荷的sp3杂化C 原子为探针,分别计算出各格点上的静电能及立体作用能,作为CoMFA 模型的自变量,然后采用偏最小二乘法(PLS)分析其和化合物生物活性pIC50的关系,用抽一法(LOO)进行交叉验证,确立主成分数(NOC)并建立相应的CoMFA模型[21,26].

图2 化合物32 为模板的分子构象叠合Fig.2 The alignment of the conformations of the molecules taking compound 32 as template molecule

2.1 对接分析本文采用分子对接来确定各抑制剂的活性构象.为验证所用对接方法的可靠性,我们将化合物32 用LeDock 对接到与其结合的3CL酶的结合腔内.随后,以32 在晶体结构中的结合构象为参考,计算其均方根偏差(RMSD)[31]为0.322,如图3 所示,两者结构高度重叠,化合物32 的A、C、D 及E 环分别结合于3CL 酶的S1′、S1、S2 及S4 位点,表明LeDock 能准确预测抑制剂和3CL酶的结合模式.可用LeDock 预测各化合物的活性构象.

图3 预测结构(元素颜色)与晶体结构(青色)的比较Fig.3 Superimposition between the predicted pose (color by element) and the crystal pose (cyan)

2.2 CoMFA 模型分析CoMFA 模型统计分析结果列于表3,其对各化合物生物活性的预测值及残差见表2,活性数据的实验值和预测值的相关图见图4.其中,CoMFA 模型的抽一交叉验证相关系数为0.810,非交叉验证相关系数为0.981,其对测试集化合物的活性预测值偏差较小(表3),预测值与实验值的相关系数r2pred为0.855,表明所建立的CoMFA模型具有较高的置信度和较强的预测能力[32].

图4 训练集和测试集中三芳基吡啶酮类化合物的pIC50 实验值与预测值对比Fig.4 The plots of the predicted versus experimental pIC50 values for the training and test sets of the triarylpyridinone derivatives

表3 最佳CoMFA 模型统计数据Tab.3 Statistical parameters of best CoMFA model

CoMFA 分析结果显示立体场和静电场相互作用对活性的贡献分别为63.6%和36.4%,表明立体场对抑制剂分子与3CL 酶的相互作用的影响更为明显.图5(a)为表征CoMFA 立体场特征的等势面图.其中,绿色区域代表体积大的原子或基团对活性有利,黄色区域则相反.图中参照分子为化合物17(球棍)和32(棍状),20(线状).

从图5(a)可以看出,R2取代基伸向3CL 酶S3/S4 结合位点.此处有三块较大的绿色区域,表明在此引入大取代基有利于提高化合物的活性.如R2为氢、甲氧基、丙氧基和邻氯苄氧基时,相应的化合物15、21、22和32的抗3CL 酶活性随着R2体积的增大而逐步提高.化合物14、16和17的活性依次提高,也遵循同样的规律.但是,绿色区域周围的四块代表立体位阻的黄色区域,表明R2取代基不仅要体积大小合适,而且其在S3/S4 结合腔的位置也要合适,不能和结合腔中氨基酸残基发生立体碰撞,否则对活性不利.例如:苯基乙氧基取代的化合物20,因碳链的延长,其苯环伸向了结合腔的另一侧,偏离了绿色区域而靠近了一小块黄色区域,由于存在立体位阻,化合物20的活性低于化合物19(R2为苄氧基).同样,因为取代基过大而存在立体位阻,化合物23及24的活性均比22低,而37的活性比01高.同时,17、37及01的活性也由于空间位阻逐渐降低.

此外,从立体场等势图还可以看出,化合物32位于S4 结合位点的苯环,在其邻位附近存在两块绿色区域,表明此处有取代基对活性有利,如此处分别被Cl、F 和CH3取代得到的化合物32、29和27的活性均高于未取代的化合物25.而在苯环的间位附近则有一块黄色区域,表明此处不宜有较大的取代基.如邻位苯取代物27和29活性要高于间位苯取代物28和30.

图5(b)为表征CoMFA 静电场特征的等势图.其中,红色区域代表负电性基团对活性有利,而蓝色区域则是正电性基团对活性有利.图中参照分子为化合物17(球棍)和32(棍状)和07(线状).

从图5(b)可以看出,化合物17在S4 位点的末端甲基,靠近两块中等大小的红色区域,表明此处若有负电性基团,对化合物抑制3CL 酶的活性有利.如R2末端基团为三氟甲基的化合物38及36的活性比相应甲基取代的17和22的高,验证了这一结论.同样,化合物07噁唑环上的三氟甲基CF3也在这两块红色区域旁,所以其活性比甲基取代的04高.此外,R2为苄氧基取代的化合物32,其末端苯环的邻位氯原子指向了这两块红色区域,表明此处的负电性取代基对活性有利,如邻位分别被Cl 和F 取代得到的化合物32和29的活性均高于未取代的化合物25.

此外,从图5(b)可以看到,在3CL 酶S3/S4 位点处有一大块蓝色区域,其中,化合物32末端苯环的对位接近了蓝色区域,表明此处若有负电性基团将对活性不利,如对位为F 取代的化合物33的活性低于未取代的32.另外,化合物03和06末端芳杂环上的O 和S,也靠近了蓝色区域,所以负电性更高的化合物03的活性比06低.此外,苯环/芳杂环上方的蓝色区域,表明缺电子的芳环对活性有利,而富电子的五元芳杂环对活性不利,如化合物32的活性高于所有五元芳杂环取代的化合物.

从图5(b)还可以看到,R1取代基所处的S1′位点处,有红色和蓝色区域.当R1取代基为嘧啶酮基时,其2 位的酮羰基氧在红色区域附近,对活性有利,所以R1为嘧啶酮基的化合物22、35、36和26的活性均比相应的R1为2-氰基苯基的化合物17、37、38和20的活性高.另外,红色区域旁边的蓝色区域,代表此处有正电性原子或基团对活性有利,当R1为嘧啶酮基时,其N1 位的正电性氢原子刚好在蓝色区域附近,对活性有利,所以R1为未取代的嘧啶酮基的化合物35、36、34、07和08其活性均比N1 位为甲基取代的嘧啶酮基的化合物09、10、11、12和13的活性高.

图5 CoMFA 立体场和静电场等势面图Fig.5 Steric field distribution and electrostatic field distribution of CoMFA

综上所述,对于三芳基吡啶酮类3CL 蛋白酶抑制剂,应在其R1基团上引入适当的取代基以调节基团的电荷分布,其R2取代基则应充分考虑取代基的大小及电性,从而能和3CL 酶的S3/S4 结合腔紧密结合以提高化合物的抗病毒活性.

2.3 小分子设计基于上述构效关系分析,从图1所示通用结构出发,在R1取代基如嘧啶酮基的C-6 位引入吸电基CN 以提高N1位氢原子的正电性,或在2-氰基苯基上引入甲氧基和氰基以调节芳环的电荷分布,在R2末端芳环的邻位引入适当大小的吸电基团如CN、CF3为提高化合物活性的有利因素.据此设计了如表4 所示的化合物,并通过以训练集所建立的 CoMFA 模型对其进行预测,结果见表4.由表4 中的数据可以看出,基于CoMFA 模型所设计的化合物均具有较优的预测活性,其pIC50在7.76~8.16 间,高于现有化合物的测试活性,支持了本研究在R1基团上引入适当的取代基来调节基团的电荷分布,在R2末端芳基上引入适当的取代基调节侧链的体积和极性,能有效提高化合物抗病毒活性的理论假设.

表4 新设计化合物分子结构及预测值Tab.4 Structures and predicted values of newly designed compounds

本文采用分子对接的方法获得了38 个三芳基吡啶酮类化合物与3CL 蛋白酶之间相互作用的活性构象,以此为基础进行比较分子力场分析(CoMFA).所建立的CoMFA 模型交叉验证系数q2为0.810,非交叉验证相关系数r2为0.981,对由8 个化合物构成的测试集进行了预测,其预测相关系数r2pred为0.855,内部交叉验证与外部测试集验证结果都表明该模型具有良好的拟合能力和较高的预测能力.同时,基于CoMFA 模型的立体场和静电场等势图,设计了9 个具有较高预测活性的三芳基吡啶酮类3CL 蛋白酶抑制剂,为此类化合物的进一步结构改造与优化提供理论指导.

猜你喜欢 蛋白酶抑制剂化合物 蛋白酶对禾花鱼消化酶活性的影响江西水产科技(2022年2期)2022-05-17PD-1抑制剂联合仑伐替尼治疗晚期肝癌的疗效分析中国典型病例大全(2022年11期)2022-05-13血管紧张素转换酶抑制剂在肾内科的应用分析健康体检与管理(2022年4期)2022-05-13不同蛋白酶酶解制备鸡肉小肽的工艺条件研究中国饲料(2022年5期)2022-04-26质子泵抑制剂对反流性咽喉炎的疗效研究医学概论(2022年4期)2022-04-244个进口PD-1/PD-L1抑制剂不良反应信号的挖掘与评价中国药房(2022年7期)2022-04-14关于麦芽中蛋白酶的分解研究食品安全导刊·中旬刊(2020年2期)2020-06-01思乡与蛋白酶文苑(2018年22期)2018-11-19例析高考中的铁及其化合物中学化学(2017年6期)2017-10-16例谈氯及其化合物的学习与考查中学化学(2017年6期)2017-10-16

推荐访问:吡啶 蛋白 分子