一种高通量挖掘和筛选抗菌肽的方法与应用

文档序号:36932382发布日期:2024-02-02 21:57阅读:18来源:国知局
一种高通量挖掘和筛选抗菌肽的方法与应用

本发明涉及生物,具体涉及一种高通量挖掘和筛选抗菌肽的方法与应用。

背景技术

0、
背景技术:

1、抗生素,是指由微生物(包括细菌、真菌、放线菌属)或动植物所产生的具有抗病原体或其他活性的一类次级代谢产物,能抑制或阻断病原体的生长和繁殖(kazemi r,aliabadi m a,chakoosari m m d.antibiotic resistance of lactic acid bacteria:areview[j].scientific journal of microbiology,2013,11(2):201-206.)。对于预防和治疗感染引起疾病具有不可替代的作用。然而随着在临床和农牧业生产中长期大剂量地使用抗生素,微生物的耐药性不断增强。多重耐药菌已经成为威胁人类健康严重问题。临床上常见的多重耐药菌主要有鲍曼不动杆菌(acinetobacter baumannii),铜绿假单胞菌(pseudomonas aeruginosa),肺炎克雷伯菌(klebsiella pneumoniae),大肠埃希菌(escherichia coli)等。为了更有效地对抗耐药菌和多重耐药菌,寻找不易使病原微生物产生耐药性的新型抗生素已经成为全球抗生素领域的一个热点问题(savage,paulb.multidrug-resistant bacteria:overcoming antibiotic permeability barriers ofgram-negative bacteria[j].annals of medicine,2001,33(3):167-171.brown c,alhassan a n.multiple-antibiotic-resistant bacteria from cockroaches trappedfrom a public hospital and a nearby students’hostel in accra,ghana[j].international journal of biological&chemical sciences,2015,8(4):1859-1864.)

2、抗菌肽(antimicrobial peptides,amps)是一类具有抗菌活性的碱性多肽物质,典型的抗菌肽一般由5~50个氨基酸组成,广泛存在于从简单的原核生物到复杂的真核生物中。抗菌肽一般由生物体的免疫防御系统抵御外界病原体侵袭时分泌,是生物体免疫防御系统的重要组成部分。抗菌肽具有广谱抗菌活性,对细菌有很强的杀伤作用,尤其是其对某些耐药性病原菌的杀灭作用,并且不易诱发病原微生物产生耐药性,这些特征提高了人们对抗菌肽领域的关注(kang h k,kim c,seo c h,et al.the therapeuticapplications of antimicrobial peptides(amps):a patent review[j].journal ofmicrobiology,2017,55(1):1-12.kosikowska p,lesner a.antimicrobial peptides(amps)as drug candidates:a patent review(2003-2015)[j].expert opinion ontherapeutic patents,2016,26(6).)

3、尽管抗菌肽存在广阔的应用前景,但由于对抗菌肽的研究相对较晚,其作用机制、活性及稳定性的提高和毒性的降低等诸多方面的研究还有待深入。国内外大部分的研究仍处于临床前阶段,临床应用的抗菌肽相对较少。如何高效的发现更多的高活性、高稳定性和低毒性的抗菌肽也是目前研究的热点之一。传统抗菌肽多数是从微生物或动植物体内分离得到,分离过程操作繁琐、流程长、成本高,且容易使一些抗菌肽的活性受到影响。随着对抗菌肽活性和相关理化性质的研究不断积累以及生物信息学技术的发展,通过对生物基因组的分析进行抗菌肽挖掘和筛选从理论上变得可行。但到目前为止,尚未见到高效且系统的挖掘筛选方法的相关报道。


技术实现思路

1、本发明所要解决的第一个技术问题是:提供一种能够高效地获得抗菌肽的筛选方法。

2、本发明所要解决的第二个技术问题是:提供至少一种能够有效抗菌的人工合成肽。

3、本发明所要解决的第三个技术问题是:提供至少一种上述抗菌肽的应用。

4、为解决上述第一个技术问题,本发明的技术方案为:一种高通量挖掘和筛选抗菌肽的方法,包括以下步骤:以自然界存在的或人工设计的碱基序列或氨基酸序列为基础,计算氨基酸序列的各理化及结构参数值,同时综合利用多种限定条件进行分级筛选,再对得到的多肽序列进行评估分析,筛选出具有抗菌活性的抗菌肽序列。

5、进一步地,进行分级筛选所利用的多种限定条件包括59个参数的部分或者全部参数,并根据需要设置参数筛选保留值范围。

6、所述的59个参数如下:

7、参数1:净电荷(p1:net charge)、参数2:等电点(p2:pi)、参数3:长度(p3:length)、参数4:mf均一化线性力矩(p4:nlm-mf)、参数5:α螺旋指数(p5:α-helix index)、参数6:hw疏水力(p6:h-hw)、参数7:hw均一化线性力矩(p7:nlm-hw)、参数8:ww均一化线性力矩(p8:nlm-ww)、参数9:uh均一化线性力矩(p9:nlm-uh)、参数10:疏水力矩(p10:hm)、参数11:ew均一化线性力矩(p11:nlm-ew)、参数12:kd均一化线性力矩(p12:nlm-kd)、参数13:ew疏水力矩(p13:hm-ew)、参数14:(p14)oct-if index、参数15:非均一化伯曼指数(bomanindex ii)、参数16:oct指数(p16:octanol index)、参数17:mf疏水力矩(hm-mf)、参数18:uh疏水力矩(hm-uh)、参数19:uh疏水力(h-uh)、参数20:hw疏水力矩(hm-hw)、参数21:kd疏水力矩(hm-kd)、参数22:平均净电荷(n.charge)、参数23:ww疏水力矩(hm-ww)、参数24:无序化指数(disordering index)、参数25:hw线性力矩(p25:lm-hw)、参数26:ww线性力矩(p26:lm-ww)、参数27:非均一化疏水力(p27:hydrophobicity index ii,h2)、参数28:界面疏水力指数(p28:interfacial hydrophobicity(if)index)、参数29:uh线性力矩(p29:lm-uh)、参数30:mf均一化疏水力(p30:nh-mf)、参数31:mf线性力矩(p31:lm-mf)、参数32:均一化疏水力(p32:hydrophobicity index,h)、参数33:总亲水性(p33:grand hydropathy,g2)参数34:伯曼指数(p34:boman index)、参数35:tm指数(p35:translocon tm index(tm))、参数36:kd线性力矩(p36:lm-kd)、参数37:ew线性力矩(p37:lm-ew)、参数38:n.oct指数(p38:normalized octanol index)、参数39:总平均亲水性(p39:gravy(grand average ofhydropathy),g)、参数40:hw均一化疏水力(p40:nh-hw)、参数41:均一化oct-if指数(p41:n.oct-if index)、参数42:均一化界面疏水力指数(p42:n.if)、参数43:uh均一化疏水力(p43:nh-uh)、参数44:mf疏水力(p44:h-mf)、参数45:氨基酸平均聚集倾向(p45:aminoacid aggregation propensity value sequence average(a3vsa))、参数46:穿透深度指数(p46:penetration depth inedx(depth inedx))、参数47:穿透角度指数(p47:penetration angle inedx(angle inedx))、参数48:非均一化脂溶性指数(p48:aliphaticinedx ii)、参数49:脂溶性指数(p49:aliphatic inedx)、参数50:不稳定性指数2(p50:instability inedx ii)、参数51:非均一化不稳定性指数(instability inedx i)、参数52:α螺旋指数2(p52:α-helix index ii)、参数53:α螺旋破坏子指数(p53:αhelix brokerinedx(α-b inedx))、参数54:均一化α螺旋破坏子指数(p54:αhelix broker inedx(nα-binedx))、参数55:聚集指数t(p55:aggregation index of tango(agg-t))、参数56:连续2个同种电荷(p56:cc2 index)、参数57:连续α螺旋破坏子指数(p57:cα-b inedx)、参数58:连续3个同种电荷(p58:cc3 index)、参数59:二硫键指数(disulfide bond index(dsb index))。

8、各参数的取值范围如下:

9、参数1:净电荷(p1:net charge)≥5.0、参数2:等电点(p2:pi)≥10、参数3:长度(p3:length)15~50、参数4:mf均一化线性力矩(p4:nlm-mf)≤1.8、参数5:α螺旋指数(p5:α-helix index)≥20、参数6:hw疏水力(p6:h-hw)≥20、参数7:hw均一化线性力矩(p7:nlm-hw)≤1.6、参数8:ww均一化线性力矩(p8:nlm-ww)≤1.6、参数9:uh均一化线性力矩(p9:nlm-uh)≤1.8、参数10:疏水力矩(p10:hm)≥0.5、参数11:ew均一化线性力矩(p11:nlm-ew)≤1.8、参数12:kd均一化线性力矩(p12:nlm-kd)≤1.5、参数13:ew疏水力矩(p13:hm-ew)≥10、参数14:(p14)oct-if index≥8.0、参数15:非均一化伯曼指数(boman index ii)≤-20、参数16:oct指数(p16:octanol index)≥10、参数17:mf疏水力矩(hm-mf)≥20、参数18:uh疏水力矩(hm-uh)≥4.0、参数19:uh疏水力(h-uh)≥2.0、参数20:hw疏水力矩(hm-hw)≥10、参数21:kd疏水力矩(hm-kd)≥30、参数22:平均净电荷(n.charge)≥0.2、参数23:ww疏水力矩(hm-ww)≥14、参数24:无序化指数(disordering index)≤0、参数25:hw线性力矩(p25:lm-hw)≤0.26、参数26:ww线性力矩(p26:lm-ww)≤0.26、参数27:非均一化疏水力(p27:hydrophobicity index ii,h2)≤-2.0、参数28:界面疏水力指数(p28:interfacialhydrophobicity(if)index)≥2.0、参数29:uh线性力矩(p29:lm-uh)≤0.26、参数30:mf均一化疏水力(p30:nh-mf)≥0.2、参数31:mf线性力矩(p31:lm-mf)≤0.24、参数32:均一化疏水力(p32:hydrophobicity index,h)≤-0.1、参数33:总亲水性(p33:grand hydropathy,g2)≤-5.0、参数34:伯曼指数(p34:boman index)≥0.5、参数35:tm指数(p35:translocontm index(tm))≥6.0、参数36:kd线性力矩(p36:lm-kd)≤0.25、参数37:ew线性力矩(p37:lm-ew)≤0.3、参数38:n.oct指数(p38:normalized octanol index)≥60、参数39:总平均亲水性(p39:gravy(grand average of hydropathy),g)≤0.2、参数40:hw均一化疏水力(p40:nh-hw)≥1.0、参数41:均一化oct-if指数(p41:n.oct-if index)≥40、参数42:均一化界面疏水力指数(p42:n.if)≥10、参数43:uh均一化疏水力(p43:nh-uh)≥0.1、参数44:mf疏水力(p44:h-mf)≥4.0、参数45:氨基酸平均聚集倾向(p45:amino acid aggregationpropensity value sequence average(a3vsa))≤0.1、参数46:穿透深度指数(p46:penetration depth inedx(depth inedx))10~18、参数47:穿透角度指数(p47:penetration angle inedx(angle inedx))75~105、参数48:非均一化脂溶性指数(p48:aliphatic inedx ii)≥18、参数49:脂溶性指数(p49:aliphatic inedx)≤130、参数50:不稳定性指数2(p50:instability inedx ii)≥40、参数51:非均一化不稳定性指数(instability inedx i)≥10、参数52:α螺旋指数2(p52:α-helix index ii)≥0、参数53:α螺旋破坏子指数(p53:αhelix broker inedx(α-b inedx))≤10、参数54:均一化α螺旋破坏子指数(p54:αhelix broker inedx(nα-b inedx))≤30、参数55:聚集指数t(p55:aggregation index of tango(agg-t))≤0.5、参数56:连续2个同种电荷(p56:cc2 index)≤2、参数57:连续α螺旋破坏子指数(p57:cα-b inedx)≤0.2、参数58:连续3个同种电荷(p58:cc3 index)=0、参数59:二硫键指数(disulfide bond index(dsb index))≤0.5。

10、进一步地,所述评估分析包括通过对得到的多肽序列进行评估分析,筛选出可能具有抗菌活性的抗菌肽序列的步骤,采用的算法为md index评分系统。

11、进一步地,确定了45个参数(p1至p45)的极值(最大值和最小值),

12、p1-p45的极值范围如下:p1min为-3~1,p1max为15~25;p2min为2~5,p2max为10~14;p3min为5~10,p3max为40~50;p4min为0~0.5,p4max为8~10;p5min为5~10,p5max为50~60;p6min为1~2,p6max为60~80;p7min为0~1,p7max为8~12;p8min为0~0.5,p8max为8~12;p9min为0~0.5,p9max为8~12;p10min为0~0.5,p10max为1~2;p11min为0~0.5,p11max为8~12;p12min为0~0.5,p12max为8~12;p13min为0~0.5,p13max为25~35;p14min为-20~0,p14max为40~60;p15min为-300~0,p15max为40~80;p16min为-20~0,p16max为60~80;p17min为0~0.5,p17max为40~60;p18min为0~0.5,p18max为8~10;p19min为-5~0,p19max为15~30;p20min为0~0.5,p20max为20~40;p21min为0~0.5,p21max为60~80;p22min为-1~0,p22max为0.5~1;p23min为0~1,p23max为20~40;p24min为-2~0,p24max为0.5~1;p25min为0~0.1,p25max为0.5~1;p26min为0~0.2,p26max为0.5~1;p27min为-30~-20,p27max为10~20;p28min为-20~0,p28max为20~40;p29min为0~0.2,p29max为0.5~1;p30min为-5~-1,p30max为1~3;p31min为0~0.2,p31max 0.5~1;p32min为-3~-1,p32max为0.5~1;p33min为-80~-50,p33max为30~50;p34min为-10~0,p34max为5~10;p35min为0~2,p35max为25~40;p36min为0~0.2,p36max为0.5~1;p37min0~0.2,p37max为0.5~1;p38min为-2~0,p38max为1~2;p39min为-5~0,p39max为2~5;p40min为0~0.5,p40max为2~5;p41min为-50~0,p41max为100~200;p42min为-100~-50,p42max为50~100;p43min为-1~0,p43max为0.5~1;p44min为-100~-40,p44max为50~100;p45min为-1~0,p45max为0.5~1。

13、进一步地,利用公式1和各参数的最大值与最小值对各参数的实际计算值进行min-max归一化,从而得到各参数的归一化值parametern’,parametern’即为pn’。公式1如下:其中,

14、parametern’=(parametern-parametermin)÷(parametermax-parametermin) (公式1)

15、公式中各变量的含义如下:

16、parametern’:参数n’,参数n通过公式1利用其最大值和最小值进行min-max归一化得到的值;

17、parametern:参数n的计算值;

18、parametermin:参数极值范围的最小值;

19、parametermax:参数极值范围的最大值

20、n=1-45。

21、进一步地,建立了md index评分系统公式,如下(公式2):

22、md index=42.7094+14.8456×(p1'×0.4477+p2'×0.3463+p3'×0.3314-p4'×0.3266+p5'×0.3195+p6'×0.3146-p7'×0.314-p8'×0.3077-p9'×0.294+p10'×0.2911-p11'×0.2863-p12'×0.2778+p13'×0.2708+p14'×0.2697-p15'×0.256+p16'×0.2559+p17'×0.2531+p18'×0.2518+p19'×0.2396+p20'×0.2388+p21'×0.2271+p22'×0.2262+p23'×0.2196-p24'×0.2077-p25'×0.2041-p26'×0.2019-p27'×0.1945+p28'×0.1923-p29'×0.1872+p30'×0.1841-p31'×0.1815-p32'×0.1727-p33'×0.1656+p34'×0.1618+p35'×0.1544-p36'×0.1492-p37'×0.1485+p38'×0.1376-p39'×0.1389+p40'×0.1332+p41'×0.1274+p42'×0.1259+p43'×0.1251+p44'×0.1185-p45'×0.0692), (公式2)

23、其中,p1'、p2'、p3'、p4'……p43'、p44'、p45'为各参数通过公式1利用其最大值和最小值进行min-max归一化得到的值。

24、优选地,所述评估分析的判定标准为经md index评分系统评估后评分大于50,则判定为可能具有抗菌性的抗菌肽序列。

25、进一步地,所述评估分析还包括在通过软件进行理论预测分析后,再针对可能具有抗菌活性的抗菌肽序列进行最低抑菌浓度(minimum inhibitory concentration,mic)值进行评估分析,筛选出具有抗菌活性的抗菌肽序列的步骤。

26、优选地,所述mic值是抑制大肠杆菌、金黄色葡萄球菌、铜绿假单胞菌、mrsa、肺炎克雷伯菌、粪肠球菌、耐药大肠杆菌、鲍曼不动杆菌、志贺氏菌、伤寒沙门氏菌和白色念珠菌中至少一种的最低浓度值。

27、进一步地,根据本方法,可筛选得到了抗菌肽,包括但不限制于举例如seq idno.1-81所示的抗菌肽序列。

28、上述seq id no.1-81所对应的被命名的编码为yx1、yx2、yx3、yx4、yx5、yx6、yx7、yx8、yx9、yx10、yx11、yx12、yx13、yx14、yx15、yx16、yx17、yx18、yx19、yx20、yx21、yx22、yx23、yx24、yx25、yx26、yx27、yx28、yx29、yx30、yx31、yx32、yx33、yx34、yx35、yx36、yx37、yx38、yx39、yx40、yx41、yx42、yx43、yx44、yx45、yx46、yx47、yx48、yx49、yx50、yx51、yx52、yx53、yx54、yx55、yx56、yx57、yx58、yx59、yx60、yx61、yx62、yx63、yx64、yx65、yx66、yx67、yx68、yx69、yx70、yx71、yx72、yx73、yx74、yx75、yx76、yx77、yx78、yx79、yx80、yx81其序列见序列表。

29、为解决上述第二个技术问题,本发明的技术方案为:一种抗菌肽,所述抗菌肽为根据上述方法筛选得到的抗菌肽的氨基酸序列通过化学合成或生物合成法制备而得。

30、为解决上述第三个技术问题,本发明的技术方案为:上述抗菌肽在临床抗感染药物、防腐剂或饲料添加剂的制备中的应用。

31、进一步地,所述防腐剂为用于食品或化妆品中的防腐剂。

32、本发明的有益效果在于:本发明建立了一种理性的筛选方法,该方法以自然界存在的或人工设计的碱基序列或氨基酸序列为基础,用本法中使用的算法对氨基酸序列进行扫描,同时综合利用多种限定条件进行分级筛选,再对得到的多肽序列利用md index评分系统进行评价分析,优选出分值最高的肽,通过化学合成获得短肽,测定所得系列短肽的抗菌活性等相关理化性质以评估其是否为抗菌肽;本发明方法基于自然界存在的或人工设计的碱基序列或氨基酸序列,利用生物信息学手段完成虚拟筛选,并通过实验验证,该方法能够高效快速地筛选出抗菌肽,已解决目前通过生物体内分离提取抗菌肽流程复杂、成本高、效率低、成功率低等问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1