基于人工智能和动物实验数据集的药物代谢动力预测模型的制作方法

文档序号:21446218发布日期:2020-07-10 17:37阅读:774来源:国知局
基于人工智能和动物实验数据集的药物代谢动力预测模型的制作方法

本发明涉及一种药物代谢预测模型的建立,具体涉及一种基于人工智能和动物实验数集的药物代谢动力预测模型。



背景技术:

随着信息科技的高速发展,作为当今世界三大尖端技术之一的人工智能(artificialintelligence,ai)自1956年提出以来,已获得广泛的传播和发展,并渗透于各行各业之中。2018年4月,我国教育部更是积极部署行动计划促进ai的多学科交叉融合,并计划至2020年,实现ai总体技术和应用与世界先进水平持平。ai是以人类智能的相关理论为基础,运用大数据和机器学习等方法,模拟和延伸人类智能的理论、方法、技术及应用系统的一门边缘学科;其分支领域还包括数据库、数据挖掘、统计学、知识发现、模式识别、神经网络等,目前已被广泛应用于语言识别、智能终端、移动商务、医疗健康等诸多领域。其中,医疗健康领域目前存在优质资源不足、医疗成本高、医生培养和药品研发周期长等现实问题,因此ai技术在该领域尤其展现出巨大潜力和可观前景,世界范围各大科技巨头如谷歌、ibm等都争相布局ai医疗市场。

药学领域作为最早应用ai技术的医疗健康领域,在健康管理、辅助诊疗、药物挖掘、药品调配甚至临床合理用药等诸多方面,都已经实现了ai技术的广泛应用和发展。ai技术可用于完善对患者的健康风险识别(如健康优化平台)、智能用药监测及不良反应风险评估(如计算机辅助的贝叶斯不良反应诊断系统)、辅助临床治疗药物检测、临床用药咨询、合理化药物设计(如计算机辅助药物设计)、提高新药研发转化效率、提供新的药物靶向手段(如飞利浦“蜂群”机器人),乃至于综合分析患者各类临床信息及药物经济学数据,形成科学合理的个体化处方意见等。

在21世纪的今天,原本应该处于科学前沿的制药行业却并没有产生太多耀眼的火花。据统计,药物研究是全球商业链中效率最为低下的一节,基本上,百分之九十六的药物生产都会宣告失败。通常情况下,药物最终是否能被社会接受三大因素影响:一,药物效力是否显著;二,药物是否存在较大副作用或产生一定的毒性;三,药物生产模式是否与市场经济相吻合。为了尽可能大的降低药物临床开发的淘汰率,必须尽早探索出药物的活性及其内在的组成结构等有价值的信息。因此,在推进药物设计与研发过程中,通过相关预测的方式来探究药物的活性具有重大的意义。

对药物进行活性测定主要是检测药物对机体的生物学效应,早期的活性测定主要依赖于动物实验,动物模型是最能够真实有效反映药物临床药理效用的方式。在大多传统的化合物活性研究中,通过动物活体测验和检测方式对化合物的药物活性进行测定,在海量化合物数据环境下无疑要耗费大量时间及成本。而现代化合物活性研究对未知化合物的活性预测是通过使用数学方法建立定量构效关系模型来实现的。

随着计算机数据挖掘技术的不断发展,机器学习成为了计算机科学领域的一个活跃的研究方法,科学家们应用机器学习方法提高药物活性预测效率。深度学习算法是一种非常适合于大数据分析的机器学习算法,具有“抽象概念”处理能力。使用深度学习算法,有望改进以往药物设计与药物信息中已建立的多种机器学习模型,促进化学信息学的发展。

人工智能是需要有大数据作为原料的,而新药研发领域其实是一个大数据非常丰富的宝库,因此这为人工智能提供了用武之地。比如1959年《药物化学》杂志创刊至今,至少发表了45万种化合物作为药物的研究对象,这是一个巨大的数据库,对于这样的大数据,人工智能可以发挥它的独特作用。不久前,《科学美国人》与世界经济论坛发布了2018年十大新兴技术,人工智能辅助化学分子设计——机器学习算法加速新药研发就是其中之一。

目前,在全球有至少100家企业正在探索新药研发的人工智能方法,在国外,葛兰素史克、默克、强生与赛诺菲公司都已经布局人工智能新药研发。在中国,也涌现了深度智耀、零氪科技与晶泰科技等人工智能新药研发企业,药明康德也战略投资了美国的一家人工智能新药研发公司。

现在,则可以用机器来学习药物和药物靶点的结合特点,从而让机器来进行药物设计,这也能大大提高成功设计的概率。人工智能技术的出现,为中国在新药研发的国际竞争中实现弯道超车提供了一定的可能性。



技术实现要素:

本发明的目的在于针对现有技术的缺陷和不足,提供一种基于人工智能和动物实验数据集的药物代谢动力预测模型,它全面而系统的建立人体用药在动物体内实验的相关活性数据库;用深度学习的方法构建合适的药代动力学模型,用于个体化治疗以及新药设计的辅助预测。

为实现上述目的,本发明采用以下技术步骤为:1、利用计算机浅层模拟算法建立人用药物在动物体内的相关活性数据库;2、利用深度学习的方法基于大数据和人工智能建立药物代谢动力学模型;在构建药物代谢动力学模型建立中,比较紧迫的一个问题是如何尽可能模拟每一个特定的个体。药物具有所谓的狭窄治疗指数,即使药物浓度的微小波动也可能产生治疗对象的不希望的意外的结果;3、通过深度学校建立药物活性预测模型;4、将预测模型优化后用于药物设计活性预测和个体化治疗。

所述的步骤1利用计算机浅层模拟算法建立人用药物在动物体内的相关活性数据库:建立人用药物在动物体内实验的活性数据库,不仅包含静脉注射药物,而是要收集包含口服、静脉注射、皮下注射、灌胃等各种给药方式在内的所有数据。

所述步骤2利用深度学习的方法基于大数据和人工智能建立药物代谢动力学模型:深度学习充分借鉴了人脑神经系统的神经网络分层结构,其实质是通过多层结构对每层数据中信息进行特征提取的非线性组合,从原始数据开始将每层特征逐层转换为更高层的抽象表示,从而发现高维数据复杂的结构特征。深度学习算法目前大多基于的深度神经网络,可以通俗理解为多层神经网络,通过每个神经网络训练出一系列数据特征,当实际输出结果与目标函数有一定差距时,就会进行反馈再训练,直到结果已经收敛。此外,大数据赋予了深度学习极大机遇,目前深度学习的基本方式也是大数据驱动的深度学习方式,是机器的自主学习,即让机器自己的去学习的一种技术,其中比较、优选、积累、提炼、再比较、再优选、再积累、再提炼,采用由上而下的监督训练方法,由下而上的非监督学习就是人工智能的机器学习深度学习的路径。

随着生物和化学知识的爆炸式增长,这种形式就不能满足人们对生物技术药品知识的需求。不同来源的数据越来越多(图像、模型、结构和序列),但大部分信息仍然储存在教科书或印刷期刊中。无法通过互联网访问可获得的药物和药物受体等数据,不同的公共数据库中数据不充分并且信息不集中,上述两种状况反映了生物信息学和化学信息学的“两个孤独(twosolitudes)”。结果导致现有的电子序列和结构数据的财富与过去半个世纪以来积累的大量药物或化学知识并没有很好的联系起来。因此创建数据库—可完全搜索的互联网药物资源,将药物分子的结构和机制数据与实验后的各种活性数据结合在一起。不仅有其明显的教育价值,还可帮助研究人员轻松地浏览和探索药物结构、给药方式等各种不同的实验方法与半衰期,吸收,分布,代谢,排泄,生物利用度等这些活性评价指标之间的关系,便于进一步分析和研究。

目前,已经建立的药学相关数据库以drugbank为例,drugbank数据库是唯一将详细的药品数据(即化学、药理学和制药)与综合药物靶点信息(即序列、结构和作用通路)相结合的“生物信息学和化学信息学”资源。drugbank由加拿大卫生研究院,亚伯达省创新-健康解决方案和代谢组学创新中心(tmic)提供支持,该中心是国家资助的研究以及支持广泛的尖端技术代谢组学研究的核心。drugbank数据库查询包含以下信息:药品类型、药品简介、化学结构、药品成分、临床试验、药物靶点、酶、转运体、载体、药品图片、批准情况、批准的处方药、国外上市商品名、药物相互作用、制造商、包装商等。drugbank能够提供关于药品,药品靶点和药物作用的生物或生理结果的详细、最新、定量分析或分子量的信息。作为化学导向的药品数据库,drugbank能够提供许多内置的工具,用于查看、排序、搜索和提取文本、图像、序列或结构数据。自数据库首次发布信息起,drugbank已被广泛应用于计算机检索药物、药物“复原”、计算机检索药物结构数据、药物对接或筛选、药物代谢预测、药物靶点预测和一般制药教育。

本发明拟建立的药物活性数据库在结构和功能上与drugbank类似,由于研究目的不同,仅仅是数据内容、类型发生了改变。因此,建立数据库的工具和方法都可以是相同的(例如采用php编程+mysql数据库软件等),建库切实可行,只是在数据收集和整理上需要花费一定的时间。

本发明的第二个主要研究内容,是要借助于建立的大数据库,基于深度学习方法建立药物活性预测模型,最终用于计算机辅助药物研发或设计。近几年,随着人工智能、机器学习、深度学习方面研究的深入,国内的许多学者也都已经在此方面的研究中取得了一定的进展。2016年到2017年,以深度学习、药物活性预测为关键词能够搜索到的相关文献已有7篇,而且在这些文献中基本都是基于国外与某一部分致病基因研究相关的数据库中的数据进行研究与分析。数量较少,一方面反映了国内研究者对此方面进行的研究项目关注度有待提高,相信今后随着人工智能及计算机信息处理学的发展,与此相关的研究会越来越多;另一方面也充分说明了本发明基于自身所建立的数据库基础上能够利用深度学习方法对药物活性进行预测研究是切实可行的。

本发明全面而系统的建立人体用药在动物体内实验的相关活性数据库。基于各种已经公开的、可供检索的、值得信任的文献数据库,例如ncbi(美国国立生物信息技术中心)的pubmed(医学、生命科学领域的文献)数据库,和已建立的药物数据库,例如dragbank、dragcentral等,来收集人体药物在动物中的实验数据,包括药理,药效,药动,毒理等相关数据。目前,在国内并无与此相关的数据库可供查询和访问。在上文中提到过的主要由美国的各个部门联合建立的1352种药物化合物的静脉药物动力学参数数据库,也只是仅针对静脉注射一种给药方式,并不全面。

它利用深度学习的方法构建合适的药代动力学模型,用于个体化治疗以及新药设计的辅助预测。采用大数据驱动的深度学习方式,对已建立的数据库中的数据进行比较、优选、积累、提炼、再比较、再优选、再积累、再提炼,采用由上而下的监督训练方法,或者由下而上的非监督学习方法来建立人工智能的深度学习路径,依据数学分析模式对药物活性数据进行实验探究。最终通过优化模型用于个体化治疗及新药研发设计的辅助预测。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的流程结构示意框图。

具体实施方式

参看图1所示,本具体实施方式采用的技术方案是:1、利用计算机浅层模拟算法建立人用药物在动物体内的相关活性数据库;2、利用深度学习的方法基于大数据和人工智能建立药物代谢动力学模型;在构建药物代谢动力学模型建立中,比较紧迫的一个问题是如何尽可能模拟每一个特定的个体。药物具有所谓的狭窄治疗指数,即使药物浓度的微小波动也可能产生治疗对象的不希望的意外的结果;3、通过深度学校建立药物活性预测模型;4、将预测模型优化后用于药物设计活性预测和个体化治疗。

所述的步骤1利用计算机浅层模拟算法建立人用药物在动物体内的相关活性数据库:建立人用药物在动物体内实验的活性数据库,不仅包含静脉注射药物,而是要收集包含口服、静脉注射、皮下注射、灌胃等各种给药方式在内的所有数据。

所述步骤2利用深度学习的方法基于大数据和人工智能建立药物代谢动力学模型:深度学习充分借鉴了人脑神经系统的神经网络分层结构,其实质是通过多层结构对每层数据中信息进行特征提取的非线性组合,从原始数据开始将每层特征逐层转换为更高层的抽象表示,从而发现高维数据复杂的结构特征。深度学习算法目前大多基于的深度神经网络,可以通俗理解为多层神经网络,通过每个神经网络训练出一系列数据特征,当实际输出结果与目标函数有一定差距时,就会进行反馈再训练,直到结果已经收敛。此外,大数据赋予了深度学习极大机遇,目前深度学习的基本方式也是大数据驱动的深度学习方式,是机器的自主学习,即让机器自己的去学习的一种技术,其中比较、优选、积累、提炼、再比较、再优选、再积累、再提炼,采用由上而下的监督训练方法,由下而上的非监督学习就是人工智能的机器学习深度学习的路径。

随着生物和化学知识的爆炸式增长,这种形式就不能满足人们对生物技术药品知识的需求。不同来源的数据越来越多(图像、模型、结构和序列),但大部分信息仍然储存在教科书或印刷期刊中。无法通过互联网访问可获得的药物和药物受体等数据,不同的公共数据库中数据不充分并且信息不集中,上述两种状况反映了生物信息学和化学信息学的“两个孤独(twosolitudes)”。结果导致现有的电子序列和结构数据的财富与过去半个世纪以来积累的大量药物或化学知识并没有很好的联系起来。因此创建数据库—可完全搜索的互联网药物资源,将药物分子的结构和机制数据与实验后的各种活性数据结合在一起。不仅有其明显的教育价值,还可帮助研究人员轻松地浏览和探索药物结构、给药方式等各种不同的实验方法与半衰期,吸收,分布,代谢,排泄,生物利用度等这些活性评价指标之间的关系,便于进一步分析和研究。

目前,已经建立的药学相关数据库以drugbank为例,drugbank数据库是唯一将详细的药品数据(即化学、药理学和制药)与综合药物靶点信息(即序列、结构和作用通路)相结合的“生物信息学和化学信息学”资源。drugbank由加拿大卫生研究院,亚伯达省创新-健康解决方案和代谢组学创新中心(tmic)提供支持,该中心是国家资助的研究以及支持广泛的尖端技术代谢组学研究的核心。drugbank数据库查询包含以下信息:药品类型、药品简介、化学结构、药品成分、临床试验、药物靶点、酶、转运体、载体、药品图片、批准情况、批准的处方药、国外上市商品名、药物相互作用、制造商、包装商等。drugbank能够提供关于药品,药品靶点和药物作用的生物或生理结果的详细、最新、定量分析或分子量的信息。作为化学导向的药品数据库,drugbank能够提供许多内置的工具,用于查看、排序、搜索和提取文本、图像、序列或结构数据。自数据库首次发布信息起,drugbank已被广泛应用于计算机检索药物、药物“复原”、计算机检索药物结构数据、药物对接或筛选、药物代谢预测、药物靶点预测和一般制药教育。

它利用深度学习的方法构建合适的药代动力学模型,用于个体化治疗以及新药设计的辅助预测。采用大数据驱动的深度学习方式,对已建立的数据库中的数据进行比较、优选、积累、提炼、再比较、再优选、再积累、再提炼,采用由上而下的监督训练方法,或者由下而上的非监督学习方法来建立人工智能的深度学习路径,依据数学分析模式对药物活性数据进行实验探究。最终通过优化模型用于个体化治疗及新药研发设计的辅助预测。

以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1