药物血脑屏障渗透性预测中数据集的建立方法及数据模型与流程

文档序号:17253959发布日期:2019-03-30 09:14阅读:312来源:国知局
药物血脑屏障渗透性预测中数据集的建立方法及数据模型与流程

本发明涉及计算机领域,尤其涉及药物血脑屏障渗透性预测中数据集的建立方法及数据模型。



背景技术:

血脑屏障是维持中枢神经系统稳态的严格渗透屏障,确定化合物对血脑屏障的渗透性是神经类药物发现的先决条件,只有确定药物的组成化合物对血脑屏障的渗透性之后,才能预测药物对血脑屏障的渗透性。

现有的对药物的血脑屏障渗透性的预测方法都是通过药物的物理特性和化学结构来进行预测,但是这种方法只适合于通过被动扩散通过血脑屏障的小分子化合物,而对于更多更复杂的渗透途径,该方法则无能为力。

由此可见,现有对药物的血脑屏障渗透性的预测方法中数据集范围太窄,使得预测方法的使用局限性较大,无法满足现代医学的需求。



技术实现要素:

本发明的目的在于克服现有技术的缺陷,提供一种药物血脑屏障渗透性预测中数据集的建立方法及数据模型,以解决上述技术问题。

本发明实施例提供一种药物血脑屏障渗透性预测中数据集的建立方法,包括:

获取病人使用血脑屏障渗透性已知的药物后针对已知的每种神经系统疾病显现的症状数;

将所述症状数集合形成所述药物的特征数据集,并将所述药物的特征数据集所述药物的血脑屏障渗透性结合成所述药物的特征矩阵;

将预设数量的血脑屏障渗透性已知的药物的特征矩阵进行组合形成所述数据集。

本发明实施例还提供一种药物血脑屏障渗透性的预测模型,所述预测模型为深度学习四层网络模型,采用上述一种药物血脑屏障渗透性预测中数据集的建立方法建立的数据集训练而成。

本发明实施例还提供一种药物血脑屏障渗透性的预测方法,采用上述一种药物血脑屏障渗透性的预测模型对所述药物的血脑屏障渗透性进行预测,包括:

获取待预测药物的特征数据;

利用所述药物血脑屏障渗透性的预测模型对所述特征数据进行预测,得到所述药物的血脑屏障渗透性结果;

输出所述药物的血脑屏障渗透性结果。

本发明实施例还提供一种药物血脑屏障渗透性的预测装置,采用上述一种药物血脑屏障渗透性的预测方法对药物进行血脑屏障渗透性预测,包括:

信息接收单元,用于获取待预测药物的特征数据;

信息处理单元,用于利用所述药物血脑屏障渗透性的预测模型对所述特征数据进行预测,得到所述药物的血脑屏障渗透性结果;

信息输出单元,用于输出所述药物的血脑屏障渗透性结果。

本发明实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述一种药物血脑屏障渗透性的预测方法的步骤。

本发明实施例还提供一种计算机可读存储介质,,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述一种药物血脑屏障渗透性的预测方法的步骤。

本发明实施例提供的一种药物血脑屏障渗透性预测中数据集的建立方法,通过将已知血脑屏障渗透性的药物对神经系统疾病的疗效与该药物对血脑屏障的渗透性进行关联,形成该药物的特征矩阵,将一定数量的特征矩阵组合为数据集,该数据集适于范围广,使用该数据集训练的药物血脑屏障渗透性预测模型对药物血脑屏障渗透性的预测适用范围广,结果也更加准确。

附图说明

图1示出了适于本发明实施例的药物血脑屏障渗透性预测中数据集的建立方法的实施环境图;

图2示出了适于本发明实施例的一种血脑屏障渗透性预测模型的结构示意图;

图3示出了适于本发明实施例的一种药物血脑屏障渗透性的预测模型对药物的血脑屏障渗透性进行预测的步骤图;

图4示出了适于本发明实施例的一种药物血脑屏障渗透性的预测装置的结构示意图;

图5示出了适于本发明实施例的一种计算机设备的内部结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

图1示出了适于本发明实施例的一种药物血脑屏障渗透性预测中数据集的建立方法的步骤图,详述如下:

在步骤s101中,获取病人使用血脑屏障渗透性已知的药物后针对已知的每种神经系统疾病显现的症状数。

在本发明实施例中,可以通过以往的临床数据,获取血脑屏障渗透性已知的药物在治疗神经系统疾病时的疗效,对于患有神经系统疾病的病人,在其服用相应的血脑屏障渗透性已知的治疗药物后,记录病人表现出的神经系统疾病的症状数,其中,所述神经系统疾病的症状数应该包涵已知的所以神经系统疾病,即服用一种血脑屏障渗透性已知的药物后,记录病人表现出的所以已知的神经系统疾病的症状数。所述获取可以是通过人工将上述症状数的数据输入到计算机中,也可以是计算机读取存于上述数据的存储介质获取所述数据。

作为本发明一种实施例,获取到的神经系统疾病有a、b、c3种,并且上述3种疾病的症状分别为a1、a2、a3、a4、b1、b2、b3、b4、b5、c1、c2、c3,对于血脑屏障渗透性已知的药物x,病人服用所述药物x后,出现的症状为a1、a2、以及c3,则病人服用药物x后针对每种疾病的症状数为:a,2;b,0;c,1。

本发明实施例获取病人服用血脑屏障渗透性已知的药物后出现的神经系统疾病的症状数作为建立数据集的基础,针对现有已知的所有神经系统疾病进行症状采集,扩大数据集的采集范围。

在步骤s102中,将所述症状数集合形成所述药物的特征数据集,并将所述药物的特征数据集与所述药物的血脑屏障渗透性结合成所述药物的特征矩阵。

在本发明实施例中,获取到病人服用血脑屏障渗透性已知的药物后的症状数后,将按照预设的顺序将每种疾病的症状数进行排列,形成代表该药物的特征数据集,然后将所述特征数据集与药物的血脑屏障渗透性进行组合,形成药物的特征矩阵,所述预设的顺为神经系统疾病的排列顺序,不做具体排序要求,保证特征数据集能够按照一定的顺序排序即可,可以是按照神经系统疾病英文名的首字母顺序进行排列;将代表所述药物的血脑屏障渗透性的数字作为所述特征矩阵的最后一个元素,形成代表所述药物的特征矩阵。

作为本发明一种实施例,将上一个实施例病人服用药物x后针对各种疾病出现的症状数集合为药物x的特征数据集为:{2,0,1};作为本发明一种实施例,药物x的血脑屏障渗透性为能够通过血脑屏障,用数字1表示,则药物x的特征矩阵为:{2,0,1,1}。当药物x的血脑屏障渗透性为无法通过血脑屏障时,则该药物x的特征矩阵为:{2,0,1,0}。

本发明实施例通过将血脑屏障渗透性已知的药物对神经系统疾病的治疗效果与该药物的血脑屏障渗透性进行组合,形成代表该药物血脑屏障渗透性与对神经系统疾病治疗疗效的特征矩阵,增加数据集的准确性。

在步骤s103中,将预设数量的血脑屏障渗透性已知的药物的特征矩阵进行组合形成所述数据集。

在本发明实施例中,搜集预设数量的血脑屏障渗透性已知的药物的特征矩阵,进行混合,并随机打散,形成数据集。

作为本发明一种实施例,共收集血脑屏障渗透性已知的药物的特征矩阵共1000个,并将这1000个特征矩阵进行混合,形成本发明所述的数据集。

本发明实施例通过将血脑屏障渗透性已知的药物对神经系统疾病的药物疗效和其对于血脑屏障的渗透性进行关联形成特征矩阵,将该特征矩阵作为拥有训练血脑屏障渗透性预测模型的数据集的一个元素,增加了数据集的可靠性,并扩大数据集的适应范围,使得血脑屏障渗透性预测模型的范围也大幅度增加。

在本发明实施例中,所述获取神经系统疾病的种类包括:选取医学用语词典中神经系统疾病的高级术语,将每个所述神经系统疾病的高级术语作为一个神经系统疾病的种类;根据以往的临床数据获取每种神经系统疾病的症状。

作为本发明一种实施例,获取神经系统疾病的种类,根据医学用于词典,选用词典中代表神经系统疾病的高级别术语,一共43个,并将所述43个术语作用本发明所有已知的神经系统疾病的种类,然后根据每个高级别术语的临床表现型,统计每个高级别术语的症状,并按照一定的顺序将43个高级别术语进行排序,所述排序可以是按照43个高级别术语的首字母顺序。

本发明实施例通过在医学用于词典中选取神经系统疾病的种类,保证数据集能够包含现有的所有已知的神经系统疾病,根据上述神经系统疾病的临床变现获取现有已知的神经系统疾病的症状,保证数据集的准确度。

在本发明实施例中,将所述药物的特征数据与所述药物的血脑屏障渗透性结合成所述药物的特征矩阵包括:将所述病人针对一种神经系统疾病显现出的症状数作为所述特征矩阵的一个元素;按照所述神经系统疾病的顺序将所述元素进行排列,并将代表所述药物的血脑屏障渗透性的数字作为所述特征矩阵的最后一个元素。

作为本发明一种实施例,将上述实施例中病人服用药物x后针对各种疾病出现的症状数集合为药物x的特征数据集为:{2,0,1};作为本发明一种实施例,药物x的血脑屏障渗透性为能够通过血脑屏障,用数字1表示,则药物x的特征矩阵为:{2,0,1,1}。当药物x的血脑屏障渗透性为无法通过血脑屏障时,则该药物x的特征矩阵为:{2,0,1,0}。

本发明实施例通过用数字表示药物的血脑屏障渗透性,并将该数字与药物的特征数据集形成表示该药物对神经系统疾病的疗效与药物对血脑屏障渗透性关系的特征举证,增加数据集的准确度。

在本发明实施例中,将所述数据集中预设部分的数据作为训练集,剩余部分的数据作为验证集。

作为本发明一个实施例,共搜集到血脑屏障渗透性已知的药物的特征矩阵共1000个,其中300个作为验证集,700个作为训练集,对血脑屏障渗透性预测模型进行训练和验证。

本发明实施例将数据集分为训练集与验证,对训练后的模型进行验证,保证血脑屏障渗透性模型的准确性。

在本发明实施例中,血脑屏障渗透性预测模型为深度学习四层网络模型,采用上述数据集训练而成。

作为本发明一种实施例,血脑屏障渗透性预测模型分为3层,分别为输入层、隐含层、以及输出层,训练上述模型的过程分两步,分别为正向传递过程和误差的反向传递过程。

图2示出了适于本发明实施例的一种血脑屏障渗透性预测模型的结构示意图,详述如下:

对于本发明的血脑屏障渗透性预测模型来说,输出节点x和输出节点d的个数都是已知的,只需要确定隐含层的个数即可,根据以下公式(1)可得到隐含层的节点个数:

其中h为隐含层节点数目,m为输入层节点数目,n为输出层节点数目,α为1-10之间的调节常数,在本次实验中一般α=1。

得到隐含层的节点数之后,设节点i和节点j之间的权值为ωij,节点j的阀值为bj,每个节点的输出值为xj,每个节点的输出值根据上层所有节点的输出值、当前节点与上一层所有节点的权值和当前节点的阀值还有激活函数来实现。公式如式(2)和是(3)所示:

xi=f(sj)(3)

其中f为激活函数,本文选取sigmod函数作为激活函数,公式如下:

从上到下,从左到右,依次计算所有节点的值,即可结束整个正向传递的过程。

在正向传递结束后,开始构建反向传递的过程。在反向传递的过程中最主要的是对于输入层和隐含层,隐含层之间,以及隐含层和输出层之间权值和阀值的调整。具体调整的步骤如下:

假设输出层的所有结果为dj,误差函数如下:

根据梯度下降法,反复修正权值和阀值,使得误差函数值达到最小。权值矢量的修正比于当前位置上e(ω,b)的梯度,对于第j个输出节点有:

激活函数公式见公式(4),对激活函数求导,得到公式(7),接下来针对ωij有公式(8):

其中,σij的值为公式(9),同样对于bj有公式(10):

至此,完成了隐含层和输出层之间的权值和阀值计算。

同样的对于输入层之间,输入层和隐含层的阀值调整计算为,假设wmn是输入层第m个节点和隐含层第n个节点之间的权值,假设wki是输入层第k个节点和隐含层第i个节点之间的权值,那么有公式(11),(12),对于其中的δki和δmn有公式(13)和公式(14):

根据上述公式,根据梯度下降法,那么对于隐含层和输出层之间的权值和阀值调整有公式(15)和公式(16)。对于隐含层之间的权值和阀值调整有公式(17)和公式(18)。对于输入层和隐含层之间的权值和阀值调整同样有公式(19)和公式(20):

bj=bj-η2×δij(16)

ωmn=ωmn-η1×δmn×xm(17)

bn=bn-η2×δmn(18)

ωki=ωki-η1×δki×xk(19)

bi=bi-η2×δki(20)

以上为反向传递的所有过程,通过对于权值和阀值的不断调整完成整个深度学习网络的数据处理过程,可以设置误差值或者循环次数用以结束整个过程,至此整个模型建立完成。

模型建立完成之后,用上述数据集中的训练集对上述模型进行训练,得到血脑屏障渗透性预测模型,并使用验证集对所述血脑屏障渗透性预测模型进行验证,得到预测结构较为准确的模型。

本发明实施例通过建立四层网络预测模型,用上述实施例中的数据集对模型进行训练,得到预测准确率较高的模型。

图3示出了适于本发明实施例的一种药物血脑屏障渗透性的预测模型对药物的血脑屏障渗透性进行预测的步骤图,详述如下:

在步骤s301中,获取待预测药物的特征数据。

在本发明实施例中,带预测药物是治疗神经系统疾病的药物y,获取病人服用药物y后针对上述实施例中43中神经系统疾病的症状数,并集合形成药物y的特征数据集。

本发明实施例通过将带预测药物y的特征数据进行采集,与数据集特征相同,便于对其血脑屏障渗透性的预测。

在步骤s302中,利用所述药物血脑屏障渗透性的预测模型对所述特征数据进行预测,得到所述药物的血脑屏障渗透性结果。

在本发明实施例中,将上述药物y的特征数据集作为输入,用上述血脑屏障渗透性预测模型对上述药物y的特征数据进行预测,得到药物y的血脑屏障渗透性预测结果。

在步骤s330中,输出所述药物的血脑屏障渗透性结果。

在本发明实施例中,获得所述药物y的血脑屏障渗透性结构后,输出所述结构,便于医务人员知晓。

本发明实施例通过血脑屏障渗透性预测模型对药物进行预测,能够准确的预测药物的血脑屏障渗透性,且适于范围较广。

图4示出了适于本发明实施例的一种药物血脑屏障渗透性的预测装置的结构示意图,详述如下:

本发明实施例还提供一种药物血脑屏障渗透性的预测装置,采用上述的药物血脑屏障渗透性的预测方法对药物进行血脑屏障渗透性预测,包括:

信息接收单元401,用于获取待预测药物的特征数据。

在本发明实施例中,可以通过以往的临床数据,获取血脑屏障渗透性已知的药物在治疗神经系统疾病时的疗效,对于患有神经系统疾病的病人,在其服用相应的血脑屏障渗透性已知的治疗药物后,记录病人表现出的神经系统疾病的症状数,其中,所述神经系统疾病的症状数应该包涵已知的所以神经系统疾病,即服用一种血脑屏障渗透性已知的药物后,记录病人表现出的所以已知的神经系统疾病的症状数。所述获取可以是通过人工将上述症状数的数据输入到计算机中,也可以是计算机读取存于上述数据的存储介质获取所述数据。

作为本发明一种实施例,获取到的神经系统疾病有a、b、c3种,并且上述3种疾病的症状分别为a1、a2、a3、a4、b1、b2、b3、b4、b5、c1、c2、c3,对于血脑屏障渗透性已知的药物x,病人服用所述药物x后,出现的症状为a1、a2、以及c3,则病人服用药物x后针对每种疾病的症状数为:a,2;b,0;c,1。在本发明实施例中,获取到病人服用血脑屏障渗透性已知的药物后的症状数后,将按照预设的顺序将每种疾病的症状数进行排列,形成代表该药物的特征数据集,然后将所述特征数据集与药物的血脑屏障渗透性进行组合,形成药物的特征矩阵,所述预设的顺为神经系统疾病的排列顺序,不做具体排序要求,保证特征数据集能够按照一定的顺序排序即可,可以是按照神经系统疾病英文名的首字母顺序进行排列;将代表所述药物的血脑屏障渗透性的数字作为所述特征矩阵的最后一个元素,形成代表所述药物的特征矩阵。

作为本发明一种实施例,将上一个实施例病人服用药物x后针对各种疾病出现的症状数集合为药物x的特征数据集为:{2,0,1};作为本发明一种实施例,药物x的血脑屏障渗透性为能够通过血脑屏障,用数字1表示,则药物x的特征矩阵为:{2,0,1,1}。当药物x的血脑屏障渗透性为无法通过血脑屏障时,则该药物x的特征矩阵为:{2,0,1,0}。

本发明实施例通过将血脑屏障渗透性已知的药物对神经系统疾病的治疗效果与该药物的血脑屏障渗透性进行组合,形成代表该药物血脑屏障渗透性与对神经系统疾病治疗疗效的特征矩阵,增加数据集的准确性,针对现有已知的所有神经系统疾病进行症状采集,扩大数据集的采集范围。

信息处理单元402,用于利用所述药物血脑屏障渗透性的预测模型对所述特征数据进行预测,得到所述药物的血脑屏障渗透性结果。

在本发明实施例中,将待预测的药物的特征数据集作为输入,用上述血脑屏障渗透性预测模型对上述数据集进行预测,得到药物的血脑屏障渗透性。

信息输出单元403,用于输出所述药物的血脑屏障渗透性结果。

得到上述药物的血脑屏障渗透性后,将上述结果进行输出,便于衣物人员知晓,可以是通过电脑屏幕进行显示。

本发明实施例通过提供一种药物血脑屏障渗透性的预测装置,使用上述血脑屏障渗透性预测模型对药物进的血脑屏障渗透性进行预测,准确率高。

图5示出了适于本发明实施例的一种计算机设备的内部结构图,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现药物血脑屏障渗透性的预测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行药物血脑屏障渗透性的预测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取待预测药物的特征数据;

利用所述药物血脑屏障渗透性的预测模型对所述特征数据进行预测,得到所述药物的血脑屏障渗透性结果;

输出所述药物的血脑屏障渗透性结果。

在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:

获取待预测药物的特征数据;

利用所述药物血脑屏障渗透性的预测模型对所述特征数据进行预测,得到所述药物的血脑屏障渗透性结果;

输出所述药物的血脑屏障渗透性结果。

应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1