用于药物试验的临床试验期模拟方法以及临床试验期模拟器的制作方法

文档序号：6656300阅读：169来源：国知局

专利名称：用于药物试验的临床试验期模拟方法以及临床试验期模拟器的制作方法
技术领域：
本发明涉及到一种用于药物试验的临床试验期模拟方法，该方法能够预测药物的临床试验期结果的趋势。
背景技术：
将一种新药或生物制品投放市场之前需要对该药物进行测试。测试的进行是靠临床试验的办法。临床试验包含三个阶段。在第一阶段中，药物在健康的志愿者身上进行测试。如果结果是阳性的，则进行二期临床试验，其中，在有限数目的病人身上进行药物测试，而该药物被认为对这些病人患有的疾病是有效的。在这个阶段，病人被分为三组。三组中的两组人用不同种类的安慰剂或者用现有药物进行治疗。其余组的人则用待测药物进行治疗。
第三阶段中，对非常多的志愿者进行临床测试。
第一和第二期的临床试验的花费不太高，而且所需时间也不太长，但是第三期试验则需要非常长的时间，也需要非常高的花费。
由于这个原因，如果临床试验二期的结果，即，在有限数目的个体身上进行的药物测试结果并不显示药物的有关效力的话，实际上就不再进行第三阶段的临床试验了。
通常，用待测药物进行治疗的个体的情况和用安慰剂或其它已知药物进行治疗的个体的情况之间的差别没有大到能充分确定待测药物真的有效，并且因此确信三期临床试验会产生一个阳性的结果。除了药物是真的无效这个显然的原因之外，用待测药物进行治疗的个体的情况和用安慰剂或其它已知药物进行治疗的个体的情况之间的差别程度的不明显，也可以因三个组中的个体的选择或分布不走运而引起，或者因待测药物只在被治疗的个体具有某种临床情形时才有效这个事实而引起。例如，待测药物只在病人没有患其它功能紊乱诸如糖尿病或其它类的非正常临床情形时才对某种疾病是有效的。
由于上述的原因，存在一种危险，即非阳性的或者不够充分令人鼓舞的、但并非由于待测药物缺乏效力的二期临床测试结果会导致不经三期临床测试就放弃临床试验的决定。这将导致这样事情发生，即待测药物不会在市场上出现。这种情形对于公众的健康来说是个巨大的损失，需要提供一种工具使得制药业能更好地衡量前期临床测试的结果，以便在药物测试成功地结束之前不终止试验的进行。
实际上，有已知的用于临床试验的计算机辅助模拟器，例如，由位于美国加利福尼亚州Mountain View的Pharsight公司开发的模拟方法和模拟器。所述已知模拟器的基本特点在下面William R.Gillespie的文献中被公开“使用供临床试验设计和分析的贝叶斯分层建模及模拟的案例研究”(“Case study in the use of Bayesian hierarchical modelling and simulationfor design and analysis of a clinical trial，by William R.Gillespie，BayesianCTS example at FDA/Industry workshop September 2003”)，该文献能从网页www.pharsight.com上下载。已知模拟器运行所使用的方法就是众所周知的统计算法“蒙特卡罗算法”。
然而，该模拟器的构建并不是为了模拟基于在典型的二期临床测试中在有限数目个体身上进行的临床试验而得到的三期临床测试结果或结果的趋势。因此，不能说所作的预测是非常可靠的。而且，该方法就个体的种类以及如何进行这些测试以便获得更大的成功机会而言，更多地面向对测试作出更好的计划。

发明内容
本发明的目标是，提供一种用于药物测试的临床试验阶段模拟方法和临床试验阶段模拟器，它们能基于二期临床试验的结果，对三期临床试验的成功给出很高的精度和可靠性。
本发明依靠一种临床试验阶段模拟方法来实现上述目标，该方法包含下列步骤
a)提供一个数据库，该数据库为确定数目的个体中的每一个都给出预定数目的独立变量，每个该独立变量都对应着一个确定的临床参数，这些参数与描述或识别一种疾病情形相关或者是描述或识别一种疾病情形所特有的，而待测药物正是面向这些疾病的，并且还给出至少一个另外的独立变量，用来描述个体在至少两个不同的治疗之中需要经历的一个特定治疗，其中一个治疗采用待测药物，而第二个治疗采用安慰剂或另一种已知药物，所述数据库还为每个个体给出一个和多个因变量，用来描述在个体身上观察到的所述治疗的效果；b)通过一个输入变量选择算法，通过将所述数据库的独立变量组提供给所述输入变量选择算法，进行输入变量的选择；c)在步骤b)中被选为输入变量的独立变量中加入一个或多个描述治疗效果的因变量；d)用作为输入变量的所选独立变量组以及用所述一个或多个因变量来训练并验证一个自动相关的人工神经网络；e)通过只输入描述所述个体所经历的至少两个不同疗法中的一个疗法的变量的值，对训练过的并且验证了的自动关联人工神经网络进行询问，并获得作为输出的治疗疗效变量值，根据被训练过的人工神经网络，治疗变量的所述输入值与该治疗疗效变量值相对应；f)对个体所经历的至少两个疗法中的每个疗法重复步骤e)；g)比较与所述个体所经历的不同疗法的疗效相关的所述变量的值，这些值在步骤e)和f)中被确定。
也可以进行进一步的询问步骤或者另一个询问步骤，其中，所述因变量的值被输入到训练过的并验证了的人工神经网络中，这意味着输入治疗效果的值，同时，作为一个输出，该网络给出输入变量，特别是涉及到治疗种类的变量，而根据所述网络，是这些变量导致了被输入的疗效值。
所述进一步的或者另一个询问步骤给出了对第一个询问结果进行交叉控制的机会。
而且，所述人工神经网络作为结果也提供所有的其它独立变量的值，这将给出进一步的信息，即，要被选来用于进行试验的个体的最适宜的临床概况。
所述数据库通常由个体人群以及相应的临床相关参数，如描述治疗的参数和描述疗效的因变量来产生，这些个体构成进行二期临床试验的组，即，被限制的有限的志愿者组。
进行二期临床测试的个体人群通常被分成至少两组。一组的个体用待测药物进行治疗，另一组的个体则用安慰剂或某已知药物进行治疗。
因此，本发明所述的方法提供了在有限数目的个体身上进行二期治疗或药物试验的防止性阶段(preventive phase)，而用于上述模拟步骤的数据库则从二期临床试验的结果中产生。
如在详细描述中将看到的，测试表明，通过使用一个已知的预测性算法来评估二期临床测试结果的数据库还不足以得到一个与对网络询问(interrogation)结果的上述交叉控制不矛盾的预测，在网络询问结果的交叉控制中，首先通过输入治疗变量，就药物疗效对所述网络进行询问，在第二阶段，通过给网络输入关于疗效的因变量，就对应着某一疗效的治疗进行询问。
由于二期临床测试案例数目有限，以及由于独立变量的选择经常是基于这样的事实，即考虑待测药物所面向的疾病或不适，描述受测人员健康情况的变量看起来在理论上是似乎可能相关的，因此，正常的预测网络或类似的系统不能够提供有用输出的原因可能是由于，在理论上和/或经验上定义的独立变量之间，即定义个体健康情况的变量之间有一些关系，这样，不是所有的变量都是独立的，或者说都与疾病或不适相关联。
因此，通过一个合适的方法，具体说是通过一个合适的算法进行输入变量选择的步骤对于本发明所涉及的方法来说是一个基本的步骤。
原则上，可以使用任何种类的输入变量选择方法。有不同的为人所知的选择方法或算法。
然而，最好的结果是通过使用一个基于预测算法和进化算法的结合而产生的特殊的输入变量选择机制来获得的。
这就是所谓的人工生物体(artificial organism)，因为它结合了用来模拟人脑或神经细胞网络的人工神经网络，和根据遗传法则工作的进化算法。
一个具体相关的人工生物体由一个人工神经网络和一个遗传算法的结合构成。
输入选择按如下进行开始形成一个数据库，该数据库具有一定数目的输入变量，即一定数目的独立变量，并有一定数量的、所述独立变量和因变量意义明确地与之相关的记录，通过用不同的训练和测试数据库来训练和测试人工神经网络，从而产生第一批人工神经网络，这些数据库是通过将完整数据库的记录分配给所述测试数据库和所述训练数据库来形成的，所述每个训练数据库的记录也可以通过去除一个或多个不同的独立变量而改变。每个所述人工神经网络意义明确地由特定的训练数据库以及由在测试阶段得到的验证得分(validation score)来表示，而在测试阶段中，将受过训练的人工神经网络用于测试数据库，并将人工神经网络输出的结果与测试数据库的已知结果相比较。
所述第一批人工神经网络被作为用于进化算法，具体说是遗传算法的起始人工神经网络来处理，该算法使用相应的特定训练数据库作为每个人工神经网络的基因组。通过根据所述遗传规则来结合所述父代人工神经网络的训练数据库，遗传规则应用到从起始的一批人工神经网络中的两个神经网络的结合来产生新的人工神经网络。对于每个新产生的人工神经网络，通过进行测试阶段来计算得分，新一代的人工神经网络就被产生出来，其中，训练数据库具有某一确定的结构。
重复所述步骤，一些独立变量将从人工神经网络的训练数据库中去掉，一旦在测试阶段获得某一令人满意的特定得分，进化过程就被中断。因此，作为结果，人工生物体给出一个得分达到满意值或选定值的人工神经网络，该神经网络具有一个训练数据库，该库中的记录只包含存在于初始数据库中的全体独立变量中的一些独立变量。
原则上，任何的自动关联的人工神经网络都可以与所述人工生物体相结合来使用。
使用一种特定的自动关联人工神经网络获得了最佳结果，该神经网络就是为人所知的“新式再循环网络”，它在文献(Buseema & Semeion Group″Reti neurali artificiali e sistemi sociali complessi″Volume 1 Chapter 13，Ed.Franco Angeli，1999)中被公布。这种类型的网络对于在输入选择和网络训练步骤的结尾进行询问能更好地工作。
在上述输入变量选择人工生物体中加入更多细节后，所述生物体根据下面的方法步骤来运行a)提供一个数据库，该数据库有确定数目的输入变量，即确定数目的独立变量，并且具有确定数目的、所述独立变量和因变量意义明确地与之相关的记录，在该数据库中，每个记录涉及一批样本案例中的一个已知的临床和实验案例；b)通过应用于所述数据库的数学工具，确定某一预定数目的输入变量中约化数目的输入变量选集；c)所述数学工具包含一个所谓的预测算法，诸如所谓的神经网络；d)将所述数据库分为训练和测试数据集，用于训练和测试所述预测算法；e)定义两个或更多的不同的训练数据集，每个数据集中的记录具有约化数目的输入变量，该约化数目的输入变量是通过从初始定义的数目的输入变量中排除一个或多个输入变量而得到的，而对每个记录，相应训练集的约化数目的输入变量中至少有一个输入变量不同于其它训练数据集的约化数目输入变量中的输入变量；f)用步骤e)中定义的每个不同的训练集来训练所述预测算法，用以产生第一批不同的预测算法，这些算法被分为两组，即母系预测算法和父系预测算法，并用相关的测试集测试所述预测算法；g)通过所述测试结果，计算所述第一批预测算法中每个父系或母系预测算法的符合程度得分或预测精度；i)提供一个所谓的进化算法，诸如遗传算法，并将该进化算法用于所述第一批的母系和父系预测算法中，以获得新一代的预测算法，根据进化算法的规则，该新一代的预测算法的训练和测试数据集所包含的记录的输入变量选集为第一批或前一批父系或母系预测算法的训练和测试数据集的记录的输入变量选集的组合；j)对于代表了输入变量的每个新的不同选集的每一代的新的预测算法，通过测试数据集，对根据输入变量选集的最佳假设得到的最佳预测算法进行测试或验证；k)对符合程度得分进行估计，对代表输入变量选集、使用最少输入变量数目、具有最佳测试性能的预测算法进行推广，以处理新一代预测算法。
l)重复步骤i)到k)，直至达到被定义为预测算法最佳符合的预定符合程度得分以及输入变量数目最小值为止。
m)定义与所述选集中的输入变量相关的变量作为被选的相关输入变量，其中所述输入变量选集由至少具有预定符合程度得分以及具有数目最少的被选输入变量的预测算法来表示。
实际上，预测算法已为人知，并广泛使用着。在文献“Reti NeuraliArtificiali e Sistemi Complessi”Part I Teaoriafondamenti di Reti NeuraliArtificiali Massimo Buscema & Semeion Group Franco Angeli S.r.l.Milano中，所谓的神经网络被详细地披露了。
进化算法也是公知的，在Davis Lawrence 的“遗传算法手册”(Handbook of Genetic Algorithm，Van Nostrand Reinhold New York，1991)中，给出了所谓的遗传算法的更精确的描述。
使用上述选择方法有一个危险，即，与两组志愿者所经历的治疗相关的独立变量被所述选择算法给排除出去了。在这种情形中，首先的解决办法是，在所选独立变量中加入两个与所述两种治疗相关的独立变量。这种解决办法不能给出肯定的结果，因为它包含了一种强制选择算法。
一个较好的解决办法存在于下面的事实中，即，当某种符合程度得分被达到时，该算法就被终止，而所选择的独立变量包含至少一个或者全部两个与治疗相关的独立变量。
尽管为了简单起见本发明的基本教义只涉及二期试验在两组人身上进行的情形，其中每一组人被送去经历两种治疗中的一种，一种治疗采用待测药物，而另一种治疗采用安慰剂或一种已知药物，但是本发明所涉及的上述方法也可以考虑在三组或更多组人的身上进行，所述组中的每组人被送去进行不同的治疗。在这种情形中，一种治疗用待测药物进行，其它治疗则用不同种的安慰剂或不同种的已知药物来进行。
本发明也涉及到一种装置，用来在大量病人身上进行临床试验模拟，即进行三期临床试验模拟，所述装置包含一个最初的虚拟网络，该网络由一个计算机器和一个用于所述计算机器的程序所构成，而该程序使得该装置作为一种自动关联型的神经网络来工作；为所述网络提供输入通道，每个通道用于一定数量变量中的一个变量，这些变量描述病人的相关临床数据，以及描述所述一定数量的病人所接受的治疗；也为所述网络提供一定数目的输出通道，每个通道涉及描述治疗效果的变量；也为所述装置提供机制用来读变量，这些变量有的描述病人的相关临床数据，有的涉及到所述病人所经历的治疗的种类，而相应的输出变量涉及在实验上得到肯定的、在所述一定数量病人身上进行的治疗的效果，并且所述提供的机制用来调节网络对输入变量的响应以便当所述数据库的输入变量被送入输入通道时产生已知的输出变量；提供机制(means)，用来人工输入涉及一种治疗的变量，以及用来读相应的网络输出；提供机制，用来将输出通道的输出强制在一个对应着某一效果的值上，并读出相应的网络输入值。
根据进一步的改进，进一步为所述装置提供一个程序，通过在每个不同网络中去除或抑制不同的输入通道，该程序产生不同的网络，而这些不同的输入通道涉及到描述病人临床状态的不同变量；根据结合规则，而这些结合规则遵守父代之间的基本的生物基因结合规则，通过结合每对网络的不同的有效的或者被去掉的或被抑制的通道组，该程序产生所述不同网络的结合；
提供机制，用来估计每个网络的预测精度；提供机制，用来在选择机制去掉或抑制描述治疗的变量之前，停止新网络的产生。
本发明所涉及的方法和装置的进一步改进是附属权利要求书的主题。

从下面实验案例的描述中以及从附表和附图中可以更清楚地理解本发明，在附图中图1显示了从一个试验的三期试验数据库开始定义一个模拟的二期试验数据库的步骤，该试验是使用一种已知药物进行的，并具有已知结果；图2就第一个实验而言用方框图显示了根据本发明的所述方法的步骤；图3显示了进行第一个实验所用的人工神经网络的节点动力学；图4就第二个实验而言用方框图显示了根据本发明的所述方法的步骤；图5涉及到在第二个实验中被训练过的人工神经网络的验证。
具体实施例方式
下面通过两个实验来解释本发明所涉及的方法。
两个实验使用相同的起始数据库来进行，该数据库使用对已知药物进行的、具有已知的和确定结果的三期试验的数据库来产生。通过将经历不同治疗的个体分组的数目减少到只有两组个体，其中一组个体用待测药物进行治疗，而另一组个体用一种安慰剂进行治疗，这样产生所述起始数据库以便模拟二期试验数据库。此外，从每个组中，选择构成该组的约化数目的个体。进行选择以提供这样的该试验结果，该结果不能导致对被测药物的疗效给出一个清楚的指示，这与三期试验的结果相反，三期试验的结果已经表明所述药物对它所面向的疾病具有一个清楚的疗效。
因此就构建了一个典型的二期试验情形，据此，该二期试验不对被测药物的疗效给出清晰的指示，而实际上，该药物是有疗效的。
作为构建模拟的二期试验数据库的依据的实验数据库是与名叫Friliver的药品相关的三期试验数据库。关于该试验和该药物的详细信息披露在下面GIULIO MARCHESINT，GIAMPAOLO BIANCHI，MANUELA MERLI，PIERO AMODIO，ARMINE PANELIA，CARMELA LOGUERCIO，FILLIPO ROSSI FANELLI and ROBERTO ABBIATI的文章“Nutritionalsupplementation with branched-chain amino acids in advanced cirrhosisadouble-blind，randomized trial(晚期肝硬化中用支链氨基酸进行的营养补充一种双盲随机试验)”中，该试验由意大利BCAA研究组完成，发表在“Gastroenterology(肠胃病学)”2003；1241792-1801。
该药物有一个目的，即靠营养的方法减少病人的住院率，该营养方法或许可以防止严重的肝病的恶化，并改进营养因素和生活质量。被治疗的病人的几个临床参数被纳入考虑中。所述参数构成了数据库记录的一部分独立变量，这在下面将给出详细的解释。在各独立变量中，有三个独立变量，它们指示着由参加试验的全体病人所分成的三组不同的病人身上进行的三种不同的治疗。所述三组中的两组用安慰剂进行治疗，这两组中每组所用的安慰剂不同，第三组则用待测药物进行治疗。
因变量，即试验的结果，指示一个经历治疗的病人在一定的时间之后是否需要住院，这是为了估计该药物的疗效。
全部的数据库有168个记录，每个记录属于一个不同的病人。根据提供的三种不同的治疗，形成三个组。
由与病理和待测药物相关的病人的临床相关生理参数来构成独立变量，这些独立变量列在下面的表1中。
表1也包含两个因变量指标，这两个因变量给出了药物疗效的衡量，即住院和不住院。

参加试验的三组个体根据下面的表2来构成。

已知的三期临床试验结果为，在晚期肝硬化中，用待测药物进行长期营养补充对于防止肝病恶化是有用的，并对改进代用标记(srrogate marker)和能察觉的健康状态(perceived health status)是有用的，因而在减少病人的住院需求上是有用的。这意味着，就因变量“住院”和“不住院”而言，该治疗清楚地显示住院的案例减少了，因为在试验期间，用待测药物治疗的病人需要住院的明显比用安慰剂治疗的病人要少。
所以，该已知的三期试验对于测试本方法的效果而言是一个理想的例子，因为药物疗效指标是清楚而无歧义的。
为了模拟二期临床试验的实验数据，并且为了清楚起见，只选择与安慰剂治疗和用待测药物治疗相关的两个组，即，组2和组3。
此外，记录的数目，即每组中个体的数目被减少到非常低的数目。
图1显示了实验数据的组成的产生步骤，从而显示了数据库的组成的产生步骤，该数据库被用于进行有关本发明所涉及方法的两个实验。
模拟的二期试验数据库的组成列在这里

正如通过比较用于二期试验的虚拟数据库和现实中进行的三期试验的数据库，可以从图1中清楚地看到的，二期试验的结果并不对药物在减少病人住院需求上的效力给出任何清楚的指示，而相反，三期试验的结果表明，药物在减少病人住院上有效果。
如上面已经叙述过的，本发明的目标是，基于二期试验的结果和个体数据库，模拟三期试验结果，以避免如果二期试验不能给出清楚的结果就在该二期试验阶段放弃试验。
实验1根据图2，作为第一步，用上述模拟的二期试验数据库来训练和测试一个预测算法，该算法可以不受限，但最好是一个人工神经网络。为了做到这一点，该数据库被分成一个训练数据库和一个测试数据库。这一步是一个普通的步骤，需要用它来指示人工神经网络或其它的预测算法。通过将独立变量和因变量分别送入预测算法的输入通道和输出通道而使预测算法记认数据库的因变量，该算法进行了“学习”，即，调节其内部的权重矩阵，以便使被输入的独立变量与因变量在一定的误差或精度之内相匹配。测试通常包含将独立变量输入被训练过的算法中，并让该算法计算因变量而不使用具有已知值的所述因变量来强制算法的输出。之后，由预测算法计算的因变量的值与其已知值进行比较。
许多种的预测算法以及在这之中的许多种的人工神经网络都是可用的。在这之中，一类特殊的人工神经网络给出了较好的结果，并且就本问题而言给出了最好的效果和功能。这类人工神经网络就是所谓的自动关联类的人工神经网络。在本实验中，使用一种特殊的自动关联神经网络，即所谓的“新型再循环人工神经网络”，这种网络在Buscema & Semeion Group″Retineurali artificiali e sistemi sociali complessi″Volume 1 Chapter 13，Ed.Franco Angeli，1999中有更详细的描述。
由于被选的独立变量是通过经验标准来选择的，诸如通过与疾病的临床关联来选择，所以在独立变量组中的几个变量中，或许有一些变量是伪独立变量，在实际中它们其实或多或少是因变量。由于数据库只有有限数目的案例，即有限数目的个体这一事实，这些伪独立变量可以导致算法不能正确地工作。因此，如上面已经讲过的，要经过一个中间步骤来选择约化数目的独立变量。
这个步骤也在图2中得到说明。产生一定数目的训练集和测试集，相对于从数据库中全体独立变量中选出来的独立变量数目以及独立变量种类而言，每个训练集和测试集都不同与其它的训练集和测试集。
因此，具有一定数目的一批不同的人工神经网络被进行训练和测试，每个人工神经网络都由在训练和测试数据集中所考虑的独立变量的数目和种类以及由测试步骤中所获得的符合程度得分来无歧义地识别。
这批网络被用作进化算法的起始网络群，具体说是遗传算法的起始网络群。本实验所基于的遗传算法是所谓的GenD算法(遗传掺杂算法)，该算法由Semeion开发，并在文献“Buscema & Semeion Group″Reti neuraliartificiali e sistemi sociali complessi″Volume 1 Chapter 13，Ed.FrancoAngeli，1999”中有更详细的描述。
使用每个人工神经网络的起始网络群中的每个人工神经网络的符合程度得分作为结合两个个体，即所述起始网络群中的两个人工神经网络的基因组的标准，该基因组由相对于所述训练和测试数据库中所考虑的独立变量的数目和种类而言的训练和测试数据库的成分构成，产生新一代的人工神经网络，每个新一代的网络群中的人工神经网络具有包含不同数目和种类的独立变量的训练和测试数据库，作为父代数据库以及作为完整的起始数据库。
继续产生网络群的后代，直到找到一个人工神经网络，该网络测试中的符合程度得分高于预定的符合程度得分，而且该人工神经网络在其训练数据库和测试数据库中具有最少数目的独立变量。
经过这一步骤，定义了一个新的数据库，与起始数据库对照，该数据库具有约化数目的被选独立变量，与完整的模拟二期试验数据库相符。
在这种情形中，还需要考虑另一个标准。因为问题在于，要确定药物在治疗某种疾病中的疗效，被选独立变量的约化集应该包含至少一个与一种治疗(治疗b或2，或者治疗c或3)相关的变量，或者包含与二期治疗中两组个体所经历的两种治疗相关的两个变量。
因此，为了终止独立变量选择阶段，该标准不仅迫使符合得分要被满足以及训练和测试数据库具有最少独立变量，而且也迫使约化的数据库必须包含两个独立变量中至少一个独立变量，该变量描述至少一个治疗。
在如图2所示的本实验1中，当涉及两个治疗的独立变量仍然存在于训练和测试数据库中的约化数目的被选变量之间时，独立变量选择阶段就被终止。
独立变量选择阶段在这样的一代人工神经网络产生时被终止，其中，具有最佳符合得分的人工神经网络只有15个独立变量，这15个独立变量是从被定义为完整的模拟二期试验数据库的原始的起始数据库的21个独立变量中选出的。
两个因变量被加入到这个数据库中，于是产生了一个新的起始数据库用于训练人工神经网络。这个新的约化的起始数据库包含21个个体，对于每个个体，包含涉及15个被选临床参数的15个被选独立变量以及涉及“住院”和“不住院”结果的两个因变量。
这个新的约化的起始数据库被用来训练一种新型再循环人工网络。在训练该网络时，为网络的节点(knot)产生一个权重矩阵。然后，就可以对网络进行询问。
询问的进行如下。或者是独立变量或者是因变量的某变量的对应输入节点被强制为某个值，然后获得或者为独立变量或者为因变量的其它变量的值，根据人工神经网络以及根据其权重矩阵，所获得的值与为所述特定变量输入的值相符。
根据本发明，两种询问可以相关联。
第一种询问包括，输入与治疗相关的独立变量的值，然后观察由人工神经网络给出的因变量的输出。
在本例中，这意味着，输入用来指示一种治疗的值，这种治疗或者是B或者是C，然后考虑人工神经网络输出端给出的变量“住院”和“不住院”的值。
可以进行交叉询问，其中，因变量的值被赋予人工神经网络的输出端，将输出端强制为这些值，然后考虑人工神经网络给出的与治疗相关的独立变量的响应。
根据两种询问的结果是否相符或矛盾，这两种询问于是就给出了清晰的判断，即人工神经网络所获得的结果是真还是假。
下面的表3到表6给出了不同询问的结果。
在表3中，要求人工神经网络预测在病人经历治疗B，即经历安慰剂治疗的情形中的住院和不住院情况。通过为独立变量“治疗2”赋予“I值”，即赋予输入值1，就可以完成这一点。
表3实验2的结果，用安慰剂治疗

通过选择安慰剂治疗2，询问新型再循环算法如表中所清楚地看到的，结果并不清晰，因为两个因变量“住院Yes”和“住院No”的值均大于0.9，接近1。
如果考虑互补的例子，其中要求人工神经网络预测在个体经历治疗3，即经历待测药物治疗的情形中的住院情况，则可以得到类似的结果。这个结果显示在下面的表4中。在这种情形中，独立变量“治疗2”的“I值”(输入值)为0，独立变量“治疗3”(采用待测药物的治疗)的“I值”(输入值)为1。
表4实验2的结果，用药物治疗

通过选择待测药物治疗3，询问新型再循环算法这两个询问的结果都没有表明待测药物是有效的还是无效的，这两个结果都与用药物Friliver进行的三期试验的结果形成对比。
然而，改变视角可以得到正面的结果。
在第三个询问中，要求人工神经网络预测要使用哪种治疗才能得到“不住院”。
在这种情形中，如从表5中清楚地看到的，因变量“不住院”和“住院”的输出值被分别强制为1和0，如在“I值”(输入值)一栏中所看到的。
表5实验2的结果，用药物治疗

通过输入因变量的值并作为输出考虑与治疗2和3相关的变量值，询问新型再循环算法通过将因变量“住院No”和“住院Yes”的值分别强制为1和0，而这表示不需要住院或发生了住院的情形，实验1中的人工神经网络将独立变量“治疗2”(安慰剂)和“治疗3”(待测药物)的值分别设为0和1，于是表明，当采用“治疗3”，即采用待测药物的治疗时，“不住院”的情形发生了。这个结果与现实中进行的三期试验的结果相符合。
根据图3，其中，通过以y轴表示与不同变量相关的节点的节点值、以x轴表示循环周期，从而显示了节点动力学，可以从人工神经网络中导出一个进一步的指示。在图3中，对于表3中的询问，指示出了节点与因变量“住院Yes”和“住院No”相关联的速度，其中，要求人工神经网络确定，如果采用治疗2，这意味着，如果病人用安慰剂治疗而不是用待测药物治疗，是否能预测住院情况。可以看到，与变量“住院Yes”相关的节点非常快地达到接近1的值，而对应“不住院”的因变量的节点在算法经历了105个循环周期之后仍没有达到最终值。
因此，尽管表3和表4中询问的结果没有给出关于疗效的任何指示，但是表5询问的结果以及对节点动力学的分析清楚地指明，药物或许有疗效。如果模拟的二期试验没有给出指示药物疗效的结果，这也能给出结果。
实验2在第二个实验中，使用相同的模拟二期试验数据库，以及将相同的标准和方法步骤运用于所述数据库。
同样，在训练、验证和询问人工神经网络之前，进行包含独立变量选择的预防处理阶段。
用于第二个实验的方法中的步骤显示在图4中。在该第二个实验中，通过预防处理变量选择阶段选择了21个独立变量。不同于第一个实验，这里变量选择阶段的终止发生在某一阶段，该阶段中，被选的变量里只存在治疗3，即用待测药物进行的治疗。
在这21个所选的独立变量中加入两个因变量，并对一个新的再循环算法进行训练、验证以及询问。
表6给出了进行独立变量选择之后用约化数据库来训练的新的再循环算法的验证图。
表6中所完成的询问过程包括，给描述待测药物治疗，即“治疗3”的独立变量输入值“1”，然后考虑人工神经网络给出的两个因变量“住院Yes”和“住院No”的输出值。
正如在下面所清楚地看到的，结果表明，因变量“住院Yes”的值为0，而因变量“住院No”的值为1，这意味着，考虑用待测药物对病人进行治疗，可以预测到病人不需要住院。这个结果与在该药物上进行的真实的三期试验的结果相符合。
表6实验2的结果，用药物治疗

通过输入与治疗3相关的独立变量的值，并作为结果获得与住院和不住院相关的因变量的值，来询问新型再循环算法表7涉及到一个询问，其中因变量的值被输入人工神经网络。将值0赋予变量“住院No”，将值1赋予变量“住院Yes”。这等价于向人工神经网络询问该治疗，是否病人不需要住院。
在这种情形中，很明显结果是，独立变量“治疗3”的值为0。因此在这种情形中，该算法不能够确定在不需要住院的情形中，这种情况是否是由于用治疗3，即用所述药物治疗了病人的原因。
表7实验2的结果，用药物治疗

通过输入因变量的值，考虑不住院的情形并考虑独立变量作为输出变量，来询问新型再循环算法表8描绘了所述人工神经网络对问题“在不采用待测药物治疗的情形中，是否需要住院”给出的答案。
在这种情形中，变量“治疗3”被赋予输入值0，意味着不用待测药物治疗。
由所述算法将关于“住院Yes”的变量设置为1，而将关于“住院No”的变量被设置为0或者近似为0。
表8实验2的结果，不用药物治疗

通过输入独立变量的值，考虑不用所述药物治疗的情形并考虑因变量“住院”和“不住院”作为输出变量，来询问新型再循环算法因此，人工算法所得到的答案是，如果不进行治疗，病人要“住院”。
因此，根据实验2由所述算法对三个询问中的两个所给出的答案与药物真实试验的结果相符合。
由所述两个实验所公开的方法可以获得另一个重要结果，该结果涉及到一个事实，即通过询问人工神经网络，可以获得其它独立变量值的确定的概况。
这些独立变量都涉及到确定的临床参数，这些参数有精确的生理含义，具体说是相对于测试药物的特定疾病而言的生理含义。
这个事实能给出一些信息，说明要成为用于试验的最适宜个体的话所述个体所需要具有的具体特点。
此外，所述临床参数的概况能给出关于临床参数的信息，而这些参数是真的与疾病相关，给出这些信息，也为了识别临床参数值特殊的情况或组合，对于这些特殊情况或组合，药物或者是无效的或是显著有效的，因此可以构建另外的工具进行疾病的医学研究。
从上面的叙述中，或许已经注意到，本发明所涉及的方法是用于从二期试验数据库模拟三期试验的非常有用且成本低廉的工具。这有助于决定是否对某种药物进行三期试验，尽管二期试验的结果并没有为该药物的疗效提供任何指示。因此，可以对非常高的投资进行更好的检查，以避免金钱和时间的损失。
权利要求
1.用于药物试验的临床试验阶段模拟方法，该方法允许预测药物的临床试验阶段的结果趋势，包含下面的步骤a)提供一个数据库，该数据库为确定数目的个体中的每个个体都给出预定数目的独立变量，每个所述独立变量都对应着一个确定的临床参数，这些参数与描述或识别一种疾病情形相关或者是描述或识别该疾病情形所特有的，而所述待测药物正是面向这些疾病的，并且该数据库还包括至少一个另外的独立变量，用来描述所述个体在至少两个不同的治疗之中已经接受的一个特定治疗，其中一个治疗采用待测药物，而第二个治疗采用安慰剂或另外的已知药物，所述数据库还为每个个体给出一个和多个因变量，用来描述在所述个体身上观察到的所述治疗的效果；b)通过一个输入变量选择算法，通过将所述数据库的独立变量组提供给所述输入变量选择算法，进行输入变量的选择；c)在步骤b)中被选为输入变量的所述独立变量中加入一个或多个描述所述治疗效果的因变量；d)用作为输入变量的所选独立变量组以及用所述一个或多个因变量来训练并验证自动相关的人工神经网络；e)通过只输入描述所述个体所经历的所述至少两个不同疗法中的一个疗法的所述变量的值，对所述训练过的并验证了的自动关联人工神经网络进行询问，并获得作为输出的所述治疗疗效的所述变量值，根据被训练过的人工神经网络，该输出与所述治疗的所述变量的所述输入值相对应；f)对所述个体所经历的所述至少两个疗法中的每个疗法重复步骤e)；g)相对于所述个体所经历的所述不同疗法的疗效来比较所述变量的值，所述值在步骤e)和f)中被确定。
2.根据权利要求1的临床虚拟试验阶段，其特征在于包含一个进一步的询问步骤或者另一个询问步骤，其中，所述因变量的值被输入到所述训练过的并验证了的人工神经网络中，这意味着输入所述治疗效果的值，而同时作为一个输出，该网络给出所述输入变量，特别是涉及到所述治疗种类的变量，而根据所述网络，是这些变量将导致被输入的疗效值。
3.根据权利要求1或2的一种临床虚拟试验阶段，其特征在于，它包括通过确定人工神经网络的与所述变量相关的节点的节点动力学，来区别两个不同变量的类似输出值的步骤，节点动力学确定所述两个节点中的哪一个首先以稳定的方式达到所述类似值，并把对应着首先达到所述类似值的所述节点的变量的所述输出值设置为所述类似值，而其它变量的输出值被设置为在其它节点首先达到所述类似值的时刻所述对应节点所达到的值。
4.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于包含，在所述数据库的各变量中进行变量选择的步骤。
5.根据权利要求4的临床虚拟试验阶段，其特征在于，在所述数据库的所述独立变量中进行所述变量选择，所述独立变量关联到与所述待测药物被指定来治疗的所述疾病相关的所述临床参数。
6.根据前面权利要求4到6中一个或多个权利要求的临床虚拟试验阶段，其特征在于，所述独立变量选择步骤从原始数据库中的全体独立变量中选择出有限或约化数目的独立变量。
7.根据权利要求6的临床虚拟试验阶段，其特征在于，所述独立变量选择步骤在这样一个独立变量选择阶段中被终止，在该阶段中，在所述被选的独立变量中仍然存在代表所述试验中所提供的至少一个或至少部分或者全部的治疗的至少一个所述变量。
8.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，通过一种预测算法以及一种进化算法的组合来进行所述的变量选择步骤。
9.根据权利要求8的临床虚拟试验阶段，其特征在于，通过下面的步骤进行所述变量选择提供一个起始数据库，该数据库具有一定数目的输入变量，即一定数目的独立变量，以及具有一定数目的记录，所述独立变量和因变量意义明确地与这些记录相关；通过用不同的训练和测试数据库训练和测试所述人工神经网络来产生第一批的人工神经网络，所述训练和测试数据库是通过将所述起始数据库中的所述记录分配在所述测试数据库和所述训练数据库来形成的；而且，通过在每个不同的训练和测试数据库中去掉一个或多个不同的独立变量，每个训练数据库中的所述记录被改变，使得用不同的训练和测试数据库所产生的所述每个人工神经网络意义明确地由所述特定的训练数据库以及由在测试所述人工神经网络中所获得的验证或符合程度得分来表示；所述第一批人工神经网络随后被作为一种进化算法的起始批数据库，具体说是一个遗传算法的起始批数据库，该算法使用所述相应的特定训练数据库作为每个人工神经网络的基因组；所述进化算法产生新一代的人工神经网络，其中包括一批人工神经网络，它们中的每一个已经通过一个训练和测试数据库进行了训练和测试，该训练和测试数据库的变量数目和变量种类是两个父代人工神经网络的相应的训练和测试数据库的变量数目和变量种类的组合；对于每个新产生的人工神经网络，通过进行测试阶段，计算所述符合程度得分；重复所述步骤，直到一个子代人工神经网络所达到的符合程度得分高于一个预定的低限为止，该子代人工神经网络也具有从所述起始数据库中的全体独立变量中选出来的最小数目的独立变量。
10.根据权利要求9的临床虚拟试验阶段，其特征在于，当在所述被选的独立变量中仍然存在至少一个独立变量时，而该至少一个独立变量代表所述试验中所提供的至少一个或至少部分或者全部的所述治疗，所述进化算法被终止。
11.根据权利要求9和10的临床虚拟试验阶段，其特征在于，所述变量选择通过下面的方法步骤来进行a)提供一个数据库，该数据库有确定数目输入变量，即确定数目的独立变量，并且具有确定数目的、所述独立变量和因变量意义明确地与之相关的记录，在该数据库中，每个记录涉及一批样本案例中的一个已知的临床或实验案例；b)通过应用于所述数据库的数学工具，确定某一预定数目输入变量中约化数目的输入变量选集；c)所述数学工具包含一个所谓的预测算法，诸如所谓的神经网络；d)将所述数据库分为训练和测试数据集，用于训练和测试所述预测算法；e)定义两个或更多的不同的训练数据集，每个所述数据集中的记录具有约化数目的输入变量，该约化数目的输入变量是通过从初始定义的输入变量的数目中排除一个或多个输入变量而得到的，而对每个记录，相应训练集的约化数目的输入变量中至少有一个输入变量不同于其它训练数据集的约化数目输入变量中的输入变量；f)用步骤e)中定义的每个所述不同的训练集来训练所述预测算法，用以产生第一批不同的预测算法，这些算法被分为两组，即母系预测算法和父系预测算法，并用相关的测试集测试所述预测算法；g)通过所述测试结果，计算所述第一批预测算法中每个父系或母系预测算法的符合程度得分或预测精度；i)提供一个所谓的进化算法，例如遗传算法，并将该进化算法用于所述第一批的母系和父系预测算法中，以获得新一代的预测算法，根据所述进化算法的规则，所述新算法的训练和测试数据集所包含的记录的输入变量选集为第一批或前一批父系或母系预测算法的训练和测试数据集的记录的所述输入变量选集的组合；j)对于代表了输入变量的每个新的不同选集的每一代的新的预测算法，通过测试数据集，对根据输入变量选集的最佳假设得到的最佳预测算法进行测试或验证；k)对符合程度得分进行估计，对代表输入变量选集、使用最少输入变量数目、具有最佳测试性能的预测算法进行推广，以处理新一代预测算法；l)重复步骤i)到k)，直至被定义为预测算法最佳符合的预定符合程度得分以及输入变量最小数目被达到为止；m)定义与所述选集中的输入变量相关的输入变量作为被选的相关输入变量，其中所述选集由至少具有预定符合程度得分以及具有最少数目的被选输入变量的所述预测算法来表示。
12.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，它包含一个预防步骤，在有限数目的个体身上进行所述治疗或药物的二期试验，而用于如上所述的模拟步骤的数据库是从所述二期临床试验的结果中产生的。
13.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，它是一种基于二期临床试验数据的三期临床试验模拟。
14.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，所述二期试验数据库包含多于两个的可选治疗，每个所述治疗在一组个体身上进行，每组个体包含参加二期试验的全体个体中的一部分个体。
15.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，通过输入与所提供的一个或多个所述治疗相关的变量的值，并通过读出与所提供的疗效相关的一个或多个所述变量的所述输出，进行询问。
16.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，通过输入与所提供的一个或多个疗效相关的所述变量的值，并通过读出与所提供的治疗相关的一个或多个所述变量的输出，进行询问。
17.根据前面一个或多个权利要求的临床虚拟试验阶段，其特征在于，作为询问的结果，涉及所述相关临床参数或所述其它参数的独立变量是红色的，以便规定进行真实三期试验的最佳个体的临床和处方概况。
18.进行模拟临床虚拟试验阶段的装置，其特征在于，所述装置包含第一虚拟网络，该网络由一个计算机器和一个用于所述计算机器的程序所构成，而该程序强制该装置作为一种自动关联型的神经网络来工作；所述网络被提供了输入通道，每个所述通道用于一定数量变量中的一个变量，这些变量描述病人的相关临床数据，以及描述所述一定数量的病人所经历的治疗；所述网络也被提供了一定数目的输出通道，每个该输出通道涉及描述所述治疗效果的变量；所述装置也被提供了一种机制用来读取描述病人的所述相关临床数据的变量、涉及到所述病人所经历的治疗的种类的变量，以及涉及在实验上得到肯定的、在所述一定数量病人身上进行的治疗的效果的相应的输出变量，并且该提供的机制用来调节所述网络对所述输入变量的响应以便当所述数据库的所述输入变量被送入所述输入通道时产生所述已知的输出变量；提供一种机制，用来人工输入涉及一种治疗的变量，以及用来读相应的网络输出；提供一种机制，用来将所述输出通道的输出强制在一个对应着某一效果的值上，并读出所述网络的相应的输入值。
19.根据权利要求18的装置，其特征在于，所述装置被进一步提供了一个程序，通过在每个不同网络中去除或抑制不同的输入通道，该程序产生不同的网络，而这些不同的输入通道涉及到描述的病人临床状态的不同变量；根据遵守父母之间的基本的生物基因结合规则的结合规则，通过结合每对网络的不同的有效的或者被去掉的或被抑制的通道组，该程序产生所述不同网络的结合；提供一种机制，用来估计每个网络的预测精度；提供一种机制，用来在所述选择机制去掉或抑制描述所述治疗的所有变量之前，停止新网络的产生。
20.根据权利要求18或19的装置，其特征在于包括用于在所述数据库中提供的变量之中选择一个或多个变量的机制；用于为所述一个或多个被选变量输入数据值的机制；用于开启一个计算周期的机制；用于打印和/或可视化从一个和多个被选变量的所述输入值中计算的全部的所述其它变量或者至少部分的所述其它变量的值的机制；用于选择计算出其值的所述变量的机制；用于打印和/或可视化在计算出其值的变量之中选出的变量的计算值的机制。
21.根据前面的权利要求18到20中的一个或多个权利要求的装置，其特征在于，它包含一个输出，用于可视化或打印节点动力学，以及用于意义明确地突出对应着所选变量的节点；
22.根据权利要求21的装置，其特征在于，它包括一种机制，用于确定每个对应着一个被选变量的节点达到一个稳定的计算值所需计算时间。
23.根据权利要求22的装置，其特征在于，它包含一种机制，用于以一种有序的方式、按达到一个稳定的计算值所需计算时间自动列出节点及其对应的变量，以及包含一种机制，用于确定在一个被选变量首先达到一个稳定计算值的时刻所有或者所选各变量的其余节点的值。
全文摘要
一种用于药物试验的临床试验期模拟方法，该方法允许用一些步骤来预测一种药物的临床试验期的结果趋势，这些步骤包括，提供一个数据库，该数据库为一定数目个体中的每个个体提供预定数目的独立变量，每个独立变量对应着与一种疾病状况相关或反映一种疾病特征的某个临床参数，而这种疾病正是待测药物所面向的，还提供至少另一个描述特殊治疗的独立变量，该特殊治疗是所述个体在至少两个不同治疗中所经历的一个治疗，这两个不同的治疗中，一个治疗使用所述药物，第二个治疗使用安慰剂或另一种已知药物，所述数据库也为每个个体提供一个或多个描述所述治疗的疗效的因变量；进行输入变量选择；在被选来作为输入变量的独立变量中加入描述治疗效果的因变量；用作为输入变量的被选择变量以及用因变量来训练并验证一个人工神经网络；通过输入描述一个治疗的变量的值，询问所述神经网络，并作为输出获得治疗效果变量值，根据被训练过的人工神经网络，所述治疗变量的输入值对应着该输出值。
文档编号G06F19/00GK1977270SQ200580021371
公开日2007年6月6日申请日期2005年6月27日优先权日2004年6月30日
发明者P·M·布谢马, E·格罗西申请人:布雷克成像有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：P.M.布谢马;E.格罗西
技术所有人：布雷克成像有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。