基于疾病圈数据信息的自我诊疗方法

文档序号:6640804阅读:171来源:国知局
基于疾病圈数据信息的自我诊疗方法【专利摘要】本发明提供一种基于疾病圈数据信息的自我诊疗方法,包括如下步骤:建立MO数据库;创建一个以药品电子标识码为关键码的存储MO数据库中对应的MOterms的哈希表MOhash;创建疾病圈,生成对应的治疗信息矩阵;对治疗信息矩阵进行统计整合。将每种方案中的每种药物在MO数据库中对应的MOterms集合进行合并,将聚类中对应方案中的药物进行筛选,选择出最佳的治疗方案。通过本发明的方法,建立起一种基于疾病圈数据信息的自我诊疗方法,为疾病自诊信息平台提供诊疗方案的信息分析方法,为病患初期的自诊之后需要选择的自我诊疗方案提供科学的依据,既为人们节省不必要的时间消耗,又不会耽误疾病的最佳治疗时间。【专利说明】基于疾病圈数据信息的自我诊疗方法【
技术领域
】[0001]本发明属于计算机信息领域,特别是涉及到一种基于疾病圈数据信息的自我诊疗方法。【
背景技术
】[0002]现阶段人们的生活节奏很快,生活压力也很大,这就为人们的身体健康带来了很多隐忧。人们一旦身体健康出现问题,首选是去医院,但是医院里看病的人又似乎永远是非常多,哪怕是一些小病征,整个看病的流程走下来会花费很多时间;而如果人们觉得耽误时间,不愿意去医院,只是依据自己的经验买些药服用,这样又有可能错过最佳治疗时间,耽误病情。[0003]基于这种现象,如果能够有一个帮助人们进行疾病自诊的信息平台,将会对人们产生巨大的帮助,人们可以通过信息平台的内容,结合自身的状况,先对自己的病患进行初期的判断,病征轻微的,可以根据信息平台的内容进行自我简单的治疗,病征有危险的发展趋势时,再去医院治疗。[0004]要建立一个这样的帮助人们进行疾病自诊的信息平台,需要有一个完善的医学信息数据库,才能保证自诊的准确性,既能帮助人们节省时间,又不会耽误疾病的最佳治疗时间。[0005]在有了完善的医学信息数据库之后,还要有基于医学信息本体数据库的关联药品的自我分析方法。[0006]有了上述信息之后,还需要根据信息找出最佳的诊疗方案,才能比较完整的为人们提供服务【
发明内容】[0007]本发明要解决的问题是设计一种基于疾病圈数据信息的自我诊疗方法,为疾病自诊信息平台提供诊疗方案的信息分析方法,为病患初期的自诊之后需要选择的自我诊疗方案提供科学的依据。[0008]需要说明的是,本发明基于疾病圈数据信息的自我诊疗方法,是信息学的一种应用,通过相关信息分析以便于选择自我选择适当的诊疗方案,并非属于疾病的诊断和治疗方法,因此不违反专利法第二十五条的相关规定。[0009]为了达到上述目的,本发明采取的技术方案为:一种基于疾病圈数据信息的自我诊疗方法,其特征在于,包括如下步骤:[0010](I)建立医学信息本体(MedicalOntology)数据库,即MO数据库;将疾病及其特征用MOterms进行编号;每个MOterms代表一个顶点,两个terms之间的关系用有向边表示,这样将疾病和病征表示在一个有向无环图中;[0011](2)创建一个以药品电子标识码为关键码的存储MO数据库中对应的MOterms的哈希表MOhash;[0012](3)创建疾病圈,根据每位病患提供的治疗信息,包括:[0013]每个病患提供自身病患所处的疾病阶段,包括初患,复发,较轻,严重,前期,中期,后期,I,II,III期等,用集合J=(J1,J2,J3,...}代表;[0014]每个病患提供对应阶段使用的药物产品集M=(M1,M2,…,MJ,η表示产品数目;[0015]及对应的每种产品服用/使用疗程T=IT1,T2,….,TJ;[0016]及对应的每种产品治疗效果E=(E1,E2,....,EJ;[0017]及对应的疗程药品花费F=(F1,F2,…,FJ;[0018]及对应的耐药时间N=(N1,N2,…,NJ;[0019]及对应的不良反应时间R=(R1,R2,…,RJ;[0020]根据上述信息生成对应的治疗信息矩阵D={Μ,Τ,Ε,F,N,R};[0021](4)对病友的治疗信息矩阵进行统计整合。对使用相同药品集合的病友进行归类统计,排序出流行的治疗方案;对每种药物进行统计,统计出每种药物的使用数据,包括使用率、平均耐药时长、耐药率、不良反应率,并且对药物进行综合指标排序。综合指标公式为[0022]药物综合指标=药物使用率X(I一不良反应率)X(I一耐药率);[0023](5)将每种方案中的每种药物在MO数据库中对应的MOterms集合进行合并,得到了每种治疗方案的MOterms集合,对药物成分机理等差异性不大的方案进一步聚类;聚类后,按照每类中对应的方案数目进行排序;[0024](6)将聚类中对应方案中的药物进行筛选,按步骤(4)药物综合指标进行排序,或者按照其他指标排序,选择出最佳的治疗方案。[0025](7)若不同的医师提供了针对不同阶段的不同标准治疗方案。需要将各个病患的治疗史与标准治疗方案进行比较。[0026]优选的,所述步骤(I)中,创建MO数据库的方法为:[0027]a.将疾病及其特征用MOterms进行编号,每个MOterms代表一个顶点,两个terms之间的关系用有向边表示,这样将疾病和病征表示在一个有向无环图中;[0028]b.顶点之间的关联分成两种类型:is_a关系和part_of关系;is_a关系是一种简单的包含关系;part_of关系表示一部分的包含关系,一种疾病往往有多种病征表现,病征和疾病之间是part_of的关系,疾病和疾病之间是is_a的关系,病征和病征之间是is_a的关系;[0029]c.对于任两个terms之间的有向边,若是part_of的关系,则赋予权重;权重用关联概率d表示;将父term与之关联的子terms之间进行关联度d分配(0〈d〈=I);其中关联度d(terml,term2)表示父病征terml出现term2子病征的概率;[0030]d.对于任两个terms之间的有向边,若是is_a的关系,则赋予权重;权重用关联百分比表示;父term与子terms之间的关联百分比用该子term在父term所关联的所有子terms中出现比率,所述子terms的关联百分比之和为I。[0031]优选的,所述步骤(5)的聚类方法为:[0032]聚类之前,首先构建方案相似度图,图中每个顶点代表不同的方案,两个顶点之间的边的赋权代表对应的MO的重叠度D;[0033]其次,从每个图的顶点出发,找到含有该顶点的极大团;最后将得到的极大团进行融合成高密度子图,从而得到这些高密度子图根据规模排序,得到聚类的方法。[0034]优选的,所述步骤(7)的比较方法为:[0035]第一步:以每个药品为顶点,两种药品对应的顶点之间的边赋权为该两种药品在所有病患治疗史中被同时使用的关联比率指标,即同时出现在不同病友的治疗信息矩阵中的关联比率指标:[0036]关联比率指标(药物1,药物2)=两种药物被同时使用的比率X(I—max(药物I的不良反应率,药物2的不良反应率))X(I—max(药物I耐药率,药物2耐药率));[0037]由此得到了药物使用率关联的图G;[0038]第二步:从图G中找最大赋权团,所述团是每个顶点都有边连接的子图,该团对应的就是病患中最流行的治疗方案,即药品选择方案;[0039]第三步:运用该图G,统计出医师的标准治疗方案在疾病圈中对应的子图的边赋权和。然后对不同医师的治疗方案,对对应的子图的边赋权和进行排序,而到医师中的最佳治疗方案。[0040]第四步:将医师的最佳治疗方案与得到的最大赋权团对应的方案进行比较,以便修正。[0041]本发明的有益效果为:通过本发明的方法,建立起基于疾病特征的医学信息本体数据库,并建立起一种基于疾病圈数据信息的自我诊疗方法,为疾病自诊信息平台提供诊疗方案的信息分析方法,为病患初期的自诊之后需要选择的自我诊疗方案提供科学的依据,既为人们节省不必要的时间消耗,又不会耽误疾病的最佳治疗时间。【具体实施方式】[0042]下面结合具体实施例对本发明做进一步说明。[0043]本发明用于自诊时的治疗方案比较:根据治疗史和产品信息(个人治疗信息包括:使用的药品/器械;药品/器械的价格;是否治愈;治愈时间(疗程);是否复发;等等信息),给出同疾病圈中同样药物对不同人群的效果,以及同样人群对不同药品的效果。[0044]问题模型:已知某个疾病,在网站建立了与之对应的疾病圈(一种以疾病为讨论目的的社交网络圈),疾病圈中有一定的会员(病友)。病友在注册时必须提交个人健康治疗信息;在注册后,可以选择不同的疾病圈。在进入相关疾病圈后,可以讨论该疾病的治疗信息,也可以提交自己的治疗史,更主要是希望寻求帮助,得到更佳的治疗方案。企业会员和医师会员也分配到相应的疾病圈。企业将通过疾病圈了解药品器械的使用回馈和新产品的推介。医师将通过疾病圈掌握治疗方案的反馈信息以便及时修正治疗方案。[0045]数据信息:数据信息主要来自病友提供的治疗病历;医生提供的标准病例和标准治疗方案;企业提供的医药器械信息。[0046](I)每个病友提供自身病患所处的疾病阶段(初患,复发,较轻,严重,前期,中期,后期,I,II,III期等,可用集合J=(J11J21J3,-!代表)和对应阶段使用的药物器械产品集M=(M1,M2,…,MJ(η表示产品数目)及对应的每种产品服用/使用疗程T=IT1,T2,…?,TJ、治疗效果(I?5星)E=(E1,E2,....,EJ、疗程药品花费F=(F1,F2,…,Fj;耐药时间(即服用多长时间后耐药,O表示未耐药,其它数值表示耐药时间)N=叫,N2,…,NJ;不良反应时间(即服用多长时间出现不良反应,O表示未出现,其它数值表示不良反应时间)R=IR”R2,…,RJ。[0047]其中药品器械产品集将根据电子标识码来唯一确定,通过哈希表(hashtable)可以追溯到相关生产企业等信息。[0048]这样,我们就得到了,每个病友在不同患病阶段都对应一个治疗信息矩阵(Matrix)D={Μ,Τ,E,F,N,R},每一行代表上述的相关特征信息集合(产品集M、疗程集T、疗效集E、费用集F、耐药集N、不良反应集R)。[0049](2)每个医生提供的对不同患病阶段J=(J1,J2,J3,...}所开具的药品器械集合DM对应的疗程(即治疗方案)。[0050](3)与此疾病有关的所有药物器械集合及对应的生产企业,该数据集是已经采集到的所有药品器械,并且已经分配到MO数据库中相应的疾病和病症的MOtermsο[0051]其中,首先,创建MO数据库:[0052]a.将疾病及其特征用MOterms进行编号,每个MOterms代表一个顶点,两个terms之间的关系用有向边表示,这样将疾病和病征表示在一个有向无环图中;[0053]b.顶点之间的关联分成两种类型:is_a关系和part_of关系;is_a关系是一种简单的包含关系;part_of关系表示一部分的包含关系,一种疾病往往有多种病征表现,病征和疾病之间是part_of的关系,疾病和疾病之间是is_a的关系,病征和病征之间是is_a的关系;[0054]c.对于任两个terms之间的有向边,若是part_of的关系,则赋予权重;权重用关联概率d表示;将父term与之关联的子terms之间进行关联度d分配(0〈d〈=I);其中关联度d(terml,term2)表示父病征terml出现term2子病征的概率;[0055]d.对于任两个terms之间的有向边,若是is_a的关系,则赋予权重;权重用关联百分比表示;父term与子terms之间的关联百分比用该子term在父term所关联的所有子terms中出现比率,所述子terms的关联百分比之和为I。[0056]其次,创建一个以药品电子标识码为关键码的存储MO数据库中对应的MOterms的哈希表MOhashο[0057]模型建立:[0058]该问题需要解决的两个具体问题:[0059]第一:根据病友所处的疾病阶段和用药史得到每个病人的治疗信息矩阵D,对所有的治疗信息矩阵集合进行统计,统计出在该疾病圈中所有的治疗方案,并且对信息矩阵的指标分别进行排序。这样,病友、医师、和企业均能够了解目前的流行治疗方案和用药等。可以对所有阶段的治疗信息进行统计,也可以分疾病阶段进行统计。同时,根据病友的治疗史对应的治疗信息矩阵D,聚类得到最佳的治疗方案。[0060]第二:若不同的医师提供了针对不同阶段的不同标准治疗方案。需要将各个病友的治疗史与标准治疗方案进行比较。从而判断哪些标准方案更经济有效(费用低、疗程短、疗效高、耐药率低、不良反应低)或需要修正。[0061]算法概述:[0062]对于问题一:[0063]第一步:首先根据每位病友提供的治疗信息,生成对应的治疗信息矩阵D={Μ,Τ,E,F,N,R}ο[0064]第二步:对病友的治疗信息矩阵进行统计整合。对使用相同药品器械集合M的病友进行归类统计,排序出流行的治疗方案;对每种药物进行统计,统计出每种药物器械的使用率,平均耐药时长,耐药率,不良反应率等。并且对药物进行综合指标排序。综合指标公式为[0065]Productive_Index(药物)=药物使用率X(I—不良反应率)X(I—耐药率)。[0066]第三步:因为上一步统计出的流行方案是针对具体药物器械的方案,而且疾病圈中的治疗史或治疗方案差异性很大,又因为有些药物器械功能同质性很高,甚至有些产品成分构成一样只是商品名称不一样,所以我们需要对这种所构成的药物成分机理等差异性不大的方案进一步聚类(clustering)。因此,我们将每种方案中的每种药物在MO数据库中对应的MOterms集合进行合并,得到了每种治疗方案(或治疗史)的MOterms集合。这样,若两种方案对应的MOterms集合有很高的重叠度,我们就说这两种治疗方案高度吻合(很高的相似度)。[0067]聚类之前,首先构建方案相似度图(similaritygraph):图中每个顶点(node)代表不同的方案,两个顶点之间的边(edge)的赋权(weight)代表对应的MO的重叠度d。例如方案I对应的MOterms集合为SI,方案2对应的MOterms集合为S2,则重叠度d=Sins2|/|siuS2|ο[0068]我们设计的聚类算法为团融合聚类算法(CliqueMergingClustering):该算法是将要聚类的元素(顶点)根据相似度构建相似度图(similaritygraph);然后从每个图的顶点出发,找到含有该顶点的极大团(maximalclique)(团是图中的两两顶点都有边连接的子图);最后将得到的极大团进行融合成高密度子图(highlydensesub-graph),从而得到这些高密度子图根据规模排序,得到聚类的方法。[0069]聚类后,按照每类中对应的方案数目进行排序。[0070]第四步:对得到的最好的聚类,我们将聚类中对应方案中的药物进行筛选,按Productive_index指标排序,或者按照性价比等其他指标排序,选择出最佳的治疗方案。对于问题二:[0071]第一步:我们以每个药品器械为顶点,两种药品器械对应的顶点之间的边赋权为该两种药品器械在所有病友治疗史中被同时使用(同时出现在不同病友的治疗信息矩阵中)的关联比率指标:[0072]Correlative_Productive_index(药物1,药物2)=两种药物被同时使用的比率X(1—max(药物I的不良反应率,药物2的不良反应率))X(I—max(药物I耐药率,药物2耐药率)).这样我们就得到了药物使用率关联的图G。[0073]第二步:从该图中找最大赋权团(maximumweightclique,边权和最大的团),该团就对应的就是病友中最流行的治疗方案(药品器械选择方案)。[0074]第三步:我们同时运用该图G,统计出医师的标准治疗方案在疾病圈中对应的子图的边赋权和。然后对不同医师的治疗方案,对对应的子图的边赋权和进行排序,而到医师中的最佳治疗方案。[0075]将医师的最佳治疗方案与我们得到的最大赋权团对应的方案进行比较,以便修IHo[0076]以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。【权利要求】1.一种基于疾病圈数据信息的自我诊疗方法,其特征在于,包括如下步骤:(1)建立医学信息本体(MedicalOntology)数据库,即MO数据库;将疾病及其特征用MOterms进行编号;每个MOterm代表一个顶点,两个terms之间的关系用有向边表示,这样将疾病和病征表不在一个有向无环图中;(2)创建一个以药品电子标识码为关键码的存储MO数据库中对应的MOterms的哈希表MOhash;(3)创建疾病圈,根据每位病患提供的治疗信息,包括:每个病患提供自身病患所处的疾病阶段,包括初患,复发,较轻,严重,前期,中期,后期,I,II,III期等,用集合J=(J11J21J3,-!代表;每个病患提供对应阶段使用的药物产品集M=(M1,M2,…,Mj,η表示产品数目;及对应的每种产品服用/使用疗程T=;及对应的每种产品治疗效果E=(E1,E2,....,EJ;及对应的疗程药品花费F=(F1,F2,…,FJ;及对应的耐药时间N=(N1,N2,…,Nj;及对应的不良反应时间R=(R1,R2,…,RJ;根据上述信息生成对应的治疗信息矩阵D={Μ,Τ,Ε,F,N,R};(4)对病友的治疗信息矩阵进行统计整合。对使用相同药品集合的病友进行归类统计,排序出流行的治疗方案;对每种药物进行统计,统计出每种药物的使用数据,包括使用率、平均耐药时长、耐药率、不良反应率,并且对药物进行综合指标排序。综合指标公式为药物综合指标=药物使用率X(I一不良反应率)X(I一耐药率);(5)将每种方案中的每种药物在MO数据库中对应的MOterms集合进行合并,得到了每种治疗方案的MOterms集合,对药物成分机理等差异性不大的方案进一步聚类;聚类后,按照每类中对应的方案数目进行排序;(6)将聚类中对应方案中的药物进行筛选,按步骤(4)药物综合指标进行排序,或者按照其他指标排序,选择出最佳的治疗方案。(7)若不同的医师提供了针对不同阶段的不同标准治疗方案。需要将各个病患的治疗史与标准治疗方案进行比较。2.根据权利要求1所述的一种基于疾病圈数据信息的自我诊疗方法,其特征在于,所述步骤(I)中,创建MO数据库的方法为:a.将疾病及其特征用MOterms进行编号,每个MOterms代表一个顶点,两个terms之间的关系用有向边表示,这样将疾病和病征表示在一个有向无环图中;b.顶点之间的关联分成两种类型:is_a关系和part_0f关系;is_a*系是一种简单的包含关系;part_of关系表示一部分的包含关系,一种疾病往往有多种病征表现,病征和疾病之间是part_of的关系,疾病和疾病之间是is_a的关系,病征和病征之间是is_a的关系;c.对于任两个terms之间的有向边,若是part_of的关系,则赋予权重;权重用关联概率d表示;将父term与之关联的子terms之间进行关联度d分配(0〈d〈=I);其中关联度d(terml,term2)表示父病征terml出现term2子病征的概率;d.对于任两个terms之间的有向边,若是is_a的关系,则赋予权重;权重用关联百分比表示;父term与子terms之间的关联百分比用该子term在父term所关联的所有子terms中出现比率,所述子terms的关联百分比之和为I。3.根据权利要求1所述的一种基于疾病圈数据信息的自我诊疗方法,其特征在于,所述步骤(5)的聚类方法为:聚类之前,首先构建方案相似度图,图中每个顶点代表不同的方案,两个顶点之间的边的赋权代表对应的MO的重叠度D;其次,从每个图的顶点出发,找到含有该顶点的极大团;最后将得到的极大团进行融合成高密度子图,从而得到这些高密度子图根据规模排序,得到聚类的方法。4.根据权利要求1所述的一种基于疾病圈数据信息的自我诊疗方法,其特征在于,所述步骤(7)的比较方法为:第一步:以每个药品为顶点,两种药品对应的顶点之间的边赋权为该两种药品在所有病患治疗史中被同时使用的关联比率指标,即同时出现在不同病友的治疗信息矩阵中的关联比率指标:关联比率指标(药物1,药物2)=两种药物被同时使用的比率X(I—max(药物I的不良反应率,药物2的不良反应率))X(I—max(药物I耐药率,药物2耐药率));由此得到了药物使用率关联的图G;第二步:从图G中找最大赋权团,所述团是每个顶点都有边连接的子图,该团对应的就是病患中最流行的治疗方案,即药品选择方案;第三步:运用该图G,统计出医师的标准治疗方案在疾病圈中对应的子图的边赋权和。然后对不同医师的治疗方案,对对应的子图的边赋权和进行排序,而到医师中的最佳治疗方案。第四步:将医师的最佳治疗方案与得到的最大赋权团对应的方案进行比较,以便修正。【文档编号】G06Q50/22GK104484844SQ201410848793【公开日】2015年4月1日申请日期:2014年12月30日优先权日:2014年12月30日【发明者】赵欣,张少强申请人:天津迈沃医药技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1