本发明涉及计算机处理技术领域,尤其涉及一种基于文献数据的风险评价方法、装置及服务器。
背景技术:
当前,高血压是引起心脑血管事件的重要危险因素,约40%的冠心病,80%的脑血管意外与血压异常升高有关。为了控制血压,患者需终身规律服药,且药物的降压疗效可受高血压的类型、年龄、种族及病理机制等因素的影响,必须进行个体化给药。随着越来越多的抗高血压药物在临床上的使用,不良反应的发生率也随之增加并日趋复杂。临床医生只有充分认识不同类型降压药物的不良反应发生情况,采取适宜的防治对策,才能提高临床合理用药水平。目前,临床医生主要依据降压药物说明书对不良反应进行判断,但每类降压药物不良反应种类繁多,临床医生很难逐一进行确认,导致许多的不良反应被忽视。
鉴于此,如何基于文献数据获取降压药物的不良反应信息,以对降压风险进行评价成为目前需要解决的技术问题。
技术实现要素:
为解决上述的技术问题,本发明提供一种基于文献数据的风险评价方法、装置及服务器,利用计算机处理的技术手段,能够从每类降压药物推荐出相应的最常见不良反应排名信息,从而对降压药物在高血压及其特殊人群中使用的风险进行评价,提高低年资、基层医生、患者对降压药物风险的认知度,减少不良事件的发生,提高降压疗效。
第一方面,本发明提供一种基于文献数据的风险评价方法,包括:
获取生物医学文献数据库中所有文章的摘要数据;
通过限定医学主题词表来建立与某一类降压药物的不良反应相关的文章的摘要数据库;
建立衡量与某一类降压药物的不良反应相关的文章质量的数据指标;
根据所述摘要数据库,提取每篇与某一类降压药物的不良反应相关的文章中的文章、作者、期刊、出版物类型和该类降压药物不良反应的信息;
根据提取的信息和所述数据指标,构建加权异构图形;
对所述加权异构图形进行排序,获取所述某一类降压药物的不良反应排名信息。
可选地,所述生物医学文献数据库为生物医学文献数据库MEDLINE。
可选地,所述摘要数据库中每一篇文章的摘要信息包括:文字编号、作者与其单位和期刊名称;
和/或,
所述数据指标,包括:文章发表日期和文章类型。
可选地,所述文章类型,包括:荟萃Meta分析、随机对照试验、务实临床试验、双生子研究、对照临床试验、观察性研究、比较研究和病例报告。
可选地,所述根据提取的信息和所述数据指标,构建加权异构图形,包括:
根据提取的信息,构建异构图形;
根据所述数据指标,计算所述异构图形各边缘的权重。
可选地,所述对所述加权异构图形进行排序,获取所述某一类降压药物的不良反应排名信息,包括:
采用MedRank排序算法,通过第一公式对所述加权异构图形进行进行迭代运算,直到结果收敛于隐定质,以获取所述某一类降压药物的不良反应排名信息;
其中,所述第一公式为:
其中,t∈{1,…,n-1},n为大于1的正整数;X1为目标类型,代表所述某一类降压药物的不良反应;Xt为第t次对象类型;C为中心类型;为X1对象类型在当次迭代的排序分数;U为|X1|×|X1|的单位矩阵,|X1|为X1类型对象之总数,α为决定U/|X1|项之权重;WAB为对象A和B的带权邻接矩阵,表示两者之间的权重链接;为对行进行规化的对角矩阵,其中第i行的对角值为WAB第i行之和。
第二方面,本发明提供一种基于文献数据的风险评价装置,包括:
摘要数据获取模块,用于获取生物医学文献数据库中所有文章的摘要数据;
数据库建立模块,用于通过限定医学主题词表来建立与某一类降压药物的不良反应相关的文章的摘要数据库;
数据指标建立模块,用于建立衡量与某一类降压药物的不良反应相关的文章质量的数据指标;
提取模块,用于根据所述摘要数据库,提取每篇与某一类降压药物的不良反应相关的文章中的文章、作者、期刊、出版物类型和该类降压药物不良反应的信息;
图形构建模块,用于根据提取的信息和所述数据指标,构建加权异构图形;
排名信息获取模块,用于对所述加权异构图形进行排序,获取所述某一类降压药物的不良反应排名信息。
可选地,所述图形构建模块,具体用于
根据提取的信息,构建异构图形;
根据所述数据指标,计算所述异构图形各边缘的权重。
可选地,所述排名信息获取模块,具体用于
采用MedRank排序算法,通过第一公式对所述加权异构图形进行进行迭代运算,直到结果收敛于隐定质,以获取所述某一类降压药物的不良反应排名信息;
其中,所述第一公式为:
其中,t∈{1,…,n-1},n为大于1的正整数;X1为目标类型,代表所述某一类降压药物的不良反应;Xt为第t次对象类型;C为中心类型;为X1对象类型在当次迭代的排序分数;U为|X1|×|X1|的单位矩阵,|X1|为X1类型对象之总数,α为决定U/|X1|项之权重;WAB为对象A和B的带权邻接矩阵,表示两者之间的权重链接;为对行进行规化的对角矩阵,其中第i行的对角值为WAB第i行之和。
第三方面,本发明提供一种服务器,包括:上述基于文献数据的风险评价装置。
由上述技术方案可知,本发明的基于文献数据的风险评价方法、装置及服务器,利用计算机处理的技术手段,利用计算机处理的技术手段,能够从每类降压药物推荐出相应的最常见不良反应排名信息,从而对降压药物在高血压及其特殊人群中使用的风险进行评价,提高低年资、基层医生、患者对降压药物风险的认知度,减少不良事件的发生,提高降压疗效。
附图说明
图1为本发明一实施例提供的一种基于文献数据的风险评价方法的流程示意图;
图2为图1所示方法中构建的加权异构图形的示意图;
图3为本发明一实施例提供的一种基于文献数据的风险评价装置的结构示意图;
图4为本发明一实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他的实施例,都属于本发明保护的范围。
图1示出了本发明一实施例提供的基于文献数据的风险评价方法的流程示意图,如图1所示,本实施例的基于文献数据的风险评价方法如下所述。
101、获取生物医学文献数据库中所有文章的摘要数据。
其中,所述生物医学文献数据库可优选为生物医学文献数据库MEDLINE。
102、通过限定医学主题词表(Medical Subject Headings,简称MeSH)来建立与某一类降压药物的不良反应相关的文章的摘要数据库。
其中,所述摘要数据库中每一篇文章的摘要信息可以包括:文字编号、作者与其单位和期刊名称等。
应说明的是,所述步骤102中MeSH应至少包括:“人类(Human)”和“高血压(Hypertension)”。
应说明的是,在具体应用中,本实施例中的降压药物可以被分为8类:利尿剂、β受体阻滞剂、α-受体拮抗剂、血管紧张素转换酶抑制剂(ACEI)、钙通道阻滞剂(CCB)、血管紧张素受体拮抗剂(ARB)、血管扩张剂、神经节阻滞剂(在生物医学文献数据库MEDLINE中,MeSH中共有95个主要主题词和121个补充概念属于以上8类)。可通过令MeSH词属于以上8类的MeSH词,而且将MeSH词限定为“治疗应用(therapeutic use)”、或“药物疗法(drug therapy)”、或“投药和剂量(administration&dosage)”。
103、建立衡量与某一类降压药物的不良反应相关的文章质量的数据指标。
其中,所述数据指标包括:文章发表日期和文章类型。
进一步地,所述文章类型,可以包括:荟萃Meta分析、随机对照试验、务实临床试验、双生子研究、对照临床试验、观察性研究、比较研究和病例报告等。
104、根据所述摘要数据库,提取每篇与某一类降压药物的不良反应相关的文章中的文章、作者、期刊、出版物类型和该类降压药物不良反应的信息。
在具体应用中,可通过将MeSH限定为至少包括下述降压药物的不良反应中的一种或多种:“Flushing(脸红)”,“headache(头痛)”,“tachycardia(心动过速)”,“ankle edema(踝部水肿)”,“edema(水肿)”,“dry cough(干咳)”,“hypokalemia(低血钾症)”,“hyperkalemia(高血钾症)”,“gingival hyperplasia(牙龈增生)”,“asthma(哮喘)”,“bradycardia(心动过缓)”,“dyspnea and palpitations(呼吸困难和心悸)”,“Dizziness(头晕)”,“hot flushes(热潮红)”,“hypotension(低血压)”,“angioedema(血管性水肿)”,“leukopenia(白细胞减少症)”,“orthostatic hypotension(起立性低血压)”,“dry mouth(口干)”,“constipation(便秘)”,“vasopressor reaction(血管升压反应)”,“Hyperuricemia(高尿酸血症)”等,通过所述摘要数据库,提取每篇与某一类降压药物的不良反应相关的文章中的该类降压药物不良反应的信息。
105、根据提取的信息和所述数据指标,构建加权异构图形,如图2所示。
在具体应用中,所述步骤105,可以具体包括图中未示出的步骤105a和105b:
105a、根据提取的信息,构建异构图形。
105b、根据所述数据指标,计算所述异构图形各边缘的权重。
进一步地,在步骤105b中,可根据所述数据指标,基于以下三个因子,计算所述异构图形各边缘的权重:
一、时间因子(T):从一篇文章的发表年度中提取时间信息;如果这篇文章是在本年度发表,权重=0;如果它是在过去10年发表,权重=1,否则,权重=-1;
二、文章类型(P):Meta分析和随机对照试验的文章,权重=1,否则,权重=0;
三、临床试验的机构和设计方法(I):美国为研究院,前瞻性研究,随机分配,多中心研究,双盲法/单盲法,权重=1,否则,权重=0;
最后权重=0.7+(T+P+I)/10。
106、对所述加权异构图形进行排序,获取所述某一类降压药物的不良反应排名信息。
在具体应用中,所述步骤106,可以具体包括:
采用MedRank排序算法,通过第一公式对所述加权异构图形进行进行迭代运算,直到结果收敛于隐定质,以获取所述某一类降压药物的不良反应排名信息;
其中,所述第一公式为:
其中,t∈{1,…,n-1},n为大于1的正整数;X1为目标类型,代表所述某一类降压药物的不良反应;Xt为第t次对象类型;C为中心类型;为X1对象类型在当次迭代的排序分数;U为|X1|×|X1|的单位矩阵,|X1|为X1类型对象之总数,α为决定U/|X1|项之权重;WAB为对象A和B的带权邻接矩阵,表示两者之间的权重链接;为对行进行规化的对角矩阵,其中第i行的对角值为WAB第i行之和。
可理解的是,为确保所述第一公式的迭代收敛于隐定值,本实施例引入了U/|X1|以保证迭代矩阵的连结性(connectivity)。
本实施例的基于文献数据的风险评价方法,利用计算机处理的技术手段,利用计算机处理的技术手段,能够从每类降压药物推荐出相应的最常见不良反应排名信息,从而对降压药物在高血压及其特殊人群中使用的风险进行评价,提高低年资、基层医生、患者对降压药物风险的认知度,减少不良事件的发生,提高降压疗效。该方法能够为低年资、基层医生以及高血压患者提供辅助决策支持,从而更合理的选择降压药物,减少心脑血管疾病的发生。
举例来说,以血管紧张素受体阻断剂(Angiotensin Receptor Blocker,简称ARBs)的不良反应、以及生物医学文献数据库MEDLINE为例,本实施例的基于文献数据的风险评价方法,可以具体包括:
S1、获取生物医学文献数据库MEDLINE中所有文章的摘要数据。
在具体应用中,可通过申请生物医学文献数据库MEDLINE权限,MEDLINE(2015年)的XML格式(109GB)可以从该网站获取(http://www.nlm.nih.gov/bsd/licensee/access/medline_pubmed.html)。每个摘要数据包含一篇文章的目录信息,如文章编号(PMID),文章的标题、作者名单、期刊名称、出版地点、类型、主题词和索引等。
S2、通过限定医学主题词表MeSH来建立与ARBs的不良反应相关的文章的摘要数据库。
其中,MeSH应包含“Humans(人类)”、“Hypertension(高血压)”和“Angiotensin Receptor Blocker”(或“ARBs”)。
其中,所述摘要数据库中每一篇文章的摘要信息可以包括:文字编号、作者与其单位和期刊名称等。
S3、建立衡量与ARBs的不良反应相关的文章质量的数据指标。
其中,所述数据指标包括:文章发表日期和文章类型。
进一步地,所述文章类型,可以包括:荟萃Meta分析、随机对照试验、务实临床试验、双生子研究、对照临床试验、观察性研究、比较研究和病例报告等。
S4、根据所述摘要数据库,提取每篇与ARBs的不良反应相关的文章中的文章、作者、期刊、出版物类型和ARBs的不良反应的信息。
S5、根据提取的信息和所述数据指标,构建加权异构图形。
S6、采用MedRank排序算法,通过第一公式对所述加权异构图形进行进行迭代运算,直到结果收敛于隐定质,以获取所述某一类降压药物的不良反应排名信息;
其中,所述第一公式为:
其中,t∈{1,…,n-1},n为大于1的正整数;X1为目标类型,代表所述某一类降压药物的不良反应;Xt为第t次对象类型;C为中心类型;为X1对象类型在当次迭代的排序分数;U为|X1|×|X1|的单位矩阵,|X1|为X1类型对象之总数,α为决定U/|X1|项之权重;WAB为对象A和B的带权邻接矩阵,表示两者之间的权重链接;为对行进行规化的对角矩阵,其中第i行的对角值为WAB第i行之和。
表1
本实施例的基于文献数据的风险评价方法,利用计算机处理的技术手段,能够从每类降压药物推荐出相应的最常见不良反应排名信息,从而对降压药物在高血压及其特殊人群中使用的风险进行评价,提高低年资、基层医生、患者对降压药物风险的认知度,减少不良事件的发生,提高降压疗效。
图3示出了本发明一实施例提供的一种基于文献数据的风险评价装置的结构示意图,如图3所示,本实施例的基于文献数据的风险评价装置3,包括:摘要数据获取模块31、数据库建立模块32、数据指标建立模块33、提取模块34、图形构建模块35和排名信息获取模块36;
摘要数据获取模块31,用于获取生物医学文献数据库中所有文章的摘要数据;
数据库建立模块32,用于通过限定医学主题词表来建立与某一类降压药物的不良反应相关的文章的摘要数据库;
数据指标建立模块33,用于建立衡量与某一类降压药物的不良反应相关的文章质量的数据指标;
提取模块34,用于根据所述摘要数据库,提取每篇与某一类降压药物的不良反应相关的文章中的文章、作者、期刊、出版物类型和该类降压药物不良反应的信息;
图形构建模块35,用于根据提取的信息和所述数据指标,构建加权异构图形;
排名信息获取模块36,用于对所述加权异构图形进行排序,获取所述某一类降压药物的不良反应排名信息。
其中,本实施例所述生物医学文献数据库可优选为生物医学文献数据库MEDLINE。
其中,本实施例所述摘要数据库中每一篇文章的摘要信息可以包括:文字编号、作者与其单位和期刊名称等。
其中,所述数据指标包括:文章发表日期和文章类型。
进一步地,所述文章类型,可以包括:荟萃Meta分析、随机对照试验、务实临床试验、双生子研究、对照临床试验、观察性研究、比较研究和病例报告等。
在具体应用中,本实施例所述图形构建模块35,可具体用于
根据提取的信息,构建异构图形;
根据所述数据指标,计算所述异构图形各边缘的权重。
在具体应用中,本实施例所述排名信息获取模块36,可具体用于
采用MedRank排序算法,通过第一公式对所述加权异构图形进行进行迭代运算,直到结果收敛于隐定质,以获取所述某一类降压药物的不良反应排名信息;
其中,所述第一公式为:
其中,t∈{1,…,n-1},n为大于1的正整数;X1为目标类型,代表所述某一类降压药物的不良反应;Xt为第t次对象类型;C为中心类型;为X1对象类型在当次迭代的排序分数;U为|X1|×|X1|的单位矩阵,|X1|为X1类型对象之总数,α为决定U/|X1|项之权重;WAB为对象A和B的带权邻接矩阵,表示两者之间的权重链接;为对行进行规化的对角矩阵,其中第i行的对角值为WAB第i行之和。
可理解的是,为确保所述第一公式的迭代收敛于隐定值,本实施例引入了U/|X1|以保证迭代矩阵的连结性(connectivity)。
本实施例的基于文献数据的风险评价装置,能够从每类降压药物推荐出相应的最常见不良反应排名信息,从而对降压药物在高血压及其特殊人群中使用的风险进行评价,提高低年资、基层医生、患者对降压药物风险的认知度,减少不良事件的发生,提高降压疗效。
本实施例的基于文献数据的风险评价装置,可以用于执行前述图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4示出了本发明一实施例提供的一种服务器的结构示意图,如图4所示,本实施例的服务器,包括:图3所示实施例所述的基于文献数据的风险评价装置3。
本实施例的服务器,能够从每类降压药物推荐出相应的最常见不良反应排名信息,从而对降压药物在高血压及其特殊人群中使用的风险进行评价,提高低年资、基层医生、患者对降压药物风险的认知度,减少不良事件的发生,提高降压疗效。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。