一种建立中医数据库的方法

文档序号:6533859阅读:534来源:国知局
专利名称:一种建立中医数据库的方法
技术领域
本发明涉及一种建立中医数据库的方法,特别涉及一种可以进行科学分析、统计的中医数据库的建立方法。
背景技术
中医学的精髓在哪里?在《黄帝内经》、《神农本草经》等医学巨著里,在张仲景、张景岳等中医大家的学术思想里。然而中医学是实践医学,其精髓也应存在于历代名老中医的临床医案里。但上述医书、案例等资料浩如烟海,人工是不可能进行科学的分析和统计的。随着计算机软硬件技术的发展,利用计算机系统建立数据库,对中医进行分析和统计提供了可能。但现有的数据库常常是将医学书籍和医案进行简单的录入,多半只具有检索功能,不能进行科学分析和统计,例如,不能定量地说明其中哪些病因或病理结果对引起某证候更重要,哪些症状对辨识某证候更重要,哪些用药对治疗某证候更重要,更很少介绍哪些病因或病理结果、症状和用药对某证候一定不重要。

发明内容本发明为了克服以上技术的不足,提供了一种可以进行科学分析、统计的中医数据库的建立方法。
本发明是通过以下措施来实现的本发明的建立中医数据库的方法,是利用计算机系统,将医案参数按二值变量,录入计算机,其中医案涉及的参数赋值为1,未涉及的参数赋值为0。
本发明的建立中医数据库的方法,所述的医案参数为病名、病位、病因或病理结果、证型、症状及用药的二种或二种以上。
本发明的建立中医数据库的方法,所述的计算机系统以VisualFoxPro 6.0为开发平台,编制计算机软件。
采用本发明的方法,将一些医案建立数据库,然后进行统计分析,可望使分类、命名和诊断严重不统一的中医证候统计规范化,并能为中医教学、临床和科研提供参考数据。
利用本发明的数据库,使用Logistic回归分析统计方法筛选并定量地表达了脾、肺、肾、肝、心、胃在疾病过程中的常见临床证候,与某一证候正相关和负相关的病因或病理结果、症状和用药。并据统计结果总结出五脏疾病的发病规律和生理功能。
对常见临床症状的临床证型、发病部位、病因或病理结果、伴随症状和常用药物进行统计,对常见临床证型的病因或病理结果、常见症状和常用药物进行统计,编辑成“中医统计诊断”,将部分症状、证型、病因或病理结果、用药统计规范化,对疾病的诊断、用药、制药提供一种规范化的指导,促进中药的标准化、规范化、科学化。
利用本发明的方法建立的中医数据库,具备数字化输入,输入简单、快捷。利用本发明的中医数据库,可以对医案进行科学的统计、分析,实现中医辨证用药的标准化、规范化、科学化。


附图为本发明中脾虚湿盛的病因个数与AIC的关系具体实施方式
下面以《全国中医图书联合目录》为例建立数据库。
1数据库的建立1.1医案的纳入标准①以《全国中医图书联合目录》为指导,以山东中医药大学图书馆藏书为基础,挑选宋、元、明、清及近代的中医临床名家的医案;②医案的辨证用药遵循中医学的传统思路;③若属对患者多次复诊的医案,则由二诊时的疗效决定是否仅录入初诊部分,以使各医案之间相对独立。
1.2医案的排除标准①没有临床症状或用药的医案;②参考西医诊断或理化检查结果用药的医案;③复诊的医案;④表述不规范,容易产生歧义的医案。
1.3编制计算机软件以高等中医院校全国统编教材《中医诊断学》、《中药学》、《中医内科学》等为蓝本,对所有医案涉及的内容如病名(501个)、病位(80个)、病因或病理结果(100个)、综合证型(186个)、症状(817个)及用药(781味)等进行分类、编号和西文命名。以Visual FoxPro 6.0为开发平台,编制计算机操作软件,使得这些内容都成为取值为0或1的二值变量。
1.4医案的录入录入员只需用鼠标将某一医案所涉及的内容点击一遍,即把他们赋值为1,其他未点击的部分则自动赋值为0。在录入过程中,要求尊重原著,不容许任何主观意志的介入。初步录入的医案经由核查人员的两次审核合格后方被正式录用。共录入了156位中医临床名家的医案22,459条。
1.5数据库的优化将所有变量分成症状、病名、辨证及用药四类,使得每一类中的变量都是相对独立的变量。如果在某一类中没有任何变量取值为1,则将所有该类中的变量视为数据空缺。
2统计采用国际通用的SAS 6.12统计软件的非条件Logistic多元逐步回归法进行统计。这里的“非条件”是针对成组设计的资料进行的分析,Logistic回归是处理二值型因变量的回归方法,逐步回归包括两个相反的过程①不断从模型以外的变量中挑选“重要”的引入模型。②对引入模型的变量进行综合分析,将那些“不重要”的变量从模型中剔除。
2.1自变量的筛选原则①以某一被研究对象如肝气郁结为因变量,从80个常见病位中筛选伴随的发病部位,从100个常见病因或病理结果中筛选病因或病理结果,从817个常见症状中筛选症状,从781种常用药物中筛选用药,被选中的对象称为自变量。②随着被选入的自变量数增加,模型反映实际问题的能力(即拟合优度)不断增强,表述拟合优度的指标AIC不断下降。如图1为研究脾虚湿盛证的病因时获得的自变量个数与AIC的关系,显然,当自变量数为4时,AIC的下降速度由快转慢。从判断回归方程预测准确性的统计量Concordant(和谐)的值也容易发现,当自变量数是4时,Concordent=74.5%,当自变量数增加至14个时,Concordent=81.7%。亦即,后增的10个病因仅使模型的预测准确性升高7.2%。故4个病因是我们期望获得的自变量较少而拟合优度较高的简约模型。③进入模型的自变量在进行Waldχ2检验时应至少在α=0.05水平上统计显著。
2.2统计结果的表达以肝气郁结的统计结果为例。全国统编教材《中医诊断学》认为,肝气郁结的常见症状是胁痛、胁胀、善太息、月经紫黯、乳房胀痛、咽如物梗,吐咽不解、瘕聚、脉弦等。但在这些症状中哪些是肝气郁结的主要症状,哪些是肝气郁结的特异性症状,我们没有统一的认识。借助上述统计分析,我们发现肝气郁结的症状Logit(p)=-3.7425+1.2319脉弦(0.2938)+1.5179胁胀(0.0925)+1.2752胁痛(0.1396)+2.2004太息(0.0605)+1.4912月经紫黯(0.0672)+1.1407嗳气(0.0708)-0.9208咳嗽(-0.1791)+1.7171咽如物梗,吐咽不解(0.0655)+0.5222脉沉(0.0846)+1.0890瘕聚(0.0656)+1.7796乳房胀痛(0.0489)-0.7652发热(-0.1357)。
模型评价对于每一自变量都有Waldχ2>26.9,p=0.0001。Concordant=67.6%。
其中,①所有症状是从817个临床症状中筛选出来的;②症状的排列顺序为进行Logistic回归时各症状进入模型的先后顺序;③症状前的数值是偏回归系数,其正、负号表示该症状对肝气郁结的正、负面影响。偏回归系数的自然指数又称发生比率(Odds Ratio)。例如善太息的发生比率为exp(2.2004)=9.0287,表示仅有善太息一个症状发生时诊断为肝气郁结的概率与不诊断为肝气郁结的概率之比,是所有症状都不发生时诊断肝气郁结的概率与不诊断肝气郁结的概率之比的9.0287倍。亦即,善太息是诊断肝气郁结的重要症状或特异性症状。同理,发热的发生比率是exp(-0.7652)=0.4652,说明发热一般不见于肝气郁结。容易理解,对于某一证候来说,偏回归系数为负值的症状可用作该证候的鉴别诊断;④由于各症状的度量尺度不同,如“胁胀”由不发生到发生的变化与“脉弦”由不发生到发生的变化是不同的,使得不同症状对诊断肝气郁结的影响大小不能比较。若将数据库中各症状和因变量的值分别减去其平均值,再除以各自的标准差(这一过程又叫变量的标准化),就使之转化为无量纲的变量,就使各症状对诊断肝气郁结的影响大小具有了可比性。在上述统计结果中,各症状后的数值(括号内)是标准化回归系数,其大小表示在整体考虑所有被纳入的症状时,各个症状对诊断肝气郁结的影响程度。因此,标准化回归系数较高的症状如脉弦是肝气郁结的主要症状。
由回归方程可知,按照各症状对肝气郁结的贡献度,由大到小依次是脉弦(0.2938)、胁痛(0.1396)、胁胀(0.0925)、脉沉(0.0846)、嗳气(0.0708)、月经紫黯(0.0672)、瘕聚(0.0656)、咽如物梗,吐咽不解(0.0655)、善太息(0.0605)、乳房胀痛(0.0489)。按照各症状对判断肝气郁结的特异性,由强到弱依次是2.2004太息、1.7796乳房胀痛、1.7171咽如物梗,吐咽不解、1.5179胁胀、1.4912月经紫黯、1.2752胁痛、1.2319脉弦、1.1407嗳气、1.0890瘕聚、0.5222脉沉。而咳嗽、发热不是肝气郁结的症状,可用做鉴别诊断。
3已有的统计结果(1)脏腑病辨证用药的Logistic回归分析 统计筛选并定量地表达了脾、肺、肾、肝、心、胃在疾病过程中的常见临床证候,与某一证候正相关和负相关的病因或病理结果、症状和用药。并据统计结果总结出五脏疾病的发病规律和生理功能。
(2)《中医统计诊断》对332个常见临床症状的临床证型、发病部位、病因或病理结果、伴随症状和常用药物进行了统计。对110个常见临床证型的病因或病理结果、常见症状和常用药物也进行了统计。编辑成的《中医统计诊断》作为“新世纪全国高等中医药院校创新教材”由中国中医药出版社出版,这一工作可望使《中医诊断学》中的部分症状、证型、病因或病理结果、用药统计规范化。
权利要求
1.一种中医数据库的建立方法,其特征在于利用计算机系统,将医案参数按二值变量,录入计算机,其中医案涉及的参数赋值为1,未涉及的参数赋值为0。
2.根据权利要求1所述的中医数据库的建立方法,其特征在于所述的医案参数为病名、病位、病因或病理结果、证型、症状及用药的二种或二种以上。
3.根据权利要求1所述的中医数据库的建立方法,其特征在于所述的计算机系统以Visual FoxPro 6.0为开发平台,编制计算机软件。
全文摘要
本发明涉及一种建立中医数据库的方法,以解决目前的中医数据库不能进行科学分析、统计的问题。本发明的建立中医数据库的方法,是利用计算机系统,将医案参数按二值变量,录入计算机,其中医案涉及的参数赋值为1,未涉及的参数赋值为0。利用本发明的方法建立的中医数据库,具备数字化输入,输入简单、快捷。利用本发明的中医数据库,可以对医案进行科学的统计、分析,实现中医辨证用药的标准化、规范化、科学化。
文档编号G06F17/30GK1658196SQ20051004222
公开日2005年8月24日 申请日期2005年3月24日 优先权日2005年3月24日
发明者张启明 申请人:山东中医药大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1