本发明涉及中药相关领域,特别是一种基于数据挖掘分析法的肺癌治疗核心处方发现方法。
背景技术:
肺癌是全球常见的恶性肿瘤之一,为目前人类因癌症死亡的主要原因,是对人类健康与生命危害最大的恶性肿瘤之一。据统计,2011年全球肺癌的发病人数为16.08万人。目前对于晚期非小细胞肺癌,以铂类为基础的联合化疗被认为是其标准治疗方案,但总体疗效显示中位生存时间不到10个月,很少有患者的生存时间超过2年,临床疗效达到了一个“瓶颈”期,且毒副反应大。
在中国,大部分肿瘤患者接受中医药治疗。中医药与手术、放疗、化疗、热疗、生物治疗及靶向药物结合等结合均显示出一定优势。目前用于治疗晚期肺癌的中成药或中药复方种类繁多,但大部分中成药含有抗癌中草药的比例偏低,或仅有抗癌中草药,导致治疗效果表现单一,成效不佳,为此需要一种能够发现新肺癌治疗处方的方法,从而进行肺癌的治疗。
技术实现要素:
本发明的目的是为了解决上述问题,发现了一种基于数据挖掘分析法的肺癌治疗核心处方,具有简单快捷的功能,可方便临床医生快速使用,解决了现有的医疗处方中关于治疗肺癌的处方过少的问题,通过将相关治疗肺癌的处方录入到中医传承辅助平台软件(v2.5)中,通过软件进行有效的分析,从而得到关于治疗肺癌的核心处方,从而方便医务人员的研究。
实现上述目的本发明的技术方案为,一种基于数据挖掘分析法的肺癌治疗核心处方发现方法,包括以下步骤:
步骤一:选取资料
1996年1月-2018年12月,中国知网数据库收录的期刊文献中,省级及省级以上名医治疗肺癌的处方,肺癌诊断标准参考《内科学》,排除动物实验类、外治法类、无具体药物或药物组成不完整及组成相同的处方,最终选出符合标准的处方126个;
步骤二:数据录入系统
药物名称参照《中华人民共和国药典》进行规范,如将如墨旱莲、旱莲草统一为墨旱莲;山栀子、栀子统一为栀子;土元、土鳖虫统一为土鳖虫;野荞麦、金荞麦统一为金荞麦;夜交藤、首乌藤统一为首乌藤;龟板,龟甲统一为龟甲等;将规范后的中药录入中医传承辅助平台软件(v2.5),录入后双人核对数据;
步骤三:数据统计
在中医传承辅助平台软件(v2.5)“方剂分析”模块中,使用频次统计、关联规则统计方法,分析名医治疗肺癌的用药规律发现核心处方;
①频次分析,首先进行药物频次分析,将药物进行频次统计,并按数值由高到低进行排序;再进行药物功效频次分析,参照《中药学》将药物依功效类别进行分类;
②组方规律分析,通过软件,设置支持度和置信度,得到药对组合,再此基础上进行关联规则分析,将关联规则分析结果进行网络图展示;
步骤四:结果,总结核心处方。
所述数据挖掘关联规则分析发现核心处方中的支持度和置信度为关联规则算法中的一个重要参数,支持度个数:是指药对或药物组合(症状或症状组合)在所选处方(医案)中出现的频次(本参数≤处方(医案)总数)。本参数默认为“处方(医案)数目”的20%,即支持度=20%。支持度(医案)个数=方剂(医案)数量*支持度。可根据实际数据量调节。
置信度:“->”左边为a,右边为b。当a药物出现,b药物出现的概率。(a出现后,本参数越接近1,b出现的几率越高。)如“甘草”出现后,“人参”出现的概率为1,即100%。本参数可根据实际情况调节。
利用本发明的技术方案制作的一种基于数据挖掘分析法的肺癌治疗核心处方发现方法:通过将期刊文献中,关于省级及省级以上名医治疗肺癌的处方录入到中医传承辅助平台软件(v2.5)中,使用频次统计、关联规则统计方法,从而分析名医治疗肺癌的用药规律发现新处方,可以有效的节省医务人员研究新处方的时间,使医务人员研究新处方更加的快捷方便。
附图说明
图1是本发明所述一种基于数据挖掘分析法的肺癌治疗新处方发现方法的流程示意图;
图2是本发明所述药物频次≥30分析表;
图3是本发明所述药物功效频次分析表;
图4是本发明所述频度≥30的药对组合统计表;
图5是本发明所述药物配伍关联规则分析表;
图6是本发明所述药物配伍关联规则网络图;
具体实施方式
下面结合附图对本发明进行具体描述,如图1-6所示,在本实施方案中:
实施例1:频次分析
结合附图2,通过药物频次分析后,筛选出符合标准的处方126首,包含药物272味,将药物进行频次统计,并按数值由高到低进行排序。结果药物频次≥30的有20味,前5位是黄芪、茯苓、白术、麦冬、甘草;
结合附图3,通过药物功效频次分析,参照《中药学》将药物依功效类别进行分类,共分出18个类别,结合药物频次统计药物功效频次,总频次为2326次。药物功效频次≥100的有5类,分别为补虚药、清热药、化痰止咳平喘药、利水渗湿药、活血化瘀药。
实施例2:组方规律分析
通过软件,设置支持度为“25”,置信度为“0.6”;得到药对组合37对,频度≥30的有18对,结合附图4,前4位为白术-茯苓、黄芪-白术、麦冬-黄芪、黄芪-茯苓;在此基础上进行关联规则分析,结合附图5,得到22条药物配对关联规则,其中置信度≥0.8的有6条;结合附图6将关联规则分析结果进行网络图展示,呈现出11味药物之间的组合。
基于以上过程,最终得出的11味药物可以认定为是治疗肺癌的核心处方,处方药物为:黄芪、党参、白术、茯苓、半夏、陈皮、薏苡仁、浙贝母、北沙参、麦冬、白花蛇舌草、甘草。
上述技术方案仅体现了本发明技术方案的优选技术方案,本技术领域的技术人员对其中某些部分所可能做出的一些变动均体现了本发明的原理,属于本发明的保护范围之内。
1.一种基于数据挖掘分析法的肺癌治疗核心处方发现,其特征在于,包括以下步骤:
步骤一:选取资料
1996年1月-2018年12月,中国知网数据库收录的期刊文献中,省级及省级以上名医治疗肺癌的处方,肺癌诊断标准参考《内科学》,排除动物实验类、外治法类、无具体药物或药物组成不完整及组成相同的处方,最终选出符合标准的处方126个;
步骤二:数据录入系统
药物名称参照《中华人民共和国药典》进行规范,如将如墨旱莲、旱莲草统一为墨旱莲;山栀子、栀子统一为栀子;土元、土鳖虫统一为土鳖虫;野荞麦、金荞麦统一为金荞麦;夜交藤、首乌藤统一为首乌藤;龟板,龟甲统一为龟甲等;将规范后的中药录入中医传承辅助平台软件(v2.5),录入后双人核对数据;
步骤三:数据统计
在中医传承辅助平台软件(v2.5)“方剂分析”模块中,使用频次统计、关联规则统计方法,分析名医治疗肺癌的用药规律及发现新处方;
①频次分析,首先进行药物频次分析,将药物进行频次统计,并按数值由高到低进行排序;再进行药物功效频次分析,参照《中药学》将药物依功效类别进行分类;
②关联规则组方规律分析,通过软件,设置支持度和置信度,得到药对组合,再此基础上进行关联规则分析,将关联规则分析结果进行网络图展示;
步骤四:结果,总结核心处方。
2.根据权利要求1所述的一种基于数据挖掘分析法的肺癌治疗核心处方发现,其特征在于,所述数据挖掘关联规则分析发现核心处方中的支持度和置信度为关联规则算法中的一个重要参数;支持度个数:是指药对或药物组合(症状或症状组合)在所选处方(医案)中出现的频次(本参数≤处方(医案)总数),本参数默认为“处方(医案)数目”的20%,即支持度=20%。支持度(医案)个数=方剂(医案)数量*支持度,可根据实际数据量调节;置信度:“->”左边为a,右边为b,当a药物出现,b药物出现的概率;(a出现后,本参数越接近1,b出现的几率越高。)如“甘草”出现后,“人参”出现的概率为1,即100%。本参数可根据实际情况调节。