基于模糊联合聚类方法的针灸处方主穴挖掘方法

文档序号:10687129阅读:357来源:国知局
基于模糊联合聚类方法的针灸处方主穴挖掘方法
【专利摘要】本发明公开一种基于模糊联合聚类方法的针灸处方主穴挖掘方法,包括:将治疗某种疾病的腧穴字段分解成标准腧穴并对其进行转换成处方和腧穴的共现关系;使用模糊联合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧穴的处方和具有相似处方的腧穴;但当针灸数据库中处方集合大于第一阈值且分类多于第二阈值时,采用改进模糊联合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧穴的处方和具有相似处方的腧穴。
【专利说明】
基于模糊联合聚类方法的针灸处方主穴挖掘方法
技术领域
[0001] 本发明涉及数据处理技术领域,具体涉及一种基于模糊联合聚类方法的针灸处方 主穴挖掘方法。
【背景技术】
[0002] 中医腧穴是针灸治疗疾病的施术部位,治疗疾病时对针灸产生刺激点与反应,也 是中医开具针灸处方的依据。在中医针灸治疗过程中,根据经验和病人的特点,不同的医生 针对同一类疾病会采用不同的腧穴治疗配方。因此,一些支持针灸决策的系统的数据库中, 所有医生治疗同一种疾病的采用的不同腧穴组合就会形成集合。研究发现,可以从这些治 疗疾病的腧穴集合中发现某种共性,即某些腧穴在治疗针某种疾病时会被医生普遍采用。 因而考虑挖掘更加可靠的主要腧穴集合问题,揭示腧穴运用特点和配伍规律,如何取得合 理有效的应用研究证据将对提高针灸临床疗效具有非常重要的意义。
[0003] 网络多媒体的检索和过滤最常用的办法就是聚类。该方法根据对象的特性将其聚 集成类,从而同类间的相似性尽可能小,不同类之间相似性尽可能大,这其实是无监督的模 式识别方法。例如K-means聚类法,可以将某个对象(一般以向量表示)集合划分成好几个聚 类或者数据子集,这样同一聚类中各个对象之间的相似性比其他聚类中各个对象之间的 相似性更高。
[0004] 为了提升高维数据的查询效率,通常用聚类算法将相似性高的数据点聚集在一 起。因此聚类算法直接或者间接应用于大量高维数据机构。但传统的聚类算法也有不足之 处,因为只根据对象与对象之间的相似性进行聚类,却没有考虑对象属性之间的相似性。

【发明内容】

[0005] 针对上述问题,本发明提供一种采用模糊联合聚类算法分析针灸临床循证决策支 持系统中的处方数据库,运用联合聚类方法对处方和腧穴进行同时聚类,从而得出针对某 一种疾病的针灸处方相对应的几个主要腧穴集合的基于模糊联合聚类方法的针灸处方主 穴挖掘方法。
[0006] 为达到上述目的,本发明基于模糊联合聚类方法的针灸处方主穴挖掘方法,包括: 将治疗某种疾病的腧穴字段分解成标准腧穴并对其进行转换成处方和腧穴的共现关系;
[0007] 使用模糊联合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧 穴的处方和具有相似处方的腧穴;
[0008] 进一步地,模糊集群的聚类标准如下:
[0010]式⑴中,若第j个腧穴在第i个处方中存在,则dij = 1;否则dij = 0;
[0011]每个簇的聚合度是由定性变量dij、处方和腧穴的隶属度函数Ud和w。」的乘积总和; 通过给处方和腧穴的隶属度函数不断赋值来使聚集度最大化,从而形成模糊簇。处方和腧 穴的隶属度函数如下:
[0014] 其中,i和j分别指代矩阵的行即处方与列即腧穴,c指示聚类数量,Uc;1是处方在聚 类C中的隶属度函数,W。」是腧穴在聚类C中的隶属度函数。
[0015] 当针灸数据库中处方集合大于第一阈值且分类多于第二阈值时,采用改进模糊联 合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧穴的处方和具有相似 处方的腧穴。
[0016] 进一步地,所述的改进模糊集群的聚类方法中,处方簇看作是处方集合{Pu i = 1……M,j = l……N},即每个处方在所有的簇中的权重之和为1,其中M为处方 数,N为聚类数,定义第i行所属的类为C 由此提出改进的模型:
[0017] 其中先求出处方集合中的每一个元素与每类中所有处方元素总和的比率,如果当 第i行取得元素的最大值时,则返回其所属的类C (1) = j,即可得到处方的具体分类结果;
[0018] 腧穴集簇可以看做腧穴集合{Aij| i = l……M,j = l……N},即所有的腧穴在 每一个类中的权重之和为1,其中M为腧穴数,N为聚类数,定义腧穴簇中每列元素 值的最低限制为0,如果,则取其值,从而得出属于每类新的腧穴集合; 〇泛1如|知》8,/ = 1""'.風/=^."..況丨,即可得到腧穴的具体分类结果。
[0019] 有益效果
[0020] 本发明基于模糊联合聚类方法的针灸处方主穴挖掘方法与现有技术具备如下有 益效果:
[0021] 本发明基于模糊联合聚类方法的针灸处方主穴挖掘方法,利用模糊联合聚类思想 并改进来挖掘针对某种疾病所用针灸穴位的主要穴位,实验结果表明,本发明提出的算法 能够很好的挖掘出所用的主穴信息并应用于决策支持系统,经过成都中医药大学老师的鉴 定,该方法非常实用。接下来,为了给用户提供友好的用户界面,可以将挖掘出来的主穴信 息在决策系统中以可视化的方式显示出来,从而提高决策支持系统的辅助能力。
【具体实施方式】
[0022]下面对本发明做进一步的描述。
[0023] 实施例
[0024] 本实施例基于模糊联合聚类方法的针灸处方主穴挖掘方法,包括:将治疗某种疾 病的腧穴字段分解成标准腧穴并对其进行转换成处方和腧穴的共现关系;
[0025] 使用模糊联合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧 穴的处方和具有相似处方的腧穴;
[0026] 当针灸数据库中处方集合大于第一阈值且分类多于第二阈值时,采用改进模糊联 合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧穴的处方和具有相似 处方的腧穴。
[0027] 模糊联合聚类FCR(Fuzzy Co-clustering with Ruspini ' s condition)即同时对 矩阵的行和列进行聚类,优势突出,广泛应用在数据分析和协同过滤等领域。为了获得模糊 聚类,给出联合聚类算法聚类准则的定义,见式(1)。在这个定义之下,那些具有高度彼此相 关性的个体和属性将会聚集起来。在这个意义上说,我们把聚合度作为聚类准则。模糊集群 的聚类标准如下:
[0029]式(1)中,若第j个腧穴在第i个处方中存在,则dij = l;否则dij = 0。每个簇的聚合 度是由定性变量dij、处方和腧穴的隶属度函数Ud和w。」的乘积总和。通过给处方和腧穴的隶 属度函数不断赋值来使聚集度最大化,从而形成模糊簇。处方和腧穴的隶属度函数如下:
[0032]其中,i和j分别指代矩阵的行(处方)与列(腧穴),c指示聚类数量,Uc;1是处方在聚 类C中的隶属度函数,W。」是腧穴在聚类C中的隶属度函数。
[0033]本专利提出的联合聚类算法是通过优化目标函数实现聚合度的最大化,采用熵的 最大化和拉格朗子乘法来构造目标函数如公式(4)。目标函数的解法是已知必备的条件通 过迭代处理,达到局部最小值。通过使用该方法,可以一次获得全部数据集的聚类结果。模 糊聚类后,可以得到全部处方和腧穴所属的簇。
[0035]其中M,yc是不同的拉格朗日乘数。(4)式中的第二项和第三项把熵的最大化描述 成正则表达式,这个方法在模糊c-means算法中运用第一次被Miyamoto等人提出[10]。它能 让我们获得模糊聚类。T u和Tu是指明模糊度的权值参数,余下描述的是隶属度约束条件,也 就是(1)式和(2)式.。从优化目标函数R的必需条件,也就是3170^=0和0L/0~=O,得到 如下等式:
[0038]根据前面的论述分析,主要改进的是在模糊联合聚类的基础上将处方和腧穴作进 一步的细粒度分类。我们将表1中处方簇看作是处方集合{Pij|i = l……M,j = l……N},即每 个处方在所有的簇中的权重之和为1。其中M为处方数,N为聚类数,定义第i行所属的类为 C(i)。由此提出改进的模型:

[0040]其中先求出处方集合中的每一个元素与每类中所有处方元素总和的比率,然后如 果当第i行取得元素的最大值时,则返回其所属的类C⑴=j,即可得到处方的具体分类结 果。下面给出了 一个对FCR-PA进行解释的简单例子。
[0041 ]例如:治疗中风表格1和表格2的数据对FRC-PA的解释。
[0042] 表1中风处方簇
[0045]表2中风腧穴簇
[0047] {i = 1……M,j = 1……N},即所有的腧穴在每一个类中的权重之和为1:其中M为腧 穴数,N为聚类数,首先定义腧穴簇中每列元素值的最低限制为如果夂 则取其值,从 而得出属于每类新的腧穴集合:仰=丨心|心>5,/ = 1……M,j = 1……#丨。通过进一步的 规范,即可得到腧穴的具体分类结果。如下实例1是对该模型的进一步阐述,由表1的处方集 合可以转化成矩阵所示:
[0049] 然后求出每行的最大值,由模型可知当取得矩阵中每行元素的最大值所对应的变 量j,既是第i行所属的类C(i)。
[0050] 本发明使用模糊联合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有 相似腧穴的处方和具有相似处方的腧穴。但是当针灸数据库中处方集合比较大且分类更多 时,这种算法不足以把处方和腧穴更好聚类。本发明提出使用改进的FCR-PA算法进一步的 细粒度分类,可以清晰地辨别出处方和腧穴的所属类。该方法能够有效地挖掘出治疗某一 种疾病的主要腧穴,为不同的医生问诊提供有价值的决策支持。
[0051] 对本发明应当理解的是,以上所述的实施例,对本发明的目的、技术方案和有益效 果进行了进一步详细的说明,以上仅为本发明的实施例而已,并不用于限定本发明,凡是在 本发明的精神原则之内,所作出的任何修改、等同替换、改进等,均应包含在本发明的保护 范围之内,本发明的保护范围应该以权利要求所界定的保护范围为准。
【主权项】
1. 一种基于模糊联合聚类方法的针灸处方主穴挖掘方法,其特征在于,包括:将治疗某 种疾病的腧穴字段分解成标准腧穴并对其进行转换成处方和腧穴的共现关系; 使用模糊联合聚类方法对处方和腧穴进行同时聚类,分别找出集群中具有相似腧穴的 处方和具有相似处方的腧穴; 当针灸数据库中处方集合大于第一阈值且分类多于第二阈值时,使用改进的模糊联合 聚类算法进一步的细粒度分类,辨别出处方和腧穴的所属类采用改进模糊联合聚类算法对 处方和腧穴进行同时聚类,分别找出集群中具有相似腧穴的处方和具有相似处方的腧穴。2. 根据权利要求1所述的基于模糊联合聚类方法的针灸处方主穴挖掘方法,其特征在 于,模糊集群的聚类标准如下:式⑴中,若第j个腧穴在第i个处方中存在,则dij = 1;否则dij = 0; 每个簇的聚合度是由定性变量dij、处方和腧穴的隶属度函数Ud和w。」的乘积总和;通过 给处方和腧穴的隶属度函数不断赋值来使聚集度最大化,从而形成模糊簇,处方和腧穴的 隶属度函数如下:其中,i和j分别指代矩阵的行即处方与列即腧穴,c指示聚类数量,Uc;1是处方在聚类c中 的隶属度函数,W。」是腧穴在聚类C中的隶属度函数。3. 根据权利要求1所述的基于模糊联合聚类方法的针灸处方主穴挖掘方法,其特征在 于,所述的改进模糊集群的聚类算法中,处方簇看作是处方集合{Pd i = l……M,j = l…… N},即每个处方在所有的簇中的权重之和为1,其中M为处方数,N为聚类数,定义第i行所属 的类为C⑴由此提出改进的模型:其中先求出处方集合中的每一个元素与每类中所有处方元素总和的比率,如果当第i 行取得元素的最大值时,则返回其所属的类C(1) = j,即可得到处方的具体分类结果; 腧穴集簇可以看做腧穴集合{Aij| i = l……M,j = l……N},即所有的腧穴在每一个 类中的权重之和为1,其中M为腧穴数,N为聚类数,定义腧穴簇中每列元素值的最 低限制为3,如果则取其值,从而得出属于每类新的腧穴集合; {^}\^>8,i = l……髮,J_ = 1 _"况丨,即得到腧穴的具体分类结果。
【文档编号】G06F17/30GK106055631SQ201610367442
【公开日】2016年10月26日
【申请日】2016年5月27日
【发明人】郑皎凌, 舒红平, 高燕, 罗飞, 曹亮, 刘魁, 李骥
【申请人】成都成信高科信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1