基于层次聚类的风险分析方法、装置、设备及存储介质与流程

文档序号:23056462发布日期:2020-11-25 17:35阅读:来源:国知局

技术特征:

1.一种基于层次聚类的风险分析方法,其特征在于,包括:

获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;

根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;

根据所述多个目标相关系数生成多个医院之间的距离矩阵;

对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;

根据所述聚类树进行风险分析,得到风险分析结果。

2.根据权利要求1所述的基于层次聚类的风险分析方法,其特征在于,所述根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数,包括:

分别确定医院i的药品销售额yi和医院j的药品销售额yj;

将所述药品销售额yi和所述药品销售额yj输入到预置的相似度公式中,生成医院i和医院j的相关系数,预置的相似度公式为其中,yi表示医院i的药品销售额,yj表示医院j的药品销售额,i、j为正整数,<>表示均值,ρij为医院i和医院j的相关系数;

计算其他任意两个医院之间的相关系数,得到多个其他相关系数,所述其他任意两个医院不同时包含医院i和医院j;

生成多个目标相关系数,所述多个目标相关系数包括所述医院i和医院j的相关系数和所述多个其他相关系数。

3.根据权利要求1所述的基于层次聚类的风险分析方法,其特征在于,所述根据所述多个目标相关系数生成多个医院之间的距离矩阵,包括:

根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离;

基于所述多个初始距离生成距离矩阵,所述距离矩阵用于指示任意两个医院之间的距离。

4.根据权利要求3所述的基于层次聚类的风险分析方法,其特征在于,所述根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离,包括:

调用预置的距离公式计算每个目标相关系数对应的距离,得到多个初始距离,d(i,j)表示医院i和医院j之间的距离,所述预置的距离公式为:

5.根据权利要求1-4中任意一项所述的基于层次聚类的风险分析方法,其特征在于,所述对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇,包括:

对所述距离矩阵进行剪枝操作,得到剪枝后的距离矩阵;

对所述剪枝后距离矩阵进行层次聚类,生成聚类树。

6.根据权利要求5所述的基于层次聚类的风险分析方法,其特征在于,所述对所述距离矩阵进行剪枝操作,得到剪枝后的距离矩阵,包括:

将所述距离矩阵转换为无向图;

利用预置算法和所述无向图生成最小生成树;

基于所述最小生成树对所述距离矩阵进行剪枝,得到剪枝后的距离矩阵。

7.根据权利要求5所述的基于层次聚类的风险分析方法,其特征在于,所述对所述剪枝后距离矩阵进行层次聚类,生成聚类树,包括:

调用预置的矩阵距离公式计算所述剪枝后的距离矩阵中每个数据点的距离,得到多个距离,预置的矩阵距离公式为d表示任意两个数据点之间的距离;

将多个距离中最近的两个数据点进行层次聚类,得到多个数据类别,数据类别包括数据点和数据组合,并迭代执行层次聚类过程直至距离矩阵转换为多个簇,生成聚类树。

8.一种基于层次聚类的风险分析装置,其特征在于,包括:

获取模块,用于获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;

计算模块,用于根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;

生成模块,用于根据所述多个目标相关系数生成多个医院之间的距离矩阵;

聚类模块,用于对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;

分析模块,用于根据所述聚类树进行风险分析,得到风险分析结果。

9.一种基于层次聚类的风险分析设备,其特征在于,所述基于层次聚类的风险分析设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;

所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于层次聚类的风险分析设备执行如权利要求1-7中任意一项所述的基于层次聚类的风险分析方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被处理器执行时实现如权利要求1-7中任意一项所述的基于层次聚类的风险分析方法。


技术总结
本发明涉及人工智能领域,公开了基于层次聚类的风险分析方法、装置、设备及存储介质,应用于智慧医疗领域中,通过对时间序列数据进行降噪和剪枝处理,避免陷入维数灾难,增强风险分析结果的可信度。本发明方法包括:获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;根据所述多个目标相关系数生成多个医院之间的距离矩阵;对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;根据所述聚类树进行风险分析,得到风险分析结果。

技术研发人员:郭建福;张旭
受保护的技术使用者:平安医疗健康管理股份有限公司
技术研发日:2020.08.31
技术公布日:2020.11.24
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1