可视化方法、可视化装置、计算机设备和存储介质与流程

文档序号:18192833发布日期:2019-07-17 05:39阅读:163来源:国知局
可视化方法、可视化装置、计算机设备和存储介质与流程

本发明涉及医疗数据可视化技术领域,具体而言,涉及结构化医疗数据的可视化方法、结构化医疗数据的可视化装置、计算机设备和计算机可读存储介质。



背景技术:

目前,数据挖掘是对大量数据进行加工、分类、聚类等处理,并利用统计分析和逻辑分析的方式挑选出有用信息的过程,包括对数据进行特征提取。而随着数字化技术在医疗领域的应用,医疗数据量越来越大,蕴含着许多有价值的信息资源,并且医疗数据挖掘具有广泛的应用领域,包括:医疗活动辅助诊断、医疗质量管理、医学信息处理、医药研发、生物医学、医学图像等。

但是,医疗数据具有模式多态性(比如同病多名)、不完整性、时间性、冗余性和隐私性等特点,从而对数据挖掘工作构成了挑战,尤其其中的非结构化数据更是难以分析。所以针对结构化医疗数据进行数据挖掘,是医疗数据挖掘一个较好的突破口。

因此,如何使得用户更加方便地对结构化医疗数据进行挖掘,实现结构化医疗数据的可视化成为亟待解决的技术问题。



技术实现要素:

本发明正是基于上述问题,提出了一种新的技术方案,可以有效地实现对结构化医疗数据的可视化,从而使得用户更加方便地对结构化医疗数据进行挖掘。

有鉴于此,本发明的第一方面提出了一种结构化医疗数据的可视化方法,包括:获取各医疗病案中包含的各预设结构化变量的基本信息;根据对每个预设结构化变量的基本信息的统计分析结果形成每个预设结构化变量对应的信息分布视图和/或形成不同预设结构化变量之间的变量关系视图;输出并展示信息分布视图和/或变量关系视图。

在该技术方案中,通过对各医疗病案中包含的每个预设结构化变量的基本信息进行统计分析,进而不仅可以针对每个预设结构化变量绘制其信息分布视图还可以绘制体现不同的预设结构化变量之间的关联性的变量关系视图,并能够进行信息分布视图和/或变量关系视图的输出展示,实现了对结构化医疗数据的可视化处理,以使用户能够更加直观地了解结构化医疗数据的基本信息情况,从而使得用户更加方便地对结构化医疗数据进行挖掘,不仅节省了人力资源,还能够提高数据挖掘的效率。

在上述技术方案中,优选地,在获取各医疗病案中包含的各预设结构化变量的基本信息的步骤之前,还包括:检测是否接收到用户输入的针对各医疗病案的分类指令;若是,按照分类指令中包含的预设分类标准将所有医疗病案进行分类,以针对分类得到的每个医疗病案组别分别执行获取其中每个医疗病案中包含的各预设结构化变量的基本信息并形成信息分布视图和/或变量关系视图的步骤;若否,直接执行获取各医疗病案中包含的各预设结构化变量的基本信息的步骤。

在该技术方案中,进一步地为了更方便地实现结构化医疗数据的可视化,并使得到的预设结构化变量的信息分布视图和/或预设结构化变量之间的变量关系视图更加直观地展示其基本信息数据情况,可以预先根据用户的实际需求对需要进行可视化处理的所有医疗病案进行分类,实现更有针对性的结构化医疗数据的数据挖掘。

在上述任一技术方案中,优选地,各预设结构化变量的基本信息包括之一或多种的组合:变量属性信息、变量类型信息和变量取值信息;以及根据对每个预设结构化变量的基本信息的统计分析结果形成每个预设结构化变量对应的信息分布视图的步骤,具体包括:当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为连续变量时,获取每个预设结构化变量的变量取值信息中处于预设区间内的第一目标变量取值信息,采用第一预设图形表示第一目标变量取值信息对应的信息分布视图;当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为离散变量时,获取每个预设结构化变量的变量取值信息中的频数高于预设值的第二目标变量取值信息,采用第二预设图形表示第二目标变量取值信息对应的信息分布视图。

在该技术方案中,各医疗病案中包含的各预设结构化变量的基本信息包括但不限于以下之一或多种的组合:变量属性信息,比如字符属性、数值属性、时间属性等;变量类型信息,比如离散型变量、连续型变量;变量取值信息,比如取值区间、取值类别等。

进一步地,当通过对每个预设结构化变量的基本信息进行分析确定了其所属的变量类型后则可以采用相应地可视化图形对其进一步进行可视化处理,具体地可以根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其变量类型,进而基于此对其变量取值信息进行自动化处理,以能够合理地展示数据过滤掉不好的数据点,然后绘制图形实现可视化,则当预设结构化变量为连续变量时,可以根据连续的取值区间的分布特点,截取有意义的区间,即过滤掉异常值或不重要的区间,使其取值区间位于预设区间内,具体地可以通过柱状图、箱线图等展示连续变量的信息分布视图,而当预设结构化变量为离散变量时,可以根据该预设结构化变量的取值类别的频数分布特点,挑选频数高于预设值的取值类别,具体可以通过饼图、条形图等展示离散变量的信息分布视图。通过以上方案,可以将预设结构化变量的不良数据过滤掉,只根据合理、有意义的数据构建其信息分布视图,从而保证了构建信息分布视图的准确性。

其中,用于对连续变量的取值情况进行过滤处理的预设区间和用于对离散变量的取值情况进行过滤处理的预设值可以根据实际需要进行具体设置。进一步地,当预设结构化变量为可以自然排序的变量时,比如时间,则可以先进行排序,然后再进行取值的过滤以及相应地可视化处理。

在上述任一技术方案中,优选地,根据对每个预设结构化变量的基本信息的统计分析结果形成不同预设结构化变量之间的变量关系视图的步骤,具体包括:获取至少一个预设统计主题;确定各预设结构化变量中与每个预设统计主题关联的目标结构化变量;根据对目标结构化变量的基本信息的统计分析结果形成与每个预设统计主题关联的各目标结构化变量之间的变量关系视图,并采用第三预设图形表示与每个预设统计主题关联的各目标结构化变量之间的变量关系视图。

在该技术方案中,可以通过预先设定常用的统计主题的形式构建不同预设结构化变量之间的变量关系视图,即将与同一预设统计主题有关的预设结构化变量进行汇总,并基于对筛选出的目标结构化变量的基本信息的统计分析生成与同一预设统计主题关联的各目标结构化变量之间的变量关系视图,进一步地可以采用平行坐标图、星形图、矩阵散点图、多面体图等更加直观地展示不同的结构化变量之间的统计关系。

其中,预设统计主题包括但不限于:医疗费用主题、治疗效果主题、疾病主题、时间主题。

在上述任一技术方案中,优选地,结构化医疗数据的可视化方法还包括:当接收到用户输入的调节指令时,根据调节指令中包含的调节参数对应调节预设分类标准、预设区间、预设值、预设统计主题、第一预设图形、第二预设图形和第三预设图形中的一个或多个。

在该技术方案中,为了使对结构化医疗数据的可视化结果更加满足用户的需求,以便于后续的数据挖掘等,可以在实现可视化的过程中和输出相应的视图后根据用户的需求调节相应的参数,实现结构化医疗数据的可视化过程中友好的人机交互功能,提升用户体验;具体地,用户至少可以对用于对医疗病案进行分类的预设分类标准、过滤各预设结构化变量的取值的预设区间和预设值以及设定的预设统计主题,并且还可以改变结构化医疗数据的可视化的视图形式。

本发明的第二方面提出了一种结构化医疗数据的可视化装置,包括:获取模块,用于获取各医疗病案中包含的各预设结构化变量的基本信息;处理模块,用于根据对获取模块获取的每个预设结构化变量的基本信息的统计分析结果形成每个预设结构化变量对应的信息分布视图和/或形成不同预设结构化变量之间的变量关系视图;输出模块,用于输出并展示信息分布视图和/或变量关系视图。

在该技术方案中,通过对各医疗病案中包含的每个预设结构化变量的基本信息进行统计分析,进而不仅可以针对每个预设结构化变量绘制其信息分布视图还可以绘制体现不同的预设结构化变量之间的关联性的变量关系视图,并能够进行信息分布视图和/或变量关系视图的输出展示,实现了对结构化医疗数据的可视化处理,以使用户能够更加直观地了解结构化医疗数据的基本信息情况,从而使得用户更加方便地对结构化医疗数据进行挖掘,不仅节省了人力资源,还能够提高数据挖掘的效率。

在上述技术方案中,优选地,结构化医疗数据的可视化装置还包括:检测模块,用于在获取模块获取各医疗病案中包含的各预设结构化变量的基本信息之前,检测是否接收到用户输入的针对各医疗病案的分类指令;分类模块,在检测模块检测接收到分类指令时,按照分类指令中包含的预设分类标准将所有医疗病案进行分类,以针对分类得到的每个医疗病案组别分别执行获取其中每个医疗病案中包含的各预设结构化变量的基本信息并形成信息分布视图和/或变量关系视图的步骤;以及获取模块在检测模块检测未接收到分类指令时,直接执行获取各医疗病案中包含的各预设结构化变量的基本信息的步骤。

在该技术方案中,进一步地为了更方便地实现结构化医疗数据的可视化,并使得到的预设结构化变量的信息分布视图和/或预设结构化变量之间的变量关系视图更加直观地展示其基本信息数据情况,可以预先根据用户的实际需求对需要进行可视化处理的所有医疗病案进行分类,实现更有针对性的结构化医疗数据的数据挖掘。

在上述任一技术方案中,优选地,各预设结构化变量的基本信息包括之一或多种的组合:变量属性信息、变量类型信息和变量取值信息;以及处理模块具体用于:当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为连续变量时,获取每个预设结构化变量的变量取值信息中处于预设区间内的第一目标变量取值信息,采用第一预设图形表示第一目标变量取值信息对应的信息分布视图;当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为离散变量时,获取每个预设结构化变量的变量取值信息中的频数高于预设值的第二目标变量取值信息,采用第二预设图形表示第二目标变量取值信息对应的信息分布视图。

在该技术方案中,各医疗病案中包含的各预设结构化变量的基本信息包括但不限于以下之一或多种的组合:变量属性信息,比如字符属性、数值属性、时间属性等;变量类型信息,比如离散型变量、连续型变量;变量取值信息,比如取值区间、取值类别等。

进一步地,当通过对每个预设结构化变量的基本信息进行分析确定了其所属的变量类型后则可以采用相应地可视化图形对其进一步进行可视化处理,具体地可以根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其变量类型,进而基于此对其变量取值信息进行自动化处理,以能够合理地展示数据过滤掉不好的数据点,然后绘制图形实现可视化,则当预设结构化变量为连续变量时,可以根据连续的取值区间的分布特点,截取有意义的区间,即过滤掉异常值或不重要的区间,使其取值区间位于预设区间内,具体地可以通过柱状图、箱线图等展示连续变量的信息分布视图,而当预设结构化变量为离散变量时,可以根据该预设结构化变量的取值类别的频数分布特点,挑选频数高于预设值的取值类别,具体可以通过饼图、条形图等展示离散变量的信息分布视图。通过以上方案,可以将预设结构化变量的不良数据过滤掉,只根据合理、有意义的数据构建其信息分布视图,从而保证了构建信息分布视图的准确性。

其中,用于对连续变量的取值情况进行过滤处理的预设区间和用于对离散变量的取值情况进行过滤处理的预设值可以根据实际需要进行具体设置。进一步地,当预设结构化变量为可以自然排序的变量时,比如时间,则可以先进行排序,然后再进行取值的过滤以及相应地可视化处理。

在上述任一技术方案中,优选地,处理模块具体包括:获取子模块,用于获取至少一个预设统计主题;确定子模块,用于确定各预设结构化变量中与每个预设统计主题关联的目标结构化变量;处理子模块,用于根据对目标结构化变量的基本信息的统计分析结果形成与每个预设统计主题关联的各目标结构化变量之间的变量关系视图,并采用第三预设图形表示与每个预设统计主题关联的各目标结构化变量之间的变量关系视图。

在该技术方案中,可以通过预先设定常用的统计主题的形式构建不同预设结构化变量之间的变量关系视图,即将与同一预设统计主题有关的预设结构化变量进行汇总,并基于对筛选出的目标结构化变量的基本信息的统计分析生成与同一预设统计主题关联的各目标结构化变量之间的变量关系视图,进一步地可以采用平行坐标图、星形图、矩阵散点图、多面体图等更加直观地展示不同的结构化变量之间的统计关系。

其中,预设统计主题包括但不限于:医疗费用主题、治疗效果主题、疾病主题、时间主题。

在上述任一技术方案中,优选地,结构化医疗数据的可视化装置还包括:调节模块,用于当接收到用户输入的调节指令时,根据调节指令中包含的调节参数对应调节预设分类标准、预设区间、预设值、预设统计主题、第一预设图形、第二预设图形和第三预设图形中的一个或多个。

在该技术方案中,为了使对结构化医疗数据的可视化结果更加满足用户的需求,以便于后续的数据挖掘等,可以在实现可视化的过程中和输出相应的视图后根据用户的需求调节相应的参数,实现结构化医疗数据的可视化过程中友好的人机交互功能,提升用户体验;具体地,用户至少可以对用于对医疗病案进行分类的预设分类标准、过滤各预设结构化变量的取值的预设区间和预设值以及设定的预设统计主题,并且还可以改变结构化医疗数据的可视化的视图形式。

本发明的第三方面提出了一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述技术方案中任意一项所述的结构化医疗数据的可视化方法的步骤。

本发明的第四方面提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述技术方案中任意一项所述的结构化医疗数据的可视化方法的步骤。

通过本发明的技术方案,可以有效地实现对结构化医疗数据的可视化,从而使得用户更加方便地对结构化医疗数据进行挖掘。

附图说明

图1示出了本发明实施例的结构化医疗数据的可视化方法的流程示意图;

图2示出了本发明实施例的构建变量关系视图的方法流程示意图;

图3示出了本发明实施例的信息分布视图;

图4示出了本发明实施例的变量关系视图;

图5示出了本发明实施例的结构化医疗数据的可视化装置的示意框图;

图6示出了图5所示的处理模块的示意框图;

图7示出了本发明实施例的计算机设备的示意框图。

具体实施方式

为了可以更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了本发明实施例的结构化医疗数据的可视化方法的流程示意图。

如图1所示,根据本发明实施例的结构化医疗数据的可视化方法,具体包括以下流程步骤:

步骤102,获取各医疗病案中包含的各预设结构化变量的基本信息。

可以理解的是,各医疗病案中包含的预设结构化变量至少可以包括:年龄、性别、疾病、科室、治疗费用、治疗时间等。

步骤104,根据对每个预设结构化变量的基本信息的统计分析结果形成每个预设结构化变量对应的信息分布视图和/或形成不同预设结构化变量之间的变量关系视图。

步骤106,输出并展示信息分布视图和/或变量关系视图。

在该实施例中,通过对各医疗病案中包含的每个预设结构化变量的基本信息进行统计分析,进而不仅可以针对每个预设结构化变量绘制其信息分布视图还可以绘制体现不同的预设结构化变量之间的关联性的变量关系视图,并能够进行信息分布视图和/或变量关系视图的输出展示,实现了对结构化医疗数据的可视化处理,以使用户能够更加直观地了解结构化医疗数据的基本信息情况,从而使得用户更加方便地对结构化医疗数据进行挖掘,不仅节省了人力资源,还能够提高数据挖掘的效率。

进一步地,在上述实施例中,在步骤102之前,本发明实施例的结构化医疗数据的可视化方法还可以包括以下流程步骤:

检测是否接收到用户输入的针对各医疗病案的分类指令;若是,按照分类指令中包含的预设分类标准将所有医疗病案进行分类,以针对分类得到的每个医疗病案组别分别执行获取其中每个医疗病案中包含的各预设结构化变量的基本信息并形成信息分布视图和/或变量关系视图的步骤;若否,直接执行获取各医疗病案中包含的各预设结构化变量的基本信息的步骤。

在该实施例中,进一步地为了更方便地实现结构化医疗数据的可视化,并使得到的预设结构化变量的信息分布视图和/或预设结构化变量之间的变量关系视图更加直观地展示其基本信息数据情况,可以预先根据用户的实际需求对需要进行可视化处理的所有医疗病案进行分类,实现更有针对性的结构化医疗数据的数据挖掘。

具体地,可以按照疾病类别进行分类,比如心脑血管疾病、皮肤疾病、妇科疾病等。

进一步地,在上述实施例中,各预设结构化变量的基本信息包括之一或多种的组合:变量属性信息、变量类型信息和变量取值信息。

可以理解的是,各医疗病案中包含的各预设结构化变量的基本信息包括但不限于以下之一或多种的组合:变量属性信息,比如字符属性、数值属性、时间属性等;变量类型信息,比如离散型变量、连续型变量;变量取值信息,比如取值区间、取值类别等。

进一步地,在上述实施例中,步骤104中所述的根据对每个预设结构化变量的基本信息的统计分析结果形成每个预设结构化变量对应的信息分布视图的方案可以具体执行为:

当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为连续变量时,获取每个预设结构化变量的变量取值信息中处于预设区间内的第一目标变量取值信息,采用第一预设图形表示第一目标变量取值信息对应的信息分布视图。

可以理解的是,当预设结构化变量为连续变量时,可以根据连续的取值区间的分布特点,截取有意义的区间,即过滤掉异常值或不重要的区间,使其取值区间位于预设区间内,具体地可以通过柱状图、箱线图等展示连续变量的信息分布视图。

进一步地,在展示连续变量的信息分布视图时,还可以统计并展示其平均值、中间值、中位数、最值、方差。

当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为离散变量时,获取每个预设结构化变量的变量取值信息中的频数高于预设值的第二目标变量取值信息,采用第二预设图形表示第二目标变量取值信息对应的信息分布视图。

可以理解的是,当预设结构化变量为离散变量时,可以根据该预设结构化变量的取值类别的频数分布特点,挑选频数高于预设值的取值类别,具体可以通过饼图、条形图等展示离散变量的信息分布视图。

进一步地,在展示离散变量的信息分布视图时,还可以统计并展示其取值类别的频数的平均值、中间值、中位数、最值和方差。

在该实施例中,当通过对每个预设结构化变量的基本信息进行分析确定了其所属的变量类型后则可以采用相应地可视化图形对其进一步进行可视化处理,具体地可以根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其变量类型,进而基于此对其变量取值信息进行自动化处理,以能够合理地展示数据过滤掉不好的数据点,然后绘制图形实现可视化;而且通过上述实施例,可以将预设结构化变量的不良数据过滤掉,只根据合理、有意义的数据构建其信息分布视图,从而保证了构建信息分布视图的准确性。

进一步可以理解的是,用于对连续变量的取值情况进行过滤处理的预设区间和用于对离散变量的取值情况进行过滤处理的预设值可以根据实际需要进行具体设置。

进一步可以理解的是,当预设结构化变量为可以自然排序的变量时,比如时间,则可以先进行排序,然后再进行取值的过滤以及相应地可视化处理。

进一步地,在上述实施例中,步骤104中所述的根据对每个预设结构化变量的基本信息的统计分析结果形成不同预设结构化变量之间的变量关系视图的方案可以具体按照如图2所示的流程进行执行,包括:

步骤s20,获取至少一个预设统计主题。

可以理解的是,

步骤s22,确定各预设结构化变量中与每个预设统计主题关联的目标结构化变量。

步骤s24,根据对目标结构化变量的基本信息的统计分析结果形成与每个预设统计主题关联的各目标结构化变量之间的变量关系视图,并采用第三预设图形表示与每个预设统计主题关联的各目标结构化变量之间的变量关系视图。

在该实施例中,可以通过预先设定常用的统计主题的形式构建不同预设结构化变量之间的变量关系视图,即将与同一预设统计主题有关的预设结构化变量进行汇总,并基于对筛选出的目标结构化变量的基本信息的统计分析生成与同一预设统计主题关联的各目标结构化变量之间的变量关系视图,进一步地可以采用平行坐标图、星形图、矩阵散点图、多面体图等更加直观地展示不同的结构化变量之间的统计关系。

其中,预设统计主题包括但不限于:医疗费用主题、治疗效果主题、疾病主题、时间主题。

进一步地,在上述实施例中,结构化医疗数据的可视化方法还包括:当接收到用户输入的调节指令时,根据调节指令中包含的调节参数对应调节预设分类标准、预设区间、预设值、预设统计主题、第一预设图形、第二预设图形和第三预设图形中的一个或多个。

在该实施例中,为了使对结构化医疗数据的可视化结果更加满足用户的需求,以便于后续的数据挖掘等,可以在实现可视化的过程中和输出相应的视图后根据用户的需求调节相应的参数,实现结构化医疗数据的可视化过程中友好的人机交互功能,提升用户体验;具体地,用户至少可以对用于对医疗病案进行分类的预设分类标准、过滤各预设结构化变量的取值的预设区间和预设值以及设定的预设统计主题,并且还可以改变结构化医疗数据的可视化的视图形式。

例如,用户可以通过鼠标或者对话框的方式调节直方图的横纵坐标范围;用户可以自己定义医疗主题和该医疗主题所需要的字段关系图,还可以自定义划分字段的水平的标准和条件,并进行调整,从而实现人机交互。

下面以心脑血管疾病为例对本发明的结构化医疗数据的可视化方案进行说明。具体地,心脑血管疾病的各医疗病案中包含的预设结构化变量包括:年龄、性别、疾病、科室、治疗费用、治疗时间等。

进一步地,根据各预设结构化变量的基本信息可以确定性别、疾病名称、科室名称为字符属性且为离散型变量,年龄、治疗费用为数值属性且为连续型变量,而治疗时间为时间属性且可视为离散型变量。

举例来说,对于离散变量疾病和科室,各个疾病名称和各个科室名称就是其取值类别,而由于疾病数目和科室数目均较多,可以挑选取值类别的频数较高的几个疾病名称进行离散变量的信息分布视图的绘制,可以绘制饼图或条形图,比如科室频数较高的包括心内科、神经内科、神经外科,信息分布图如图3所示;而对于连续变量治疗费用可以用直方图进行信息分布图的绘制,治疗费用具体还可以细化为:住院费、手术费、药物费、护工费和总治疗费用等。

进一步地,若上述变量为预定类型的变量,该预定类型的变量为可以自然排序的变量,比如时间、年龄,则可以先排序再构建信息分布图,从而使得构建出的信息分布图更加有次序,方便用户查看。

进一步地,对于不同预设结构化变量之间的变量关系视图,比如,对于疾病主体,可以绘制不同年龄、不同性别得某种疾病的分布图;以医疗费用为主题,可以绘制不同疾病、不同科室之间的治疗费用分布图,总费用和手术费用等之间的关系图;以治疗时间为主题,可以绘制不同疾病在不同季节的发病图;进一步地在这些关系图中,还可以计算不同变量之间的相关关系系数,以及计算条件概率等统计量。

如图4所示,构建的变量关系视图为四面体的图,在该变量关系视图中的四个顶点分别对应一个变量,即总共有季节、疾病、治疗费用和治疗时间这四个变量。在该变量关系视图中每个变量的顶点大小是不同的,顶点大小反映变量的分数,两个变量之间线段的粗细也是不同的,线段越粗,说明这两个变量之间的相关性越大。

图5示出了本发明实施例的结构化医疗数据的可视化装置的示意框图。

如图5所示,根据本发明实施例的结构化医疗数据的可视化装置50,包括:获取模块502、处理模块504和输出模块506。

其中,获取模块502用于获取各医疗病案中包含的各预设结构化变量的基本信息;处理模块504用于根据对获取模块502获取的每个预设结构化变量的基本信息的统计分析结果形成每个预设结构化变量对应的信息分布视图和/或形成不同预设结构化变量之间的变量关系视图;输出模块506用于输出并展示信息分布视图和/或变量关系视图。

在该实施例中,通过对各医疗病案中包含的每个预设结构化变量的基本信息进行统计分析,进而不仅可以针对每个预设结构化变量绘制其信息分布视图还可以绘制体现不同的预设结构化变量之间的关联性的变量关系视图,并能够进行信息分布视图和/或变量关系视图的输出展示,实现了对结构化医疗数据的可视化处理,以使用户能够更加直观地了解结构化医疗数据的基本信息情况,从而使得用户更加方便地对结构化医疗数据进行挖掘,不仅节省了人力资源,还能够提高数据挖掘的效率。

进一步地,如图5所示,在上述实施例中,结构化医疗数据的可视化装置50还包括:检测模块508和分类模块510。

其中,检测模块508用于在获取模块502获取各医疗病案中包含的各预设结构化变量的基本信息之前,检测是否接收到用户输入的针对各医疗病案的分类指令;分类模块510在检测模块508检测接收到分类指令时,按照分类指令中包含的预设分类标准将所有医疗病案进行分类,以针对分类得到的每个医疗病案组别分别执行获取其中每个医疗病案中包含的各预设结构化变量的基本信息并形成信息分布视图和/或变量关系视图的步骤;以及获取模块502在检测模块508检测未接收到分类指令时,直接执行获取各医疗病案中包含的各预设结构化变量的基本信息的步骤。

在该实施例中,进一步地为了更方便地实现结构化医疗数据的可视化,并使得到的预设结构化变量的信息分布视图和/或预设结构化变量之间的变量关系视图更加直观地展示其基本信息数据情况,可以预先根据用户的实际需求对需要进行可视化处理的所有医疗病案进行分类,实现更有针对性的结构化医疗数据的数据挖掘。

进一步地,在上述实施例中,各预设结构化变量的基本信息包括之一或多种的组合:变量属性信息、变量类型信息和变量取值信息;以及处理模块504具体用于:当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为连续变量时,获取每个预设结构化变量的变量取值信息中处于预设区间内的第一目标变量取值信息,采用第一预设图形表示第一目标变量取值信息对应的信息分布视图;当根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其为离散变量时,获取每个预设结构化变量的变量取值信息中的频数高于预设值的第二目标变量取值信息,采用第二预设图形表示第二目标变量取值信息对应的信息分布视图。

在该实施例中,各医疗病案中包含的各预设结构化变量的基本信息包括但不限于以下之一或多种的组合:变量属性信息,比如字符属性、数值属性、时间属性等;变量类型信息,比如离散型变量、连续型变量;变量取值信息,比如取值区间、取值类别等。

进一步地,当通过对每个预设结构化变量的基本信息进行分析确定了其所属的变量类型后则可以采用相应地可视化图形对其进一步进行可视化处理,具体地可以根据每个预设结构化变量的变量属性信息和/或变量类型信息确定其变量类型,进而基于此对其变量取值信息进行自动化处理,以能够合理地展示数据过滤掉不好的数据点,然后绘制图形实现可视化,则当预设结构化变量为连续变量时,可以根据连续的取值区间的分布特点,截取有意义的区间,即过滤掉异常值或不重要的区间,使其取值区间位于预设区间内,具体地可以通过柱状图、箱线图等展示连续变量的信息分布视图,而当预设结构化变量为离散变量时,可以根据该预设结构化变量的取值类别的频数分布特点,挑选频数高于预设值的取值类别,具体可以通过饼图、条形图等展示离散变量的信息分布视图。通过以上方案,可以将预设结构化变量的不良数据过滤掉,只根据合理、有意义的数据构建其信息分布视图,从而保证了构建信息分布视图的准确性。

其中,用于对连续变量的取值情况进行过滤处理的预设区间和用于对离散变量的取值情况进行过滤处理的预设值可以根据实际需要进行具体设置。进一步地,当预设结构化变量为可以自然排序的变量时,比如时间,则可以先进行排序,然后再进行取值的过滤以及相应地可视化处理。

进一步地,在上述实施例中,处理模块504具体包括:获取子模块5042、确定子模块5044和处理子模块5046,如图6所示。

其中,获取子模块5042用于获取至少一个预设统计主题;确定子模块5044用于确定各预设结构化变量中与每个预设统计主题关联的目标结构化变量;处理子模块5046用于根据对目标结构化变量的基本信息的统计分析结果形成与每个预设统计主题关联的各目标结构化变量之间的变量关系视图,并采用第三预设图形表示与每个预设统计主题关联的各目标结构化变量之间的变量关系视图。

在该实施例中,可以通过预先设定常用的统计主题的形式构建不同预设结构化变量之间的变量关系视图,即将与同一预设统计主题有关的预设结构化变量进行汇总,并基于对筛选出的目标结构化变量的基本信息的统计分析生成与同一预设统计主题关联的各目标结构化变量之间的变量关系视图,进一步地可以采用平行坐标图、星形图、矩阵散点图、多面体图等更加直观地展示不同的结构化变量之间的统计关系。

其中,预设统计主题包括但不限于:医疗费用主题、治疗效果主题、疾病主题、时间主题。

进一步地,如图5所示,在上述实施例中,结构化医疗数据的可视化装置50还包括:调节模块512,用于当接收到用户输入的调节指令时,根据调节指令中包含的调节参数对应调节预设分类标准、预设区间、预设值、预设统计主题、第一预设图形、第二预设图形和第三预设图形中的一个或多个。

在该实施例中,为了使对结构化医疗数据的可视化结果更加满足用户的需求,以便于后续的数据挖掘等,可以在实现可视化的过程中和输出相应的视图后根据用户的需求调节相应的参数,实现结构化医疗数据的可视化过程中友好的人机交互功能,提升用户体验;具体地,用户至少可以对用于对医疗病案进行分类的预设分类标准、过滤各预设结构化变量的取值的预设区间和预设值以及设定的预设统计主题,并且还可以改变结构化医疗数据的可视化的视图形式。

作为本发明的一个实施例,提出了一种服务器,包括如上实施例中任一项所述的结构化医疗数据的可视化装置50,因此,该服务器具有该结构化医疗数据的可视化装置50所有有益的技术效果,在此不再赘述。

图7示出了本发明实施例的计算机设备的示意框图。

如图7所示,根据本发明实施例的实施例的计算机设备70,包括存储器702、处理器704及存储在所述存储器702上并可在所述处理器704上运行的计算机程序,其中存储器702和处理器704之间可以通过总线连接,所述处理器704用于执行存储器702中存储的计算机程序时实现如上实施例中所述的结构化医疗数据的可视化方法的步骤。

本公开实施例的方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本公开实施例的结构化医疗数据的可视化装置和计算机设备中的单元可以根据实际需要进行合并、划分和删减。

根据本公开实施例,提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例所述的结构化医疗数据的特征提取方法的步骤。

进一步地,本领域普通技术人员可以理解的是,上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(read-onlymemory,rom)、随机存储器(randomaccessmemory,ram)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammablereadonlymemory,eprom)、一次可编程只读存储器(one-timeprogrammableread-onlymemory,otprom)、电子抹除式可复写只读存储器(electrically-erasableprogrammableread-onlymemory,eeprom)、只读光盘(compactdiscread-onlymemory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

进一步地,上述计算机设备可以为pc(personalcomputer,个人电脑)端。

以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可以有效地实现对结构化医疗数据的可视化,从而使得用户更加方便地对结构化医疗数据进行挖掘。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1