基于大数据的乳腺筛查数据分析系统和方法

文档序号:10655175阅读:998来源:国知局
基于大数据的乳腺筛查数据分析系统和方法
【专利摘要】本发明公开了一种基于大数据的乳腺筛查数据分析系统和方法。所述方法包括如下步骤:接收乳腺筛查结果信息;对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中;接收数据统计规则,并根据所述数据统计规则对所述数据仓库中的数据进行统计得到统计结果;根据所述统计结果生成统计结果报告供使用者查看。本发明以大数据为基础,对不同地区发送的乳腺筛查信息的数据进行收集和处理,以转化为可以挖掘的数据,并根据数据统计规则生成统计结果报告供使用者查看,方便使用者了解一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,及时做出乳腺相关疾病的整体预防和治疗方案。
【专利说明】
基于大数据的乳腺筛查数据分析系统和方法
技术领域
[0001]本发明涉及数据处理技术领域,尤其涉及一种基于大数据的乳腺筛查数据分析系统和方法。【背景技术】
[0002]乳腺癌是妇女常见的恶性肿块之一,全世界每年新发病例超过90万人。目前,CR数字化乳腺高频钼靶X线检查(简称“乳腺钼靶检查”)是诊断乳腺疾病的首选,是最可靠、最直接、最简便的无创性检测手段,痛苦相对较小,简便易行,且分辨率高,重复性好,留取的图像可供前后对比,已作为常规检查。但是现有的乳腺筛查系统没有对群体患者进行自动统计分析的功能,导致很难掌握一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,不利于乳腺相关疾病的整体预防和治疗。
【发明内容】

[0003]本发明的主要目的在于提供一种基于大数据的乳腺筛查数据分析系统和方法,旨在解决现有的乳腺筛查系统没有对群体患者进行自动分析的功能,导致很难掌握一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,不利于乳腺相关疾病的整体预防和治疗的问题。
[0004]为实现上述目的,本发明提供了一种基于大数据的乳腺筛查数据分析系统。
[0005]所述基于大数据的乳腺筛查数据分析系统运行于服务器中,该系统包括数据收集模块、数据仓库建立模块、数据处理模块以及结果生成模块,其中:[〇〇〇6]所述数据收集模块用于接收乳腺筛查结果信息;
[0007]所述数据仓库建立模块用于对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中;
[0008]所述数据处理模块用于接收数据统计规则,并根据所述数据统计规则对所述数据仓库中的数据进行统计,得到统计结果;[〇〇〇9]所述结果生成模块用于根据所述统计结果生成统计结果报告供使用者查看。
[0010]优选地,所述数据仓库建立模块包括数据清理子模块、数据变换子模块以及数据集成子模块,其中:
[0011]所述数据清理子模块用于对接收到的结构化、半结构化、非结构化的乳腺筛查结果信息进行数据清理,包括去除冗余数据、填补缺值数据以及清除异常数据;
[0012]所述数据变换子模块用于根据数据的属性将半结构化和非结构化数据转换成结构化数据;
[0013]所述数据集成子模块用于将经过数据变换后的结构化数据集成在数据仓库中。
[0014]优选地,所述乳腺筛查结果信息由不同地区的乳腺筛查信息系统发送。
[0015]优选地,所述乳腺筛查结果信息至少包括患者基本信息和患者的乳腺筛查诊断结果伯i息。
[0016]优选地,所述结果生成模块根据所述数据统计规则生成统计结果模板,以及将所述统计结果填入到所述统计结果模板中以生成统计结果报告。
[0017]本发明还提供了一种基于大数据的乳腺筛查数据分析方法,应用于服务器中。
[0018]所述基于大数据的乳腺筛查数据分析方法包括如下步骤:
[0019]接收乳腺筛查结果信息;
[0020]对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中;
[0021]接收数据统计规则,并根据所述数据统计规则对所述数据仓库中的数据进行统计得到统计结果;
[0022]根据所述统计结果生成统计结果报告供使用者查看。[〇〇23]优选地,所述对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中的步骤包括:
[0024]对接收到的结构化、半结构化、非结构化的乳腺筛查结果信息进行数据清理,包括去除冗余数据、填补缺值数据以及清除异常数据;
[0025]根据数据的属性将半结构化和非结构化数据转换成结构化数据;
[0026]将经过数据变换后的数据集成在数据仓库中。
[0027]优选地,所述乳腺筛查结果信息由不同地区的乳腺筛查信息系统发送。
[0028]优选地,所述乳腺筛查结果信息至少包括患者基本信息和患者的乳腺筛查诊断结果伯i息。
[0029]优选地,根据所述统计结果生成统计结果报告供使用者查看的步骤包括如下步骤:
[0030]根据所述数据统计规则生成统计结果模板;
[0031]将所述统计结果填入到所述统计结果模板中以生成统计结果报告。
[0032]相较于现有技术,本发明提供的基于大数据的乳腺筛查数据分析系统以大数据为基础,对不同地区发送的乳腺筛查信息的数据进行收集、优化处理以转化为可以挖掘的数据,并根据数据统计规则生成统计结果报告供使用者查看,方便使用者了解一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,及时做出乳腺相关疾病的整体预防和治疗方案。【附图说明】
[0033]图1为本发明基于大数据的乳腺筛查数据分析系统运行环境较佳实施例的功能模块不意图;[〇〇34]图2为本发明基于大数据的乳腺筛查数据分析系统中数据仓库建立模块的子模块功能不意图;
[0035]图3为本发明基于大数据的乳腺筛查数据分析方法较佳实施例的流程示意图。 【具体实施方式】
[0036]为更进一步阐述本发明为达成上述目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明的【具体实施方式】、结构、特征及其功效进行详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0037]为实现本发明目的,本发明提供了一种基于大数据的乳腺筛查数据分析系统。
[0038]参照图1所示,图1为本发明基于大数据的乳腺筛查数据分析系统运行环境较佳实施例的功能模块示意图。
[0039]在本实施例中,基于大数据的乳腺筛查数据分析系统10运行于服务器1中。所述服务器1包括基于大数据的乳腺筛查数据分析系统10,还包括存储单元12、处理单元14和通讯单元16〇
[0040]所述的存储单元12可以为一种只读存储单元R0M,电可擦写存储单元EEPR0M、快闪存储单元FLASH或固体硬盘等。所述的处理单元14可以为一种中央处理器(Central Processing Unit,CPU)、微控制器(M⑶)、数据处理芯片、或者具有数据处理功能的信息处理单元。所述通讯单元16为一种具有远程通讯功能的无线通讯接口或有线接口,例如,支持 GSM、GPRS、WCDMA、CDMA、TD-SCDMA、WiMAX、TD-LTE、FDD-LTE 等通讯技术的无线或有线通讯接 □ 〇
[0041]所述基于大数据的乳腺筛查数据分析系统10包括数据收集模块101、数据仓库建立模块102、数据处理模块103以及结果生成模块104。本发明所称的模块是指一种能够被所述处理单元14执行并且能够完成固定功能的一系列计算机程序指令段,其存储在存储单元 12中。
[0042]所述数据收集模块101用于接收乳腺筛查结果信息。
[0043]所述乳腺筛查结果信息由不同地区的乳腺筛查信息系统定期或不定期发送至该基于大数据的乳腺筛查数据分析系统10中。所述乳腺筛查结果信息包括患者基本信息,所述患者基本信息包括但不仅限于,姓名、年龄、性别、所在区域(包括但不限于国家、省、市、 区)。所述乳腺筛查结果信息还包括患者的乳腺筛查诊断结果信息。即所述乳腺筛查结果信息至少包括患者基本信息和患者的乳腺筛查诊断结果信息。
[0044]所述数据仓库建立模块102用于对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中。
[0045]具体地,如图2所示为本发明基于大数据的乳腺筛查数据分析系统中数据仓库建立模块的子模块功能示意图。所述数据仓库建立模块102包括数据清理子模块1021、数据变换子模块1022以及数据集成子模块1023。
[0046]所述数据清理子模块1021用于对接收到的结构化、半结构化、非结构化的乳腺筛查结果信息进行数据清理,包括去除冗余数据、填补缺值数据以及清除异常数据。例如对于同一个区域的患者的乳腺筛查结果信息建立以区域为关键词的索引去除冗余数据,以确保数据处理过程的实时性要求;对于没有性别信息的数据进行填补缺省值,以确保数据统计结果的准确性;对于年龄不在预设范围(例如15岁?65岁)内的数据进行异常清除,以确保分析结果在可控范围之内。
[0047]所述数据变换子模块1022用于根据数据的属性将半结构化和非结构化数据转换成结构化数据。例如按照患者的性别、区域、年龄、诊断结果信息等进行划分,对属性相同的非结构化数据进行结构化处理。[〇〇48]所述数据集成子模块1023用于将经过数据变换后的结构化数据集成在数据仓库中。具体地,将上述结构化数据分类存储与数据仓库中,以供数据处理模块103对数据进行快速处理。
[0049]所述数据处理模块103用于接收数据统计规则,并根据所述数据统计规则对所述数据仓库中的数据进行统计得到统计结果。所述数据统计规则由使用者根据需要输入至基于大数据的乳腺筛查数据分析系统10中,例如,若使用者需要统计深圳地区预设年龄段的乳腺筛查结果情况,则所述数据统计规则为筛选出地区为深圳且年龄在预设年龄段之间的患者数量。
[0050]所述结果生成模块104用于根据所述统计结果生成统计结果报告供使用者查看。 具体地,所述结果生成模块104可以提前根据所述数据统计规则生成统计结果模板,再根据统计结果将数据填入到所述统计结果模板中,生成统计结果报告供使用者查看,方便使用者了解一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,及时做出乳腺相关疾病的整体预防和治疗方案。
[0051]本发明提供的基于大数据的乳腺筛查数据分析系统以大数据为基础,对不同地区发送的乳腺筛查信息的数据进行收集、优化处理以转化为可以挖掘的数据,并根据数据统计规则生成统计结果报告供使用者查看,方便使用者了解一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,及时做出乳腺相关疾病的整体预防和治疗方案。[〇〇52]本发明的另外一个方面,提供了一种与上述基于大数据的乳腺筛查数据分析系统对应的方法。
[0053]参照图3所示,图3为本发明基于大数据的乳腺筛查数据分析方法较佳实施例的流程不意图。
[0054]在本实施例中,结合图1、图2和图3所示,所述基于大数据的乳腺筛查数据分析方法运行于服务器1中,包括如下步骤:
[0055]S10:数据收集模块101接收乳腺筛查结果信息;
[0056]具体地,所述乳腺筛查结果信息由不同地区的乳腺筛查信息系统定期或不定期发送至该基于大数据的乳腺筛查数据分析系统中。所述乳腺筛查结果信息包括患者基本信息,所述患者基本信息包括但不仅限于,姓名、年龄、性别、所在区域(包括但不限于国家、 省、市、区)。所述乳腺筛查结果信息还包括患者的乳腺筛查诊断结果信息。即所述乳腺筛查结果信息至少包括患者基本信息和患者的乳腺筛查诊断结果信息。[〇〇57]S20:数据仓库建立模块102对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中。
[0058] 具体地,所述步骤S20包括如下细化步骤:[〇〇59]步骤1:数据清理子模块1021对接收到的结构化、半结构化、非结构化的乳腺筛查结果信息进行数据清理,包括去除冗余数据、填补缺值数据以及清除异常数据。例如对于同一个区域的患者的乳腺筛查结果信息建立以区域为关键词的索引去除冗余数据,以确保数据处理过程的实时性要求;对于没有性别信息的数据进行填补缺省值,以确保数据统计结果的准确性;对于年龄不在预设范围(例如15岁?65岁)内的数据进行异常清除,以确保分析结果在可控范围之内。
[0060]步骤2:数据变换子模块1022根据数据的属性将半结构化和非结构化数据转换成格式化数据。例如按照患者的性别、区域、年龄、诊断结果信息等进行划分,对属性相同的非结构化数据进行结构化处理。[0061 ]步骤3:数据集成子模块1023将经过数据变换后的结构化数据集成在数据仓库中。 具体地,将上述结构化后的数据分类存储与数据仓库中,以供数据处理模块103对数据进行快速处理。
[0062]S30:数据处理模块103接收数据统计规则,并根据所述数据统计规则对所述数据仓库中的数据进行统计得到统计结果。
[0063]所述数据统计规则由使用者根据需要输入至基于大数据的乳腺筛查数据分析系统中,例如,若使用者需要统计深圳地区预设年龄段的乳腺筛查结果情况,则所述数据统计规则为筛选出地区为深圳且年龄在预设年龄段之间的患者数量。[〇〇64] S40:结果生成模块104根据所述统计结果生成统计结果报告供使用者查看。
[0065]具体地,可以提前根据所述数据统计规则生成统计结果模板,再根据统计结果将数据填入到所述统计结果模板中,生成统计结果报告供使用者查看,方便使用者了解一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,及时做出乳腺相关疾病的整体预防和治疗方案。
[0066]本发明提供的基于大数据的乳腺筛查数据分析系统以大数据为基础,对不同地区发送的乳腺筛查信息的数据进行收集、优化处理以转化为可以挖掘的数据,并根据数据统计规则生成统计结果报告供使用者查看,方便使用者了解一个片区、一个城市甚至一个国家的妇女的乳腺筛查情况,及时做出乳腺相关疾病的整体预防和治疗方案。[〇〇67]以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效功能变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
【主权项】
1.一种基于大数据的乳腺筛查数据分析系统,其特征在于,所述基于大数据的乳腺筛 查数据分析系统运行于服务器中,该系统包括数据收集模块、数据仓库建立模块、数据处理 模块以及结果生成模块,其中:所述数据收集模块用于接收乳腺筛查结果信息;所述数据仓库建立模块用于对所述乳腺筛查结果信息进行数据清理、数据变换和数据 集成,并存储于数据仓库中;所述数据处理模块用于接收数据统计规则,并根据所述数据统计规则对所述数据仓库 中的数据进行统计得到统计结果;所述结果生成模块用于根据所述统计结果生成统计结果报告供使用者查看。2.如权利要求1所述的基于大数据的乳腺筛查数据分析系统,其特征在于,所述数据仓 库建立模块包括数据清理子模块、数据变换子模块以及数据集成子模块,其中:所述数据清理子模块用于对接收到的结构化、半结构化、非结构化的乳腺筛查结果信 息进行数据清理,包括去除冗余数据、填补缺值数据以及清除异常数据;所述数据变换子模块用于根据数据的属性将半结构化和非结构化数据转换成结构化 数据;所述数据集成子模块用于将经过数据变换后的结构化数据集成在数据仓库中。3.如权利要求2所述的基于大数据的乳腺筛查数据分析系统,其特征在于,所述乳腺筛 查结果信息由不同地区的乳腺筛查信息系统发送。4.如权利要求2所述的基于大数据的乳腺筛查数据分析系统,其特征在于,所述乳腺筛 查结果信息至少包括患者基本信息和患者的乳腺筛查诊断结果信息。5.如权利要求1所述的基于大数据的乳腺筛查数据分析系统,其特征在于,所述结果生 成模块根据所述数据统计规则生成统计结果模板,以及将所述统计结果填入到所述统计结 果模板中以生成统计结果报告。6.—种基于大数据的乳腺筛查数据分析方法,应用于服务器中,其特征在于,所述基于 大数据的乳腺筛查数据分析方法包括如下步骤:接收乳腺筛查结果信息;对所述乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中;接收数据统计规则,并根据所述数据统计规则对所述数据仓库中的数据进行统计得到 统计结果;根据所述统计结果生成统计结果报告供使用者查看。7.如权利要求6所述的基于大数据的乳腺筛查数据分析方法,其特征在于,所述对所述 乳腺筛查结果信息进行数据清理、数据变换和数据集成,并存储于数据仓库中的步骤包括:对接收到的结构化、半结构化、非结构化的乳腺筛查结果信息进行数据清理,包括去除 冗余数据、填补缺值数据以及清除异常数据;根据数据的属性将半结构化和非结构化数据转换成结构化数据;将经过数据变换后的结构化数据集成在数据仓库中。8.如权利要求7所述的基于大数据的乳腺筛查数据分析方法,其特征在于,所述乳腺筛 查结果信息由不同地区的乳腺筛查信息系统发送。9.如权利要求7所述的基于大数据的乳腺筛查数据分析方法,其特征在于,所述乳腺筛查结果信息至少包括患者基本信息和患者的乳腺筛查诊断结果信息。10.如权利要求6所述的基于大数据的乳腺筛查数据分析方法,其特征在于,所述根据 所述统计结果生成统计结果报告供使用者查看的步骤包括如下步骤:根据所述数据统计规则生成统计结果模板;将所述统计结果填入到所述统计结果模板中以生成统计结果报告。
【文档编号】G06F17/30GK106021331SQ201610298325
【公开日】2016年10月12日
【申请日】2016年5月7日
【发明人】张贯京, 陈兴明, 高伟明, 李慧玲
【申请人】深圳市前海安测信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1