一种计算机辅助医疗数据处理系统及方法

文档序号:9489624阅读:381来源:国知局
一种计算机辅助医疗数据处理系统及方法
【技术领域】
[0001]本发明涉及移动互联网中的数据处理领域,具体涉及计算机辅助医疗数据处理系统及方法。
【背景技术】
[0002]计算机辅助诊断(computer aided diagnosis,CAD) [1]或计算机辅助检测(computer aideddetect1n,CAD)是指通过影像学、医学图像处理技术以及其他可能的生理、生化手段,结合计算机的分析计算,辅助发现病灶,提高诊断的准确率[2]。现在常说的CAD技术主要是指基于医学影像学的计算机辅助技术。与所述计算机辅助检测(CAD)相区别,后者重点是检测,计算机只需要对异常征象进行标注,在此基础上进行常见的影像处理,并无需进行进一步诊断。即,计算机辅助诊断是计算机辅助检测的延伸和最终目的,相应地,计算机辅助检测是计算机辅助诊断的基础和必经阶段。CAD技术又被称为医生的“第三只眼”,CAD系统的广泛应用有助于提高医生诊断的敏感性和特异性。

【发明内容】

[0003]为了使基于位置的推荐更加准确,需要将互联网数据进行前期处理,本发明的目的就在于提供这样的一种计算机辅助医疗数据处理系统及方法。
[0004]一种计算机辅助医疗数据处理系统,包括移动信息处理中心,用于对互联网数据分析和挖掘,并输出结果到后续的推荐系统;所述移动信息处理中心包括依次相连的数据仓库和数据处理服务器,数据仓库用于对互联网数据进行存储和预处理,包括依次连接的数据清理模块、数据变换模块和数据集成模块;数据处理服务器采用Hadoop平台,包括顺序连接的HDFS模块和MapReduce模块。
[0005]数据处理服务器还包括HBase模块,存储需要随时读写的数据,其输出端与MapReduce模块连接。
[0006]互联网数据为位置信息、疾病信息集合和病例文件。
[0007]计算机辅助医疗数据处理方法,包括以下步骤:
[0008]步骤1、数据清理模块对收集到的结构化、半结构化、非结构化的互联网数据进行清理,去除冗余数据、填补缺值数据,清除异常数据;
[0009]步骤2、数据变换模块按线性或非线性划分数据的属性,将数据转换成可供数据挖掘的形式;例如将音频和视频转换成系统指定的格式,将数值数据统一为离散化或连续型数据进行处理;
[0010]步骤3、数据集成模块将经过数据变换后的数据集成在数据仓库中;
[0011]步骤4、预处理后的大量的互联网数据分布式存储在HDFS模块中,小部分需要随时读写的数据存储在HBase模块中;
[0012]步骤5、MapReduce模块对HDFS模块和HBase模块中的数据进行挖掘,并将挖掘出的结果输出给推荐系统。
[0013]本发明达到的有益效果:通过对杂乱无章的互联网数据进行预处理和分析挖掘,使其符合被推荐系统接收的需求,从而使推荐结果更加准确可靠。
【附图说明】
[0014]图1为本发明一种计算机辅助医疗数据处理系统结构原理图。
【具体实施方式】
[0015]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0016]如图1所示,一种计算机辅助医疗数据处理系统处理包括用户的位置信息、疾病信息集合和病例文件在内的互联网数据,它包括移动信息处理中心,由数据仓库和数据处理服务器组成,其中数据仓库用于对互联网数据进行存储和预处理,数据预处理功能由数据清理模块、数据变换模块、数据集成模块构成,对结构化、半结构化、非结构化的互联网数据依次进行上述处理,然后送入数据处理服务器。在这里,经过预处理的大量数据被存入HDFS模块,小部分需要随时读写的数据存入Hbase模块,它是一个搭建在HDFS模块上的面向列的数据库,运行在HDFS之上。MapReduce模块分布式并发处理HDFS模块中的大量数据,进行数据挖掘;通过基于MapReduce的数据挖掘算法对大量毫无规律的数据进行数据挖掘,并将结果输出给推荐系统,推荐系统根据这些数据对用户行为模式进行分析,比较用户的行为模式和待推荐的物品之间的相似程度,从而决定要为该用户推荐哪种物品。
[0017]本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。
【主权项】
1.一种计算机辅助医疗数据处理系统,其特征在于:包括移动信息处理中心,用于对互联网数据分析和挖掘,并输出结果到后续的推荐系统;所述移动信息处理中心包括依次相连的数据仓库和数据处理服务器,数据仓库用于对互联网数据进行存储和预处理,包括依次连接的数据清理模块、数据变换模块和数据集成模块;数据处理服务器采用Hadoop平台,包括顺序连接的HDFS模块和MapReduce模块,所述互联网数据为位置信息、疾病信息集合和病例文件。2.根据权利要求1或2所述的互联网数据处理系统,其特征在于:所述数据处理服务器还包括HBase模块,存储需要随时读写的数据,其输出端与MapReduce模块连接。3.一种利用权利要求3所述的一种计算机辅助医疗数据处理系统进行数据处理的方法,其特征在于,包括以下步骤: 步骤1、数据清理模块对收集到的结构化、半结构化、非结构化的互联网数据进行清理,去除冗余数据、填补缺值数据,清除异常数据; 步骤2、数据变换模块按线性或非线性划分数据的属性,将数据转换成可供数据挖掘的形式; 步骤3、数据集成模块将经过数据变换后的数据集成在数据仓库中; 步骤4、预处理后的大量的互联网数据分布式存储在HDFS模块中,小部分需要随时读写的数据存储在HBase模块中; 步骤5、MapReduce模块对HDFS模块和HBase模块中的数据进行挖掘,并将挖掘出的结果输出给推荐系统。
【专利摘要】本发明公开了一种计算机辅助医疗数据处理系统及方法,该系统包括移动信息处理中心,用于对互联网数据分析和挖掘,并输出结果到后续的推荐系统;移动信息处理中心包括依次相连的数据仓库和数据处理服务器,数据仓库用于对互联网数据进行存储和预处理,包括依次连接的数据清理模块、数据变换模块和数据集成模块;数据处理服务器采用Hadoop平台,包括顺序连接的HDFS模块和MapReduce模块。通过对杂乱无章的互联网数据进行预处理和分析挖掘,使其符合被推荐系统接收的需求,从而使推荐结果更加准确可靠。
【IPC分类】G06F19/00
【公开号】CN105243277
【申请号】CN201510662352
【发明人】平凡, 万林
【申请人】平凡
【公开日】2016年1月13日
【申请日】2015年10月10日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1