本发明涉及智能诊断的数据分析的技术领域,具体涉及一种基于BP神经网络算法的智能诊断用数据分析方法。
背景技术:
现有医疗基础设施难以满足患者的看病需求,偶尔发烧感冒去医院看病等小病,排队往往要个半天,对于患者来说,这个时间成本是非常昂贵的。再一个,一个医生的培养成本是非常高昂的,很自然的,这其中的一部分成本就会转移到患者的看病费用上。动辄几百的费用,对于底层的工薪的家庭来说,是笔不小的支出。
网络大数据是指“人、机、物”三元世界在网络空间中交互、融合所产生并在互联网上可获得的大数据,通过对数据的深度挖掘,得到大量有价值的数据,并利用BP神经网络学习算法对数据进行整体的学习分析,不断完善自身系统,最后实现根据输入输出期望结果。
技术实现要素:
针对现有技术的不足,本发明的目的旨在提供一种基于BP神经网络算法的智能诊断用数据分析方法,降低诊断门槛,有效缓解看病难的形势。
为实现上述目的,本发明采用如下技术方案:
基于BP神经网络算法的智能诊断用数据分析方法,包含有以下步骤:
S1、采集数据,该数据包括结构化数据与非结构化数据;
S2、对所采集的数据进行初步处理;
S3、将经过初步处理的数据进行关键词的聚类;
S4、将经过关键词聚类的数据通过训练好的BP神经网络算法建立数学模型,并将该数学模型作为分析结果进行输出。
进一步地,步骤S2中,初步处理包括清洗和格式转换。
进一步地,步骤S3中,将经过初步处理的数据进行关键词的聚类的步骤包括:
S31、从数据中任意选取K个数据对象作为聚类中心、从而形成K个聚类,其中K为大于1、小于数据量的正整数;
S32、分别计算聚类中心外其余数据到各个聚类中心的距离,并将聚类中心外其余数据分配到离自己最近的聚类中;
S33、顺序选取一个数据以代替原来的聚类中心,并计算替代后消耗的方差E,选择消耗的方差E最小的数据作为确定的聚类中心;
S34、重复步骤S32,若数据分配发生变化则继续按步骤进行数据处理,若数据分配未发生变化则输出聚类结果。
进一步地,该BP神经网络算法包括有输入部、训练部和输出部,在训练的过程中,该输入部用于输入样本数据与期待值,该训练部用于将待分析数据与期待值进行对比,并根据待分析数据与期待值之间的误差调整权重系数,该输出部用于输出对应的样本结果。
基于BP神经网络算法的智能诊断用数据分析系统,包括:
数据采集模块,用于采集待分析数据;
数据初步处理模块,用于对所采集的数据进行初步处理;
数据聚类模块,用于将经过初步处理的数据进行关键词的聚类;
数据分析模块,用于将经过关键词聚类的数据通过训练好的BP神经网络算法建立数学模型,并将该数学模型作为分析结果进行输出。
进一步地,数据初步处理模块对数据进行初步处理的内容包括清洗和格式转换。
进一步地,数据聚类模块对数据进行关键词聚类的方式为:1)从数据中任意选取K个数据对象作为聚类中心、从而形成K个聚类,其中K为大于1、小于数据量的正整数;2)分别计算聚类中心外其余数据到各个聚类中心的距离,并将聚类中心外其余数据分配到离自己最近的聚类中;3)顺序选取一个数据以代替原来的聚类中心,并计算替代后消耗的方差E,选择消耗的方差E最小的数据作为确定的聚类中心;4)重复2),若数据分配发生变化则继续按步骤进行数据处理,若数据分配未发生变化则输出聚类结果。
进一步地,数据分析模块中的BP神经网络算法包括有输入部、训练部和输出部,在训练的过程中,该输入部用于输入样本数据与期待值,该训练部用于将待分析数据与期待值进行对比,并根据待分析数据与期待值之间的误差调整权重系数,该输出部用于输出对应的样本结果。
本发明的有益效果在于:在当今看病难,看病贵的形势下,智能诊断可以使病人不用在医院进行挂号排队等繁琐手续,直接通过在线平台诊断自己的病情,足不出户就可以准确了解自己所得的病症,免去出门看病的烦扰;此外,在线平台诊断病情大大降低了诊断成本;智能诊断综合医科书和实际生活的病情诊断,对患者的疾病症状给出一个初步判断。
附图说明
图1是本发明中BP神经网络算法的流程结构图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
实施例1
基于BP神经网络算法的智能诊断用数据分析方法,包含有以下步骤:
S1、采集数据,该数据包括结构化数据与非结构化数据;
S2、对所采集的数据进行初步处理,初步处理包括清洗和格式转换,具体地,结构化数据直接经清洗和格式转换完成初步处理,非结构化数据还需要经过流式汇总、社交网络分析、语意分词等技术处理以提取有用信息,其中对于社交类的实时数据还需要经采集工具进行实时汇总计算完成初步处理,其中清洗包括去除数据中离散程度较大的数据、存在缺失的不完整数据以及重复出现的重复数据;
S31、从数据中任意选取K个数据对象作为聚类中心、从而形成K个聚类,其中K为大于1、小于数据量的正整数;
S32、分别计算聚类中心外其余数据到各个聚类中心的距离,并将聚类中心外其余数据分配到离自己最近的聚类中;
S33、顺序选取一个数据以代替原来的聚类中心,并计算替代后消耗的方差E,选择消耗的方差E最小的数据作为确定的聚类中心;
S34、重复步骤S32,若数据分配发生变化则继续按步骤进行数据处理,若数据分配未发生变化则输出聚类结果;
S4、将经过关键词聚类的数据通过训练好的BP神经网络算法建立数学模型,并将该数学模型作为分析结果进行输出,该BP神经网络算法包括有输入部、训练部和输出部,如图1所示,在训练的过程中,该输入部用于输入样本数据x1、x2、...、xn与期待值,该训练部用于将待分析数据与期待值进行对比,并根据待分析数据与期待值之间的误差e调整权重系数w1、w2、...、wn,从而使分析结果不断趋近于实际情况,该输出部用于输出对应的样本结果u:
其中n为数据量,
该分析结果与样本分析结果y(t)应一致。
实施例2
基于BP神经网络算法的智能诊断用数据分析系统,包括:
数据采集模块,用于采集待分析数据,具备抽取外部业务平台数据的能力和接收开放业务系统的推送能力;
数据初步处理模块,用于对所采集的数据进行初步处理,初步处理包括清洗和格式转换,具体地,结构化数据直接经清洗和格式转换完成初步处理,非结构化数据还需要经过流式汇总、社交网络分析、语意分词等技术处理以提取有用信息,其中对于社交类的实时数据还需要经采集工具进行实时汇总计算完成初步处理,其中清洗包括去除数据中离散程度较大的数据、存在缺失的不完整数据以及重复出现的重复数据;
数据聚类模块,用于将经过初步处理的数据进行关键词的聚类,进行关键词聚类的方式为:1)从数据中任意选取K个数据对象作为聚类中心、从而形成K个聚类,其中K为大于1、小于数据量的正整数;2)分别计算聚类中心外其余数据到各个聚类中心的距离,并将聚类中心外其余数据分配到离自己最近的聚类中;3)顺序选取一个数据以代替原来的聚类中心,并计算替代后消耗的方差E,选择消耗的方差E最小的数据作为确定的聚类中心;4)重复2),若数据分配发生变化则继续按步骤进行数据处理,若数据分配未发生变化则输出聚类结果;
数据分析模块,用于将经过关键词聚类的数据通过训练好的BP神经网络算法建立数学模型,并将该数学模型作为分析结果进行输出,该BP神经网络算法包括有输入部、训练部和输出部,如图1所示,在训练的过程中,该输入部用于输入样本数据x1、x2、...、xn与期待值,该训练部用于将待分析数据与期待值进行对比,并根据待分析数据与期待值之间的误差e调整权重系数w1、w2、...、wn,从而使分析结果不断趋近于实际情况,该输出部用于输出对应的分析结果u:
其中n为数据量,
该分析结果与样本分析结果y(t)应一致。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。