一种基于大数据的多功能档案管理系统的制作方法

文档序号:31033278发布日期:2022-08-06 02:30阅读:83来源:国知局
一种基于大数据的多功能档案管理系统的制作方法

1.本发明属于档案管理技术领域,具体为一种基于大数据的多功能档案管理系统。


背景技术:

2.档案管理亦称档案工作。是档案馆(室)直接对档案实体和档案信息进行管理并提供利用服务的各项业务工作的总称,也是国家档案事业最基本的组成部分。档案的收集、整理、保管、鉴定、统计和提供利用的活动。包括:档案收集、档案整理、档案价值鉴定、档案保管、档案编目和档案检索、档案统计、档案编辑和研究(见档案文献编纂)、档案提供利用。这8项工作的划分只是相对稳定而不是绝对的,也有分为6个环节的,也有分为基础工作和利用工作两大部分的
3.但是常见的档案管理在使用时,效率不够高,从而影响了系统的运行速度,为人们的使用带来了不便。


技术实现要素:

4.本发明的目的在于:为了解决上述提出的问题,提供一种基于大数据的多功能档案管理系统。
5.本发明采用的技术方案如下:一种基于大数据的多功能档案管理系统,包括启动控制模块、档案数据提取模块、归档安全管理模块、大数据库模块、存储结构模块、安全管理模块、文字信息提取模块、字符信息提取模块、rfid标签安全模块、数据安全模块、防火用电安全模块,所述启动控制模块的输出端连接有所述档案数据提取模块的输入端,所述档案数据提取模块的输出端连接有所述归档安全管理模块的输入端,所述归档安全管理模块的输出端连接有所述大数据库模块的输入端,所述大数据库模块的输出端连接有所述存储结构模块的输入端,所述存储结构模块的输出端连接有所述安全管理模块的输入端。
6.在一优选的实施方式中,所述档案数据提取模块的内部固定安装有文字信息提取模块和字符信息提取模块,所述文字信息提取模块和字符信息提取模块的输出端连接有所述档案数据提取模块的输入端;所述安全管理模块的内部固定安装有rfid标签安全模块、数据安全模块和防火用电安全模块,所述rfid标签安全模块、数据安全模块和防火用电安全模块的输出端连接有所述安全管理模块的输入端。
7.在一优选的实施方式中,所述文字信息提取模块的内部先对档案信息进行预处理,在进行预处理的过程中,常采用的预处理方式为线性归一化方式,最重要的步骤是删除信息中的白噪声,预处理的目的是对医院纸质档案关键信息进行提取;其次对档案信息关联程度进行筛选,利用变量处理工具令经处理后的信息和图像更加容易被识别,提高系统识别性能;针对医院档案中的图像信息,利用字符图像完成线性归一化操作,不同问题下的归一化处理是存在差异的,在对医院档案信息进行处理时,把汉字信息字符组成的点阵图移动至指定位置,从而减少汉字在点阵图上的位置误差,从而实现位置归一化操作。
8.在一优选的实施方式中,所述字符信息提取模块对字符轮廓进行提取,如果白点
周围四个方位均和一个黑点相邻,则该黑点即为轮廓上的点;利用字符轮廓黑点对特征向量进行提取,即使一般字符会存在污点,通常会丢失部分污点处的信息,有时会导致字符受损严重,但依旧可以通过存在于笔画与轮廓中的特征进行提取。
9.在一优选的实施方式中,所述字符信息提取模块提取特征值可通过字符轮廓保存后进行,如果当前字符轮廓出现毛刺,则是由于成像质量不好而具有干扰因素,所述字符信息提取模块通过模板法针对处理中的特征值进行平滑处理,以降低噪声干扰,完成对轮廓边缘的平滑处理,处理时首先需对其周围的8个相邻像素进行考察,如果图像中黑点和周围相邻像素排序组合成图像的任何一个文字,则把该黑像素转换成白像素;如果字符轮廓周围相邻像素排序和任意黑像素排序一致,那么将该黑像素滤除,通过图2所示的排序情况,利用平滑操作替代被滤除的黑色像素,从而删除字符轮廓中的小的突起。
10.在一优选的实施方式中,所述归档安全管理模块在运行时一方面,提高档案防火墙防护性能,避免使用安全性低的防火墙软件,不仅要在医院内网与外网间建立防火墙,还要针对医院电子档案保密级别设置对应防火墙,提高安全性;另一方面,提高对网络入侵检测模块的开发,不仅要提高对外部入侵的检测,还要针对内部数据进行检测防范,增强档案管理的安全性;不仅如此,还需建立病毒防御模块,防止病毒与黑客入侵,提高电子档案管理的安全程度。
11.在一优选的实施方式中,所述大数据库模块设置为nosql数据库,该数据块泛指非关系型数据库,nosql数据库所有数据均独立设计,便于将数据划分至不同服务器上,减少所有服务器数据量,面对大规模数据的写入操作更加便于处理;nosql数据库不但可通过节点解决了关系数据库结构定义无法改变以及对数据定长的问题,而且可在不定义表结构的情况下正常工作,支持复杂的查询条件,将大数据环境下医院内不同非结构化电子档案数据集合在一起,获取电子档案数据库架构。
12.在一优选的实施方式中,所述存储结构模块的内部存储方式主要包括系统主动分片存储方式与用户自定义分片存储方式;分片存储基本思想如下:把二进制文件划分为若干个数据段,所有数据段均以一条记录的形式在nosql数据库中存储,为了达到负载均衡,nosql数据库提供分片机制,令一个档案信息数据的若干个分块被保存在分片服务器中,所有分片服务器对全部档案数据子集进行映射以实现管理,用户不用了解档案数据具体被保存的位置,而是通过mongos路由进程进行管理,在查询时,路由进程将自动调用相关程序,从而得到被保存的电子档案的查询结果,供用户使用。
13.在一优选的实施方式中,所述rfid标签安全模块使用聚苯乙烯等薄膜保护标签的ic芯片和天线;芯片内置限幅保护电路,出现异常情况或者磁场能量超负荷,均会采取保护措施保障芯片安全;如果芯片由于标签线圈异常而不能获得能量,rfid将失效不能进行工作。
14.在一优选的实施方式中,所述防火用电安全模块的内部整个部署不使用高压电源;所述防火用电安全模块将rfid读写器rj45端口与档案室局域网设备连接,将读写器数据传输至数据库。
15.综上所述,由于采用了上述技术方案,本发明的有益效果是:
16.1、本发明中,归档安全管理模块的内部设置有电子档案信息流和网络端口中间利用分布式协同处理,按照病毒种类、滑动窗口大小以及入侵方式,对电子档案服务器节点进
行选择,为不同种类的电子档案信息流提供安全保障,提高了档案管理的安全性,同时档案数据提取模块通过有效的信息提取方式将信息提取出来,便于查询与管理。通过分布式大数据映射方式能够有效提高电子档案管理安全性,利用分片存储思想可以减少存储空间,继而提高系统响应速度。
17.2、本发明中,存储结构模块的内部设置有档案室中布置的rfid天线,在信号收发过程中为低压高频,因此不会产生电火花,满足防火要求;天线材质符合相应阻燃标准,通过磁场耦合方式与rfid标签进行能量传递,从而提高了该系统在使用时的安全性。
附图说明
18.图1为本发明的系统框图;
19.图2为本发明中档案数据提取模块系统框图;
20.图3为本发明中安全管理模块系统框图。
21.图中标记:1-启动控制模块、2-档案数据提取模块、3-归档安全管理模块、4-大数据库模块、5-存储结构模块、6-安全管理模块、7-文字信息提取模块、8-字符信息提取模块、9-rfid标签安全模块、10-数据安全模块、11-防火用电安全模块。
具体实施方式
22.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
23.参照图1-3,
24.一种基于大数据的多功能档案管理系统,包括启动控制模块1、档案数据提取模块2、归档安全管理模块3、大数据库模块4、存储结构模块5、安全管理模块6、文字信息提取模块7、字符信息提取模块8、rfid标签安全模块9、数据安全模块10、防火用电安全模块11,:启动控制模块1的输出端连接有档案数据提取模块2的输入端,档案数据提取模块2的输出端连接有归档安全管理模块3的输入端,归档安全管理模块3的输出端连接有大数据库模块4的输入端,大数据库模块4的输出端连接有存储结构模块5的输入端,存储结构模块5的输出端连接有安全管理模块6的输入端。
25.档案数据提取模块2的内部固定安装有文字信息提取模块7和字符信息提取模块8,文字信息提取模块7和字符信息提取模块8的输出端连接有档案数据提取模块2的输入端;安全管理模块6的内部固定安装有rfid标签安全模块9、数据安全模块10和防火用电安全模块11,rfid标签安全模块9、数据安全模块10和防火用电安全模块11的输出端连接有安全管理模块6的输入端。
26.文字信息提取模块7的内部先对档案信息进行预处理,在进行预处理的过程中,常采用的预处理方式为线性归一化方式,最重要的步骤是删除信息中的白噪声,预处理的目的是对医院纸质档案关键信息进行提取;其次对档案信息关联程度进行筛选,利用变量处理工具令经处理后的信息和图像更加容易被识别,提高系统识别性能;针对医院档案中的图像信息,利用字符图像完成线性归一化操作,不同问题下的归一化处理是存在差异的,在对医院档案信息进行处理时,把汉字信息字符组成的点阵图移动至指定位置,从而减少汉
字在点阵图上的位置误差,从而实现位置归一化操作。
27.字符信息提取模块8对字符轮廓进行提取,如果白点周围四个方位均和一个黑点相邻,则该黑点即为轮廓上的点;利用字符轮廓黑点对特征向量进行提取,即使一般字符会存在污点,通常会丢失部分污点处的信息,有时会导致字符受损严重,但依旧可以通过存在于笔画与轮廓中的特征进行提取。
28.字符信息提取模块8提取特征值可通过字符轮廓保存后进行,如果当前字符轮廓出现毛刺,则是由于成像质量不好而具有干扰因素,字符信息提取模块8通过模板法针对处理中的特征值进行平滑处理,以降低噪声干扰,完成对轮廓边缘的平滑处理,处理时首先需对其周围的8个相邻像素进行考察,如果图像中黑点和周围相邻像素排序组合成图像的任何一个文字,则把该黑像素转换成白像素;如果字符轮廓周围相邻像素排序和任意黑像素排序一致,那么将该黑像素滤除,通过图2所示的排序情况,利用平滑操作替代被滤除的黑色像素,从而删除字符轮廓中的小的突起。
29.归档安全管理模块3在运行时一方面,提高档案防火墙防护性能,避免使用安全性低的防火墙软件,不仅要在医院内网与外网间建立防火墙,还要针对医院电子档案保密级别设置对应防火墙,提高安全性;另一方面,提高对网络入侵检测模块的开发,不仅要提高对外部入侵的检测,还要针对内部数据进行检测防范,增强档案管理的安全性;不仅如此,还需建立病毒防御模块,防止病毒与黑客入侵,提高电子档案管理的安全程度。
30.大数据库模块4设置为nosql数据库,该数据块泛指非关系型数据库,nosql数据库所有数据均独立设计,便于将数据划分至不同服务器上,减少所有服务器数据量,面对大规模数据的写入操作更加便于处理;nosql数据库不但可通过节点解决了关系数据库结构定义无法改变以及对数据定长的问题,而且可在不定义表结构的情况下正常工作,支持复杂的查询条件,将大数据环境下医院内不同非结构化电子档案数据集合在一起,获取电子档案数据库架构。
31.存储结构模块5的内部存储方式主要包括系统主动分片存储方式与用户自定义分片存储方式;分片存储基本思想如下:把二进制文件划分为若干个数据段,所有数据段均以一条记录的形式在nosql数据库中存储,为了达到负载均衡,nosql数据库提供分片机制,令一个档案信息数据的若干个分块被保存在分片服务器中,所有分片服务器对全部档案数据子集进行映射以实现管理,用户不用了解档案数据具体被保存的位置,而是通过mongos路由进程进行管理,在查询时,路由进程将自动调用相关程序,从而得到被保存的电子档案的查询结果,供用户使用。
32.rfid标签安全模块9使用聚苯乙烯等薄膜保护标签的ic芯片和天线;芯片内置限幅保护电路,出现异常情况或者磁场能量超负荷,均会采取保护措施保障芯片安全;如果芯片由于标签线圈异常而不能获得能量,rfid将失效不能进行工作。
33.防火用电安全模块11的内部整个部署不使用高压电源;防火用电安全模块11将rfid读写器rj45端口与档案室局域网设备连接,将读写器数据传输至数据库。
34.归档安全管理模块3的内部设置有电子档案信息流和网络端口中间利用分布式协同处理,按照病毒种类、滑动窗口大小以及入侵方式,对电子档案服务器节点进行选择,为不同种类的电子档案信息流提供安全保障,提高了档案管理的安全性,同时档案数据提取模块2通过有效的信息提取方式将信息提取出来,便于查询与管理。通过分布式大数据映射
方式能够有效提高电子档案管理安全性,利用分片存储思想可以减少存储空间,继而提高系统响应速度。
35.本发明中,存储结构模块5的内部设置有档案室中布置的rfid天线,在信号收发过程中为低压高频,因此不会产生电火花,满足防火要求;天线材质符合相应阻燃标准,通过磁场耦合方式与rfid标签进行能量传递,从而提高了该系统在使用时的安全性。
36.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1