本发明涉及进口单机的设备所产生的图文信息数据进行数据信息采集技术领域,具体的说是涉及信息孤岛设备的信息采集方法。
背景技术:
今年来人工智能发展站迅速,国内都在大力发展智慧城市、智慧医疗/智慧物流/大数据等项目,人工智能的核心不外乎对数据的掌控,那么就需要对数据进行采集整合及分析,但目前对于一些信息孤岛设备的图文信息采集通常上通过对设备系统进行分析测试找bug进行破解或进行数据抓包来得到数据。
对于信息孤岛设备的信息采集目前大多是通过对设备系统的分析找漏洞,通过数据抓包或破解的方式来采集,这种方式采集数据难度较大,无法适应不同的孤岛设备,对数据的识别及归类整合困难,耗时久,效率低。
有鉴于此,本发明提供一种信息孤岛设备的信息采集方法,以解决上述问题。
技术实现要素:
为解决上述背景技术中提出的问题,本发明的目的在于提供信息孤岛设备的信息采集方法。
为实现上述目的,本发明采取的技术方案为:信息孤岛设备的信息采集方法,包括以下步骤:
步骤一、在信息孤岛设备上安装虚拟打印驱动模块,设为默认打印机驱动;
步骤二、设置好接收数据端的ip及端口;
步骤三、在服务器接收端运行数据接收分析模块;
步骤四、在孤岛设备上将需要采集的图文报告进行打印;
步骤五、当打印开始时系统将调用步骤一中默认的打印驱动模块进行打印;
步骤六、当打印完成后,虚拟打印驱动模块会将打印的内容进行截取并转化成图片和pdf格式的文件并发送到步骤二和步骤三中设置好的数据接收分析模块;
步骤七、当数据接收分析模块接收到来自信息孤岛设备上虚拟打印驱动模块发送的文件时,自动进行文件解析处理;
步骤八、文件数据解析完成后自动将识别好的数据上传到服务器数据库中完成数据采集。
上述技术方案的步骤三中,在服务器接收端将孤岛设备发送的文件进行转化并识别数据。
上述技术方案的步骤三中,将识别好的数据进行整合保存到服务器数据库,完成数据采集。
与现有技术相比,本发明的有益效果是:
本发明是通过在不同的孤岛设备上安装虚拟的打印驱动,将孤岛设备上所产生的图文报告通过打印的方式进行抓取,然后转换成易于识别的格式的文件,如pdf文件、图片文件或xps文件,进行解析整合后存到云端或服务器端数据库,大大提高了对信息孤岛设备的信息采集效率,且能够适应不同的设备不同的系统,有效的降低了软件开发的成本和难度。
本发明具体优点在于:(1)数据采集的方式可适应各种不同信息孤岛设备降低了数据采集对对数据的分析难度;(2)采集方式简单方便,不需要投入时间进行系统分析及破解;(3)采集数据可识别度高,降低了数据采集对对数据的分析难度。
附图说明
图1为本发明的流程示意图;
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合附图和具体实施方式,进一步阐述本发明是如何实施的。
信息孤岛设备的信息采集方法,包括以下步骤:
步骤一、在信息孤岛设备上安装虚拟打印驱动模块,设为默认打印机驱动;
步骤二、设置好接收数据端的ip及端口;
步骤三、在服务器接收端运行数据接收分析模块;
步骤四、在孤岛设备上将需要采集的图文报告进行打印;
步骤五、当打印开始时系统将调用步骤一中默认的打印驱动模块进行打印;
步骤六、当打印完成后,虚拟打印驱动模块会将打印的内容进行截取并转化成图片和pdf格式的文件并发送到步骤二和步骤三中设置好的数据接收分析模块;
步骤七、当数据接收分析模块接收到来自信息孤岛设备上虚拟打印驱动模块发送的文件时,自动进行文件解析处理;
步骤八、文件数据解析完成后自动将识别好的数据上传到服务器数据库中完成数据采集。
如图1所示,本发明的业务逻辑是:1、在信息孤岛设备上通过打印方式将需要抓取的数据文件发送到外部接收端。2、在服务器接收端将孤岛设备发送的文件进行转化并识别数据。3、将识别好的数据进行整合保存到服务器数据库完成数据采集。
本发明的关键点在于:1、将信息孤岛设备内产生的图文报告通过打印的方式快速进行捕获抓取;2、将抓取的报告图片文件或xps文件进行转化识别并分析存档。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围中。