大数据平台上传文本解析系统的制作方法

文档序号:16973757发布日期:2019-02-26 18:47阅读:483来源:国知局
大数据平台上传文本解析系统的制作方法

本发明属于网络信息技术领域,主要涉及大数据平台上传文本解析系统。



背景技术:

现有的网络平台都在构建大数据信息化,在一些特殊的网络平台需要上传审查文件,由后台人员进行评判,这一过程仅在前端的工作过程采用了数据信息化,就是将材料上传至平台,后期的处理还需要人工进行初级审查,后由专家审查,这个过程是比较慢的,而且往往会出现滥竽充数文件名错误等问题,要进过初级审查才能完成没有完全用到大数据信息化技术,需要一种对上传文件格式审查的同时对文件名称及内容的初级审查网络技术。



技术实现要素:

为了解决这些问题,本发明提供了一种多支撑墩单堆台的托盘,采用单面堆放平台多并

大数据平台上传文本解析系统,包括文件上传模块、文件存储模块、文件分型模块、文字提取模块、文字对比模块和文字评判模块,所述文件上传模块将上传的文件提交上传置制定的文件存储模块中,文件分型模块调取文件存储模块中的文件进行分型,分型后的文件经文字提取模块将分型文件的文字进行提取,提取后的文字在文字对比模块中与类型库的文字对比,文字评判模块判断对比文字是否为所需文字,做通过和驳回评判。

首先,文件上传平台后分析上传文件类型。

进一步,平台对文件自分为三种类型word、pdf和rar,其中rar再次分型为word、pdf。进一步,对word和pdf中所包含的文字进行分析,提取标题及内容文字。

进一步,分析后将标题与内容文字与类型库进行对比。

进一步,对比后判断是否为后台所需要的材料文件,是所需材料则通过审查,非所需材料文件则驳回审查。

所述类型库对比为重点文字对比,提取上传文件中的重点标题和重点文字与植入的所需文字进行对比。

本发明具有的有益效果:实现了对文件的初级审查采用大数据文字提取技术,把上传的文件内容提起出来与模型库中的重点文字对比判断是否同过提交材料,省去了人工初级审查阶段,节省时间节省人力。

附图说明

图1为本发明程序结构示意图。

图2为本发明类型库结构示意图。

图3为本发明系统结构结构示意图。

具体实施方式

参照图1-3,大数据平台上传文本解析系统,包括文件上传模块、文件存储模块、文件分型模块、文字提取模块、文字对比模块和文字评判模块,所述文件上传模块将上传的文件提交上传置制定的文件存储模块中,文件分型模块调取文件存储模块中的文件进行分型,分型后的文件经文字提取模块将分型文件的文字进行提取,提取后的文字在文字对比模块中与类型库的文字对比,文字评判模块判断对比文字是否为所需文字,做通过和驳回评判。

首先,文件上传平台后分析上传文件类型。

进一步,平台对文件自分为三种类型word、pdf和rar,其中rar再次分型为word、pdf。进一步,对word和pdf中所包含的文字进行分析,提取标题及内容文字。

进一步,分析后将标题与内容文字与类型库进行对比。

进一步,对比后判断是否为后台所需要的材料文件,是所需材料则通过审查,非所需材料文件则驳回审查。

所述类型库对比为重点文字对比,提取上传文件中的重点标题和重点文字与植入的所需文字进行对比。

这里本发明的描述和应用都只是说明性和示意性的,并非是想要将本发明的范围限制在上述实施例中。这里所披露的实施方式的变形和改变是完全可能的,对于那些本领域的普通技术人员来说,实施例的替换和等效的各种部件均是公知的。本领域技术人员还应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现,以及在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。



技术特征:

技术总结
大数据平台上传文本解析系统,包括文件上传模块、文件存储模块、文件分型模块、文字提取模块、文字对比模块和文字评判模块,所述文件上传模块将上传的文件提交上传置制定的文件存储模块中,文件分型模块调取文件存储模块中的文件进行分型,分型后的文件经文字提取模块将分型文件的文字进行提取,提取后的文字在文字对比模块中与类型库的文字对比,文字评判模块判断对比文字是否为所需文字,做通过和驳回评判。实现了对文件的初级审查采用大数据文字提取技术,把上传的文件内容提起出来与模型库中的重点文字对比判断是否同过提交材料,省去了人工初级审查阶段,节省时间节省人力。

技术研发人员:陈迅
受保护的技术使用者:力电科技有限责任公司
技术研发日:2018.12.04
技术公布日:2019.02.26
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1