一种基于深度学习的保险票据分类方法与流程

文档序号:18304217发布日期:2019-07-31 10:43阅读:436来源:国知局

本发明涉及票据分类技术领域,尤其涉及一种基于深度学习的保险票据分类方法。



背景技术:

保险单的主要内容包括双方对有关保险标的事项的说明,包括被保险人名称,保险标的名称及其存放地点或所处状态、保险金额、保险期限、保险费等,双方的权利和义务,如承担责任和不予承担的责任等。附注条件,指保险条款或双方约定的其他条件以及保单变更、转让和注销等事项。

在传统票据管理中,常依赖人工对票据进行分类,因为待分类的票据往往数目巨大,所以需要花费大量的人力物力去完成,因此票据自动分类系统应运而生,以机器视觉为技术背景解决这类简单重复的分类工作。现今的票据自动分类系统都需要首先采集较多各类票据图像作为训练样本,这种分类系统需要收集大量训练样本和花费大量精力人工设计票据特征才能保证训练得到的模型的分类性能,故存在一定的局限性。现有的票据分类方法中,在对票据分类后,难以从数据库内寻找。



技术实现要素:

本发明提出了一种基于深度学习的保险票据分类方法,以解决上述背景技术中提出的问题。

本发明提出了一种基于深度学习的保险票据分类方法,包括如下步骤:

s1:初始化票据库,清空票据库内存储的保险票据,并建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,显示数据库内数据的内容,方便对存储的保险票据进行查找;

s2:将ocr数据扫描装置与计算机相连,建立数据传递通道,将保险票据放入ocr数据扫描装置中,对保险票据进行扫描,在接到命令后,ocr数据扫描装置将存储器内的保险票据上传至计算机,计算机对上传票据进行标号处理,标号处理采用数字进行标号,使得每张保险票据上存在唯一的标号,标号处理步骤为:

a、计算机将上传的保险票据移动至编辑模块内,对保险票据进行编辑;

b、再对上传的保险票据进行标记信息的创建;

c、根据保险票据上传的顺序依次自动生成数字标号;

s3:对计算机内的保险票据进行扫描分类,对保险票据进行整合,便于对保险票据进行处理;

s4:对同种类别的保险票据进行重合比对,删掉相同的保险票据,对剩下的保险票据重新排序,生成新的序号;

s5:对每一种保险票据上的特征信息进行提取,将提取的特征信息标号,生成序号编码,存储到数据库内,在学习时,可从数据库内调出,方便对保险票据的了解,特征信息编码与原始票据编码相对应。

优选的,所述s1中,子数据存储库放置在同一个大数据库内,子数据存储库独立依存,相互之间互不干扰,单个的子数据存储库可独立工作,子数据存储库根据所要放置的票据信息进行命名,对存储的数据信息进行概括,方便之后的学习中对保险票据的查找。

优选的,所述s2中,险票据上传的步骤为计算机通过导线与ocr数据扫描装置连接,在计算机上输入数据采集命令,数据采集命令通过电信号的形式传递给ocr数据扫描装置,ocr数据扫描装置将接收的电信号转化为数据信号,ocr数据扫描装置在接收到数据信号后,ocr数据扫描装置将内部存储的保险票据信息传输给计算机,完成保险票据的上传。

优选的,所述s3中,扫描分类步骤为将上传的保险票据导入计算机数据识别系统,识别模块通过对保险票据的名称进行识别,判定保险票据的种类,别系统根据保险票据名称,将保险票识别,将同种名称的保险票存储到同一数据库内,完成对保险票的分类。

优选的,所述s4中,重合比对的步骤为根据保险票据的标号,首先挑选序号靠前的数据与其余的保险票据进行对比,比对保险票据上的特征点,特征点相同的保险票据即为相同的保险票据,删除相同的保险票据,根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号。

优选的,所述s5中,特征信息提取的过程为扫描系统对票据进行扫描,首先对保险票据的外形大小特征进行提取,获得票据的基础大小特征,然后对票据上的公章信息进行提取,获得公章所处的位置信息,最后对票据上填写的文字内容进行提取,得到票据的填写方式。

优选的,所述s5中,保险票据的查找只需要在数据库内的检索框中输入保险票据的特征信息,根据输入的特征信息,即可快速的查找到所需要的保险票据信息,查找快捷简单。

本发明提出的一种基于深度学习的保险票据分类方法,有益效果在于:

1、根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号,确保无相同票据,票据按序号排列,便于查找。

2、通过建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,根据功能标注可进行快速查找。

具体实施方式

下面结合具体实施例来对本发明做进一步说明。

本发明提出了一种基于深度学习的保险票据分类方法,包括如下步骤:

s1:初始化票据库,清空票据库内存储的保险票据,并建立多个子数据存储库,子数据存储库建立在票据库内,对每个子数据存储库进行功能标注,显示数据库内数据的内容,方便对存储的保险票据进行查找,子数据存储库放置在同一个大数据库内,子数据存储库独立依存,相互之间互不干扰,单个的子数据存储库可独立工作,子数据存储库根据所要放置的票据信息进行命名,对存储的数据信息进行概括,方便之后的学习中对保险票据的查找;

s2:将ocr数据扫描装置与计算机相连,建立数据传递通道,将保险票据放入ocr数据扫描装置中,对保险票据进行扫描,在接到命令后,ocr数据扫描装置将存储器内的保险票据上传至计算机,计算机对上传票据进行标号处理,标号处理采用数字进行标号,使得每张保险票据上存在唯一的标号,险票据上传的步骤为计算机通过导线与ocr数据扫描装置连接,在计算机上输入数据采集命令,数据采集命令通过电信号的形式传递给ocr数据扫描装置,ocr数据扫描装置将接收的电信号转化为数据信号,ocr数据扫描装置在接收到数据信号后,ocr数据扫描装置将内部存储的保险票据信息传输给计算机,完成保险票据的上传,标号处理步骤为:

a、计算机将上传的保险票据移动至编辑模块内,对保险票据进行编辑;

b、再对上传的保险票据进行标记信息的创建;

c、根据保险票据上传的顺序依次自动生成数字标号;

s3:对计算机内的保险票据进行扫描分类,对保险票据进行整合,便于对保险票据进行处理,扫描分类步骤为将上传的保险票据导入计算机数据识别系统,识别模块通过对保险票据的名称进行识别,判定保险票据的种类,别系统根据保险票据名称,将保险票识别,将同种名称的保险票存储到同一数据库内,完成对保险票的分类;

s4:对同种类别的保险票据进行重合比对,删掉相同的保险票据,对剩下的保险票据重新排序,生成新的序号,重合比对的步骤为根据保险票据的标号,首先挑选序号靠前的数据与其余的保险票据进行对比,比对保险票据上的特征点,特征点相同的保险票据即为相同的保险票据,删除相同的保险票据,根据序号的排列循序,依次对保险票进行比对,直到所有的保险票据均比对完毕,剩余的保险票据重新排列,生成新的排列序号;

s5:对每一种保险票据上的特征信息进行提取,特征信息提取的过程为扫描系统对票据进行扫描,首先对保险票据的外形大小特征进行提取,获得票据的基础大小特征,然后对票据上的公章信息进行提取,获得公章所处的位置信息,最后对票据上填写的文字内容进行提取,得到票据的填写方式,将提取的特征信息标号,生成序号编码,存储到数据库内,在学习时,可从数据库内调出,方便对保险票据的了解,特征信息编码与原始票据编码相对应,保险票据的查找只需要在数据库内的检索框中输入保险票据的特征信息,根据输入的特征信息,即可快速的查找到所需要的保险票据信息,查找快捷简单。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1