基于图像处理的金融数据管理方法及系统与流程

文档序号:35663391发布日期:2023-10-06 18:24阅读:31来源:国知局
基于图像处理的金融数据管理方法及系统

本发明涉及数据处理技术,尤其涉及一种基于图像处理的金融数据管理方法及系统。


背景技术:

1、金融数据管理是指企业将与本身相关的金融数据,采用一定的手段、按照一定的程序对自身金融数据进行管理的过程。金融数据具有数据量大、调用频率高等特点,企业在日常管理过程中存在大量的金融票据,并且要对大量的金融票据进行及时管理,方便后续进行查阅和使用。

2、现有技术中,多数企业仍采用文件夹的形式保管相应的金融票据,然而,一旦需要对相应的金融票据进行查阅时,例如,查阅大额票据时,管理人员需要查阅所有文件夹内的票据进行筛选得到符合需求的票据,无法实现依据用户的需求进行自动筛选,不仅浪费了大量的查找时间,而且容易发生错误。

3、因此,如何实现对金融数据的自动整理,并依据用户的不同需求对金融数据进行定制化检索,成为亟待解决的问题。


技术实现思路

1、本发明实施例提供一种基于图像处理的金融数据管理方法及系统,可以实现对金融数据的自动整理,并依据用户的不同需求对金融数据进行定制化检索。

2、本发明实施例的第一方面,提供一种基于图像处理的金融数据管理方法,包括:

3、调取预设识别图层叠加在目标票据上方,所述预设识别图层包括定位线以及多个识别目标区,根据对齐策略和所述定位线将所述预设识别图层与所述目标票据对齐,并基于所述识别目标区提取对应各维度标签的第一文本信息;

4、调取与所述维度标签对应的文本效验策略对所述第一文本信息进行效验,将满足效验要求的所述第一文本信息作为所述目标票据的第二文本信息,并将对应的所述维度标签作为所述目标票据的第二维度标签;

5、根据一类归类模型生成与各所述第二维度标签对应的一类总节点以及一级文件夹,并基于所述第二维度标签对应的归类区间生成与所述一类总节点对应的多个一类子节点以及二级文件夹,根据所述一类总节点和所述一类子节点生成与所述第二维度标签对应的一类管理树;

6、接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,按照顺序对所述融合维度信息依次排序得到顺位维度序号,基于融合策略和所述顺位维度序号对所述一类管理树进行融合处理,得到二类管理树。

7、可选地,在第一方面的一种可能实现方式中,所述根据对齐策略和所述定位线将所述预设识别图层与所述目标票据对齐,并基于所述识别目标区提取对应各维度标签的第一文本信息,包括:

8、获取所述预设识别图层中定位线处于第一侧的端点作为第一定位点,以及预设识别图层中定位线处于第二侧的端点作为第二定位点,获取所述目标票据中票据线处于第一侧的端点作为第三定位点,以及目标票据中票据线处于第二侧的端点作为第四定位点;

9、对所述预设识别图层和所述目标票据进行坐标化处理,得到对应第一定位点的第一坐标、第二定位点的第二坐标、第三定位点的第三坐标和第四定位点的第四坐标;

10、根据所述第一坐标和所述第二坐标得到第一斜率,根据所述第三坐标和所述第四坐标得到第二斜率,基于所述第一斜率和第二斜率的反正切函数,得到对应第一斜率的第一角度和对应第二斜率的第二角度;

11、基于所述第一角度和所述第二角度得到调节角度,根据所述调节角度对预设识别图层进行旋转处理,并将第一定位点定位至第三定位点的第三坐标处,将第二定位点定位至第四定位点的第四坐标处;

12、基于ocr文字识别,对目标票据中与识别目标区对齐的区域进行文字识别,得到对应识别目标区中各标题的初始文本信息,各所述识别目标区具有对应的维度标签,提取对应各维度标签的第一文本信息。

13、可选地,在第一方面的一种可能实现方式中,所述调取与所述维度标签对应的文本效验策略对所述第一文本信息进行效验,将满足效验要求的所述第一文本信息作为所述目标票据的第二文本信息,并将对应的所述维度标签作为所述目标票据的第二维度标签,包括:

14、对所述维度标签的属性进行解析,若所述维度标签的属性为文字属性,则调取预设文本数量和尾部校验集合,所述尾部校验集合包含多个预设尾部文本,获取所述维度标签对应第一文本信息中尾部的预设文本数量的文本作为待比对文本;

15、判断存在预设尾部文本与所述待比对文本一致,则将所述第一文本信息作为所述目标票据的第二文本信息,并将对应的所述维度标签作为所述目标票据的第二维度标签;

16、若所述维度标签的属性为通讯数字属性,则调取通讯校验数量,获取所述维度标签对应第一文本信息的字符数量得到待比对数量,判断所述待比对数量等于所述通讯校验数量,则将所述第一文本信息作为所述目标票据的第二文本信息,并将对应的所述维度标签作为所述目标票据的第二维度标签;

17、若所述维度标签的属性为金额数字属性,则调取金额校验数量,获取所述维度标签对应第一文本信息中小数点后部的金额数量作为待校验数量,判断所述待校验数量等于所述金额校验数量,则将所述第一文本信息作为所述目标票据的第二文本信息,并将对应的所述维度标签作为所述目标票据的第二维度标签。

18、可选地,在第一方面的一种可能实现方式中,所述根据一类归类模型生成与各所述第二维度标签对应的一类总节点以及一级文件夹,并基于所述第二维度标签对应的归类区间生成与所述一类总节点对应的多个一类子节点以及二级文件夹,根据所述一类总节点和所述一类子节点生成与所述第二维度标签对应的一类管理树,包括:

19、根据一类归类模型生成与所述第二维度标签对应的一类总节点,并新建一级文件夹,基于所述第二文本信息移动与所述第二维度标签对应的目标票据至所述一级文件夹,并将所述一类总节点与所述一级文件夹关联;

20、基于所述第二维度标签对应的归类区间生成与所述一类总节点连接的多个一类子节点,并生成相应的二级文件夹;

21、根据所述归类区间和第二文本信息,对所述一级文件夹内的目标票据进行归类处理得到对应各归类区间的二级票据,将所述二级票据放置于相应的二级文件夹中,基于所述归类区间将所述二级文件夹和所述一类子节点相关联;

22、将所述一类子节点和所述一类总节点直接连接,生成与所述第二维度标签对应的一类管理树。

23、可选地,在第一方面的一种可能实现方式中,所述接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,按照顺序对所述融合维度信息依次排序得到顺位维度序号,基于融合策略和所述顺位维度序号对所述一类管理树进行融合处理,得到二类管理树,包括:

24、接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,所述融合维度信息仅包括需求维度,所述需求维度包括金额、发票类型、时间、购买方公司名称、销售方公司名称中至少一种;

25、按照顺序对所述需求维度依次排序得到对应各需求维度的顺位维度序号,基于所述顺位维度序号,依次对需求维度排序得到第一需求维度序列,所述需求维度与第二维度标签一一对应;

26、获取所述第一需求维度序列中首个需求维度对应第二维度标签的一类管理树作为初始管理树,并删除第一需求维度序列中首个需求维度,得到第二需求维度序列,基于所述第二需求维度序列中需求维度对应的归类区间,依次对所述初始管理树进行融合处理得到二类管理树。

27、可选地,在第一方面的一种可能实现方式中,所述基于所述第二需求维度序列中需求维度对应的归类区间,依次对所述初始管理树进行融合处理得到二类管理树,包括:

28、提取所述第二需求维度序列中首个需求维度作为当前需求维度,确定所述当前需求维度对应的归类区间作为第一中继区间,基于所述第一中继区间构建与所述初始管理树中各一类子节点直接连接的第一中继子节点和相应的第一中继文件夹,将所述第一中继文件夹移动至初始管理树对应的二级文件夹中;

29、获取所述二级文件夹中二级票据对应所述当前需求维度的第二文本信息,基于所述第一中继区间和第二文本信息,对二级文件夹中二级票据进行归类并移动至相应的第一中继文件夹中,基于第一中继区间将第一中继子节点与相应的第一中继文件夹相关联;

30、提取位于所述第二需求维度序列中下一个需求维度作为当前需求维度,确定所述当前需求维度对应的归类区间作为第二中继区间,基于所述第二中继区间构建与各所述第一中继子节点直接连接的第二中继子节点和相应的第二中继文件夹,将所述第二中继文件夹移动至所述第一中继子节点对应的第一中继文件夹中;

31、获取所述第一中继文件夹中二级票据对应所述当前需求维度的第二文本信息,基于所述第二中继区间和第二文本信息,对第一中继文件夹中二级票据进行归类并移动至相应的第二中继文件夹中,基于第二中继区间将第二中继子节点与相应的第二中继文件夹相关联;

32、将所述第二中继子节点作为第一中继子节点和第二中继文件夹作为第一中继文件夹,重复上述步骤,直至所述第二需求维度序列中不具有需求维度时停止,得到二类管理树。

33、可选地,在第一方面的一种可能实现方式中,所述接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,按照顺序对所述融合维度信息依次排序得到顺位维度序号,基于融合策略和所述顺位维度序号对所述一类管理树进行融合处理,得到二类管理树,包括:

34、接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,所述融合维度信息包括需求维度和需求维度对应的一类需求区间,所述需求维度包括金额、发票类型、时间、购买方公司名称、销售方公司名称中至少一个,所述一类需求区间为相应所述第二维度标签对应的归类区间中的至少一种;

35、按照顺序对所述需求维度依次排序得到对应各需求维度的顺位维度序号,基于所述顺位维度序号,依次对需求维度排序得到需求维度序列;

36、获取第一需求维度序列中首个需求维度对应的一类管理树作为待裁剪管理树和一类需求区间,保留所述待裁剪管理树中与一类需求区间对应的一类子节点得到裁剪后的第一管理树,并删除第一需求维度序列中首个需求维度,得到第二需求维度序列,基于所述第二需求维度序列中需求维度对应的一类需求区间,依次对所述第一管理树进行融合处理得到二类管理树。

37、可选地,在第一方面的一种可能实现方式中,所述基于所述第二需求维度序列中需求维度对应的一类需求区间,依次对所述第一管理树进行融合处理得到二类管理树,包括:

38、提取所述第二需求维度序列中首个需求维度作为当前需求维度,确定所述当前需求维度对应的一类需求区间作为第一中继区间,基于所述第一中继区间构建与所述第一管理树中各一类子节点直接连接的第一中继子节点和相应的第一中继文件夹,将所述第一中继文件夹移动至第一管理树对应的二级文件夹中;

39、获取所述二级文件夹中二级票据对应所述当前需求维度的第二文本信息,基于所述第一中继区间和第二文本信息,对二级文件夹中二级票据进行归类并移动至相应的第一中继文件夹中,基于第一中继区间将第一中继子节点与相应的第一中继文件夹相关联;

40、提取位于所述第二需求维度序列中下一个需求维度作为当前需求维度,确定所述当前需求维度对应的第一需求区间作为第二中继区间,基于所述第二中继区间构建与各所述第一中继子节点直接连接的第二中继子节点和相应的第二中继文件夹,将所述第二中继文件夹移动至所述第一中继子节点对应的第一中继文件夹中;

41、获取所述第一中继文件夹中二级票据对应所述当前需求维度的第二文本信息,基于所述第二中继区间和第二文本信息,对第一中继文件夹中二级票据进行归类并移动至相应的第二中继文件夹中,基于第二中继区间将第二中继子节点与相应的第二中继文件夹相关联;

42、将所述第二中继子节点作为第一中继子节点和第二中继文件夹作为第一中继文件夹,重复上述步骤,直至所述第二需求维度序列中不具有需求维度时停止,得到二类管理树。

43、可选地,在第一方面的一种可能实现方式中,所述接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,按照顺序对所述融合维度信息依次排序得到顺位维度序号,基于融合策略和所述顺位维度序号对所述一类管理树进行融合处理,得到二类管理树,包括:

44、接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,所述融合维度信息包括需求维度和需求维度对应的二类需求区间,所述需求维度包括金额维度、发票类型维度、时间维度、公司名称维度中至少一个,所述二类需求区间为用户主动输入的需求区间;

45、按照顺序对所述需求维度依次排序得到对应各需求维度的顺位维度序号,基于所述顺位维度序号,依次对需求维度排序得到需求维度序列;

46、获取需求维度序列中首个需求维度作为当前需求维度,调取与所述当前需求维度对应一类总节点作为二类总节点,以及相应的一级文件夹作为第一文件夹,将所述二类总节点与所述第一文件夹关联;

47、基于所述当前需求维度对应的二类需求区间生成与所述二类总节点连接的多个二类子节点,并生成相应的第二文件夹;

48、根据所述二类需求区间和第二文本信息,对所述第一文件夹内的目标票据进行归类处理得到对应各二类需求区间的二级票据,将所述二级票据放置于相应的第二文件夹中,基于所述归类区间,将所述二级文件夹和所述二类子节点相关联;

49、将所述二类子节点和所述二类总节点直接连接,生成与所述当前需求维度对应的新建管理树;

50、提取位于所述需求维度序列中下一个需求维度作为当前需求维度,确定所述当前需求维度对应的二类需求区间作为第一中继区间,基于所述第一中继区间构建与各所述二类子节点直接连接的第一中继子节点和相应的第一中继文件夹,将所述第一中继文件夹移动至所述二类子节点对应的第二文件夹中;

51、获取所述第二文件夹中二级票据对应所述当前需求维度的第二文本信息,基于所述第一中继区间和第二文本信息,对第二文件夹中二级票据进行归类并移动至相应的第一中继文件夹中,基于第一中继区间将第一中继子节点与相应的第一中继文件夹相关联;

52、将所述第一中继子节点作为二类子节点和第一中继文件夹作为第二文件夹,重复上述步骤,直至所述第二需求维度序列中不具有需求维度时停止,得到二类管理树。

53、本发明实施例的第二方面,提供一种基于图像处理的金融数据管理系统,包括:

54、提取模块,用于调取预设识别图层叠加在目标票据上方,所述预设识别图层包括定位线以及多个识别目标区,根据对齐策略和所述定位线将所述预设识别图层与所述目标票据对齐,并基于所述识别目标区提取对应各维度标签的第一文本信息;

55、校验模块,用于调取与所述维度标签对应的文本效验策略对所述第一文本信息进行效验,将满足效验要求的所述第一文本信息作为所述目标票据的第二文本信息,并将对应的所述维度标签作为所述目标票据的第二维度标签;

56、生成模块,用于根据一类归类模型生成与各所述第二维度标签对应的一类总节点以及一级文件夹,并基于所述第二维度标签对应的归类区间生成与所述一类总节点对应的多个一类子节点以及二级文件夹,根据所述一类总节点和所述一类子节点生成与所述第二维度标签对应的一类管理树;

57、融合模块,用于接收用户的融合需求信息,对所述融合需求信息进行解析得到融合维度信息,按照顺序对所述融合维度信息依次排序得到顺位维度序号,基于融合策略和所述顺位维度序号对所述一类管理树进行融合处理,得到二类管理树。

58、本发明实施例的第三方面,提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能涉及的所述方法。

59、本发明的有益效果如下:

60、1、本发明可以选择性的对票据中的内容进行自动识别,并校验生成与票据对应的第二维度标签,依据用户不同的需求生成不同的二类管理树,本发明可以实现对票据的自动整理,并依据用户的需求不同进行为用户筛选符合其需求的票据,减少了查找相应票据的时间。本发明通过预设识别图层处的定位线以及多个识别目标区,利用定位线与目标票据对齐,使得预设识别图层处的识别目标区与相应的目标票据的区域相对应,方便后续对用户所需要的文字进行识别,方便选择票据中较为重要的内容进行自动归类。本发明会依据用户的需求对一类管理树进行融合处理,得到与用户需求对应的二类管理树,方便后续针对用户的不同需求得到不同的二类管理树,协助用户对金融数据进行融合检索,得到符合用户需求的结果。

61、2、本发明依据预设识别图层的定位线和识别目标区对目标票据进行定位处理和对所需文本进行自动识别得到识别后的第一文本信息,并且第一文本信息具有相应的校验策略分别进行校验,从而得到符合要求的第二文本信息。本发明依次通过旋转处理和对齐处理使得预设识别图层中定位线与目标票据中票据线相互对齐,首先,分别确定定位线与票据线的第一侧和第二侧,并进行坐标化处理,可以得到定位线与票据线的斜率从而得到相应的夹角,根据两者夹角的差值可以确定旋转的调节角度,使得定位线与票据线相互平行,后续直接将定位线与票据线的2个定位点进行对齐,使得预设识别图层与目标票据完全重合,完成定位后仅对识别目标区对应的区域内的文字进行识别,实现了自动对票据中重要的文字信息进行自动识别,得到各个维度标签的第一文本信息。每个维度标签具有相应的校验策略如果是文本属性则选择文本尾部中预设文本数量的文本,通过与尾部校验集合进行比对查看是否出现错误,如果为通讯数字属性,则对通信位数进行校验,如果为金额数字属性则查看小数点后是否等于金额校验数量,本发明会对提取的字符信息进行自动校验,如果出现错误则提醒管理员进行重新拍摄,如果没有错误则将第一文本信息作为所述目标票据的第二文本信息。

62、3、本发明会利用一类归类模型自动生成与各个第二维度标签对应的一类管理树,方便用户对各个第二维度标签的数据进行直接调取,并且结合用户的不同需求生成不同的二类管理树,方便后续协助用户对金融数据进行融合检索。本发明会针对不同的第二维度标签生成相应一类总节点,每个一类总节点对应相应的一级文件夹,每个一级文件夹中存放有与所述第二维度标签对应的目标票据,并依据第二维度标签对应的归类区间生成与一类总节点连接的多个一类子节点并生成与一类子节点对应的二级文件夹,按照归类区间和每个目标票据对应第二维度标签的第二文本信息,对目标票据进行归类移动至相应的二级文件夹,使得每个第二维度标签都具有相应的一类管理树,方便后续针对用户不同的单一需求进行直接调取相应的目标票据进行查看。本发明会依据用户的需求对一类管理树进行2种类别的融合处理,使得可以依据用户的不同需求进行不同的融合,第一种,通过用户的融合维度信息仅包括需求维度,则会依据用户不同需求维度并调取一类管理树进行自动融合处理,得到多维度的二类管理树,依据用户的不同需求对一类管理树进行自动融合处理,方便用户后续进行查找相应目标票据。第二种,用户的融合维度信息包括需求维度和需求维度对应的一类需求区间,可以调取一类管理树并对相应的节点进行裁剪,得到符合用户需求维度和一类需求区间的管理树,后续依据用户选中的一类需求区间自动生成相应的二类管理树,使得二类管理树中的一类需求区间满足用户的需求,可以较为精准的定位到用户所需的目标票据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1