数据处理方法、装置、设备以及介质与流程

文档序号:37265130发布日期:2024-03-12 20:48阅读:14来源:国知局
数据处理方法、装置、设备以及介质与流程

本技术涉及互联网,尤其涉及一种数据处理方法、装置、设备以及介质。


背景技术:

1、文本识别技术是指利用计算机对图像中的文字进行识别,并输出识别文本的过程。文本识别技术可以应用在多个领域,例如,信件和快递包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总等领域。用户通过文本识别技术可以快速录入图像中的文本信息,提高工作效率。

2、目前的文本识别场景中,通常利用光学字符识别(optical characterrecognition,ocr)识别出含有文本信息的图像中的每一个字段,再由用户从文本识别结果中筛选出实际需要的文本内容,以便进行信息录入。可见,这种文本识别方式得到的文本识别结果可能与实际期望的文本内容并不匹配,影响了文本识别效果。


技术实现思路

1、本技术实施例提供一种数据处理方法、装置、设备以及介质,可以提升文本识别效果。

2、本技术实施例一方面提供了一种数据处理方法,包括:

3、响应针对模板配置入口的触发操作,显示模板配置页面;

4、响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板包含编辑操作所指示的配置字段名;

5、为文本识别模板生成模板标识;模板标识用于调用业务服务对象对应的文本识别模板,以为业务服务对象提供结构化识别服务。

6、本技术实施例一方面提供了一种数据处理装置,包括:

7、配置页面显示模块,用于响应针对模板配置入口的触发操作,显示模板配置页面;

8、识别模板创建模块,用于响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板用于为业务服务对象提供结构化识别服务,不同的文本识别模板用于服务不同的业务服务对象;

9、模板标识生成模块,用于为文本识别模板生成模板标识,将模板标识发送给业务服务对象;模板标识用于调用业务服务对象对应的文本识别模板。

10、其中,数据处理装置还包括创建权限申请模块,创建权限申请模块用于:

11、接收业务服务对象对应的权限申请请求,获取权限申请请求携带的对象凭证;

12、若对象凭证指示业务服务对象满足权限激活条件,则确定业务服务对象具备模板创建权限,为业务服务对象显示模板配置入口。

13、其中,配置页面显示模块具体用于:

14、响应针对模板配置入口的触发操作,显示模板编辑页面;

15、响应模板编辑页面中的类型输入区域的编辑操作,根据类型输入区域中的编辑内容确定模板类型;

16、响应针对模板类型的确认操作,显示模板配置页面,在模板配置页面中显示与模板类型相匹配的初始识别模板。

17、其中,配置页面显示模块具体用于:

18、响应针对模板配置入口的触发操作,显示一个或者多个初始识别模板;

19、显示模板配置页面,在模板配置页面中显示,针对一个或者多个初始识别模板的模板选择操作所触发的初始识别模板。

20、其中,配置页面显示模块具体用于:

21、响应针对模板配置入口的触发操作,显示模板编辑页面;

22、响应模板编辑页面中的样图输入区域的样图添加操作,将样图输入区域中的输入图像确定为样本配置图像;

23、显示模板配置页面,在模板配置页面中显示与初始识别模板相匹配的样本配置图像的字段识别结果。

24、其中,字段识别结果包括第一识别结果和第二识别结果,配置页面显示模块具体用于:

25、根据初始识别模板,对样本配置图像进行文本识别,得到样本配置图像对应的字段名列表和字段值列表;

26、为字段名列表中所包含的字段名匹配第一配置字段名,为字段值列表中所包含的字段值匹配第二配置字段名;

27、将字段名列表和第一配置字段名确定为样本配置图像对应的第一识别结果,将字段值列表和第二配置字段名确定为样本配置图像对应的第二识别结果。

28、其中,模板配置页面包括第一输入区域和第二输入区域,第一输入区域包括第一识别结果,第二输入区域包括第二识别结果;字段输入区域为第一输入区域和第二输入区域中的任意一个。

29、其中,编辑操作包括子区域添加操作和文本输入操作;识别模板创建模块具体用于:

30、响应针对模板配置页面中的字段输入区域的子区域添加操作,在字段输入区域中添加字段子区域;

31、响应针对字段子区域的文本输入操作,将字段子区域中的输入文本确定为扩充字段名;

32、将包含扩充字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。

33、其中,模板配置页面中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,编辑操作包括子区域删除操作;识别模板创建模块具体用于:

34、响应针对模板配置页面中的字段输入区域的子区域删除操作,在模板配置页面所显示的初始识别模板中,清除子区域删除操作对应的字段子区域中的配置字段名,得到业务服务对象对应的文本识别模板。

35、其中,编辑操作包括字段名修改操作,初始识别模板中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,一个字段子区域对应一个激活控件,激活控件对应的激活状态包括开启状态和关闭状态;识别模板创建模块具体用于:

36、响应针对模板配置页面中的字段输入区域的字段名修改操作,根据字段名修改操作所确定的文本内容,更新字段名修改操作所确定的字段子区域中的配置字段名;

37、将处于开启状态的激活控件对应的字段子区域确定为候选子区域,将包含候选子区域中的配置字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。

38、其中,数据处理装置还包括模板标识发送模块,模板标识发送模块用于:

39、响应针对文本识别模板的确认操作,为文本识别模板生成模板标识,将文本识别模板添加至模板创建记录列表,在模板创建记录列表中为文本识别模板添加发布控件;

40、响应针对文本识别模板对应的发布控件的触发操作,将文本识别模板对应的发布状态从待发布状态切换显示为已发布状态;

41、将处于已发布状态的文本识别模板对应的模板标识,发送给业务服务对象。

42、其中,模板标识发送模块还用于:

43、获取文本识别模板对应的最大历史使用时间戳,根据最大历史使用时间戳确定文本识别模板对应的使用间隔时长;

44、若使用间隔时长大于间隔时长阈值,则在模板创建记录列表中删除文本识别模板。

45、其中,数据处理装置还包括结构化文本识别模块,结构化文本识别模块用于:

46、响应针对文本识别控件的触发操作,显示文本识别页面;文本识别页面包括图像区域和标识区域;

47、响应针对图像区域的图像添加操作,将图像添加操作所指示的图像确定为待识别图像;

48、响应针对标识区域的标识输入操作,在标识区域中显示模板标识;

49、响应针对待识别图像的文本识别操作,将模板标识传入文本识别接口,通过文本识别接口调用模板标识对应的文本识别模板;

50、根据文本识别模板对待识别图像进行文本识别,得到与文本识别模板中的配置字段名相匹配的结构化文本。

51、其中,结构化文本识别模块还用于:

52、响应针对文本识别页面中的模板修改控件的触发操作,显示文本识别模板对应的模板修改页面;

53、响应模板修改页面中的模板修改操作,将模板修改操作所确定的文本识别模板确定为文本更新模板,将业务服务对象对应的文本识别模板替换为文本更新模板。

54、其中,结构化文本识别模块还用于:

55、响应针对文本识别接口的代码导出操作,将文本识别接口关联的代码文件封装为文本识别开发包;

56、将文本识别开发包发送给业务服务对象对应的终端设备,以使终端设备根据文本识别开发包搭建业务服务对象对应的文本识别应用。

57、本技术实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器与处理器相连,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得该计算机设备执行本技术实施例中上述一方面提供的方法。

58、本技术实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序适于由处理器加载并执行,以使得具有处理器的计算机设备执行本技术实施例中上述一方面提供的方法。

59、根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述一方面提供的方法。

60、本技术实施例中,通过响应针对模板配置入口的触发操作,可以显示模板配置页面;通过响应针对模板配置页面中的字段输入区域的编辑操作,可以创建业务服务对象对应的文本识别模板,为文本识别模板生成模板标识,该模板标识可以用于调用业务服务对象对应的文本识别模板,为业务服务对象提供结构化识别服务。其中,文本识别模板可以包含模板配置页面中的字段输入区域的编辑操作所指示的配置字段名,也就是说,在本技术实施例中业务服务对象可以创建自己专属的文本识别模板,通过自己创建的文本识别模板,可以使得提取得到的结构化文本符合实际业务需求,进而有助于提升文本识别效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1