文档处理方法和装置、电子设备和计算机可读存储介质与流程

文档序号:31116901发布日期:2022-08-12 22:13阅读:来源:国知局

技术特征:
1.一种文档处理方法,包括:获取目标文档,其中,所述目标文档包含有至少一个图像数据;对所述图像数据进行识别,以获得所述图像数据的图像信息;根据所述图像信息生成所述图像数据的标签数据;将所述标签数据添加到所述目标文档中以生成标注文档,其中,在所述标注文档中所述标签数据与所述图像数据关联。2.根据权利要求1所述的文档处理方法,所述方法进一步包括:对所述目标文档进行解析,以获得具有预定文件结构的待处理文档。3.根据权利要求1所述的文档处理方法,所述方法进一步包括:检测所述目标文档中是否存在图像内容标签。4.根据权利要求1所述的文档处理方法,其中,所述对所述图像数据进行识别包括:使用图像识别模型来对所述图像数据进行识别。5.根据权利要求1所述的文档处理方法,其中,所述对所述图像数据进行识别包括:根据所述图像数据的类型确定图像识别模型的类型,并且使用所确定的类型的图像识别模型来对所述图像数据进行识别。6.根据权利要求5所述的文档处理方法,其中,所述图像识别模型的类型包括:手写签名识别模块和印章识别模型。7.一种文档处理装置,包括:获取模块,用于获取目标文档,其中,所述目标文档包含有至少一个图像数据;识别模块,用于对所述图像数据进行识别,以获得所述图像数据的图像信息;生成模块,用于根据所述图像信息生成所述图像数据的标签数据;标注模块,用于将所述标签数据添加到所述目标文档中以生成标注文档,其中,在所述标注文档中所述标签数据与所述图像数据关联。8.根据权利要求7所述的文档处理装置,其中,所述文档处理装置进一步包括:解析模块,用于对所述目标文档进行解析,以获得具有预定文件结构的待处理文档。9.一种电子设备,包括:存储器,用于存储程序;处理器,用于运行所述存储器中存储的所述程序,以执行如权利要求1至6中任一所述的文档处理方法。10.一种计算机可读存储介质,其上存储有可被处理器执行的计算机程序,其中,该程序被处理器执行时实现如权利要求1至6中任一所述的文档处理方法。

技术总结
本申请公开了一种文档处理方法和装置、电子设备和计算机可读存储介质。该方法包括:获取目标文档;对图像数据进行识别,以获得图像数据的图像信息;根据图像信息生成图像数据的标签数据;将标签数据添加到目标文档中以生成标注文档。本申请实施例通过从目标文档中提取图像数据,对图像数据进行识别以获取图像信息,将获取到的图像信息作为该图像的标签信息添加到目标文档中,从而这样处理后的目标文档中可以包含有图像的信息,从而当之后用户对这样处理过的目标文档进行内容搜索时,就可以通过目标文档中包含的图像的标签信息而实现低于其中包含的图像的搜索,大大地提高了这样的目标文档的使用效率。目标文档的使用效率。目标文档的使用效率。


技术研发人员:陈祖家 赵欢 姜永 夏昌吉 邢振
受保护的技术使用者:北京爱知之星科技股份有限公司
技术研发日:2021.12.29
技术公布日:2022/8/11
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1