图像处理方法、装置、设备及计算机可读存储介质与流程

文档序号:19157003发布日期:2019-11-16 00:57阅读:来源:国知局

技术特征:

1.一种图像处理方法,其特征在于,所述方法包括:

获取输入图像的原始特征图;

对所述原始特征图进行多个不同的几何参数变换处理,获得多个变换特征图,所述多个不同的几何参数变换处理包括至少两个不同的尺寸变换处理和/或至少两个不同的方向变换处理;

对所述多个变换特征图分别进行文本检测,获得多个检测文本框;

基于所述多个检测文本框,得到所述输入图像的文本检测结果。

2.根据权利要求1所述的方法,其特征在于,所述多个检测文本框中对应于不同的几何参数变换处理的检测文本框具有不同的大小和/或方向。

3.根据权利要求1或2所述的方法,其特征在于,所述多个检测文本框中对应于每个几何参数变换处理的检测文本框的大小和/或方向位于所述每个几何参数变换处理的预设数值范围内,其中,每个几何参数变换处理的预设数值范围是通过对所述每个几何参数变换处理的预设几何范围进行所述每个几何参数变换处理得到的,不同的几何参数变换处理对应不同的预设几何范围。

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述对所述原始特征图进行多个不同的几何参数变换处理,获得多个变换特征图,包括:

通过多个不同分支对所述原始特征图进行几何参数变换处理,获得多个变换特征图。

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方向变换处理包括以下中的至少一种:旋转、翻转、旋转加翻转、保持方向不变。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述基于所述多个检测文本框,得到目标文本框,包括:

将所述多个检测文本框映射回所述输入图像,得到多个映射文本框;

基于所述多个映射文本框,得到所述输入图像的文本检测结果。

7.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法通过文本检测网络实现,还包括:

根据所述多个检测文本框和所述输入图像的真值数据,确定网络损失值;

基于所述网络损失值,对所述文本检测网络的网络参数进行调整。

8.一种图像处理装置,其特征在于,所述装置包括:

获取单元,用于获取输入图像的原始特征图;

几何参数变换单元,用于对所述原始特征图进行多个不同的几何参数变换处理,获得多个变换特征图,所述多个不同的几何参数变换处理包括至少两个不同的尺寸变换处理和/或至少两个不同的方向变换处理;

文本检测单元,用于对所述多个变换特征图分别进行文本检测,获得多个检测文本框;

目标确定单元,用于基于所述多个检测文本框,得到所述输入图像的文本检测结果。

9.一种图像处理设备,其特征在于,所述设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现权利要求1至7中任一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一所述的方法。


技术总结
本公开涉及一种图像处理方法、装置、设备及计算机可读存储介质。该方法包括:获取输入图像的原始特征图;对所述原始特征图进行多个不同的几何参数变换处理,获得多个变换特征图,所述多个不同的几何参数变换处理包括至少两个不同的尺寸变换处理和/或至少两个不同的方向变换处理;对所述多个变换特征图分别进行文本检测,获得多个检测文本框;基于所述多个检测文本框,得到所述输入图像的文本检测结果。

技术研发人员:许有疆;旷章辉;张伟
受保护的技术使用者:深圳市商汤科技有限公司
技术研发日:2019.08.07
技术公布日:2019.11.15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1