图像中文字区域的定位方法及装置与流程

文档序号:11832892阅读:来源:国知局

技术特征:

1.一种图像中文字区域的定位方法,其特征在于,包括:

构建参数回归模型;

通过所述参数回归模型生成与图像对应的文本空间分布参数;

根据所述文本空间分布参数重构与所述图像对应的文字-非文字二值图像。

2.根据权利要求1所述的图像中文字区域的定位方法,其特征在于,所述构建参数回归模型,包括:

获取所述参数回归模型的目标文本空间分布参数;

将测试图像输入所述参数回归模型生成测试文本空间分布参数;

根据所述目标文本空间分布参数与所述测试文本空间分布参数运算得到当前误差;

计算所述当前误差与基础误差的差值;其中,所述基础误差为上次运算得到的误差;

判断所述差值是否小于第一预设阈值;

若所述差值大于或者等于所述第一预设阈值,根据所述当前误差调整所述参数回归模型的未知参数,将所述当前误差确定为基础误差,并重复执行步骤将测试图像输入所述参数回归模型生成测试文本空间分布参数,直至所述差值小于所述第一预设阈值;

若所述差值小于所述第一预设阈值,将所述参数回归模型未知参数的当前值确定为模型参数。

3.根据权利要求1所述的图像中文字区域的定位方法,其特征在于,所述根据所述文本空间分布参数重构与所述图像对应的文字-非文字二值图像,包括:

将所述文本空间分布参数中小于第二预设阈值的参数设置为0;将所述文本空间分布参数中大于所述第二预设阈值的参数设置为1;

将参数0和参数1转换为二值像素灰度值;

根据所述的二值像素灰度值构建所述文字-非文字二值图像。

4.根据权利要求3所述的图像中文字区域的定位方法,其特征在于,在所述将所述文本空间分布参数中小于预设阈值的参数设置为0;将所述文本空间分布参数中大于预设阈值的参数设置为1之前,还包括:

构建降维模型;

将所述文本空间分布参数输入所述降维模型;

通过参数重构的方式将所述文本空间分布参数进行降维处理。

5.根据权利要求4所述的图像中文字区域的定位方法,其特征在于,所述构建降维模型,包括:

获取预先标注的二值化图像的文本空间分布参数作为标定文本空间分布参数;

将所述二值化图像的像素灰度值输入所述降维模型生成重构文本空间分布参数;

根据所述标定文本空间分布参数与所述重构文本空间分布参数运算得到当前误差;

计算所述当前误差与基础误差的差值;其中,所述基础误差为上次运算得到的误差;

判断所述差值是否小于第三预设阈值;

若所述差值大于等于所述第三预设阈值,根据所述当前误差调整所述降维模型的未知参数,将所述当前误差确定为基础误差,并重复执行步骤将所述二值化图像的像素灰度值输入所述降维模型生成重构文本空间分布参数,直至所述差值小于所述第三预设阈值;

若所述差值小于所述第三预设阈值,将所述降维模型未知参数的当前值确定为模型参数。

6.根据权利要求2至5中任一权项所述的图像中文字区域的定位方法,其特征在于,所述获取所述参数回归模型的目标文本空间分布参数,包括:

读取所述降维模型最后一层的输出数据;

将所述降维模型最后一层的输出数据确定为所述目标文本空间分布参数。

7.一种图像中文字区域的定位装置,其特征在于,包括:

构建模块,用于构建参数回归模型;

生成模块,用于通过所述构建模块所构建的参数回归模型生成与图像对应的文本空间分布参数;

重构模块,用于根据所述生成模块所生成的文本空间分布参数重构与所述图像对应的文字-非文字二值图像。

8.根据权利要求7所述的装置,其特征在于,所述构建模块包括:获取单元,生成单元、计算单元、判断单元、调整单元和确定单元,其中,

所述获取单元,用于获取所述参数回归模型的目标文本空间分布参数;

所述生成单元,用于将测试图像输入所述参数回归模型生成测试文本空间分布参数;

所述计算单元,用于根据所述目标文本空间分布参数与所述测试文本空间分布参数运算得到当前误差;还用于计算所述当前误差与基础误差的差值;其中,所述基础误差为上次运算得到的误差;

所述判断单元,用于判断所述差值是否小于第一预设阈值;

在所述差值大于或者等于所述第一预设阈值时,所述调整单元,用于根据所述当前误差调整所述参数回归模型的未知参数;所述确定单元,用于在所述差值大于或者等于所述第一预设阈值时,将所述当前误差确定为基础误差;

在所述差值小于所述第一预设阈值时,所述确定单元,还用于将所述参数回归模型未知参数的当前值确定为模型参数。

9.根据权利要求7所述的装置,其特征在于,所述重构模块包括:二值化单元、转换单元和构建单元,其中,

所述二值化单元,用于将所述文本空间分布参数中小于第二预设阈值的参数设置为0;将所述文本空间分布参数中大于所述第二预设阈值的参数设置为1;

所述转换单元,用于将参数0和参数1转换为二值像素灰度值;

所述构建单元,用于根据所述的二值像素灰度值构建所述文字-非文字二值图像。

10.根据权利要求7所述的装置,其特征在于,所述装置还包括:输入单元和降维单元,其中,

所述构建模块,还用于构建降维模型;

所述输入单元,用于将所述文本空间分布参数输入所述降维模型;

所述降维单元,用于通过参数重构的方式将所述文本空间分布参数进行降维处理。

11.根据权利要求10所述的装置,其特征在于,

所述获取单元,还用于获取预先标注的二值化图像的文本空间分布参数作为标定文本空间分布参数;

所述生成单元,还用于将所述二值化图像的像素灰度值输入所述降维模型生成重构文本空间分布参数;

所述计算单元,还用于根据所述标定文本空间分布参数与所述重构文本空间分布参数运算得到当前误差;计算所述当前误差与基础误差的差值;

所述判断单元,还用于判断所述差值是否小于第三预设阈值;

在所述差值大于等于所述第三预设阈值时,所述调整单元,还用于根据所述当前误 差调整所述降维模型的未知参数;所述确定单元,还用于将所述当前误差确定为基础误差;

在所述差值小于所述第三预设阈值时,所述确定单元,还用于将所述降维模型未知参数的当前值确定为模型参数。

12.根据权利要求8至11中任一权项所述的装置,其特征在于,所述获取单元包括:

读取子单元,用于读取所述降维模型最后一层的输出数据;

所述确定单元,还用于将所述降维模型最后一层的输出数据确定为所述目标文本空间分布参数。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1