一种文本检测的方法、装置、电子设备和存储介质与流程

文档序号：22244895发布日期：2020-09-15 20:01阅读：来源：国知局

技术特征：

1.一种文本检测的方法，其特征在于，包括：

获取目标图片的文本行区域掩码的掩码图，所述掩码图与目标图片的尺寸相同；

确定所述掩码图中各个像素点的值，在编号为i的文本行区域掩码中，其文本行区域掩码内的各个像素点的值为i，掩码图中文本行区域掩码外的其余像素点的值为0；1≤i≤m，m为目标图片对应的文本行区域掩码的总数；

将掩码图中第j行像素点的值减去第j+1行对应像素点的值，得到第j行或第j+1行像素点的新值，其中，1≤j≤n，n为掩码图的总行数；

所述新值中等于-i的像素点的集合，形成编号为i的文本行区域掩码对应的第一边界信息，所述新值中等于i的像素点的集合，形成编号为i的文本行区域掩码对应的第二边界信息；

利用所述第一边界信息和第二边界信息构造编号为i的文本行区域掩码对应的文本行轮廓。

2.根据权利要求1所述的方法，其特征在于，获取目标图片的文本行区域掩码的掩码图，包括：

获取目标图片；

将所述目标图片输入预先训练过的基于深度学习的文本行检测网络模型，输出带有各个文本行区域掩码的掩码图。

3.根据权利要求1所述的方法，其特征在于，所述利用所述第一边界信息和第二边界信息构成构造编号为i的文本行区域掩码对应的文本行轮廓，包括：

根据所述第一边界信息和第二边界信息确定编号为i的文本行区域掩码对应的中线位置和高度。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一边界信息和第二边界信息确定编号为i的文本行区域掩码对应的中线位置和高度，包括：

确定所述新值中等于-i的像素点的第一坐标对应的新值中等于i的像素点的第二坐标，所述第一坐标和第二坐标的横坐标相同；

将所述第一坐标和第二坐标的纵坐标相加后求平均，得到中点位置；所有中点位置的集合构成编号为i的文本行区域掩码对应的中线位置；

将所述第一坐标和第二坐标的纵坐标相减后取绝对值，得到高度信息；所有高度信息的集合构成编号为i的文本行区域掩码对应的高度；

基于所述编号为i的文本行区域掩码对应的中线位置和高度构造编号为i的文本行区域掩码对应的文本行轮廓。

5.根据权利要求1所述的方法，其特征在于，所述利用所述第一边界信息和第二边界信息构成构造编号为i的文本行区域掩码对应的文本行轮廓，包括：

将所述新值中等于-i的像素点依次相连，形成编号为i的文本行区域掩码对应的第一边界；将所述新值中等于i的像素点依次相连，形成编号为i的文本行区域掩码对应的第二边界；

确定所述新值等于-i的像素点中横坐标最小的像素点为第一像素点，确定所述新值等于i的像素点中横坐标最小的像素点为第二像素点；确定所述新值等于-i的像素点中横坐标最大的像素点为第三像素点，确定所述新值等于i的像素点中横坐标最大的像素点为第四像素点；

将第一像素点和第二像素点连接，作为编号为i的文本行区域掩码对应的左边界；将第三像素点和第四像素点，连接作为编号为i的文本行区域掩码的右边界；

将所述左边界、第一边界、右边界以及第二边界构成的闭合框形成所述编号为i的文本行区域掩码对应的文本行轮廓。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述方法，还包括：

确定编号为i的文本行区域掩码对应的文本行轮廓在所述目标图片中的位置，将所述文本行轮廓合成于所述目标图片中。

7.一种文本检测的装置，其特征在于，包括：

获取单元，用于获取目标图片的文本行区域掩码的掩码图，所述掩码图与目标图片的尺寸相同；

确定单元，用于确定所述掩码图中各个像素点的值，在编号为i的文本行区域掩码中，其文本行区域掩码内的各个像素点的值为i，掩码图中文本行区域掩码外的其余像素点的值为0；1≤i≤m，m为目标图片对应的文本行区域掩码的总数；

计算单元，用于将掩码图中第j行像素点的值减去第j+1行对应像素点的值，得到第j行或第j+1行像素点的新值，其中，1≤j≤n，n为掩码图的总行数；

信息形成单元，用于所述新值中等于-i的像素点的集合，形成编号为i的文本行区域掩码对应的第一边界信息，所述新值中等于i的像素点的集合，形成编号为i的文本行区域掩码对应的第二边界信息；

轮廓构造单元，用于利用所述第一边界信息和第二边界信息构造编号为i的文本行区域掩码对应的文本行轮廓。

8.根据权利要求7所述的装置，其特征在于，所述获取单元，包括：

图片获取子单元，用于获取目标图片；

识别子单元，用于将所述目标图片输入预先训练过的基于深度学习的文本行检测网络模型，输出带有各个文本行区域掩码的掩码图。

9.根据权利要求7所述的装置，其特征在于，所述轮廓构造单元，包括：

中线和高度获取子单元，用于根据所述第一边界信息和第二边界信息确定编号为i的文本行区域掩码对应的中线位置和高度。

10.根据权利要求9所述的装置，其特征在于，所述中线和高度获取子单元，包括：

第一孙单元，用于确定所述新值中等于-i的像素点的第一坐标对应的新值中等于i的像素点的第二坐标，所述第一坐标和第二坐标的横坐标相同；

第二孙单元，用于将所述第一坐标和第二坐标的纵坐标相加后求平均，得到中点位置；所有中点位置的集合构成编号为i的文本行区域掩码对应的中线位置；

第三孙单元，用于将所述第一坐标和第二坐标的纵坐标相减后取绝对值，得到高度信息；所有高度信息的集合构成编号为i的文本行区域掩码对应的高度；

第四孙单元，用于基于所述编号为i的文本行区域掩码对应的中线位置和高度构造编号为i的文本行区域掩码对应的文本行轮廓。

11.根据权利要求7所述的装置，其特征在于，所述轮廓构造单元，包括：

第一信息构建子单元，用于将所述新值中等于-i的像素点依次相连，形成编号为i的文本行区域掩码对应的第一边界；将所述新值中等于i的像素点依次相连，形成编号为i的文本行区域掩码对应的第二边界；

目标像素点确定子单元，用于确定所述新值等于-i的像素点中横坐标最小的像素点为第一像素点，确定所述新值等于i的像素点中横坐标最小的像素点为第二像素点；确定所述新值等于-i的像素点中横坐标最大的像素点为第三像素点，确定所述新值等于i的像素点中横坐标最大的像素点为第四像素点；

第二信息构建子单元，用于将第一像素点和第二像素点连接，作为编号为i的文本行区域掩码对应的左边界；将第三像素点和第四像素点连接，作为编号为i的文本行区域掩码的右边界；

第三信息构建子单元，用于将所述左边界、第一边界、右边界以及第二边界构成的闭合框形成所述编号为i的文本行区域掩码对应的文本行轮廓。

12.根据权利要求7-11任一项所述的装置，其特征在于，所述装置，还包括：

合成单元，用于确定编号为i的文本行区域掩码对应的文本行轮廓在所述目标图片中的位置，将所述文本行轮廓合成于所述目标图片中。

13.一种电子设备，其特征在于，包括：存储有可执行程序代码的存储器；与所述存储器耦合的处理器；所述处理器调用所述存储器中存储的所述可执行程序代码，用于执行权利要求1至6任一项所述的一种文本检测的方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，其中，所述计算机程序使得计算机执行权利要求1至6任一项所述的一种文本检测的方法。

技术总结
本发明实施例公开了一种文本检测的方法、装置、电子设备和存储介质。该方法包括：获取目标图片的文本行区域掩码的掩码图；确定掩码图中各个像素点的值，在编号为i的文本行区域掩码中，其文本行区域掩码内的各个像素点的值为i；将掩码图中第j行像素点的值减去第j+1行对应像素点的值，得到第j行或第j+1行像素点的新值；新值中等于‑i和i的像素点的集合，分别形成编号为i的文本行区域掩码对应的第一边界信息和第二边界信息；利用第一边界信息和第二边界信息构造编号为i的文本行区域掩码对应的文本行轮廓。实施本发明实施例，可以快速确定各个文本行的轮廓，降低整个文本识别的耗时。

技术研发人员：尹磊;邓小兵;张春雨
受保护的技术使用者：广东小天才科技有限公司
技术研发日：2020.06.08
技术公布日：2020.09.15

完整全部详细技术资料下载

当前第2页1 2