营业执照版面分析方法及装置与流程

文档序号:12597268阅读:来源:国知局

技术特征:

1.一种营业执照版面分析方法,其特征在于,包括:

确定营业执照中的至少一个连通域;

确定所述至少一个连通域中每个连通域的外接矩形,以得到至少一个外接矩形;

根据所述至少一个外接矩形,确定预设字符的定位轴,所述营业执照中的字符包括所述预设字符;

根据所述定位轴,分割所述营业执照的内容,将所述营业执照的内容分割成至少一个字符;

根据所述至少一个字符,对所述营业执照进行版面分析。

2.根据权利要求1所述的方法,其特征在于,所述确定营业执照中的至少一个连通域之前,还包括:

获取所述营业执照的二值化图像;

所述确定营业执照中的至少一个连通域,包括:

确定所述二值化图像中的至少一个连通域。

3.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个外接矩形,确定预设字符的定位轴之前,还包括:

过滤所述至少一个外接矩形,以得到所述至少一个外接矩形中符合条件的外接矩形。

4.根据权利要求3所述的方法,其特征在于,所述符合条件的外接矩形包括:像素数量小于第一阈值的外接矩形、横纵比小于第二阈值的外接矩形、包含的连通域的个数小于第三阈值的外接矩形。

5.根据权利要求1~4任一项所述的方法,其特征在于,所述根据所述至少一个外接矩形,确定预设字符的定位轴,包括:

对所述至少一个外接矩形中的每个外接矩形提取图像特征,以得到图像特征集;

提取所述预设字符的图像特征;

从所述图像特征集中确定出与所述预设字符的图像特征最接近的图像特征,将所述最接近的图像对应的外接矩形作为所述预设字符的定位轴。

6.根据权利要求1~4任一项所述的方法,其特征在于,所述根据所述定位轴,分割所述营业执照的内容,将所述营业执照的内容分割成至少一个字符,包括:

根据所述定位轴,将所述营业执照的内容分割成至少一个字符串;

将所述至少一个字符串中的每个字符串映射到所述营业执照中,以得到映射字符串后的营业执照;

以行为单位从所述映射字符串后的营业执照中提取至少一个行字符串;

对所述至少一个行字符串中的每个行字符串进行分割,以得到所述至少一个字符。

7.一种营业执照版面分析装置,其特征在于,包括:

处理模块,用于确定营业执照中的至少一个连通域;

外接矩形确定模块,用于确定所述至少一个连通域中每个连通域的外接矩形,以得到至少一个外接矩形;

定位轴确定模块,用于根据所述至少一个外接矩形,确定预设字符的定位轴,所述营业执照中的字符包括所述预设字符;

分割模块,用于根据所述定位轴,分割所述营业执照的内容,将所述营业执照的内容分割成至少一个字符;

分析模块,用于根据所述至少一个字符,对所述营业执照进行版面分析。

8.根据权利要求7所述的装置,其特征在于,

所述处理模块,用于获取所述营业执照的二值化图像,确定所述二值化图像中的至少一个连通域。

9.根据权利要求7所述的装置,其特征在于,

所述外接矩形确定模块,还用于在所述定位轴确定模块根据所述至少一个外接矩形,确定预设字符的定位轴之前,过滤所述至少一个外接矩形,以得到所述至少一个外接矩形中符合条件的外接矩形。

10.根据权利要求9所述的装置,其特征在于,所述符合条件的外接矩形包括:像素数量小于第一阈值的外接矩形、横纵比小于第二阈值的外接矩形、包含的连通域的个数小于第三阈值的外接矩形。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1