文本行分类器的生成方法及装置与流程

文档序号：11831604阅读：来源：国知局

技术特征：

1.一种文本行分类器的生成方法，其特征在于，包括：

利用当前终端系统字库生成文本行样本；

对所述文本行样本和预存的标注样本进行特征提取；以及

根据提取到的特征进行模型训练，生成文本行分类器，以用于识别文本区域。

2.根据权利要求1所述的方法，其特征在于，还包括：

对待识别的图片进行检测，以获得检测结果；以及

使用所述文本行分类器针对所述检测结果输出分数，若所述分数大于预设阈值，则确认待识别的图片为文本区域，若所述分数小于等于预设阈值，则确认待识别的图片为非文本区域。

3.根据权利要求1或2所述的方法，其特征在于，所述利用当前终端系统字库生成文本行样本，包括：

利用当前终端系统字库生成文字样本，对所述文字样本进行处理，以生成不同类型的文本行样本，其中，所有文本行样本中包含的文字样本均满足以下条件：大小相同、旋转角度相同、字体相同、包含的常用字大于预设比例。

4.根据权利要求1或2所述的方法，其特征在于，所述对所述文本行样本和预存的标注样本进行特征提取，包括：

提取所述文本行样本对应图片的梯度方向直方图特征、梯度大小直方图特征、像素直方图特征和像素变化特征中的一种或几种；以及

获得所述文本行样本和所述标注样本的连通区域，并提取所述连通区域的特征。

5.根据权利要求1或2所述的方法，其特征在于，所述根据提取到的特征进行模型训练，生成文本行分类器，包括：

根据提取到的特征生成与文本行样本类型对应的模型，并利用所述标注样本设置所述模型的权重，以生成所述文本行分类器。

6.根据权利要求4所述的方法，其特征在于，所述获得所述标注样本的连通区域，包括：

使用第一预设算法获得所述标注样本的连通区域，所述第二预设算法包括最大稳定极值区域MSER算法和MSER算法的改进算法。

7.根据权利要求4所述的方法，其特征在于，所述获得所述连通区域的特征，包括：

使用第二预设算法获得所述连通区域中笔画的宽度特征，所述第二预设算法包括SWT算法和SFT算法。

8.一种文本行分类器的生成装置，其特征在于，包括：

生成模块，用于利用当前终端系统字库生成文本行样本；

提取模块，用于对所述生成模块生成的文本行样本和预存的标注样本进行特征提取；以及

训练模块，用于根据所述提取模块提取到的特征进行模型训练，生成文本行分类器，以用于识别文本区域。

9.根据权利要求8所述的装置，其特征在于，还包括：

检测模块，用于对待识别的图片进行检测，以获得检测结果；以及

识别模块，用于使用所述训练模块训练生成的所述文本行分类器针对所述检测结果输出分数，若所述分数大于预设阈值，则确认待识别的图片为文本区域，若所述分数小于等于预设阈值，则确认待识别的图片为非文本区域。

10.根据权利要求8或9所述的装置，其特征在于，所述生成模块，具体用于：

11.根据权利要求8或9所述的装置，其特征在于，所述提取模块包括：

第一提取单元，用于提取所述文本行样本对应图片的梯度方向直方图特征、梯度大小直方图特征、像素直方图特征和像素变化特征中的一种或几种；以及

第二提取单元，用于获得所述文本行样本和所述标注样本的连通区域，并提取所述连通区域的特征。

12.根据权利要求8或9所述的装置，其特征在于，所述训练模块，具体用于：

根据提取到的特征生成与文本行样本类型对应的模型，并利用所述标注样本设置所述模型的权重，以生成所述文本行分类器。

13.根据权利要求11所述的装置，其特征在于，所述第二提取单元，具体用于：

使用第一预设算法获得所述标注样本的连通区域，所述第二预设算法包括最大稳定极值区域MSER算法和MSER算法的改进算法。

14.根据权利要求11所述的装置，其特征在于，所述第二提取单元，具体用于：

使用第二预设算法获得所述连通区域中笔画的宽度特征，所述第二预设算法包括SWT算法和SFT算法。

完整全部详细技术资料下载

当前第2页1 2 3