一种英语单词识别方法和装置与流程

文档序号：11865273阅读：来源：国知局

技术特征：

1.一种英语单词识别方法，其特征在于，包括：

对输入的视频图像进行笔画宽度变换；

对经笔画宽度变换后输出的图像进行连通域分析，并从分析结果中筛选出是文本区域的连通域；

对筛选出的连通域进行合并，得到文本行；

利用光学字符识别模型对所述文本行进行识别，其中，所述光学字符识别模型的训练数据为英文字母，每个英文字母都具有多种不同腐蚀度的模板；

对识别出的文本行进行语义分析，选出符合语义的文本行。

2.根据权利要求1所述的方法，其特征在于，所述对输入图像进行笔画宽度变换，包括：

将输入的视频图像解码为RGB图像；

把所述RGB图像转化成灰度图；

把所述灰度图转化成标准窗口小部件工具箱图像；

利用Canny边缘检测算子对所述标准窗口小部件工具箱图像进行边缘检测，得到所有边缘像素点；

利用sobel算子分别计算得到各边缘像素点的梯度方向；

为每一个所述边缘像素点寻找与其梯度方向相反的边缘像素点，形成边缘像素点对；

分别计算由每一个所述边缘像素点对确定的笔画宽度值，其笔画宽度值的大小为本边缘像素对之间的欧式距离。

3.根据权利要求1所述的方法，其特征在于，所述从分析结果中筛选出是文本区域的连通域，包括：

从分析结果中筛选出是文本区域的连通域，筛选条件包括：连通域的笔划宽度一致；而且与要识别的英语单词的颜色相同的像素点在连通域中所占比例不低于第一预设值。

4.根据权利要求1所述的方法，其特征在于，所述从分析结果中筛选出是文本区域的连通域，包括：

从分析结果中筛选出是文本区域的连通域，筛选条件包括：连通域的笔划宽度一致；而且连通域的笔画方差不低于第二预设值、笔画均值不低于第三预设值且连通域宽高比不超过第四预设值。

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述利用光学字符识别模型对所述文本行进行识别前，还包括：利用最大类间方差二值化过滤所述文本行的背景噪音；

对应的，所述利用光学字符识别模型对所述文本行进行识别，为：利用光学字符识别模型对背景噪音过滤后的文本行进行识别。

6.一种英语单词识别装置，其特征在于，包括：

笔画宽度变换模块，用于对输入的视频图像进行笔画宽度变换；

连通域分析筛选单元，用于对经笔画宽度变换后输出的图像进行连通域分析，并从分析结果中筛选出是文本区域的连通域；

文本行合并单元，用于对筛选出的连通域进行合并，得到文本行；

OCR识别单元，用于利用光学字符识别模型对所述文本行进行识别，其中，所述光学字符识别模型的训练数据为英文字母，每个英文字母都具有多种不同腐蚀度的模板；

语义分析单元，对识别出的文本行进行语义分析，选出符合语义的文本行。

7.根据权利要求6所述的装置，其特征在于，所述笔画宽度变换模块具体包括：

RGB图像转化单元，用于将输入的视频图像解码为RGB图像；

灰度图转化单元，用于把所述RGB图像转化成灰度图；

SWT图像转化单元，用于把所述灰度图转化成SWT图像；

边缘检测单元，用于利用Canny边缘检测算子对所述SWT图像进行边缘检测，得到所有边缘像素点；

梯度方向计算单元，用于利用sobel算子分别计算得到各边缘像素点的梯度方向；

笔画宽度计算单元，用于为每一个所述边缘像素点寻找与其梯度方向相反的边缘像素点，形成边缘像素点对；分别计算由每一个边缘像素点对确定的笔画宽度值，大小为本边缘像素对之间的欧式距离。

8.根据权利要求6所述的装置，其特征在于，所述连通域分析筛选单元具体用于对经笔画宽度变换后输出的图像进行连通域分析，并从中筛选出笔划宽度一致，而且与要识别的英语单词的颜色相同的像素点在连通域中所占比例不低于第一预设值的连通域。

9.根据权利要求6所述的装置，其特征在于，所述连通域分析筛选单元具体用于对经笔画宽度变换后输出的图像进行连通域分析，并从中筛选出连通域的笔划宽度一致，而且连通域的笔画方差不低于第二预设值、笔画均值不低于第三预设值且连通域宽高比不超过第四预设值的连通域。

10.根据权利要求6-9中任一项所述的装置，其特征在于，所述装置还包括：背景噪音过滤单元，用于在利用光学字符识别模型对所述文本行进行识别前，先利用最大类间方差二值化过滤所述文本行的背景噪音。

完整全部详细技术资料下载

当前第2页1 2 3