梵文天城体印刷字符拉丁转写图像识别方法与流程

文档序号:12468630阅读:来源:国知局

技术特征:

1.一种梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,包括如下步骤:

(1)对包含梵文天城体印刷字符的字符图片进行扫描,基于字符块间垂直最大空白空间进行梵文天城体印刷字符块分割,得到若干梵文天城体印刷字符块;

(2)对得到的梵文天城体印刷字符块进行识别,得到梵文天城体印刷字符块对应的特征向量;

(3)将得到的特征向量与标准拉丁字符的特征向量进行对比,根据对比结果,将识别的梵文天城体印刷字符块转为拉丁字符。

2.根据权利要求1所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,步骤(1)中,对所述字符图片进行梵文天城体印刷字符块分割的方法为:

(1-1)对所述字符图片进行扫描后,识别出当前梵文天城体印刷字符对应的文字区域以及与文字区域相连的空白区域;

(1-2)同时识别出该梵文天城体印刷字符的连接符;

(1-3)利用在垂直于连接符的方向上最大空白区域对得到的文字区域进行分割,分割出所述梵文天城体印刷字符块。

3.根据权利要求2所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,步骤(1-3)中,对文字区域进行分割时,分别对连接符两侧的文字区域进行分割。

4.根据权利要求2所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,步骤(2)中,利用九宫格或田字格的方法对梵文天城体印刷字符块进行识别。

5.根据权利要求4所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,步骤(2)中,以梵文天城体顶部为上,对于位于连接符下方的梵文天城体印刷字符块采用九宫格方法进行识别,对于位于连接符上方的梵文天城体印刷字符块采用田字格方法进行识别。

6.根据权利要求4或5所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,利用九宫格方法进行识别的过程为:利用三组横线和三组竖线,将梵文天城体印刷字符块均为九份,求取每份的像素值,归一化,得到梵文天城体印刷字符块的九维特征向量。

7.根据权利要求4或5所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,利用田字格方法进行识别的过程为:利用两组横线和两组竖线,将梵文天城体印刷字符块均为四份,求取每份的像素值,归一化,得到梵文天城体印刷字符块的四维特征向量。

8.根据权利要求1、4或5所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,步骤(3)中,采用最小方差匹配法进行对比,即具有最小方差结果的标准拉丁字符即为当前梵文天城体印刷字符对应的拉丁字符。

9.根据权利要求1、4或5所述的梵文天城体印刷字符拉丁转写图像识别方法,其特征在于,步骤(3)中,所述标准拉丁字符的特征向量是由已知的梵文天城体印刷字符计算得到。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1