文字识别方法和装置的制造方法_2

文档序号:9766202阅读:来源:国知局
或 2*40*40)。
[0042] 为解决送一问题,本实施例可采取下采样方式来降低特征向量的维数。
[0043] 具体地,参见图5,可W对所述第一图像进行下采样,得到下采样后的第一图像 SubImgO, W及,对所述第二图像进行下采样,得到下采样后的第二图像Sublmgl。然后将下 采样后的第一图像转换为第一组一维向量[feaO],将下采样后的第二图像转换为第二组一 维向量[feal]。
[0044] 在下采样后,点pO'、pO"的值分别为图像SublmgO、SubImgl中对应点的局部高斯 加权和。其中,高斯加权的方式可W减少因下采样导致的信息损失,同时可W较好地处理文 字的局部变形和平移变换。
[0045] S303;将所述第一组一维向量和所述第二组一维向量组合后,得到与所述特征算 子对应的一组特征向量。
[0046] 最终,算子a对应的特征向量为第一组一维向量[feaO]与第二组一维向量[feal] 排成一维向量后的结果[feaO, feal]。在本实施例中,SubImgO和SubImgl大小为7*7,因 此算子a得到的特征向量长度为2*7*7。
[0047] 类似的,可W通过图3所述的方法计算其他H种算子对应的特征向量。
[0048] 需要理解的是,由于上述的四种算子的设计思想在于描述文字的四种方向,因此 在采用不同的算子进行运算时,局部计算方式可能存在一定程度的区别。
[0049] 最后,对所述至少一组的特征向量进行组合,获取待识别的图像的特征向量。例 女口,若使用四种算子,则图像的特征向量由上述四种算子对应的四组特征向量的组合构成; 或者使用a、b两种算子,则图像的特征向量由算子a和算子b对应的两组特征向量的组合 构成,具体的组合方式可W有多种,在此不再一一列举。
[0050] S102;将待识别的图像的特征向量与预先获取的文字样本的特征向量进行比对, 获取待识别的图像的文字识别结果,其中,所述文字样本的特征向量是根据所述特征算子 对所述文字样本进行运算后得到的。
[0051] 具体地,可W预先收集每个文字的大量样本,根据所述特征算子通过与图3所示 的方法得到每个样本的特征向量,再利用聚类的方法从大量样本中找出预设个数的具有代 表性的聚类中必,从而每个文字都可W由预设个数的文字样本的特征向量来表示。当需要 识别图像中的文字时,可将待识别的图像的特征向量与预先获取的文字样本的特征向量进 行比对,计算所述待识别的图像的特征向量与每个所述文字样本的特征向量之间的相似度 数值,将相似度数值最大的文字样本确定为所述待识别的图像的文字识别结果。
[0052] 本实施例通过根据预设的特征算子,获取待识别的图像的特征向量并与预先获取 的文字样本的特征向量进行比对,获取待识别的图像的文字识别结果,由于特征向量是根 据预设的特征算子对当前处理的像素点的不同方向上的相邻的局部像素点进行运算得到 的,对文字的特征表述更加准确,提高了识别准确率,且计算简单,提高了识别速度。
[0053] 图6是根据本申请另一实施例提出的文字识别方法的流程示意图,该方法包括:
[0054] S601 ;收集每个文字的大于预设数量的样本,并根据特征算子得到每个样本的特 征向量。
[0055] 具体地,每个文字都存在多种样本,例如同一个字在不同的字体、不同的语种中或 不同的角度下都可能对应不同的形状,因此,可W收集每个文字的大量样本,并根据特征算 子通过图3中的方法计算每个样本对应的特征向量。
[0056] S602;对每个样本的特征向量进行聚类处理,得到预设个数的聚类中必。
[0057] 具体地,可W对每个样本的特征向量进行聚类处理,从大量样本中找出预设个数 的具有代表性的聚类中必。
[0058] 其中,聚类方法可W有多种,例如kmeans聚类方法等,在此不再一一列举。预设个 数可W根据每个文字对应的样本的具体情况进行设定。
[0059] S603;将预设个数的聚类中必对应的特征向量作为所述文字的文字样本的特征向 量。
[0060] 从而每个文字都可W由预设个数的文字样本的特征向量来表示。
[006。 S604 ;根据预设的特征算子,获取待识别的图像的特征向量。
[0062] 具体与步骤SlOl相同,在此不再赏述。
[0063] S605;计算所述待识别的图像的特征向量与每个所述文字样本的特征向量之间的 相似度数值。
[0064] 具体的,可通过数学方法,依次计算所述待识别的图像的特征向量与每个所述文 字样本的特征向量之间的相似度数值,也可W在已知的文字样本的特征向量中查找与所述 待识别的图像的特征向量相同的特征向量。
[0065] S606;将相似度数值最大的文字样本确定为所述待识别的图像的文字识别结果。
[0066] 本实施例通过根据预设的特征算子,获取待识别的图像的特征向量并与预先获取 的文字样本的特征向量进行比对,获取待识别的图像的文字识别结果,由于特征向量是根 据预设的特征算子对当前处理的像素点的不同方向上的相邻的局部像素点进行运算得到 的,对文字的特征表述更加准确,且提高了识别的准确率,且计算简单,提高了识别速度。另 夕F,预先获取的每个文字都对应预设个数的文字样本的特征向量,可识别不同形态的文字, 提高了识别率。
[0067] 为了实现上述实施例,本申请还提出一种文字识别装置。
[006引图7是本申请另一实施例的文字识别装置的结构示意图。如图7所示,该文字识 别装置包括;获取模块100和识别模块200。
[006引具体地,获取模块100用于根据预设的特征算子,获取待识别的图像的特征向量, 所述特征算子用于根据当前处理的像素点的不同方向上的相邻的局部像素点进行运算。其 中,预设的特征算子包括至少一种。在本申请的一个实施例中,如图2所示,特征算子可W 是如下算子中的至少一项:
[0070] 第一种特征算子(图2中的算子a),所述第一种特征算子用于根据当前处理的像 素点的相邻行的局部像素点进行运算;
[0071] 第二种特征算子(图2中的算子b),所述第二种特征算子用于根据当前处理的像 素点的相邻列的局部像素点进行运算;
[0072] 第H种特征算子(图2中的算子C),所述第H种特征算子用于根据当前处理的像 素点的一种相邻对角线的局部像素点进行运算;
[0073] 第四种特征算子(图2中的算子d),所述第四种特征算子用于根据当前处理的像 素点的另一种相邻对角线的局部像素点进行运算。
[0074] 更具体地,获取模块100可W分别采用每种特征算子,对所述待识别的图像进行 运算,得到与所述特征算子数量相同的至少一组的特征向量,对所述至少一组的特征向量 进行组合,获取待识别的图像的特征向量。
[0075] 识别模块200用于将所述待识别的图像的特征向量与预先获取的文字样本的特 征向量进行比对,获取所述待识别的图像的文字识别结果,其中,所述文字样本的特征向量 是根据所述特征算子对所述文字样本进行运算后得到的。更具体地,识别模块200可W预 先收集每个文字的大量样本,根据所述特征算子得到每个样本的特征向量,再利用聚类的 方法从大量样本中找出预设个数的具有代表性的聚类中必,从而每个文字都可W由预设个 数的文字样本的特征向量来表示。当需要识别图像中的文字时,可将待识别的图像的特征 向量与预先获取的文字样本的特征向量进行比对,计算所述待识别的图像的特征向量与每 个所述文字样本的特征向量之间的相似度数值,将相似度数值最大的文字样本确定为所述 待识别的图像的文字识别结果。
[0076] 本实施例通过根据预设的特征算子,获取待识别的图像的特征向量并与预先获取 的文字样本的特征向量进行比对,获取待识别的图像的文字识别结果,由于特征向量是根 据预设的特征算子对当前处理的像素点的不同方向上的相邻的局部像素点进行运算得到 的,对文字的特征表述更加准确,提高了识别准确率,且计算简单,提高了识别速度。
[0077] 图8是本申请另一实施例的文字识别装置的结构示意图。如图8所示,该文字识 别装置包括;获取模块100、运算子模块110、运算单元111、生成单元112、组合单元113、组 合子模块120、识别模块200、计算子模块210、确定子模块220、收集模块300、聚类模块400 和关联模块500。其中,获取模块100包括运算子模块110和组合子模块120 ;运算子模块 110包括运算单元111、生成单元112和组合单元113 ;识别模块200包括计算子模块210和 确定子模块220。
[0078] 运算子模
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1