图像处理装置及图像处理方法_5

文档序号:9476262阅读:来源:国知局
处理装置从包含多行字符串的图像中确定各行的区域, 其特征在于, 该图像处理装置具有: 字符区域设定单元,其从图像中提取作为构成字符的像素组的字符要素,以分别包含 字符要素的方式设定多个字符区域;以及 行识别单元,其改变作为起点的字符区域来反复执行行提取处理,由此将所述多个字 符区域分为多个行,所述行提取处理是以某个字符区域为起点,依次连结满足规定的相邻 条件的字符区域,由此提取被推断为属于相同行的字符区域的组, 所述行识别单元执行如下操作: 在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域 不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符 区域时, 比较将所述第3字符区域加入到以所述第1字符区域为起点的行的情况与将所述第3 字符区域加入到以所述第2字符区域为起点的行的情况,由此确定应该将所述第3字符区 域加入到哪一行。2. -种图像处理装置,该图像处理装置从包含多行字符串的图像中确定各行的区域, 其特征在于, 该图像处理装置具有: 字符区域设定单元,其从图像中提取作为构成字符的像素组的字符要素,以分别包含 字符要素的方式设定多个字符区域;以及 行识别单元,其改变作为起点的字符区域来反复执行行提取处理,由此将所述多个字 符区域分为多个行,所述行提取处理是以某个字符区域为起点,依次连结满足规定的相邻 条件的字符区域,由此提取被推断为属于相同行的字符区域的组, 所述行识别单元执行如下操作: 在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域 不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符 区域时, 比较所述第3字符区域相对于以所述第1字符区域为起点的行的相邻字符区域的连结 强度与所述第3字符区域相对于以所述第2字符区域为起点的行的相邻字符区域的连结强 度,将所述第3字符区域加入连结强的行中。3. 根据权利要求2所述的图像处理装置,其特征在于, 在与行的方向垂直的方向上的、所述相邻字符区域与所述第3字符区域的重叠程度越 大,所述行识别单元评价为所述第3字符区域相对于所述相邻字符区域的连结越强。4. 根据权利要求2或者3所述的图像处理装置,其特征在于, 所述相邻字符区域与所述第3字符区域的大小越相似,所述行识别单元评价为所述第 3字符区域相对于所述相邻字符区域的连结越强。5. 根据权利要求2至4中任意一项所述的图像处理装置,其特征在于, 所述相邻字符区域内的图像与所述第3字符区域内的图像的颜色或者亮度的特征越 相似,所述行识别单元评价为所述第3字符区域相对于所述相邻字符区域的连结越强。6. -种图像处理装置,该图像处理装置从包含多行字符串的图像中确定各行的区域, 其特征在于, 该图像处理装置具有: 格式字符串获取单元,其获取对各行字符串的格式进行定义的格式字符串; 字符区域设定单元,其从图像中提取作为构成字符的像素组的字符要素,以分别包含 字符要素的方式设定多个字符区域;以及 行识别单元,其改变作为起点的字符区域来反复执行行提取处理,由此将所述多个字 符区域分为多个行,所述行提取处理是以某个字符区域为起点,依次连结满足规定的相邻 条件的字符区域,由此提取被推断为属于相同行的字符区域的组, 所述行识别单元执行如下操作: 在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域 不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符 区域时, 设将所述第3字符区域加入到以所述第1字符区域为起点的行中的情况下生成的多个 行是第1候选,将所述第3字符区域加入到以所述第2字符区域为起点的行中的情况下生 成的多个行是第2候选, 比较以下两种相似度而采用相似度高的候选,所述两种相似度是:从所述第1候选的 各行中识别的字符串的格式与所述格式字符串所定义的各行字符串的格式之间的相似度; 从所述第2候选的各行中识别的字符串的格式与所述格式字符串所定义的各行字符串的 格式之间的相似度。7. 根据权利要求6所述的图像处理装置,其特征在于, 所述格式字符串是至少定义了构成字符串的字符的个数以及一部分或者全部字符的 字符种类的信息。8. -种图像处理方法,该图像处理方法从包含多行字符串的图像中确定各行的区域, 其特征在于, 该图像处理方法具有以下步骤: 字符区域设定步骤,计算机从图像中提取作为构成字符的像素组的字符要素,以分别 包含字符要素的方式设定多个字符区域;以及 行识别步骤,计算机改变作为起点的字符区域来反复执行行提取处理,由此将所述多 个字符区域分为多个行,所述行提取处理是以某个字符区域为起点,依次连结满足规定的 相邻条件的字符区域,由此提取被推断为属于相同行的字符区域的组, 在所述行识别步骤中, 在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域 不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符 区域时, 比较将所述第3字符区域加入到以所述第1字符区域为起点的行的情况与将所述第3 字符区域加入到以所述第2字符区域为起点的行的情况,由此确定应该将所述第3字符区 域加入到哪一行。9. 一种图像处理方法,该图像处理方法从包含多行字符串的图像中确定各行的区域, 其特征在于, 该图像处理方法具有以下步骤: 字符区域设定步骤,计算机从图像中提取作为构成字符的像素组的字符要素,以分别 包含字符要素的方式设定多个字符区域;以及 行识别步骤,计算机改变作为起点的字符区域来反复执行行提取处理,由此将所述多 个字符区域分为多个行,所述行提取处理是以某个字符区域为起点,依次连结满足规定的 相邻条件的字符区域,由此提取被推断为属于相同行的字符区域的组, 在所述行识别步骤中, 在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域 不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符 区域时, 比较所述第3字符区域相对于以所述第1字符区域为起点的行的相邻字符区域的连结 强度与所述第3字符区域相对于以所述第2字符区域为起点的行的相邻字符区域的连结强 度,将所述第3字符区域加入到连结强的行中。10. -种图像处理方法,该图像处理方法从包含多行字符串的图像中确定各行的区域, 其特征在于, 该图像处理方法具有以下步骤: 格式字符串获取步骤,计算机获取对各行字符串的格式进行定义的格式字符串; 字符区域设定步骤,计算机从图像中提取作为构成字符的像素组的字符要素,以分别 包含字符要素的方式设定多个字符区域;以及 行识别步骤,计算机改变作为起点的字符区域来反复执行行提取处理,由此将所述多 个字符区域分为多个行,所述行提取处理是以某个字符区域为起点,依次连结满足规定的 相邻条件的字符区域,由此提取被推断为属于相同行的字符区域的组, 在所述行识别步骤中, 在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域 不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符 区域时, 设将所述第3字符区域加入到以所述第1字符区域为起点的行中的情况下生成的多个 行是第1候选,将所述第3字符区域加入到以所述第2字符区域为起点的行中的情况下生 成的多个行是第2候选, 比较以下两种相似度而采用相似度高的候选,所述两种相似度是:从所述第1候选的 各行中识别的字符串的格式与所述格式字符串所定义的各行字符串的格式之间的相似度; 从所述第2候选的各行中识别的字符串的格式与所述格式字符串所定义的各行字符串的 格式之间的相似度。11. 一种程序,其特征在于, 该程序使计算机执行权利要求8至10中任意一项所述的图像处理方法的各步骤。
【专利摘要】行识别单元在以第1字符区域为起点进行行提取处理的情况下、以及以位于与所述第1字符区域不同的行的第2字符区域为起点进行行提取处理的情况下,能够重复选择相同的第3字符区域时,比较将所述第3字符区域加入到以所述第1字符区域为起点的行的情况与将所述第3字符区域加入到以所述第2字符区域为起点的行的情况,来确定应该将所述第3字符区域加入到哪一行。
【IPC分类】G06K9/20
【公开号】CN105229669
【申请号】CN201480027116
【发明人】和田洋贵, 相泽知祯, 殿谷德和, 日向匡史, 凑善久, 大江正道, 小林幸司
【申请人】欧姆龙株式会社
【公开日】2016年1月6日
【申请日】2014年2月27日
【公告号】EP3001352A1, US20160092745, WO2014188753A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1