信息处理装置和图像修改方法_5

文档序号:9667755阅读:来源:国知局
件 相同的名称和参考数字,并且将不重复它们的描述。
[0152] 图22是图解根据第四实施例的信息处理系统600的实例的配置图。如图22图示 的,信息处理系统600与第三实施例的不同之处在于,信息处理装置610包括补偿单元619。
[0153] 在第四实施例中,获取单元411被配置为获取同时拍摄的多个图像。
[0154] 补偿单元619组合由获取单元411获取到的多个图像。具体地,补偿单元619计 算局部特征量,在由获取单元411获取到的图像701和702中,局部特征量表现具有不会通 过转动和缩放比例被改变的稳定的特征的点的区域,补偿单元619判定各个图像中的局部 特征量之中最类似的点为对应点,如图23图示。然后,补偿单元619从多个判定出的对应 点推测两个图像之间的移位量和变形量,根据推测的移位量和变形量,互相重叠图像,以使 对应点互相匹配,并且将图像校正为如图24图示的合成图像703。
[0155] 硬件配置
[0156] 图25是图解根据如上所述的实施例和变形实例的信息处理装置的硬件配置实例 的方框图。如图25图示的,根据如上所述的实施例以及变形实例的信息处理装置各自包括 诸如CPU的控制器901、诸如ROM和RAM的存储装置902、诸如HDD和SSD的外储存器装置 903、诸如显示器的显示装置904、诸如鼠标和键盘的输入装置905、通信接口(I/F) 906、以 及诸如摄像机的成像装置907,可以通过使用常用的计算机系统的硬件配置来实现。然而, 根据第三和第四实施例信息处理装置不必包括成像装置907。
[0157]要由根据如上所述的实施例和变形实例的信息处理装置执行的程序可以被预先 内置在ROM等等中,并且从那里被提供。
[0158] 替换地,要由根据如上所述的实施例以及变形实例的信息处理装置执行的程序可 以以能够被安装或者执行的文件的形式被记录在计算机可读的记录介质上,计算机可读的 记录介质诸如是⑶-R0M、⑶-R、存储卡、DVD和软磁盘(FD),并从那里被提供。
[0159] 替换地,要由根据如上所述的实施例和变形实例的信息处理装置执行的程序可以 被存储在连接到诸如因特网的网络的计算机系统上,并且通过经由该网络被下载而被提 供。仍然替换地,可以经由诸如因特网的网络来提供或者分配要由根据如上所述的实施例 和变形实例的信息处理装置执行的程序。
[0160] 要由按照如上所述的实施例和变形实例的信息处理装置执行的程序具有用于在 计算机系统上实现如上所述的单元的模块结构。在实际的硬件配置中,例如,控制器901从 外部存储装置903读取程序到存储装置902上,并且执行该程序,从而在计算机上实现各个 单元。
[0161] 如上所述,根据实施例和变形实例,可以加快用户对于图像中的字符的识别。
[0162] 例如,如上所述的实施例中的流程图中的步骤可以以不同的顺序被执行,一些步 骤可以同时被执行,或者每当执行步骤时,执行步骤的顺序可以被改变。
[0163] 此外,例如,第二实施例可以与第三实施例或者第四实施例组合。
[0164] 虽然已经描述了某些实施例,但是这些实施例仅仅是通过举例而给出的,并不是 想要限定本发明的范围。实际上,在此描述的新的实施例可以包含在各种其他形态之中;此 外,在没有违背本发明的精神的情况下,能够以在此描述的实施例的形式,作出各种省略、 替换和变化。附带的如权利要求书和它们的等效物意欲覆盖这种属于本发明的范围和精神 的形式或变形。
【主权项】
1. 一种信息处理装置,其特征在于,包括: 获取图像的获取单元; 第一分割单元,所述第一分割单元将所述图像分割成为包含一个以上的字符的文本包 含区域和除了所述文本包含区域之外的背景区域; 第二分割单元,所述第二分割单元将所述文本包含区域分割成为由形成所述字符的线 所构成的字符区域和除了所述字符区域之外的字符背景区域; 计算部,所述计算部计算所述字符区域的预定属性的第一代表值、所述字符背景区域 的所述预定属性的第二代表值、和所述背景区域的所述预定属性的第三代表值; 修改单元,所述修改单元以基于所述第一代表值和所述第三代表值的第一差、基于所 述第一代表值和所述第二代表值的第二差、以及基于所述第二代表值和所述第三代表值的 第三差变大的方式,修改所述第一代表值、所述第二代表值和所述第三代表值中的至少一 个;和 输出单元,所述输出单元通过以下过程获得修改后的图像 当所述第一代表值被修改时,将所述字符区域的所述预定属性的值改变为修改后的第 一代表值, 当所述第二代表值被修改时,将所述字符背景区域的所述预定属性的值改变为修改后 的第二代表值,或者 当所述第三代表值被修改时,将所述背景区域的所述预定属性的值改变为修改后的第 三代表值。2. 如权利要求1所述的装置,其特征在于,所述预定属性是能够表现被人识别的容易 性的属性。3. 如权利要求2所述的装置,其特征在于, 所述预定属性是色调, 所述第一代表值是所述字符区域中的色调的代表颜色, 所述第二代表值是所述字符背景区域中的色调的代表颜色, 所述第三代表值是所述背景区域中的色调的代表颜色, 所述第一差是当所述第一代表值是对象的颜色并且所述第三代表值是所述对象的背 景的颜色时的视觉识别距离, 所述第二差是当所述第一代表值是对象的颜色并且所述第二代表值是所述对象的背 景的颜色时的视觉识别距离,以及 所述第三差是当所述第二代表值是对象的颜色并且所述第三代表值是所述对象的背 景的颜色时的视觉识别距离。4. 如权利要求3所述的装置,其特征在于,所述修改单元进一步以所述第二差和所述 第三差的和被最大化的方式,修改所述第一代表值和所述第二代表值。5. 如权利要求2所述的装置,其特征在于, 所述预定属性是亮度,以及 所述第一代表值是所述字符区域中的亮度的代表值, 所述第二代表值是所述字符背景区域中的亮度的代表值, 所述第三代表值是所述背景区域中的亮度的代表值,以及 所述第一差、所述第二差和所述第三差是亮度差。6. 如权利要求2所述的装置,其特征在于, 所述预定属性是饱和度,以及 所述第一代表值是所述字符区域中的饱和度的代表值, 所述第二代表值是所述字符背景区域中的饱和度的代表值, 所述第三代表值是所述背景区域中的饱和度的代表值,以及 所述第一差、所述第二差和所述第三差是饱和度差。7. 如权利要求2所述的装置,其特征在于, 所述预定属性是颜色,以及 所述第一代表值是所述字符区域中的颜色的代表值, 所述第二代表值是所述字符背景区域中的颜色的代表值, 所述第三代表值是所述背景区域中的颜色的代表值,以及 所述第一差、所述第二差和所述第三差是颜色差。8. 如权利要求1所述的装置,其特征在于, 所述第一分割单元将所述图像分割成为多个文本包含区域和所述背景区域,并且 所述第二分割单元将每个所述文本包含区域分割成为所述字符区域和所述字符背景 区域, 所述信息处理装置进一步包括判定单元,所述判定单元判定所述字符区域中的每个字 符区域的重要性,并且将重要性等于或低于阈值的字符区域以及所述字符区域的字符背景 区域判定为背景区域。9. 如权利要求1所述的装置,其特征在于,所述输出单元将所述修改后的图像输出到 显示单元,用于显示。10. 如权利要求1所述的装置,其特征在于,所述输出单元将所述修改后的图像输出到 外部装置。
【专利摘要】根据实施例,信息处理装置包括获取单元、第一和第二分割单元、计算部、修改单元和输出单元。获取单元获取图像。第一分割单元将所述图像分割成为包含一个以上的字符的文本包含区域和除了所述文本包含区域之外的背景区域。第二分割单元将所述文本包含区域分割成为由形成所述字符的线所构成的字符区域和除了所述字符区域之外的字符背景区域。计算部计算所述字符区域的预定属性的第一代表值、所述字符背景区域的所述预定属性的第二代表值、和所述背景区域的所述预定属性的第三代表值。修改单元以基于第一代表值和第三代表值的第一差、基于第一代表值和第二代表值的第二差、以及基于第二代表值和第三代表值的第三差变大的方式,修改第一代表值、第二代表值和第三代表值中的至少一个。输出单元通过以下获得修改后的图像:当所述第一代表值被修改时,将所述字符区域的所述预定属性的值改变为修改后的第一代表值,当所述第二代表值被修改时,将所述字符背景区域的所述预定属性的值改变为修改后的第二代表值,或者当所述第三代表值被修改时,将所述背景区域的所述预定属性的值改变为修改后的第三代表值。
【IPC分类】G06K9/34, G06K9/32, G06K9/00
【公开号】CN105426810
【申请号】CN201510570264
【发明人】高桥梓帆美, 柴田智行, 铃木薰, 登内洋次郎, 井本和范, 三原功雄
【申请人】株式会社东芝
【公开日】2016年3月23日
【申请日】2015年9月9日
【公告号】US9384557, US20160078631
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1