信息处理装置、信息处理系统以及信息处理方法

文档序号:9631804阅读:354来源:国知局
信息处理装置、信息处理系统以及信息处理方法
【专利说明】
[0001] 本申请以日本专利申请2014-171848(申请日:2014年8月26日)为基础,根据 该申请享受优先的权益。本申请通过参照该申请,包含该申请的全部内容。
技术领域
[0002] 本发明的实施形态涉及信息处理装置、信息处理系统以及信息处理方法。
【背景技术】
[0003] -般地,在从用照相机拍摄的图像中检测出招牌或标识、纸面等上记载的文字的 情况下,根据记载有文字的文字表面和照相机的视点位置的不同,图像内的文字的表观形 状会多种多样地变形(例如,由于受到投影变形),因此存在难以从图像中稳定并且稳健地 检测出文字这样的不良情况。
[0004] 因此,为了稳定并且稳健地从图像内检测出文字,存在这样的文字检测方法:检测 记载有文字的框,并生成将检测到的框的形状修正成了没有变形的状态的图像,从生成的 修正后的图像中检测出没有变形的状态的文字。
[0005] 然而,采用上述的文字检测方法的话,存在以下这样的不良情况:需要文字被记载 在已知的框内,在文字被记载在未知的形状的框内的情况下,就无法从图像中稳定并且稳 健地检测出文字。

【发明内容】

[0006] 本发明的一个形态的目的在于,提供一种能够从图像中稳定并且稳健地检测文字 的信息处理装置、信息处理系统以及信息处理方法。
[0007] 根据实施形态,信息处理装置具有:图像输入单元、仰角取得单元、文字变形确定 单元、文字检测辞典存储单元、文字检测辞典选择单元以及文字检测单元。图像输入单元接 收通过拍摄记载有文字的文字表面而得到的图像的输入。仰角取得单元对于拍摄所述被输 入的图像的拍摄装置,取得拍摄该图像时的该拍摄装置的仰角值。文字变形确定单元基于 所述取得的仰角值,确定所述被输入的图像内的文字的表观形状如何变形。文字检测辞典 存储单元存储与多种多样地变形的文字的表观形状相对应的多个文字检测辞典。文字检测 辞典选择单元在通过所述文字变形确定单元确定了所述被输入的图像内的文字的表观形 状如何变形后,从所述文字检测辞典存储单元中选择与该确定的文字的表观形状相对应的 文字检测辞典。文字检测单元使用所述选择的文字检测辞典对所述被输入的图像执行文字 检测处理,检测出该图像中文字存在的区域。
[0008] 根据上述结构的信息处理装置,能够从图像中稳定并且稳健地检测出文字。
【附图说明】
[0009] 图1是用于对根据看的角度的不同而变形的文字的表观形状的多样性进行说明 的图。
[0010] 图2是示意性地示出照相机的三维旋转的图。
[0011] 图3是示出一个实施形态所涉及的信息处理装置的构成例的图。
[0012] 图4是用于对计算仰角值的方法进行说明的图。
[0013] 图5是用于对计算仰角值的方法进行说明的另一个图。
[0014] 图6是示出同一实施形态所涉及的仰角区域与文字变形假设的关系的图。
[0015] 图7是用于对同一实施形态所涉及的文字检测辞典存储部进行说明的图。
[0016] 图8是用于对同一实施形态所涉及的通过文字检测部执行的缩小处理进行说明 的图。
[0017] 图9是用于对同一实施形态所涉及的检测结果信息进行说明的图。
[0018] 图10是示出同一实施形态所涉及的信息处理装置的动作的一例的流程图。
[0019] 图11是示出同一实施形态所涉及的信息处理系统的构成例的图。
[0020] 图12是示出同一实施形态所涉及的信息处理装置的硬件结构的图。
[0021] 图13是用于对计算摇摆旋转角度的值的方法进行说明的图。
[0022] 图14是用于对同一实施形态所涉及的信息处理装置的变形例进行说明的图。
[0023] 图15是用于对同一实施形态所涉及的信息处理装置的变形例进行说明的另一个 图。
[0024] 图16是用于对同一实施形态所涉及的信息处理装置的变形例进行说明的又一个 图。
[0025] (符号说明)
[0026] 10 :信息处理装置,11 :图像输入部,12 :仰角取得部,13 :文字变形假设确定部, 14 :文字检测辞典存储部,15 :文字检测辞典选择部,16 :文字检测部,17 :应用部,18 :输出 部。
【具体实施方式】
[0027] 以下,参照附图对实施形态进行说明。
[0028] 首先,对从拍摄招牌或标识、纸面(例如,西餐馆的菜单等)而得到的图像(情景 图像)中检测招牌或标识、纸面等上记载的文字的情况下产生的问题点进行说明。作为从 用照相机拍摄的图像中检测招牌或标识、纸面等上记载的文字的情况下的问题点,根据记 载有文字的文字表面和拍摄该文字表面的照相机的视点的位置关系的不同,该文字的表观 形状会多种多样地变形,因此存在无法从图像中稳定并且稳健地检测出文字这样的问题 点。文字的表观形状例如如图1所示那样多种多样地变形。
[0029] 图1是用于对根据看的角度而变形的文字的表观形状的多样性进行说明的图。表 观形状A1示出从右斜下方拍摄记载有文字"TEXT"的文字表面的情况下的文字的表观形 状。又,表观形状A5示出从正前方拍摄记载有文字"TEXT"的文字表面的情况下的文字的 表观形状。进一步地,表观形状A9示出从左斜上方拍摄记载有文字"TEXT"的文字表面的 情况下的文字的表观形状。在此,取表观形状Al,A5、A9为例进行了说明,但其他的表观形 状A2~A4、A6~A8也示出了从各种方向拍摄记载有文字"TEXT"的文字表面的情况下的 表观形状。
[0030] 如图1所示,即使是相同的文字"TEXT",根据记载有该文字的文字表面和拍摄该 文字表面的照相机的视点的位置关系的不同,文字的表观形状也会多种多样地变形。因此, 如上所述那样,会产生无法从图像中稳定并且稳健地检测文字这样的问题。
[0031] 于是,为了从图像中稳定并且稳健地检测文字,提出了各种各样的文字检测方法。
[0032] 例如,存在以下这样的文字检测方法:从图像中检测记载有文字的文字表面的框, 生成将该框的形状修正成了没有变形的状态的图像,从修正后的图像中检测出没有变形的 文字。具体来说,提出了 :在从图像中检测记载在长方形的板上的文字的情况下,将由水平 边缘和垂直边缘以2组平行线包围的四边形作为上述板的框检测出,生成根据该四边形的 4顶点的坐标值对该框的变形进行了修正的图像,从修正后的图像中检测出没有变形的文 字的文字检测方法。
[0033] 又,作为其他的文字检测方法,提出有以下这样的文字检测方法:通过基于颜色的 区域分割和合并,从图像中提取记载有文字的规定的区域作为框,生成基于该规定的区域 的轮廓直线修正了该框的变形的图像,从修正后的图像中检测出没有变形的文字。
[0034] 然而,采用上述的文字检测方法的话,存在以下这样的不妥:前提是文字被记载在 已知形状的框内,无法从图像中稳定并且稳健地检测出被记载在未知的形状的框内的文字 或被记载在不具有框的文字表面上的文字。
[0035] 因此,存在以下这样的文字检测方法:使用能够指导具有各种各样的背景、各种各 样地变形了的文字的万能辞典,从没有修正的图像中不检测框地检测出文字。
[0036] 然而,该文字检测方法存在以下不妥之处:由于使用能够指导具有各种各样的背 景、各种各样地变形了的文字的万能辞典,因此能够指导的文字的数量多,对照精度反而下 降,容易产生错误检测。
[0037] 因此,存在不准备万能辞典,而是对文字的表观形状的每种变形的类型准备词典, 对于输入图像与全部的辞典进行对照,由此检测出文字的检测方法。然而,由于与全部的辞 典进行对照,因此存在直到文字检测处理结束为止所经过的时间会超时这样的不妥。
[0038] 如以上所说明的那样,在从图像中检测文字的一般的文字检测方法中,无法全部 解决框的限制、辞典的对照精度的下降、对照时间的超时之类的问题。因此,在本实施形态 中,提出一种信息处理装置,能够解决上述的各问题,执行能够从图像中稳定并且稳健地检 测出文字的文字检测处理。
[0039] 下面,对一种实施方式所涉及的信息处理装置10的结构进行说明,但在这之前, 对信息处理装置10执行检测图像内的文字的文字检测处理时考虑的、与照相机姿势有关 的前提条件进行说明。
[0040] 具有照相机功能的终端装置(以下仅记为"照相机")一般能够由使用者(拍摄 者、用户)使其三维旋转。总之,使用者既可以在三维空间中将照相机朝向上下左右方向, 也可以向斜向方向倾斜。图2是示意性地示出上述的照相机的三维旋转的图。图2的101 表示照相机的视点位置。图2的102表示照相机的拍摄面。拍摄面102的中心是图像中心 103。通过照相机的视点位置101、相对于地面在水平方向上延伸的坐标轴为X轴104。又, 通过照相机的视点位置101、相对于地面在垂直方向上延伸的坐标轴为Y轴105。进一步地, 设置与X轴104和Y轴105正交的Z轴107的话,则Z轴107也是相对于地面在水平方向 上延伸的坐标轴。即,通过X轴104和Z轴107扩展开的X-Z平面相对于地面为水平,通过 Y轴105和Z轴107扩展开的Y-Z平面相对于地面为垂直。
[0041] 在此,从照相机的视点位置101延
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1