信息处理设备、程序以及信息处理方法

文档序号:6370710阅读:98来源:国知局
专利名称:信息处理设备、程序以及信息处理方法
信息处理设备、程序以及信息处理方法技术领域
本公开涉及一种信息处理设备、程序以及信息处理方法。
背景技术
近来,已经提出了各种技术作为用于在将复印机、传真机和光学字符阅读器(OCR) 中设置的原稿读取为图像的设备中分析读取的图像以及校正该原稿中的倾斜的技术(例如,参照第5-143774号日本在先公开专利公布)。根据这些技术,可以通过按照通过分析所读取的图像检测到的原稿的倾斜旋转原稿来校正原稿的倾斜。发明内容
但是,虽然在从正面读取在平面上展开的原稿的情况下可以通过旋转文档来校正原稿的倾斜,但是原稿可能不在平面上展开。例如,当原稿被装订过时(当原稿形成课本或杂志的一部分时),原稿可能扭曲。
另外,不一定从正面读取原稿。例如,可以偏斜地读取原稿。在这种情况下,仅通过旋转原稿不能正确地执行校正。因此,需要一种方法,该方法能够执行控制以显示基于输入图像中的图形高精度地校正的图形。
根据本公开的一个实施例,提供了一种信息处理设备,包括选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及显示控制单元,执行控制以显示所述选择单元选择的图形。
根据本公开的另一个实施例,提供了一种用于使得计算机用作信息处理设备的程序,该信息处理设备包括选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及显示控制单元,执行控制以显示所述选择单元选择的图形。
根据本公开的另一个实施例,提供了一种信息处理方法,包括基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及执行控制以显示所选择的图形。
根据上述本公开的各个实施例,可以执行控制以显示基于输入图像中的图形高精度地校正的图形。


图I是示出根据本公开的一个实施例的信息处理设备的概要的图2是示出信息处理设备的硬件配置的图3是示出信息处理设备的功能配置的图4是示出输入图像和信息处理设备生成的图形数据的比较结果的图5是示出第一示例中的识别单元和测量单元的图6是示出第一示例中的线段提取单元和校正单元的图7是示出第一示例中的备选图形组生成单元的图8是示出第一示例中的选择单元的图9是示出第二示例中的识别单元和测量单元的图10是示出第二示例中的线段提取单元和校正单元的图11是示出第二示例中的备选图形组生成单元的图12是示出第二示例中的选择单元的图;以及
图13是示出信息处理设备的操作的流程的示例的流程图。
具体实施方式
下文中,将参照附图详细描述本公开的优选实施例。注意,在本公开和附图中,具有基本上相同的功能和结构的结构元件用相同的参考标号表示,并省略这些结构元件的重复说明。
将按下述顺序进行以下描述。
I.实施例
1-1.信息处理设备的概要
1-2.信息处理设备的配置示例
1-3.信息处理设备的操作的流程
2.总结
〈I.实施例〉
[1-1.信息处理设备的概要]
首先,将描述根据本公开的一个实施例的信息处理设备。图I是示出根据本公开的该实施例的信息处理设备的概要的图。如图I中所示,根据本公开的该实施例的信息处理设备100主要具有获取成像图像作为输入图像以及从获取的输入图像获取图形的功能。 信息处理设备100可以执行控制以使得图形由显示装置140显示。
图形例如在课本TX中提供,且信息处理设备100获取通过将课本TX中提供的图形成像为输入图像获得的成像图像。提供图形的位置不限于课本TX,而是图形可以在可以执行成像的任何位置处提供。提供图形的位置不是特别限定的。例如,图形可以在杂志或书本中提供。
根据本公开的该实施例的信息处理设备100可以是任意类型的设备,比如数字照相机、智能电话、个人计算机(PC)或图像扫描仪。根据本公开的该实施例的信息处理设备 100可以是安装到上述设备的信息处理模块。
[1-2.信息处理设备的配置示例]
接下来,将描述信息处理设备100的配置示例。图2是示出信息处理设备100的硬件配置的图。如图2所示,信息处理设备100包括CPU 110,RAM 120、非易失性存储器130、 显示装置140、输入装置150和成像装置160。
非易失性存储器130是被配置为信息处理设备100的存储单元的示例的数据存储装置。例如,使用磁存储装置(比如硬盘驱动器(HDD))、半导体存储装置、光存储装置或磁光存储装置来配置非易失性存储器130。非易失性存储器130存储CPU 110运行的程序或者程序的运行中使用的各种数据。
RAM 120存储CPU 110运行的程序或程序的运行中使用的参数。
CPU 110用作运算处理装置和控制装置,并且根据存储在非易失性存储器130和 RAM 120中的各种程序控制信息处理设备100中的部分或全部操作。CPU 110被配置为信息处理设备100的控制单元的示例。
使用可以向用户可视地通知信息的装置比如液晶显示器(IXD)和有机电致发光 (EL)显示装置配置显示装置140。显示装置140输出通过信息处理设备100运行的各种处理获得的结果。具体地,显示装置140用文本或图像显示通过信息处理设备100运行的各种处理获得的结果。
输入装置150输出从用户获得的操作作为到CPU 110的信号。信息处理设备100 的用户操作输入装置150从而可以向信息处理设备100输入各种数据或者指示信息处理设备100运行处理操作。使用触摸面板配置输入装置150。但是,输入装置150的类型不是特别限定的。例如,可以使用比如鼠标或键盘的装置配置输入装置150。
成像装置160使用成像元件比如电荷耦合装置(CXD)或互补金属氧化物半导体 (CMOS)对成像对象进行成像并且生成成像图像。在本公开的实施例中,成像装置160形成信息处理设备100的一部分。但是,成像装置160可以被配置为与信息处理设备100分开。
图3是示出信息处理设备100的功能配置的图。如图3中所示,信息处理设备100 包括输入图像获取单元111、识别单元112、测量单元113、线段提取单元114、校正单元115、 备选图形组生成单元116、选择单元117、操作检测单元118和显示控制单元119。如图3中所示,非易失性存储器130、成像装置160、输入装置150和显示装置140可以包括在信息处理设备100中,并且可以包括在信息处理设备100以外。
输入图像获取单元111获取通过成像装置160成像获得的成像图像作为输入图像。通过成像装置160成像的图像可以是静止图像或者运动图像。例如,如果用户在朝向课本TX的成像方向上执行成像操作,则图像由成像装置160成像。成像图像包括图形。通过输入图像获取单元111获得的输入图像输出至识别单元112、测量单元113和线段提取单元 114ο
识别单元112识别的识别值对应于输入图像中的图形的参数,且选择单元117从备选图形组中选择具有最近似于所述识别值的参数的图形。
在这种情况下,将描述由信息处理设备100基于输入图像获取单元111获取的输入图像生成的图形数据。图4是示出输入图像和信息处理设备100生成的图形数据的比较结果的图。
如图4中所示,假定成像对象的图形在输入图像中是扭曲的。如上所述,当成像对象在平装书比如课本TX的平面上提供时,扭曲的程度尤其增大。根据本公开的实施例,如图4的“线段校正”中所示,可以生成基于从输入图像识别的线段长度生成的图形数据。根据本公开的实施例,如图4的“角度校正”中所示,可以生成基于从输入图像识别的角度生成的图形数据。
下文中,将描述生成基于从输入图像识别的角度生成的图形数据的情形的示例作为第一示例。将描述生成基于从输入图像识别的线段长度生成的图形数据的情形的示例作为第二示例。
图5是示出第一示例中的识别单元112和测量单元113的图。如图5中所示,识别单元112通过字符识别从输入图像中获取识别值。在字符识别中,可以应用通用的OCR技术。当识别单元112识别角度作为识别值时,识别单元112可以识别标记,比如被分配给角度的标记Ml、用于指示角度的标记M2以及表示角度单位的标记M3,并且识别单元112识别与所识别的标记对应的角度。
如图5中所示,如果识别单元112识别标记M1,则识别单元112可以识别与标记 Ml对应的角度“80”。根据相同的规则,识别单元112可以识别角度“20”和“60”。如果识别单元112识别标记M2,则识别单元112可以识别与标记M2对应的角度“20”。如果识别单元112识别标记M3,则识别单元112可以识别与标记M3对应的角度“60”。
如图5中所示,测量单元113从输入图像中测量预定参数作为测量值。当识别单元112识别角度时,预定参数对应于角度。在图5示出的示例中,测量单元113测量与识别单元112识别的角度对应的角度“80”、“20”和“60”。但是,测量单元113测量的角度可能不是与识别单元112识别的角度对应的角度。
图6是示出第一示例中的线段提取单元114和校正单元115的图。线段提取单元 114从输入图像中提取线段。所提取的线段的数目不是特别限定的。在图6示出的示例中, 线段提取单元114从输入图像中提取线段AB、BCXD、DA、AC和BD。当线段提取单元114提取线段时,可以使用哈夫(Hough)变换。根据Hough变换,即使在输入图像中的线段是在中间截断的或者在输入图像中有噪声时,也可以高精度地提取线段。
校正单元115校正线段提取单元114提取的线段。具体地,由于假定在线段提取单元114提取的线段中存在误差,因此可以通过用校正单元115校正线段来减小误差。例如,校正单元115可以基于测量单元113测量的测量值校正线段。在图6示出的示例中,校正单元115基于测量单元113测量的测量角度校正线段。
详细地,校正单元115从测量单元113测量的测量值中选择最近似于用线段提取单元114提取的线段生成的角度的大小的测量值,并且校正线段以使得角的大小与所选择的测量值匹配。图6中示出为“校正的线段”的图形是校正单元115校正的线段的示例。但是,与输入图像相比扭曲减小。
图7是示出第一示例中的备选图形组生成单元116的图。备选图形组生成单元 116基于校正单元115校正的线段生成备选图形组。备选图形组生成单元116可以通过基于校正单元115校正的线段的仿射变换生成备选图形组。如果使用仿射变换,则可以生成各种备选图形比如旋转图形、水平翻转图形、放大图形和缩小图形,同时保持校正单元115 校正的线段的几何性质。
备选图形组中包括的备选图形的数目不是特别限定的。在图7示出的示例中,备选图形组生成单元116生成与四个备选图形对应的备选图形组。可替代地,备选图形组生成单元116可以生成如下获得的图形组作为备选图形组通过使用“O”至“360”范围内的每个整数作为角度,关于预定轴旋转校正单元115校正的线段而获得的图形组。预定轴可以是单个轴(例如,X轴)、两个轴(例如,XY轴)或三个轴(例如,XYZ轴)。
图8是示出第一示例中的选择单元117的图。选择单元117基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形。在第一示例中,角度被识别为识别值。因此,选择单元117基于识别角度从备选图形组中选择图形。详细地,选择单元117通过与备选图形组中包括的每个备选图形进行匹配选择角度最近似于识别角度的图形。
可以选择具有与识别角度的差值的和最小的角度的备选图形作为具有最近似角度的图形。在图8中示出的示例中,当识别角度为“80”、“20”和“60”时,选择单元117选择具有与识别角度“80”、“20”和“60”最近似的角度“80”、“20”和“60”的图形。
返回图3,继续进行描述。显示控制单元119执行控制以显示选择单元117选择的图形。例如,显示控制单元119控制显示装置140显示选择单元117选择的图形。显示装置140可以根据来自显示控制单元119的控制显示图形。此时,显示的图形是基于输入图像中的图形高精度地校正的图形。
操作检测单元118检测用户通过输入装置150输入的操作。显示控制单元119可以基于操作检测单元118检测的操作控制显示。例如,如果操作检测单元118检测到输入图像显示操作,则显示控制单元119可以执行控制以显示输入图像。如果操作检测单元118 检测到校正图像显示操作,则显示控制单元119可以执行控制以显示选择单元117选择的图形。
图9是示出第二示例中的识别单元112和测量单元113的图。如第一示例中所述, 识别单元112通过字符识别从输入图像获取识别值。在字符识别中,可以应用通用的OCR 技术。当识别单元112识别线段长度作为识别值时,识别单元112可以识别标记,比如被分配给线段的标记M4以及表示线段长度单位的标记M5,并且识别单元112可以识别与所识别的标记对应的线段长度。
如图9中所示,如果识别单元112识别标记M4,则识别单元112可以识别与标记 M4对应的线段长度“ ^^ ”。如果识别单元112识别标记M5,则识别单元112可以识别与标记M5对应的线段长度“ 3-S ”。
如图9中所示,测量单元113从输入图像测量预定参数作为测量值。当识别单元 112识别线段长度时,预定参数对应于线段长度。在图9中示出的示例中,测量单元113测量与识别单元112识别的线段长度对应的线段长度“3#”、“9万”和“3·^/ Ι”。但是,测量单元113测量的线段长度可能不是与识别单元112识别的线段长度对应的线段长度。
图10是示出该第二示例中的线段提取单元114和校正单元115的图。与第一示例类似,线段提取单元114从输入图像中提取线段。所提取的线段的数目不是特别限定的。 在图10中示出的示例中,线段提取单元114从输入图像中提取线段AB、BC和CA。当线段提取单元114提取线段时,可以使用Hough变换。根据Hough变换,即使在输入图像中的线段是在中间截断的或者在输入图像中有噪声时,也可以高精度地提取线段。
校正单元115校正线段提取单元114提取的线段。具体地,由于假定在线段提取单元114提取的线段中存在误差,因此可以通过用校正单元115校正线段来减小误差。例如,校正单元115可以基于测量单元113测量的测量值校正线段。在图10示出的示例中, 校正单元115基于测量单元113测量的测量长度校正线段。
详细地,校正单元115从测量单元113测量的测量值中选择最近似于线段提取单元114提取的线段的长度的测量值,并且校正线段以使得线段长度与所选择的测量值匹配。图10中示出为“校正的线段”的图形是校正单元115校正的线段的示例。但是,与输入图像相比扭曲减小。
图11是示出第二示例中的备选图形组生成单元116的图。与第一示例类似,备选图形组生成单元116基于校正单元115校正的线段生成备选图形组。备选图形组生成单元 116可以通过基于校正单元115校正的线段的仿射变换生成备选图形组。如果使用仿射变换,则可以生成各种备选图形比如旋转图形、水平翻转图形、放大图形和缩小图形,同时保持校正单元115校正的线段的几何性质。
备选图形组中包括的备选图形的数目不是特别限定的。在图11示出的示例中,备选图形组生成单元116生成与四个备选图形对应的备选图形组。可替代地,备选图形组生成单元116可以将如下获得的图形组生成作为备选图形组通过使用“O”至“360”范围内的每个整数作为角度,关于预定轴旋转校正单元115校正的线段获得的图形组。预定轴可以是单个轴(例如,X轴)、两个轴(例如,XY轴)或三个轴(例如,XYZ轴)。
图12是示出第二示例中的选择单元117的图。选择单元117基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形。在第二示例中,线段长度被识别为识别值。因此,选择单元117基于识别的线段长度的比值(各个识别的线段长度的比值) 从备选图形组中选择图形。详细地,选择单元117通过与备选图形组中包括的每个备选图形进行匹配选择具有最近似于识别的线段长度的比值(各个识别的线段长度的比值)的线段长度的比值的图形。
可以选择具有与识别的线段长度比值的差值的和最小的线段长度比值的备选图形作为具有最近似线段长度比值的图形。在图12中示出的示例中,当识别的线段长度比值为“ 3# : 9^2 : 3λ/ΙΤ ”时,选择单元117选择具有与识别的线段长度比值“ 3^/5 : 9^2 : 3λ/ΙΙ ’’ 最近似的线段长度比值“3V :9W:3^/TT”的图形。
返回图3,继续进行描述。与第一示例类似,显示控制单元119执行控制以显示选择单元117选择的图形。例如,显示控制单元119控制显示装置140显示选择单元117选择的图形。显示装置140可以根据来自显示控制单元119的控制显示图形。此时,显示的图形是基于输入图像中的图形高精度地校正的图形。
操作检测单元118检测用户通过输入装置150输入的操作。显示控制单元119可以基于操作检测单元118检测的操作控制显示。例如,如果操作检测单元118检测到输入图像显示操作,则显示控制单元119可以执行控制以显示输入图像。如果操作检测单元118 检测到校正图像显示操作,则显示控制单元119可以执行控制以显示选择单元117选择的图形。
[1-3.信息处理设备的操作的流程]
图13是示出信息处理设备100的操作的流程的示例的流程图。首先,输入图像获取单元111获取成像图像作为输入图像(步骤S11)。识别单元112通过字符识别从输入图像获取识别值,并且测量单元113从输入图像获取测量值(步骤S12)。接下来,线段提取单元114通过Hough变换从输入图像中提取线段(步骤S13)。校正单元115基于测量值校正线段提取单元114提取的线段(步骤S14)。
备选图形组生成单元116通过仿射变换从校正的线段生成备选图形组(步骤 S15)。选择单元117基于识别值从备选图形组选择图形(步骤S16)。显示控制单元119执行控制以显示选择单元117选择的图形(步骤S17)。显示装置140可以根据来自显示控制单元119的控制显示图形。
当操作结束(步骤S18中的“是”)时,操作终止。当操作继续时(步骤S18中的 “否”),处理返回步骤Sll且操作继续。
〈2.总结〉
根据本公开中描述的实施例,可以基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形,且可以执行控制以显示所选择的图形。因此,可以执行控制以显示基于输入图像中的图形高精度地校正的图形。具体地,可以通过在第一示例中识别角和在第二示例中识别线段长度来实现这些功能。
本公开中描述的各个系列的控制处理可以使用软件、硬件以及软件和硬件的组合中的任意一种实现。构成软件的各个程序预先存储在设置在各个设备内或外的计算机可读介质中。各个程序在运行时读取到随机存取存储器(RAM)中并由处理器比如中央处理单元 (CPU)运行。
已经参照附图详细描述了本公开的优选实施例。但是,本公开的技术范围不限于以上示例。对于本领域的技术人员而言明显的是,可以在不背离所附权利要求限定的技术范围和实质的情况下进行各种修改和改变。因此,应当理解,各种修改和改变包括在本公开的技术范围内。
以下配置包括在本公开的技术范围内。
(I) 一种信息处理设备,包括选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及显示控制单元,执行控制以显示所述选择单元选择的所述图形。
(2)根据(I)所述的信息处理设备,还包括线段提取单元,从所述输入图像中提取线段;校正单元,校正所述线段提取单元提取的所述线段;以及备选图形组生成单元,基于所述校正单元校正的所述线段生成所述备选图形组。
(3)根据(2)所述的信息处理设备,其中,所述线段提取单元通过Hough变换从所述输入图像中提取所述线段。
(4)根据(2)或(3)所述的信息处理设备,还包括测量单元,从所述输入图像中测量预定参数作为测量值,其中,所述校正单元基于所述测量单元测量的所述测量值校正所述线段提取单元提取的所述线段。
(5)根据(2)至(4)中任意一项所述的信息处理设备,其中,所述备选图形组生成单元基于所述校正单元校正的所述线段通过仿射变换生成所述备选图形组。
(6)根据(I)至(5)中任意一项所述的信息处理设备,还包括识别单元,通过所述字符识别从所述输入图像中获取所述识别值。
(7)—种用于使得计算机用作信息处理设备的程序,所述信息处理设备包括选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及显示控制单元,执行控制以显示所述选择单元选择的所述图形。
(8)根据(7)所述的程序,其中,所述信息处理设备还包括线段提取单元,从所述输入图像中提取线段;校正单元,校正所述线段提取单元提取的所述线段;以及备选图形组生成单元,基于所述校正单元校正的所述线段生成所述备选图形组。
(9)根据(8)所述的程序,其中,所述线段提取单元通过Hough变换从所述输入图像中提取所述线段。
(10)根据(8)或(9)所述的程序,其中所述信息处理设备还包括测量单元,从所述输入图像中测量预定参数作为测量值,以及其中,所述校正单元基于所述测量单元测量的所述测量值校正所述线段提取单元提取的所述线段。
(11)根据(8)至(10)中任意一项所述的程序,其中,所述备选图形组生成单元基于所述校正单元校正的所述线段通过仿射变换生成所述备选图形组。
(12)根据(7)至(11)中任意一项所述的程序,其中,所述信息处理设备还包括识别单元,通过所述字符识别从所述输入图像中获取所述识别值。
(13) 一种信息处理方法,包括基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及执行控制以显示所选择的图形。
本公开包含与2011年6月7日提交于日本专利局的日本在先专利申请JP 2011-127446中公开的主题相关的主题,其整体内容通过引用合并于此。
权利要求
1.一种信息处理设备,包括 选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及 显示控制单元,执行控制以显示所述选择单元选择的所述图形。
2.根据权利要求I所述的信息处理设备,其中所述识别值对应于所述输入图像中的图形的参数,且所述选择单元从所述备选图形组中选择具有最接近所述识别值的参数的图形。
3.根据权利要求I或2所述的信息处理设备,还包括 线段提取单元,从所述输入图像中提取线段; 校正单元,校正所述线段提取单元提取的所述线段;以及 备选图形组生成单元,基于所述校正单元校正的所述线段生成所述备选图形组。
4.根据权利要求3所述的信息处理设备, 其中,所述线段提取单元通过Hough变换从所述输入图像中提取所述线段。
5.根据权利要求3所述的信息处理设备,还包括 测量单元,从所述输入图像中测量预定参数作为测量值, 其中,所述校正单元基于所述测量单元测量的所述测量值校正所述线段提取单元提取的所述线段。
6.根据权利要求3所述的信息处理设备, 其中,所述备选图形组生成单元基于所述校正单元校正的所述线段通过仿射变换生成所述备选图形组。
7.根据权利要求I或2所述的信息处理设备,还包括 识别单元,通过所述字符识别从所述输入图像中获取所述识别值。
8.一种用于使得计算机用作信息处理设备的程序,所述信息处理设备包括 选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及 显示控制单元,执行控制以显示所述选择单元选择的所述图形。
9.根据权利要求8所述的程序, 其中,所述信息处理设备还包括 线段提取单元,从所述输入图像中提取线段; 校正单元,校正所述线段提取单元提取的所述线段;以及 备选图形组生成单元,基于所述校正单元校正的所述线段生成所述备选图形组。
10.根据权利要求9所述的程序, 其中,所述线段提取单元通过Hough变换从所述输入图像中提取所述线段。
11.根据权利要求9所述的程序, 其中所述信息处理设备还包括测量单元,从所述输入图像中测量预定参数作为测量值,以及 其中,所述校正单元基于所述测量单元测量的所述测量值校正所述线段提取单元提取的所述线段。
12.根据权利要求9所述的程序,其中,所述备选图形组生成单元基于所述校正单元校正的所述线段通过仿射变换生成所述备选图形组。
13.根据权利要求8所述的程序, 其中,所述信息处理设备还包括识别单元,通过所述字符识别从所述输入图像中获取所述识别值。
14.一种信息处理方法,包括 基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及 执行控制以显示所选择的图形。
15.根据权利要求14所述的信息处理方法,其中所述识别值对应于所述输入图像中的图形的参数,且基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形包括从所述备选图形组中选择具有最接近所述识别值的参数的图形。
全文摘要
本发明公开了一种信息处理设备、程序、以及信息处理方法。所述信息处理设备包括选择单元,基于通过针对输入图像的字符识别获得的识别值从备选图形组中选择图形;以及显示控制单元,执行控制以显示选择单元选择的图形。
文档编号G06K9/00GK102982306SQ20121017708
公开日2013年3月20日 申请日期2012年5月31日 优先权日2011年6月7日
发明者本间文规, 宫下健, 守屋松一郎, 梨子田辰志 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1