信息处理方法及信息处理装置的制造方法_3

文档序号:9616486阅读:来源:国知局
axColumn行 元素的位置区域,具体的:
[0077] 位于第一列第一行的元素A1的位置区域为
[0078]
[0079] 位于第一列第二行的元素A2的位置区域为
[0080]
[0081] ......;
[0082] 位于第一列第MaxColumn行的元素Amax的位置区域为
[0083]
i
[0084] 在本发明图1所示的信息处理方法中,步骤S16中分别对各个切片图像进行光学 字符识别,优选采用如下方式:
[0085] 逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片 图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别。其中,位于第η 列的切片图像由对所述表单的第η列进行切片处理得到。
[0086] 也就是说,逐个对由位于同一列的元素产生的切片图像进行光学字符识别,在该 列全部的切片图像完成光学字符识别后,再逐个对由位于另一列的元素产生的切片图像进 行光学字符识别。
[0087] 由于表单中位于同一列的元素的数据类型相同,甚至位于同一列的部分元素的内 容也相同,因此一次性对位于同一列的切片图像进行光学字符识别,可以有效控制字符识 别范围,能够提高识别率,同时也能够缩短识别操作所耗费的时间。
[0088] 例如:姓名列的元素均为汉字字符数据类型。在对由姓名列产生的切片图像进行 光学字符识别过程中,只需要利用与汉字字符数据类型对应的识别算法进行字符识别。 [0089]例如:金额列的元素均为浮点型数据类型。在对由金额列产生的切片图像进行光 学字符识别过程中,只需要利用与浮点型数据类型对应的识别算法进行字符识别。
[0090] 在本发明上述公开的信息处理方法的基础上,本发明还公开另一种优选方案,如 图2所示。在步骤S17之后,还可以设置以下步骤:
[0091] 步骤S18 :显示与第一切片图像对应的元素输入框;
[0092] 步骤S19 :接收用户在该元素输入框输入的字符串,比较用户输入的字符串和对 第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
[0093] 其中,第一切片图像是当前处于录入状态的切片图像。
[0094] 基于图2所示的信息处理方法,用户针对某一切片图像进行录入操作,如果用户 输入的字符串与对该切片图像进行光学字符识别产生的字符串不一致,表明用户输入的字 符串可能出现错误,或者该切片图像的识别出现错误,或者两者均出现错误,此时向用户发 出提示,以使得用户再次核对,以保证最终录入正确的字符串,能够进一步降低录入数据出 现错误的概率,甚至消除录入数据出现错误的现象。
[0095] 实施中,输出提示的具体方式可以采用但不限于:调整第一切片图像的显示颜色, 或者发生语音提示。
[0096] 另外,在图2所示信息处理方法的基础上,在显示与第一切片图像对应的元素输 入框之后,还可以设置以下步骤:调整第一切片图像的显示效果,以使得第一切片图像的显 示效果与其他切片图像的显示效果不同。
[0097] 在用户人工录入的过程中,将用户将要执行录入操作的切片图像调整为不同的显 示效果,以便用户能够在多个切片图像中更加直观的看到将要执行录入操作的切片图像。 [0098] 考虑到表单多为白底黑字,作为一种实现方式,可以在第一切片图像的外周显示 红色的虚线,以便用户更加直观的看到第一切片图像。
[0099] 另外,表单中的局部区域可能存在字符不太清晰的问题,为了方便用户查看该区 域,在图2所示信息处理方法的基础上,可以设置以下步骤:接收用户输入的缩放指令,响 应该缩放指令对第一切片图像进行相应的缩放处理。
[0100] 如果第一切片图像中的字符不太清晰,用户可以输入放大指令,控制设备对第一 切片图像进行放大处理,以便能看清楚第一切片图像包含的元素,在用户在元素输入框输 入字符串,并且用户输入的字符串与对第一切片图像进行光学字符识别产生的字符串一致 时,用户可以输入缩小指令,控制设备对第一切片图像进行缩小处理,以便将第一切片图像 恢复至原始大小。
[0101] 本发明还公开一种信息处理装置,用于处理表单中的元素。其中,该表单为数字化 图像,可以为票据的扫描件或者对票据进行拍摄得到的图像,该表单中的元素呈N列分布, N为大于1的整数。下文描述内容可与上述关于信息处理方法的描述内容相互对应参照。
[0102] 参见图3,图3为本发明公开的一种信息处理装置的结构示意图。该信息处理装置 包括列位置区域确定单元1、定位元素位置区域确定单元2、元素数量确定单元3、元素位置 区域确定单元4、图像处理单元5、字符识别单元6和存储单元7。
[0103] 其中:
[0104] 列位置区域确定单元1,用于分别确定表单中各列在表单中的位置区域。
[0105] 定位元素位置区域确定单元2,用于分别确定表单中各列的定位元素在表单中的 位置区域,其中,第η列的定位元素为:第η列所需录入的元素中、处于最上侧的元素,其中 η= 1,2,"·Ν〇
[0106] 元素数量确定单元3,用于确定表单中各列包含的元素的数量。
[0107] 元素位置区域确定单元4,用于利用各列在表单中的位置区域、各列的定位元素在 表单中的位置区域、以及各列包含的元素的数量,分别确定表单中各个元素在表单中的位 置区域。
[0108] 图像处理单元5,用于依据各个元素在表单中的位置区域对表单进行切片处理,得 到多个切片图像。其中,每个切片图像包含一个元素,切片处理得到的切片图像的数量与表 单包含的元素的数量一致。
[0109] 字符识别单元6,用于分别对切片图像进行光学字符识别,获得切片图像包含的字 符串。
[0110] 存储单元7,用于按照预设规则记录获得的字符串。
[0111] 本发明公开的信息处理装置,首先确定表单中各列在该表单中的位置区域,确定 各列的定位元素在表单中的位置区域,确定表单中各列包含的元素的数量,之后根据前述 信息确定各个元素在表单中的位置区域,依据各个元素在表单中的位置区域进行切片处 理,使得每个元素均切分为一个切片图像,之后对各个切片图像分别进行光学字符识别,获 得切片图像包含的字符串并进行记录。本发明公开的信息处理装置,将表单中的各个元素 分别划分为一个切片图像,后续针对各个切片图像分别进行光学字符识别,以获取切片图 像包含的字符串,由于一次光学字符识别操作仅针对一个元素,因此可以基于多种数据类 型对切片图像进行识别,直至识别出切片图像包含的字符串,能够降低数据的出错率。
[0112] 实施中,表单中第η列在表单中的位置区域以(第一坐标值、第二坐标值、第三坐 标值、第四坐标值)标定。其中,第一坐标值为第η列的左侧边与表单的左侧边之间的距离, 第二坐标值为第η列的顶端与表单的上侧边之间的距离,第三坐标值为第η列的右侧边与 表单的左侧边之间的距离,第四坐标值为第η列的底端与表单的上侧边之间的距离。
[0113] 第η列的定位元素在表单中的位置区域以(第五坐标值、第六坐标值、第七坐标 值、第八坐标值)标定。其中,第五坐标值为第η列的定位元素所处单元格的左侧边与表单 的左侧边之间的距离,第六坐标值为第η列的定位元素所处单元格的顶端与表单的上侧边 之间的距离,第七坐标值为第η列的定位元素所处单元格的右侧边与表单的左侧边之间的 距离,第八坐标值为第η列的定位元素所处单元格的底端与表单的上侧边之间的距离。
[0114] 当然,上述只是对表单中各列的位置区域以及各列中定位元素的位置区域的一种 标定方式。实施中,第一坐标值至第八坐标值还可以配置为:
[0115] 第一坐标值为第η列的左侧边与表单的左侧边之间的距离,第二坐标值为第η列 的顶端与表单的上侧边之间的距离,第三坐标值为第η列的右侧边与表单的右侧边之间的 距离,第四坐标值为第η列的底端与表单的下侧边之间的距离。
[0116] 第五坐标值为第η列的定位元素所处单元格的左侧边与表单的左侧边之间的距 离,第六坐标值为第η列的定位元素所处单元格的顶端与表单的上侧边之间的距离,第七 坐标值为第η列的定位元素所处单元格的右侧边与表单的右侧边之间的距离,第八坐标值 为第η列的定位元素所处单元格的底端与表单的下侧边之间的距离。
[0117] 作为优选方式,字符识别单元6具体用于:逐个对位于同一列的切片图像进行光 学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切 片图像均进行光学字符识别。其中,位于第η列的切片图像由对表单的第η列进行切片处 理得到。
[0118] 也就是说,字符识别单元6逐个对由位于同一列的元素产生的切片图像进行光学 字符识别,在该列全部的切片图像完成光学字符识别后,再逐个对由位于另一列的元素产 生的切片图像进行光学字符识别。
[0119] 由于表单中位于同一列的元素的数据类型相同,甚至位于同一列的部分元素的内 容也相同,因此一次性对位于同一列的切片图像进行光学字符识别,可以有效控制字符识 别范围,能够提高识别率,同时也能够缩短识别操作所耗费的时间。
[0120] 参见图4,图4为本发明公开的另一种信息处理装置的结构示意图。与图3所示信 息处理装置相比,进一步包括:控制单元8和第一处理单元9。
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1