地址识别装置的制造方法_3

文档序号:9631765阅读:来源:国知局
出部1181的处理,将在下文中进行说明。
[0061]接下来,参照图3,对基于地址识别功能部118执行的处理流程的一例进行说明。图3是示出地址识别功能部118执行的处理流程的一例的流程图。
[0062]首先,将纸张类的图像输入到图像输入部118A中(步骤ST11)。输入的图像例如被配置在存储器上。
[0063]地址识别部118B对在步骤ST11中输入到图像输入部118A中的图像进行分析,并至少提取一个地址区域(步骤ST12)。地址区域是指,记载有一个地址的区域。提取方法可以是任意的方法。作为一个示例,可利用从候选文字的排列中提取候选行然后进一步从候选行的排列中提取地址区域的方法。
[0064]图4是用于说明基于地址识别部118B执行的处理的图。在此,将作为地址识别部118B的处理对象的纸张类称为纸张类S2。地址识别部118B从纸张类S2中检测地址区域D、E、F。地址识别部118B分别在检测出的地址区域D、E、F中识别地址,并获取地址信息DUEUFlo另外,地址识别部118B求取各地址区域D、E、F的记载位置D2、E2、F2。记载位置D2、E2、F2通过将纸张类S2的左上顶点作为原点P时的坐标值(x,y)来表示。在实施方式中,记载位置D2为,包括地址区域D2的左上顶点D2(l)的坐标值以及右下顶点D2(2)的坐标值的信息。关于记载位置E2、F2,也与记载位置D相同。
[0065]另外,地址识别部118B分别截取包括地址区域D及其周边区域的图像、包括地址区域E及其周边区域的图像、以及包括地址区域F及其周边区域的图像。纸张类中,在记载有寄件人地址的位置周围很有可能存在作为大客户的公司的标志(Logo)。因此,地址识别部118B截取各个包括地址区域及其周边的图像,并保存在历史记录保留部118E的历史记录表51中。作为包括地址区域及其周边的图像而被截取的图像的尺寸优选为,大于包括寄件人地址周围记载的公司标志等的范围。地址识别部118B为截取的图像分配图像ID,用于识别各个图像。
[0066]然后,地址识别部118B将例如使地址信息、记载位置、图像ID以及纸张类ID相互对应的信息保存在历史记录保留部118E的历史记录表51中。
[0067]图5是示出历史记录保留部118E中保存的历史记录表TE的一例的图。在各个表的一条记录(Record)中存储有相互对应的一组信息。此外,图中的项目的排列仅仅是一个示例,可进行任意变换。另外,图6是示出寄件人信息保存部118F中保存的寄件人信息表TF的一例的图。在寄件人信息表TF中存储有与通过后述的处理确定为是寄件人的人员的地址信息相关的信息。
[0068]在各条记录的第一个项目中例如保存有地址信息。地址信息为,从地址区域识别出的地址信息。在图5、图6的示例中,保存有将地址信息进行编码所得的信息,例如结合了邮政编码和街道信息而得的代码。在各条记录的第二个项目中例如保存有记载位置。记载位置为,记载有地址区域的位置。此外,优选为对记载位置进行了标准化。即,在对象物(纸张类)的搬送过程中,对象物有可能会发生旋转或者平行移动,因此可进行如下的标准化处理等:例如在结合对象物的横纵方向将对象物的图像旋转后,将对象物的左上角作为原点。在各条记录的第三个项目中例如保存有图像ID。此外,被赋予图像ID的图像的数据保存在历史记录保留部118E或者寄件人信息保存部118F中。在各条记录的第四个项目中例如保存有纸张类ID。纸张类ID为,分配给各个纸张类的固有的识别信息。此外,在各个表中,还可以保存除在图5、图6中示出的信息以外的信息。例如,也可以保存图像文件名、图像获取时间、图像的尺寸等。
[0069]在此,当从一枚纸张类中提取出多个地址区域时,地址识别部118B例如会对多个地址区域赋予与各地址区域的记载位置对应的排位。与地址区域的记载位置对应的排位为,作为收件人地址而记载有地址的可能性较高的位置的排位较高,作为收件人地址而记载有地址的可能性较低的位置的排位较低。换言之,与地址区域的记载位置对应的排位为,作为寄件人地址而记载有地址的可能性较低的位置的排位较高,作为寄件人地址而记载有地址的可能性较高的位置的排位较低。该排位是根据将纸张类划分为多个区域而获得的划分区域来决定的。例如,决定为,包含纸张类上方的划分区域在内的地址区域的排位较低,而包含纸张类下方的划分区域在内的地址区域的排位较高。另外,决定为,包含纸张类左侧的划分区域在内的地址区域的排位较低,而包含纸张类右侧的划分区域在内的地址区域的排位较高。此外,纸张类的上下左右是将能够正确阅读文字的方向作为正面时的位置关系。
[0070]地址识别部118B对在步骤ST12中提取出的多个地址区域执行地址识别处理(步骤ST13)。基于地址识别部118B的地址识别方法可以是任意的方法。作为一个示例可以采用如下方法:准备地址数据库,并与地址识别部118B通过OCR (Optical CharacterRecognit1n,光学字符识别)技术等对地址区域内的候选文字进行文字识别而得到的结果进行匹配。另外,地址识别部118B并不仅限于识别文字,也能够识别数字,还能够从地址区域中仅读取邮政编码。
[0071]接下来,地址识别部118B将变量i设置为1 (步骤ST14)。变量i是在步骤ST12、ST13中分配给识别出的各个地址区域的连续编号。换言之,地址识别部118B对各个地址区域分配变量i(i = 1、2、…)。在实施方式中,假设地址识别部118B从纸张类中识别出三个地址区域。在这种情况下,地址识别部118B对各个地址区域分配i = 1、2、3。例如,地址识别部118B分别对图4中的地址信息D1、E1、F1分配变量i = 1、2、3。
[0072]接下来,非收件人判定部118C判定第i个地址信息是否为非收件地址(步骤ST15 ;图7)。另外,非收件人判定部118C对被判定为非收件地址的地址,判定是否为寄件人地址。当存在一个被判定为非收件地址的地址时,非收件人判定部118C将识别出的地址信息判定为寄件人的地址。另一方面,当存在两个以上被判定为非收件地址的地址时,非收件人判定部118C将识别出的地址信息中的、相对应的排位最低的地址信息判定为寄件人的地址。
[0073]图7是示出与步骤ST15相当的基于非收件人判定部118C执行的处理流程的一例的流程图。首先,非收件人判定部118C对记载在地址区域中的地址是通过手写方式记载的还是通过印刷方式记载的进行判定(步骤ST31)。当判定出记载在地址区域中的地址为手写记载时,非收件人判定部118C判定出记载在地址区域中的地址不是非收件地址(步骤ST40)。当判定出记载在地址区域中的地址为印刷记载时,非收件人判定部118C进入步骤ST32。关于将通过手写方式记载的地址判定为不是非收件地址的意义,将在下文中进行说明。
[0074]此外,由于在手写字和印刷字之间,文字和数字的形状大不相同,因此用于模式匹配的图案图像也大不相同。为此,作为地址识别用的图案图像,会分别准备手写用图案图像和印刷用图案图像。在实施方式中,地址识别部118B在从地址区域中识别地址信息时,执行两种模式匹配,即、使用手写用图案图像的模式匹配以及使用印刷用图案图像的模式匹配。将一并执行两种模式匹配的处理称为手写印刷判定处理。非收件人判定部118C根据基于地址识别部118B执行的手写印刷判定处理的处理结果,执行后述的步骤ST21的判定。
[0075]接下来,非收件人判定部118C将变量j设置为1 (步骤ST32)。变量j是分配给保存在历史记录保留部118E或者寄件人信息保存部118F中的表中的各条记录的连续编号。在实施方式中,非收件人判定部118C先对保存在历史记录表TE中的记录赋予连续编号,紧接着对保存在寄件人信息表TF中的记录赋予连续编号。例如,假设保存在历史记录表TE中的与地址信息相关的一组信息为N条。在这种情况下,非收件人判定部118C对保存在历史记录表TE中的各条记录分配变量j = 1?N。然后,非收件人判定部118C对保存在寄件人信息表TF中的各条记录分配从N+1开始的连续编号以作为变量j。
[0076]在此,保存在历史记录表TE中的记录和保存在寄件人信息表TF中的记录是基于过去在图3的步骤ST13中识别出的信息的记录。下面,为了说明,将作为通过前一次处理保存在历史记录表TE或者寄件人信息表TF中的记录的基础的地址信息设为Al、Bl、C1。图8是示出过去从纸张类S1识别出的地址信息Al、Bl、C1的图。
[0077]非收件人判定部118C从历史记录表TE或寄件人信息表TF中加载第j条记录(步骤 ST33)。
[0078]非收件人判定部118C对第j个地址信息是否与通过图3的流程图中的步骤ST14?ST17选择的第i个地址信息一致进行判定(步骤ST34)。当判定结果为不一致时,非收件人判定部118C进入步骤ST37的处理。当判定结果为一致时,非收件人判定部118C进入步骤ST35的处理。
[0079]在此,地址信息一致的情况包括完全一致的情况以及部分不一致的情况。例如,只要邮政编码和门牌号一致,即使表示地址的文字的一部分不一致,非收件人判定部118C也会判定为两个地址信息一致。
[0080]非收件人判定部118C对记载有第j个地址信息的记载位置与记载有第i个地址信息的记载位置是否一致进行判定(步骤ST35)。当判定结
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1