通过光学字符识别ocr处理邮件的方法

文档序号:5070478阅读:355来源:国知局
专利名称:通过光学字符识别ocr处理邮件的方法
通过光学字符识别OCR处理邮件的方法本发明涉及具有带分拣输出容器的分拣出口的分拣机中的邮件 处理方法,在进行连续的分拣操作时,邮件被引导到所述分拣输出容 器中,其中,当进行邮件的第一分拣阶段时,形成每个邮件的带有地址 信息的数字图像以尤其通过OCR ( Optical character Recognition )的 方法自动识别邮件地址,从所述图像中得到作为邮件的逻辑标识符的 数字印记,并且在存储器中对应于邮件的数字印记以及邮件被导向的 分拣输出容器的逻辑标识地记录代表自动识别出来的邮件地址的地 址数据,其中,在笫二邮件分拣阶段中,对当前邮件重新形成包括当前邮 件地址信息的数字图像,从所述图像中得到当前邮件的数字印记,且 在第一分拣操作记录的数字印记中搜索与当前邮件数字印记的匹配, 从而尤其是采集代表当前邮件地址信息的地址数据。更具体地,本发明涉及通过在一个或多个分拣机上的多个分拣操 作进行的邮件自动分拣方法,其中,无需(通过带标记或不带标记的 印刷)在邮件上附加邮件标识(通常称为时序标记("chronomarque,,) 或ID标签),尤其是条形码形式的标识。在本发明的方法中,如欧洲 专利文献EP1222037所描述的那样通过图像的签名或数字印记来识 别邮件。在连续的分拣操作中使用图像的签名或者数字印记来识别邮 件避免了使用条形码印制和读取外围设备、条形码印刷质量检查(通 常称为BCV)外围设备以及用于在具有塑料表面的邮件上粘贴标签的 贴标签机(尤其用于扁平物体类型的邮件例如杂志和报纸),由此在 分拣机器的成本上与其维护成本上获得实质性的节约,也同时在机器 使用过程中得以节约耗材。在专利文献EP1222037中,在各分拣输出容器的壁上附加条形
码,用作容器的标识。在第二分拣阶段中,在机器入口处读取装载了 的容器的条形码,且在所述容器与容器所包含邮件的数字印记之间形 成关联,以便在第二操作中搜索当前邮件数字印记与第 一操作中记录 的数字印记之间的匹配时,利用限于第 一分拣操作的单个输出容器的邮件的印记的探测空间(espace d,exploration ),从而符合实时处理 要求。然而,在该已知方法中,用于减少数字印记的探测空间的原理 仅容许来自机器第一分拣操作的多个分拣输出容器所包含的邮件,也 就是被换装在用于返回另一机器的入口以继续进行第二分拣阶段的 单个容器中的邮件。使用这种已知方法,便不再可能中断容器的序列, 例如在第二分拣阶段中引入不是来自第一分拣操作的分拣输出容器 的容器中所包含的邮件。使用这种已知方法,必须在第二阶段中保持 返回分拣机入口的每一个容器中的邮件的相对顺序。因此所述已知方 法对故障没有抵抗力,故障可能发生在分拣机供应仓中,例如在机器 堵塞之后。本发明的目的是提出一种方法,用于通过多个分拣操作分拣邮 件,所述多个分拣操作利用数字印记来标识邮件,且对上述4吏用上的 限制不敏感。为此,本发明的目的是提出一种具有带分拣输出容器的分拣出口 的分拣机中的邮件处理方法,在进行连续的分拣操作时,邮件被引导 到所述分拣输出容器中,其中,在邮件的第一分拣阶段,形成每个邮件的带有地址信息的 数字图像以自动识别邮件地址,从所述图像中得到作为邮件的逻辑标 识的数字印记,并且在存储器中对应于邮件的数字印记以及邮件被导 向的分拣输出容器的逻辑标识地记录代表自动识别出来的邮件地址 的地址数据,其中,在邮件的第二分拣阶段,对当前邮件重新形成包括当前邮 件地址信息的数字图像,从所述图像中得到当前邮件的数字印记,且 在第一分拣阶段记录的数字印记中搜索与当前邮件数字印记的匹配,其特征在于,在第二分拣阶段中-还根据当前邮件图像进行地址自动识别,从而获得代表当前 邮件地址的地址数据,—在存储器内记录的地址数据中,搜索与当前邮件地址数据的 匹配,从而从分拣输出容器的逻辑标识中识别出第 一分拣阶段中相应 于当前邮件的当前分拣输出容器,从而,为了搜索两个数字印记之间 的匹配,在由对应于所述当前分拣输出容器的数字印记构成的探测空 间内进行数字印记的匹配搜索。按照本发明的方法的基本思想因此在于,得益于OCR方法辨别 容器的某些邮件,进行邮件容器的自动识别,从而减少印记的探测空 间。按照本发明的方法被应用于可以在配备有简单的或分区的分拣输 出容器的多个分拣机(包括具有分拣发送/分拣分配部分)上进行连续 的分拣操作的处理。按照本发明的方法被应用于邮件处理中,其中, 对印记的匹配搜索用于收集表示地址信息的数据,但也能以同样的方 式被应用于下面这样的邮件处理之中其中,印记的匹配搜索被用于 在机器中实现对邮件的跟踪,按照本发明的方法可以具有如下特征-为了识别第 一分拣阶段中的当前分拣输出容器,对连续的邮件 记录地址数据之间获得匹配的次数;-如果没有检测到当前邮件数字印记与构成探测空间的数字印 记之间的匹配,把当前邮件置于等待状态,且在用与相应于第一分拣 阶段的另 一分拣输出容器的数字印记对探测空间进行更新以后,重新 对该当前邮件搜索匹配的数字印记;-记录当前邮件被置于等待状态的次数,且如果检测到所述当前 邮件被置于等待状态的次数超出特定阈值,则拒绝该当前邮件。本发明方法的实施方式举例在下面被详细说明且由附图示出。所 述描迷仅为说明性举例,本发明并不局限于此。

图1以示意性方式示出了一邮件。图2以示意性方式示出了用于实施本发明方法的分拣机。图3以图表形式示出了按照本发明的方法在第一分拣阶段中的进程。图4示出了分拣机存储器中的数据组织结构。图5以图表形式示出了按照本发明的方法在第二分拣阶段中的进程。在图1中,示出了一包含配送地址信息A的邮件P。所述邮件可 以为一封普通的信件,或者一个或大型或小型的扁平物品,如带有塑 料或纸制包装的杂志、报纸或目录册。在图2中,示意性示出了一运用本发明方法的分拣机l。 分拣机1通常包括带有储存仓和用以使邮件例如例如P侧立着 顺序前进的出仓器(d印ileur)的供给入口 2、用以获得各邮件P的 表面的包括配送地址信息A的图像的数字摄像机3以及把邮件引导向 分拣出口的带斗循环输送装置(carrousel & godets ) 4,所述分拣出口 分别配备有分拣输出容器5。各个出口都可以配备有多个分拣输出容 器(通常是一前置容器与一后置容器)或一分区容器,这都不超出本 发明的范围。在图2上,还示出了连接在视频编码系统7上的数据处理系统6。 系统6与7构成通过OCR识别地址的系统,OCR从由摄像机3形成 的邮件P的图像出发自动地或借助于视频编码操作员的介入,提取地 址信息A,在所述信息基础上,确定对应于机器分拣出口的邮件的分 拣目的地。此外,按照本发明,系统6被设置为从由摄像机3形成的记。在图2上,还示出了类似于系统6的系统9,但所述系统9属于 另一分拣机IO,所述系统9通过电信网8被通信连接到系统6,用以 将照本发明的方法应用于包括多个分拣机上的多个分拣阶段的分拣 过程。在按照本发明的方法中,邮件通过多个分拣阶段进行分拣,例如, 通过两个分拣阶段进行。图3与图5分别示出了按照本发明的方法在例如1这样的单个分
拣机上实施的第一分拣阶段与第二分拣阶段中的步骤。参考图3,在初始步骤ll中,在机器l入口准备待分拣的邮件, 且把空容器装置在机器的分拣出口上。对各分拣输出容器通过机器1 分配储存逻辑标识Bac-ID。作为容器的逻辑标识的例子,可以例如使 用如下信息的串接分拣地点的识别符/分拣机的号码/分拣机内的分 拣输出号码/日期/时间。在步骤12中,邮件被取出(depiler),且被整理成序列,以便 通过摄像机3。各邮件的表面图像被形成且被记录在系统6的存储器 中。在步骤13中,在邮件的图像基础上,通过OCR实施对地址信 息A的自动识别,与此同时,在计算机6中,从邮件图像中得到数 字印记V-Id,用作为邮件的逻辑标识符。在系统6内,也可以给邮件 分配另 一 种邮件逻辑标识,例如号码形式,比如时序标记 (chromomarque) Tag國Id (标签Id )。在步骤14中,如果通过OCR自动地址识别获得单义的地址信 息A,则代表具有邮件临时号码Tag-Id的所考虑邮件的所述地址信 息的数据AD与在步骤16被对应地记录在储存器内。在图3上,示 出了由BD-OCR/VCS表示的数据库17,其中,对于各邮件,对应 地记录有分配给邮件的临时号码Tag-Id以及代表邮件地址的数据, 号码Tag-Id作为为了在第二分拣阶段中最终采集地址数据而访问数 据库的钥匙。在步骤14中,如果OCR自动地址识别给出的是部分结 果,也就是模棱两可的地址分配信息,或仍然无任何结杲,则邮件的 数字图像被发送(步骤15)至视频编码系统7,用以通过视频编码操 作员提取地址信息,之后,在步骤16,通过系统7被提取的地址数据 与邮件临时编码Tag-Id对应地被记录在数据库17中。按照本发明的方法,在步骤18中,对于相关邮件还在数字印记 数据库20 (被称为BD-VID )内,与通过OCR自动获取的地址数据 (在步骤13)、邮件的临时号码Tag-Id与邮件被导入其中的分拣输 出容器的逻辑标识Bac-Id对应地记录邮件的数字印记V-Id (来自步
骤13)。被记录在数据库20内的地址数据为仅通过OCR地址自动 辨识获得的数据,也就是没有视频编码操作员的介入。在步骤19中,在第一步分拣操作之后是把邮件向分拣机相应分 拣出口输送,以及将邮件卸载到所述分拣出口的容器中。对于在机器 入口被取出的各个邮件,所述方法在步骤13再次循环(未示出), 并且,如有必要,对在第一步分拣阶段中装满的容器进行管理。图4以示意性方式示出数据库17与20的记录结构。具体地,对于数据库17,示出了多个记录,在每一个记录中, 被作为访问密钥的邮件临时号码Tag-Idl、 Tag-Id2、 Tag-Idn与地 址数据AD1、 AD2、 And对应地被记录,所述地址数据通过OCR地 址识别而获取,在必要情况下辅以视频编码VCS。在图4中以结构化的形式示出了数据库20,所述结构在此表现 为一组表格,每个表格由容器的逻辑标识Bac-Idl、 Bac-Id2、 Bac-Idi 标识。由Bac-Id标识的每一个表格包括一组记录,所迷记录分别对应 于装在分拣输出容器中的邮件。 一个表格的各个记录在此包括被分配给邮件的临时号码Tag-Idl.l、 ....... Tag-Idi.n、邮件的数字印记V-Idl.l.......、 V-Idi.n,以及仅通过自动识别获得的邮件地址数据AD-OCRl.l、 .......、 AD-OCRi.n。在表格的各个记录中,列出了 M所指的补充空格,其被用于如下将描述的本发明方法进程的记号。需 要理解的是,按图4所示的对表格17与20的分割仅为非限制性的举 例。图5示出了按照本发明的方法在邮件分拣的第二阶段的步骤。 在步骤41中,在第一分拣阶段中装在分拣输出容器中的被分拣的邮件被重新输送至分拣机1的入口 ,且空的分拣容器被引入机器1的分拣出口。在第二步分拣阶段中,按照本发明的方法利用数据库20与在图 4与图5上标记为45的另一临时数据库,所述临时数据库包含数字印 记V-Id,数字印记V-Id构成由BR-RV-Id所标记的探测空间,用以 按照如下描述,搜索两个数字印记之间的匹配。所述临时数据库45
在步骤41中被初始化,在笫二步分拣阶段的开始阶段不舍任何记录。在步骤42中,在分拣机的储存仓中的邮件被取出,以便串行通 过摄像机3。再次对各个邮件的表面形成包含地址信息A的图像,且 在步骤43中,从当前邮件的所述图像中获得数字印记V-Id。在按照本发明的方法中,在步骤43中,还从当前邮件的图像通 过OCR进行地址自动识别,从而再次通过OCR方法获得代表当前邮 件地址的地址数据。在步骤44中,搜索当前邮件的数字印记与记录在数据库45中的 数字印记之间的匹配。如上所述,在第二步分拣阶段开始启动时,数 据库45为空,因此对于第一封当前邮件,在步骤44中找不到两个数 字印记之间的匹配。如果在紧接步骤44的步骤46中没有找到任何匹 配,继续在步骤47中进行该方法,在所述步骤47中,确定步骤43 中所实施的OCR自动地址识别是否成功。实际上,例如,如果已经 获得构成数据库20中所记录的地址数据的发送码与分配码,可以认 为在步骤43实施的OCR自动地址识别是成功的。当在步骤47中发现OCR自动地址识别在步骤43中未成功的情 况下,在步骤48,可以控制是否把当前邮件置于等待状态。可以首先 考虑邮件仅在确定的时间段内被置于等待处理状态,例如在10秒的 时间段内,并且如果超过所述时间段,则被置于等待状态的邮件必须 被拒绝(图5上由"拒绝"所指的步骤51)。如果在步骤48中,当前邮件可以被置于等待状态,在步骤49 中,在存储器中在等待列表50中维持一邮件逻辑标识,例如Tag-Id。现在,如果在步骤47中检测到OCR地址自动识别在步骤43中 获得成功,那么在步骤52中,搜索当前邮件的地址数据AD-OCR与 记录在数据库20中的地址数据AD-OCR之间的匹配,从而在数据库 20中识别检测到匹配的一个或多个记录,通过^f务改其标记M的状态 来标识所述记录,且对于数据库20中的各个分拣输出容器对地址数 据之间的匹配计数。在步骤53中,如果未在数据库20中对分拣输出容器检测到足够 数量的标记次数,当前邮件可在步骤49中被置于等待状态。相反, 如果在步骤53中在数据库中对分拣输出容器检测到所标记的次数大 于特定阈值(例如同一个容器有三次),那么在步骤54,在数据库 45(数据库BD-RV-Id)中装栽在数据库20中的分拣输出容器的所有 记录,这些记录因此确定了用于搜索两个数字印记之间的匹配的探测 空间。在图4上,示出了印记的探测空间结构,其由数据库45构成, 所述数据库由Bac-Idj所标记的容器的邮件印记构成。对于例如容器 Bac-Idj,在图4上示出了三个记录,其分别包括邮件的数字印记 V-Id.j.l、 V-Id.j.2、 V-Id.j.n与容器从邮件1至n的识别码Tag-Id.j.l、 Tag-Id.j.2、 Tag-Id.j.n。实际上,各个分拣容器可以装有数十封邮件, 例如五十多封邮件,这代表了探测空间的范围(深度)。在按照本发 明的方法中,探测空间可以由多于一个容器(例如如图4所示的两个 容器)的数字印记V-Id与Bac-Idk所标记的容器的记录构成。在这 种情况下,增加了探测空间的大小,然而也增加了对于下述情况获得 印记的匹配的可能性,所述情况是这样的情况第一分拣阶段的多个 分拣输出容器已经在机器的供料储存仓内被清空,而没有在第二分拣 阶段启动之前遵守信封的顺序。在这种情况下,可以在步骤54中预备数据库45的部分更新,例 如把数据库45中最老的容器的邮件印记取代为一个刚被发现超出统 计次数阈值的容器的邮件印记。因此在每次更新数据库45时,取代 二分之一的容器的邮件印记。在步骤55中,如果处于等待状态的邮件清单50为非空,首先扫 描所述清单,且把该清单上所列处于等待状态的每一邮件在步骤44 与46中当作当前邮件。通常,在步骤46中会检测到一邮件(自等待 清单50中采集到)的数字印记与探测空间45中所记录的数字印记之 一匹配。才艮据在探测空间45中找到的印记与标识符Tag-Id之间的关 联,在数据库17中采集相关邮件的地址数据AD (步骤58),且朝 相应的分拣出口发送邮件(步骤57)。在步骤58中,进行探测空间 的范围的缩减针对可能的删除,利用在步骤46找到的数字印记相应的记录的标记,对数据库45进行更新。还对数据库20进行更新对在步骤54中未被装在数据库54中的容器对应的记录中的标记20进行初始化。在必要的情况下,通过删除步骤46所找到的数字印记的相应识别码Tag-Id进行等待清单50的更新。如上所述,在步骤44中首先进行等待清单50中处于等待状态的邮件的处理。如果在步骤46中,没有发现所述当前邮件的匹配,所述当前邮件可以在步骤49直接再次进入等待状态。在步骤49中,如果发现邮件进入等待状态的次数大于特定阈值,可以拒绝所述邮件(步骤51的手动处理)。在步骤58之后,进程循环回到步骤42,以便处理等待清单51 的下一个邮件或另一封邮件。如果第二分拣阶段在另 一机器比如10上完成,在步骤41将把机 器1所构成的数据库20传输至系统9。如上所述,按照本发明的方法对于下述情况具有抵抗力例如, 在容器换装之后第二分拣阶段对邮件顺序扰乱,或者序列的中断。
权利要求
1.一种具有带分拣输出容器(5)的分拣出口的分拣机(1;10)中的邮件处理方法,在连续的分拣阶段中,邮件(P)被引导到所述分拣输出容器中,其中,在邮件的第一分拣阶段,形成每个邮件的带有地址信息的数字图像(12)以自动识别邮件地址,从所述图像中得到作为邮件的逻辑标识的数字印记(V-Id),并且在存储器(16)中对应于邮件的数字印记以及邮件被导向其中的分拣输出容器的逻辑标识(Bac-Id)地记录代表自动识别出来的邮件地址的地址数据(AD),其中,在邮件的第二分拣阶段,对当前邮件重新形成(42)包括当前邮件地址信息的数字图像,从所述图像中得到(43)当前邮件的数字印记,且在第一分拣阶段记录的数字印记中搜索与当前邮件数字印记的匹配,其特征在于,在第二分拣阶段中-还根据当前邮件图像进行地址自动识别,以获得代表当前邮件地址的地址数据(AD-OCR),-在存储器内记录的地址数据中,搜索与当前邮件地址数据的匹配(44),以从分拣输出容器的逻辑标识中识别出第一分拣阶段中相应于当前邮件的当前分拣输出容器,从而,为了搜索两个数字印记之间的匹配,在由对应于所述当前分拣输出容器的数字印记构成的探测空间(45)内进行数字印记的匹配搜索。
2. 如权利要求l所述的方法,其中,为了识别第一分拣阶段的 当前分拣输出容器,对连续的邮件记录地址数据之间获得匹配的次 数。
3. 如权利要求2所述的方法,其中,如果没有检测到当前邮件 数字印记与构成探测空间的数字印记之间的匹配,把当前邮件置于等 待状态(49),且在用与相应于第一分拣阶段的另一分拣输出容器的 数字印记对探测空间进行更新(54)以后,重新对该当前邮件搜索匹 配的数字印记。
4. 如权利要求3所述的方法,其中,记录当前邮件被置于等待 状态(48)的次数,且如果检测到所述当前邮件被置于等待状态的次 数超出特定阈值,则拒绝该当前邮件(51)。
5. —种邮件分拣机,被配置为使用如前述权利要求之一所述的方法。
全文摘要
在邮件处理方法中,在第一分拣阶段中形成各邮件的图像以自动识别邮件地址并将邮件向分拣输出容器引导,由图像得到作为邮件的逻辑标识的数字印记。在第二分拣阶段重新形成(42)当前邮件的图像,以从所述图像中得到(43)印记;再次进行地址自动识别,从而获得当前邮件的地址数据;且在第一阶段存储的地址数据中搜索与当前邮件的地址数据的匹配(44),以识别当前邮件相应的当前容器,从而,为了在第二阶段搜索两个数字印记之间的匹配,在由对应于所述当前分拣输出容器的数字印记构成的探测空间(45)内进行数字印记的匹配搜索。
文档编号B07C3/14GK101132866SQ200580047911
公开日2008年2月27日 申请日期2005年10月10日 优先权日2005年2月8日
发明者克里斯托弗·卡依翁, 奥利维耶·戴普雷, 昂马吕埃·米埃特 申请人:索利斯蒂克有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1