含有地址信息的图象的视频编码方法

文档序号：6416404阅读：198来源：国知局

专利名称：含有地址信息的图象的视频编码方法
技术领域：
本发明涉及邮件的自动分检，并且尤其涉及其中通过对含有地址信息的邮件进行光学字符识别(OCR)而应用地址鉴别自动处理的系统，当地址不能通过OCR自动解释时通过视频编码辅助和改进该处理。当结束视频编码时，通常充分完成地址字段以达到期望的分检水平。
更具体地，本发明涉及一种利用视频编码来处理包含着已被OCR自动鉴别地址拒绝的地址信息的邮件图象的方法。
背景技术：
在欧洲专利文件97/921794号中，通过视频编码对包含着地址信息的图象的处理在于对地址框中的不同区域的全部或部分进行系统地编码，从而明确识别邮件的目的地。采用各种编码技术，例如轮廓编码、抽取编码、互补编码和选择编码。
尽管这些不同的视频编码技术趋于提高视频编码操作员的生产率，但是它们完全不利用通过OCR进行自动鉴别地址处理得到的结果。通常，利用OCR自动鉴别地址处理得到的结果是按图象属性向量的形式给出的，其中包括OCR提取的所有信息，地址信息特征(地址信息的印刷格式手写/打印)，OCR在地址框中检测到的信息线的数量和坐标(或者实际上地址框的每个字段的信息)，以及和置信等级关联的字段值。该和字段值关联的置信等级表示正确识别OCR所提取的字段值的概率。
图1示出一幅含有地址信息的图象IN并且示出带有含着信息的地址字段V和N的图象属性向量AT的结构，其中字段V标识地址框中的街道名(V＝RUE JEAN PERRIN)而字段N标识地址框中街道上的号码(N＝18)。这些地址字段值关联着置信等级CV和CN，在本情况中这二个等级规定按等于1的识别概率(最大置信等级)识别出该街道名并以0.38的识别概率识别出该街道号码。另外，在该图象属性向量中，组合置信等级CG对应和各地址字段关联的所有置信等级的乘积，其用来指示该地址信息的总识别概率。自动OCR鉴别处理利用该组合置信等级判定是否拒绝图象，从而该图象需要进行视频编码处理，其中例如通过比较组合置信等级和某预定阈值做出判定。
例如在一次检查运动中对通过OCR自动鉴别地址处理提供的因地理内向分检(tri distribution)过程而被拒绝的一组图象结果进行详细分检表明，可以把拒绝原因分类成几个主要类别。即，例如在这次检查运动中发现·在被拒绝的34％的情况中，通过OCR正确地识别地址字段V和N，但是通过OCR发出的组合置信等级过低；·在被拒绝的14％的情况中，正确识别地址字段V但地址字段N未正确识别·在被拒绝的25％的情况中，未正确识别地址字段V但正确识别地址字段N；·在被拒绝的26％的情况中，地址字段V和N都未正确识别；以及·只有1％的被拒绝情况和出故障识别情况有关。
根据这次观测，看来根据对组合置信等级的定阈值过滤被拒绝图象群中的34％。类似地，可能根据对置信等级CV的定阈值过滤掉14％的被拒绝图象，同时可能根据对置信等级CN的定阈值过滤被拒绝图象群中的25％。通过根据这些类别对被拒绝的图象分类，有可能对每种被拒绝图象类别施加适应该类别的特定视频编码处理，从而使操作员花费的时间最小并且由此提高视频编码系统的吞吐量。如果某被拒绝图象不属于任何预定拒绝类型，则需要通过视频编码扫描所有的地址字段予以处理，这是耗时的。很清楚拒绝类别的数量是地址结构以及地址字段数量的函数。从而应理解，以这种方式对被拒绝图象分类使得能以一种不统一的而且相适应的方式处理被拒绝的图象。

发明内容
为此，本发明提供一种采用视频编码的方法以便处理含有地址信息并且已被OCR自动鉴别地址处理，例如内向地理分检，拒绝的图象。当然，该方法容易推广到其它拒绝类型，例如外向分检(acheminement)、邮政信箱、重新定址、公司分检。对于每个被拒绝的图象，OCR自动鉴别地址处理产生一个图象属性向量，在该向量中地址框中的各个字段值关联着一个置信等级。依据本发明，对每个被拒绝的图象，该方法在于通过施加作用在和该被拒绝图象关联的图象属性向量中的各置信等级上的级联过滤器(过滤器的数量随被处理的拒绝类型变化)识别和该被拒绝图象对应的拒绝类别；一旦通过某过滤器识别和该被拒绝图象对应的拒绝类别，操作员首先在该过滤后进行专用于该拒绝类别的编码以便补充或者修改和该被拒绝图象关联的图象属性向量，然后评估和该被拒绝图象关联的图象属性向量以便能决定何时停止对该被拒绝图象的视频编码。可以分别在不同的视频编码单元或控制台中分别实现不同的操作员编码操作，从而提供使用专长于特定拒绝类别的不同视频编码操作员的优点，由此改进它们的工作。过滤的一个例子可以是对单个置信等级、对组合置信等级或者实际上对和地址框的不同字段关联的多个置信等级的组合阈定阈值。还可能在专家规则下进行细化过滤并且把过滤扩充到属性向量中地址字段值及关联置信等级之外的部分上，这不超出本发明的范围。当通过定阈值过滤时，通过监视通过各个过滤器的各图象部分的监控人员能动态地调整阈值值是有好处的。调整阈值值还能改变视频编码系统的吞吐量和出错率。邮政操作员都认为对内向分检所需的所有地址字段进行视频编码是无益的，因为它的吞吐率过小。利用本发明，通过采用级联过滤器，有可能除掉不益于通过视频编码处理的被拒绝图象。更具体地，可以调整各过滤器的阈值，从而只留下视频编码处理会比人工会检快的邮件的图象。人工分检的一般吞吐率为每小时1600到1800件，这意味着为了使视频编码超过该吞吐率，视频编码必须在短于2秒钟内处理每份被拒绝的图象，这例如意味着作为视频编码操作输入长字符串是没有问题，例如键入街道名字段V(图1中示出)是没有问题的。

下面参照附图更详细地说明本发明。
图1是和地址信息对应的图象以及相应的图象属性向量。
图2是说明本发明方法的框图。
具体实施例方式
在图1中，邮件分检设备中的OCR自动鉴别地址处理通过产生由地址框中的字段值V和N构成的图象属性向量AT响应含有地址信息的图象IN，其中这些值关联着置信等级CV和CN并且带有为置信等级CV和CN的乘积的组合置信等级CG。
通常，当组合置信等级CG低于预定阈值时，OCR自动地址鉴别不能明确地解出地址，从而把图象IN和对应的图象属性向量AT发送到进行视频编码处理。
在图1的例子中，尽管组合置信等级CG代表一条不明确解出的地址，但是地址字段V的值已被明确识别。为了明确解出地址只要求视频编码操作员确认N地址字段的值，在操作员不确认该给出的值的情况下只需要操作员对N地址字段输入新值。通过操作员确认进行编码是不耗时的，并且要比通过抽取、选择或互补信息方式输入信息进行编码操作员耗时少。依据本发明，对图象属性向量AT中的各置信等级使用级联过滤器以便识别和被拒绝图象IN对应的拒绝类别，从而施加专用于该拒绝类别的处理，例如输入信息编码之后的确认编码。
图2示出级联过滤器F1至F4，每个过滤器之后跟随着操作员编码VC1至VC4和对图象属性向量AT的评估E。过滤器F1至F4构成被拒绝图象的一种分类器TC并且它们用于确定被拒绝图象的对应类别编号。
在图2的例子中，每个过滤器F1至F4把置信等级CV、CN、CG和阈值值S1至S4比较。图2中的过滤器组织成和上面说明的拒绝类型对应。在最上游的过滤器F1处，如果置信等级CV(街道名的置信等级)大于阈值S1，则进行键盘编码VC1以输入街道号码。
在随后的过滤器F2处，如果组合置信等级CG大于阈值S2，则通过按键或语音合成同时对街道号码和街道名进行确认编码VC2。
在过滤器F3处，如果置信等级CV(和街道名相关)大于阈值S3，则先在街道名上进行确认编码VC3然后通过键盘编码输入街道号码。
在过滤器F4处，如果置信等级CN(和街道号码相关)大于阈值S4，则对街道号码进行确认编码VC4并且通过键盘编码输入街道名。
在这些级联过滤器的出口处，进行操作员填写地址框中的所有字段的键盘编码VC5，因为在这种情况下通过OCR编码的信息是不可靠的。
过滤器F1至F4排序成使各操作员进行的编码操作在操作时间上逐渐变成更加耗时。
对于这种类似的拒绝，按如下调整过滤器F1至F4的阈值值S1的阈值为0.99，S2的阈值为0.93，S3的阈值为0.85，以及S4的阈值为0.83。
根据这些阈值值，图1中的图象IN在过滤器F1的分支上视频编码。编码所需的时间约为1385毫秒(ms)，其大大短于编码地址框中所有的字段估计为4000ms的时间。
另一个被拒绝地址例子V＝AVENUE GAMBETTACV＝0.98N＝？9CN＝0.0
CG＝0.0由于置信等级CV小于0.990(阈值S1的值)，该图象被过滤器F1拒绝。它被发送到过滤器F2。置信等级CG小于0.93。该图象被过滤器F2拒绝并发送到过滤器F3。由于置信等级CV大于0.85，对街道名施加确认编码VC3并接着利用键盘编码输入街道号码。编码所需时间约等于1600ms＝街道确认(约1385ms)+键入街道号码(约215ms)。
另一个被拒绝图象的属性例子V＝RUE DE MONTFAAUCONCV＝1.0N＝6？？6CN＝0.0CG＝0.0其视频编码过程和图1例子相同，从而编码时间约为1385ms。
另一个被拒绝图象的属性例子V＝RUE AUGUSTE PERRETCV＝0.98N＝8CN＝0.99CG＝0.97由于置信等级CV小于S1，过滤器F1拒绝该图象。它被发送到第二过滤器F2。组合置信等级CG大于0.85，从而施加视频编码VC 2。本情况下平均编码时间约为1309ms。
另一个被拒绝图象的属性例子V＝PLACE FRANCOIS TRUFFAUTCV＝0.62N＝2CN＝0.85CG＝0.51
在本情况下过滤器F1、F2、F3和F4拒绝该图象，从而它受到VC 5处的视频编码。编码时间为4000ms。这是最不顺利情况。
如图2中所示，在操作员编码VC 1至VC 4后，受到视频编码的图象IN的关联图象属性向量AT被补充或被修改，并且在每次视频编码操作后在E处评估该图象属性向量，以便判定何时停止对该被拒绝图象的视频编码(因为已经完全识别地址信息)。当判定不在某个过滤级上停止视频编码时，则通过下一级过滤继续进行处理，如图2中的箭头所示。
图2清楚地示出过滤器的级联结构，其中每个过滤级带有操作员动作例如VC 1、VC 2、VC 3、VC 4以及关联评估E。由于操作员动作VC 1至VC 4分别专用于过滤器F1至F4，在其中各操作员专长于不同拒绝类型的不同视频编码单元或控制台上实现各条处理线F1-VC1-E、F2-VC2-E等等。
图2还示出监控员自动地以动态方式调整过滤器F1至F4中的阈值值S1至S4。
为了保证视频编码处理是有益的，级联过滤器可以仅由当前三个过滤级F1至F3组成，如果某被拒绝图象未被这三个过滤级中的至少一级识别，则它不由视频编码处理而会人工分检该对应的邮件。这能达到每小时约2300份邮件的平均视频编码吞吐率。更具体地，在外向内向分检(tri acheminement-distribution)过程中，可以和通过OCR自动鉴别过程相一致地实现依据本发明的使用前三个过滤组F1至F3的通过视频编码对被拒绝图象的处理，如果例如把过滤器F1-F3调整成只对已经通过OCR明确识别外向分检邮政信息的图象进行分类，因为视频编码操作VC 1至VC 3可以按大致和对外向分检邮件进行视频编码所需的处理时间相同的时间予以实现。
权利要求
1.一种通过视频编码用于处理邮件的图象(IN)的方法，每幅图象含有地址信息，所述图象已被通过OCR的自动鉴别地址处理拒绝，该方法特征在于包括对每个被拒绝图象产生一个图象属性向量(AT)，该向量由与形成地址信息的地址框中的各字段(V，N)关联的置信等级(CV，CN)构成，通过作用在所述图象的属性向量的各置信等级的级联过滤器(F1-F4)对每个被拒绝的图象分类，该级联过滤器中的各个过滤器级识别不同的拒绝类别并对每种拒绝类别确定特定类型的视频编码处理；以及当在某过滤器级上识别和被拒绝图象对应的拒绝类别时，首先在所述过滤后进行专用于该拒绝类别的视频编码(VC 1-VC 4)处理以便补充或修改该被拒绝图象的图象属性向量，然后评估(E)该被拒绝图象的属性向量以便能判定何时停止对被拒绝图象的视频编码。
2.根据权利要求1所述的方法，其中各个过滤级(F1-F4)、各视频编码处理(VC 1-VC 4)和对相应图象属性向量(AT)的评估(E)形成一组分别在不同的视频编码单元或控制台上实现的处理线。
3.根据权利要求1或2所述的方法，其中每个过滤级(F1-F4)将被拒绝图象的属性向量(AT)的至少一个置信等级(CV，CN，CG)和阈值值(S1-S4)比较。
4.根据权利要求3所述的方法，其中由用于监视通过各个过滤级的被拒绝图象的各部分的监控员来动态地调整阈值值(S1-S4)。
5.根据权利要求1至4中任一权利要求的方法，其中该地址信息是用于邮政分检的地址信息，其中地址框包括给出街道名的第一字段(V)和给出该街道上的号码的第二字段(N)构成，其中图象属性向量(AT)包括和地址框的第一字段(V)关联的第一置信等级(CV)、和地址框的第二字段(N)关联的第二置信等级(CN)、以及等于和地址框的所述第一及第二字段关联的所述置信等级的乘积的组合置信等级(CG)，并且通过下述过滤级和处理级组成级联的过滤器和专用视频编码处理a)如果第一置信等级(CV)大于第一阈值值(S1)，则通过视频编码(VC 1)输入街道号码；b)如果组合置信等级(CG)大于第二阈值值(S2)，则通过视频编码(VC 2)确认街道号码以及街道名；以及c)如果第一置信等级(CV)大于第三阈值值(S3)，则通过视频编码(VC 3)确认街道名，然后输入街道号码。
6.根据权利要求5所述的方法，其中通过语音合成完成通过视频编码的确认。
7.一种外向和内向分检邮政图象的方法，其特征在于其采用依据权利要求1至6中任一权利要求的对邮件图象(IN)视频编码的处理，其中如果在这些级联过滤器后未对某被拒绝的图象识别出拒绝类别，则把该被拒绝图象对应的邮件发送到人工分检处理。
全文摘要
本发明涉及一种通过视频编码处理由地址信息构成的图象的方法。依据本发明，对每个被OCR地址识别系统拒绝的图象，利用对被拒绝图象关联的图象属性向量的各置信值施加的级联过滤器(F1－F4)识别和被拒绝图象对应的拒绝类别。随后，当在某过滤器上识别和该被拒绝图象对应的拒绝类别时，在所述过滤处理后进行下述操作(i)专用于该拒绝类别的操作员编码(VC1－VC4)从而完成或者修改和该被拒绝图象关联的图象属性向量，以及(ii)评估(E)和被拒绝图象关联的图象属性向量从而可作出对所述被拒绝图象停止视频编码的判定。
文档编号G06K9/03GK1934577SQ03821899
公开日2007年3月21日申请日期2003年9月9日优先权日2002年9月16日
发明者赫查姆·埃尔-伯恩诺斯, 吉勒斯·莫森, 克里斯托弗·洛霍梅申请人:索利斯蒂克有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赫查姆.埃尔-伯恩诺斯;吉勒斯.莫森;克里斯托弗.洛霍梅
技术所有人：索利斯蒂克有限公司
我是此专利的发明人

上一篇：用于集成电子邮件帐户的系统和方法
上一篇：用于适配媒体系统上的兴趣简档的系统和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。