识别信件发送信息的方法和配置的制作方法

文档序号：6415809阅读：242来源：国知局

专利名称：识别信件发送信息的方法和配置的制作方法
技术领域：
本发明涉及一种各独立权利要求前序部分所述的方法和配置，特别有利地适合于确定用非拉丁字母文字所书写的信件发送信息。
各种自动识别发送信息、特别是地址信息的系统(OCR，即光学文字识别系统)，在信件处理领域是非常有名的，例如在DE 195 31 392中所描述的那样。采用先进的OCR信件分拣装置，信件的处理速度可达到每秒钟10封，即每小时36000封，甚至可以更快。然而识别可靠性会随着文字的字体以及写在信封表面的地址信息的总体质量而有很大的变化。被成功识别的信件会打上一个机器可识别的条形码，使用这样的条形码可以按照任意所需的分类方法对信件进行进一步的机器处理。特别地，使用条形码进行信件分类可以按照邮递员分发信件的相应顺序进行分类。
亚洲地区经济的增长和信件处理量的增长导致加快研制东方文字自动识别系统，以便限制成本，提高邮政服务质量。与西方国家邮局已经采用自动化新技术的情况相比，对信件识别系统提出了新的要求，因为在亚洲地区的大部分国家，中文文字被指定为书写本地区信件地址的文字。与西方拉丁文字的字母不同，中文文字是由表意的汉字组成的，每个汉字都可以表示一个词。西文字母表只有30至60个字母，而中文日常生活中常用的就有3000至6000个不同的汉字，每个都有自己的特征形式。与西文的拉丁文字系统相比，中文字符系统的这种非封闭性以及每个特定字符的表意结构，降低了OCR系统的有效性。此外问题还有，信件上的地址可以横着写，也可以竖着写，而且中文与西文字符经常混合出现。
通常，自动识别系统不仅对西文字符，也对中文字符的识别率差别很大，因此有必要对自动识别系统辅以不同形式的人工干预。最简单的辅助方法是对不能自动识别的信件采用人工分类方法。当然随着劳动力成本的不断增长，这种方法的成本特别高，非常不经济。另外，这种人工分拣的信件在以后不再能够采用机械方法继续分类，因而产生两股相互分开的信件分流，必须在某个特定时间再用人工进行合并。
为了克服OCR系统拒分信件人工分拣的这些缺点，人们发明了多种方法进行信件人工编码。所有这些方法都需要操作员的人工参与，以某种方式给信件打上条形码，这种方式应满足可通过同一架机器对OCR识别的和条形码编码的两种信件进行机械分类。
另一种对拒分信件进行编码的方法是使用所谓的人工编码台。这些信件本身一个接一个地在操作员面前通过人工编码台，操作员对每封信件利用尽量多的信息进行编码，以便识别出单义的地址信息。然后利用地址目录表将所得的地址转换为分拣条形码，打在信件上。被编码的信件将利用与适于OCR的条形码分拣器(BCS)在机械上相同的BCS继续处理。这种人工编码台方法最先由美国邮政和皇家邮政在七十年代使用。这种装置的主要缺点是信件必须从OCR信件流中分开，而操作员要识别出从他面前通过的信件由于人的生理条件局限也存在困难。
处理OCR拒分信件的最新进展是发明了在线视频编码系统(OVS)。这种OVS不是将信件本身通过人工编码台，而是将信件的视频图像送给操作员进行编码。视频图像展示给操作员的同时，信件本身保留在延迟传送带上。此处信件通常运行一段足够长的时间，以便使OVS操作员对所处理的图像输入必要的分拣信息。通常延迟传送带的延迟时间是10至30秒。延迟传送带越长，成本及对保养的要求会越高，设备也越大。
使用OVS的主要问题是，所能支配的时间仅仅足够仔细输入邮政编码信息(ZIP或PC)，需要使用的延迟传送带的长度就可能会不切实际地长。
只要有ZIP或PC，OVS就也可以有效地应用于中文地址的信件，当然有ZIP或PC的信件在许多东方国家还是比较少的，而且在可预见的将来这种情况还会保持下去。
因此，为了尽量减少必要的在线延迟时间，需要发明一种特殊的编码方法。
为了提高编码效率和/或能够输入所有的地址信息要素，即ZIP/PC、街道/信箱、收件人/信箱、收件人/公司等，因此在现有技术中发明了许多方法，主要有以下几种预视编码法(Vorschau-Codierung)预视编码法同时显示两封信件的图像，一个在另一个的上面。下面的图像是活动的，即对它的数据进行编码。经过适应训练，操作员可以在对下面的图像进行编码的同时，还能看得见上面图像的地址信息。上面的图像紧接着变成活动的，处理过程继续进行。在对一个接一个的图像进行编码时采用认知功能的和机械功能的完全重叠运行，预视编码法能够成倍提高操作员的工作效率。摘录编码法(Extraktionscodierung)因为在实际能拥有的在线延迟时间内操作员仅能可靠地输入地址信息要素ZIP/PC，摘录编码法仅输入与街道有关的地址组分中关键的组成部分。这种编码法通常基于一种特殊设计的编码规则，在其中，使用固定长度编码作为关键词对地址目录表进行索引。例如皇家邮政使用基于前三个字母和最后两个字母的摘要编码法。此时要求操作员必须熟记特殊规则，以便避免多余地址信息，而又照顾到诸如方向等不同的特殊标记，如东、西，或者街、巷、路等分类标记。
尽管摘录编码法有一定的编码效率，但也存在几个严重的缺点，特别是复杂的摘录规则需要常常顾及到街名的结尾部分，而手写信件中这些部分又是经常写得最不清楚的。另外人们还发现，不单义摘录的出现概率很高，即一个摘录编码对应目录中多个街道名，因而得不到一个单义的分拣结果。此外还要注意的是，只要没有使用一种简单重复的键盘输入，而需操作员作出判断，操作员的输入速度就会降低。补码法(Komplettierungscodierung)与摘录编码法相反，补码法对每一个要编码的地址采用一个可变的输入。实际输入与地址目录表进行比较，直到达到单义吻合。只要确定出部分单义吻合，通过显示地址的剩余部分，就能加快识别的速度。这种技术的问题是操作员必须给出明确的停止信号，而且必须显示地址信息的剩余部分，因此降低了输入效率，也不能使用预视编码法。
理论上所有上述视频编码技术都可以应用于中文字符信件的处理，尽管中文字符快速输入技术的匮乏使得这些方法的可用度受到限制。操作员辅助的OCR技术(Operateur-assistierte OCR-Technik)为了提高在线处理地址信息的能力，美国邮政试验了操作员辅助的OCR技术。这种方法注重提高对OCR拒分的地址图像的处理能力。由于操作员在辨认写错的字母时速度很慢，而且另一方面还产生复杂的识别错误，如断句断词错误，因此与简单地输入地址的方法相比，这种方法的工作效率通常较低。离线编码法(Off-line Codierung)由于以上提及的编码技术中没有一种在单纯使用在线编码时能达到较高的编码效率，最近提出了一种离线编码系统，如美国专利US PS 49 92 649中描述的那样。这种系统中对不能识别地址的信件另外增加一种信息，即跟踪识别信息(TID)。不能识别的信件单独存放的同时，将这些信件的图像信息传送给操作员进行编码，而对编码过程没有特别的时间限制。接着这些信件送到TID识别设备，TID与所输入的地址信息连接在一起。在此基础上，也可以将通常的条形码分拣信息打在信件上，以便使相关信件可以象通常的OCR识别信件一样地进行处理。虽然这种离线视频编码方法是一种有效的对所有地址信息进行编码的方法，但是，不能识别地址的信件需要增加额外的处理能力，而且物流也相应复杂。
操作员辅助的OCR技术基本上也适合于中文字符书写的信件，然而至今为止还没有快速输入这种文字的方法。
使这种情况更加恶化的是，这种方法对操作员的要求相对较高，需经必要的训练，还需要具备一定的知识。
采用语音输入装置的视频编码方法可以加快发送信息的输入速度，但只是把地址编码时的时间问题推迟到选择地址信息编码候选者的阶段。
在独立的权利要求1和9中所给出的发明解决的问题是，采用语音输入技术，用最少的人工选择要求，对以地址形式书写的发送信息，特别是在信件上用非拉丁字母文字手写的地址信息进行快速编码。
采用语音输入的辅助方法，对从OCR处理法的不全面或不单义的结果中选出的候选者进行筛选，就能很快地自动识别出正确的候选者，并不需要操作员的干预。这种方法特别适合于以中文字符书写的信件的编码过程。
本发明的有利实施形式可从各相关的权利要求中获知。
根据权利要求2，用键盘输入所显示地址信息的数字部分从而降低处理要求，是一种有益的方法。
根据权利要求3，有利的是，为了利用语音识别技术选择候选者，将OCR处理法确定的字符数目与语音识别的字符数目相比较，然后从OCR处理法确定的字符中挑选出其字符数超过统计确定的极限字符的候选者。此时按照权利要求4，可采用分段结果。
另一种根据权利要求5所述的有利选择方法中，将OCR处理法用概率确定的字符与语音识别法候选者的字符进行位置上的比较，选择出概率最大的超过极限值的候选者。
根据权利要求6，有利的是，顺序执行以下步骤来确定街道名-检查该街道名是否存在于一个地址库/街道名目录表中；-与OCR处理法确定的字符数目相比较，根据字符数目进行选择；-对候选者的字符与OCR处理法确定的字符进行位置上的比较。
如果发送信息中的数字部分通过键盘输入，则根据权利要求7和8，有利的是采用一个用于计数的OCR装置来搜寻这些数字，并借助其帮助确定地址、地址行的方向和名称段在地址行中的位置。
下面借助附图对本发明作进一步说明，附图中

图1是本发明配置的示意框图；图2是中文字符信件的编码过程的数据流程图。
图1示出的是实施本发明方法的信件分拣设备的示意框图。OCR信件分拣器10由输送装置11组成，该装置将信件从储存室12中一封接一封取出，并以大约每秒钟10封的速度送到高分辨率图像扫描器17进行信件图像的获取。接着信件被送到延迟传送带13上。信件通常在信封表面上有发送信息，特别是地址信息。OCR装置20对从图像扫描器17处获得的信件图像中的地址信息进行处理。若能完全处理，则启动条形码打印机14，在该信件上打上相应的条形码，并送至分拣盒16继续分拣。OCR装置20由一个或多个微处理器21以及相应的存储器22组成，存储器用于存储信件的图像。OCR装置还包括字典23，内含ZIP编码、城市名、街道名以及其它与地址有关的信息。在处理显示地址信息的图像时，优选以特征为目标减少从地址目录表中抽取的条目数，从而形成一个分字典。然后抽取的每一条目按概率排序，以便在处理时产生作为正确识别地址的一系列数据。此外，OCR装置还包含一个处理装置30以及数个视频编码台40，视频编码台40直接或通过局域网(LAN)31与处理装置30相连。优选将工作站用作视频编码台。如果OCR装置不能完全识别信件图像，这幅图像从OCR装置20传送到处理装置30，处理装置30控制一个TID条形码打印机15，并将该幅图像发送到任一台视频编码台40。TID条形码打印机15在该信件打上标识码TID，以便在以后使所处理的地址信息与信件本身连接在一起。在这种情况下，图像处理优选离线进行，当然在延迟时间足够长的情况下理论上也可以使用视频编码方式在线进行。在后一种情况下，TID信息也可以在一段时间后，也即在给定的时间内视频编码不能给出一个完全的处理结果时再打在信件上。
如图所示，每个视频编码台40都与一个用于键盘输入的键盘50和一个语音输入装置(由话筒60和语音识别模块70组成)连接在一起。
在处理装置30中，从语音识别模块70给出的候选者中进行挑选，从而完成本发明。
如图2所示，在识别中文字符的地址信息时，另增加一台离线的OCR装置100虽然不是必须的，但却是非常有利的。这台离线OCR装置会在识别结果不完全或不单义时再扫描一遍。若能给出单义的或完全的识别结果，则结果被接收110，编码过程也相应结束。若不能得到这样的结果，则相应的图像会送到带有键盘50、话筒60和语音识别模块70的视频编码台40。
操作员阅读地址，并对着话筒60说出街道名，同时利用键盘50输入门牌号码。随后在屏幕上显示一幅新的图像，显示出不单义或不完全的自动处理的地址结果，并开始一个新的编码过程。
根据图2，语音识别模块70给出三个候选者，分别由三个字符组成。在离线OCR装置100不能给出完全的处理结果时同样也确定三个字符，其中第一个字符的概率最高，第二个字符的概率稍低，而第三个字符是不确定的。然后处理装置30中语音识别模块70对候选者进行选择120。首先借助于处理装置30检查带有给定门牌号码301的三个候选者是否存在于街道名目录表中。若存在，则接着进行字符数目的比较。语音识别所给出的三个候选者应该与离线OCR装置100所给出的结果(3个键)相符合。
经这样的比较后，三个候选者继续保留在选择范围内，字符再从位置上按概率进行比较。
在最后的位置上，OCR装置不能确认单个字符，因此在此位置不能进行选择比较。
在第二位置，OCR装置100确定出概率较低的字符，候选者2和3也同样在第二个位置显示这个字符。此时还不能作出选择。通过对OCR装置100高概率给出的处于第一个位置上具有高概率的字符与候选者相应的字符进行比较，得出结果，只有候选者2含有在第一个位置上的这个字符，因此将这个候选者作为单义的答案。若不能单义地选择得到具有统计概率门限的候选者，则将此所寻找地址的图像打上一个特殊的编码130。此时用键盘输入的数字(此处是门牌号码301)可用于在OCR装置100输出的结果低于确定概率门限时重新实施OCR处理，在其中，利用所输入的数字，确定出地址行的位置和方向以及街道名区域。
显然，同样可以利用语音输入装置输入名称和数字，再对利用OCR结果确定的候选者进行筛选或选择。
权利要求
1.一种借助视频编码台识别信件发送信息的方法，在至少一个OCR装置，包括在一个名称目录表进行比较，不能单义地自动处理发送信息后，采集、数字化和存储含有发送信息信件表面的图像，并将其传递至视频编码台，接着借助由话筒和语音识别模块组成的话音输入装置至少输入在各个视频编码台的屏幕上显示的各发送信息中的名称，其中，从OCR自动处理的不完全和/或不单义的结果中选择语言识别的候选者。
2.根据权利要求1所述的方法，其中，用键盘输入所显示的发送信息中的数字部分。
3.根据权利要求1或2所述的方法，其中，在OCR处理法中以可能的精度确定字符的数目，并与语音识别候选者的相应字符的数目进行比较，并从OCR处理法确定的字符数目中挑选出其字符数目高于统计概率门限的候选者。
4.根据权利要求3所述的方法，其中，从OCR处理法的分段结果中确定字符数目。
5.根据权利要求1或2所述的方法，其中，将OCR处理法确定的并按概率输出的字符与语音识别候选者的字符进行位置上的比较，选择出超过概率门限的概率最大的候选者。
6.根据上述任一项权利要求所述的方法，其中确定街道名称时，首先，从街道名目录表中选择出带有所属门牌号码的街道名候选者；第二，与OCR处理法确定的字符数目进行比较，选择出字符数目相符的候选者；第三，与OCR处理法确定的字符进行位置上的比较，选择出符合条件的候选者。
7.根据上述任一项权利要求所述的方法，其中，借助一个计数-OCR装置，在地址表-ROI中尽力搜索用键盘输入的发送信息中的数字部分，然后借助所找到的数字，确定出所搜寻的地址行及其方向。
8.根据权利要求7所述的方法，其中，借助所述计数-OCR装置所找到的数字及其位置消息，确定地址行中的名称段。
9.一种识别信件发送信息的配置，包括-一个获取信件图像的装置(17)，-一个对显示发送信息的信件表面的图像进行自动处理的OCR装置(20、100)，并在一个目录表中进行比较，-一个对包含发送信息的信件表面的图像进行视频编码的装置，包括至少一个视频编码台(40)，它包括一个键盘(50)、一个显示器和一个由话筒(60)和语音识别模块(70)组成的语音输入装置，-一个处理装置(30)，它对视频编码装置的输入和输出装置和OCR装置(20、100)之间的数据流进行监控，其中在处理装置(30)中，从OCR装置(20、100)给出的不完全和/或不单义的结果中选择出语音识别模块(70)的相应候选者。
10.根据权利要求9所述的配置，其中，在处理装置(30)中，对OCR装置(20、100)确定的字符数目与语音识别模块(70)给出候选者的字符数目进行比较，从OCR装置(20、100)给出的字符数目中挑选出其字符数目超过统计门限值的候选者。
11.根据权利要求9所述的配置，其中，在处理装置(30)中，将OCR装置(20、100)确定的并按概率输出的字符与语音识别模块(70)输出相应的候选者的字符进行位置上的比较，选择出超过概率门限的概率最大的候选者。
全文摘要
本发明涉及借助视频编码台识别信件发送信息的方法和配置,在OCR装置(100)不能单义地自动处理发送信息后,经采集、数字化和存储的信件表面的图像被发送到视频编码台(40)。在此,通过语音输入装置(60、70)至少输入名称,然后从OCR不单义的自动处理结果中选择出语音识别的候选者(120)。这一点的有利实现方法是,在考虑概率因素的前提下,将各自确定的字符数目与OCR装置确定的字符数目相比较,或将候选者的字符与OCR装置确定的字符进行位置上的比较。
文档编号G06K9/00GK1268076SQ98808597
公开日2000年9月27日申请日期1998年9月21日优先权日1997年9月27日
发明者沃尔特·罗森鲍姆申请人:西门子公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：沃尔特.罗森鲍姆
技术所有人：西门子公司
我是此专利的发明人

上一篇：用移动设备的事务处理方法
上一篇：离散傅立叶变换(dft)及其反变换(idft)高效计算的方法与设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。