住址识别方法、住址识别装置及纸件类自动处理系统的制作方法

文档序号:6409277阅读:221来源:国知局
专利名称:住址识别方法、住址识别装置及纸件类自动处理系统的制作方法
技术领域
本发明系关于纸件类分拣机中的高速、高精度地读出纸件类上所记载住址的住址识别方法与住址识别装置,以及把其所读出的住址变换成条形码并在纸件上打印等处理的纸件类自动处理系统。
参照图17对过去的住址识别装置加以说明。在此住址识别装置中,首先在图像提取部121中输入纸件上所记的文字图形并将其变成图像信号,提取与图象信号中的住址相符的文字图形。然后在文字识别部122中,对图象提取部121中所提取的文字图形进行文字选出处理,再在文字识别部122中,把字库123中预存的文字与选出文字逐个地对照比较而进行文字识别。
然后,在单词识别部124中对文字识别部122所识别的文字列,从收藏着预存单词的单词库125中读出单词,将其读出的单词与识别的文字列进行对照比较而进行单词辩认,再由住址识别部126,把从预存有住址的住址库127中读出的住址与单词辨认部124所认出的单词比校对照而进行住址识别。
有关把作为读出对象的地址名称预先登记在住址库中、把从纸件上的文字列的读出结果与从住址库中读出的地址名称对照比较而辨认地址的方法,已在例如特开平2-181287号公报与USPS所用的自动地址读出分拣机中(NEC技报,通卷187号、Vol.38,N04,P41加有街名标志的场合下,根据文字识别结果与检得的市区名用预先登记有与对应于加有街名标志的市区名的街名以及对应于其街名的街名码的第3表对输入文字列中所记载的街名以及对应于该街名的街名码进行检索,并根据检得的市区名与街名而检出住所表示号码。
第5发明(权利要求5所述的发明)与第10发明(权利要求10所述的发明)是在第4与第9发明中,依照各地域所处理的纸件的多少来预先指定附加街名标志的特定地域的。
第11发明(权利要求11所述的发明)是用第1发明的住址识别方法从表示输送纸件上所记载的住址的输入文字列来识别住址,把此识别的住址变换成条形码并打印在上述纸件上,再根据所打印的条形码对打有条形码的纸件进行处理。
图1是本发明第1实施例结构方框图,图2表示在纸件上所记载住址的一例视图,图3表示文字库的一例视图,图4是说明第1实施例动作的流程图,图5表示输入文字列与文字位置P(i)的关系,字库号D(j)与字库、类目、字种之间关系、以及从r(i)中所存的比较结果的类目、文字辨认部输出的文字识别结果的视图,图6表示字种与类目的关系,从f(1)~f(m)中所收藏的最终结果的类目、字种判定部输出的字种判定结果的视图,图7是本发明第2实施例结构的方框图,图8表示街名文字数表的一例视图,图9表示市区名表的一例视图,
图10是说明本发明第2实施例动作的流程图,图11是本发明第3实施例的结构方框图,图12表示市区名表的一例视图,图13是表示街名表的一例视图,图14是说明第3实施例动作的流程图,图15是举例表示进行把所识别的住址变成条形码并打印在纸件上这样处理的邮件自动处理系统的概要图,图16是中国与韩国邮件的示例图,图17是过去的住址识别装置结构方框图。
下面,详细说明本发明的实施例。
纸件上所记载的住址,例如在日本,是由对应于市区名的邮政编码、都道府县市区街名与住址表示号码等组成的,一般地都道府县市区街名大致是汉字,地址表示号码则表示为数字与标记符号。在下面说明的实施例中,是把与街名对应的数字等组成的编码(下称街名码)附加在住址的开头。下面,把含有这种街名码、都道府县市区街名与住所表示号的称为住址。
此外,住址的一例示于图2中。图中,1A为街名码,1B为市区名/街名,1C是住所表示号码。在此地址例中,街名码1A的前3位数即“183”相当于现在给定的邮政编码,在此情况下是表示“府中市”,而街名码1A的后3位即“123”为街名,是对应于“日新町”的。
实施例1下面,参照附图来说明本发明的第1实施例。
在此实施例中,对相当于住址的输入文字列逐字地进行文字识别,并依据识别的结果判定字种(汉字、数字、符号等)。然后从输入文字列的开头依次地检测字种,首先把数字或符号的连续部分看做街名码,再检出字种从汉字转换为数字或符号的位置,把其以后的部分看做住所表示号。结合此街名码与住所表示号来识别住址。
图1是实施例1的结构方框图,图象提取部101把纸件上的文字或符号等变为电气图象信号。
地址位置检出部102检出在图象提取部101中变成的图象信号的文字列的长度、方向与列的数等信息,根据所检出的信息而检出与纸件上所载住址相符的文字列。作为这种住址位置检出技术,可以考虑采用例如本申请人的特公昭59-39065号公报中所公开的技术。
在特公昭59-39065号公报中,以一定的宽度范围扫描匀速输送邮件的记有收件人姓名地址的一侧,把由此而得的文字列进行每隔一定期间进行压缩并检出由此而得的经一定期间压缩的文字列的起始与终点位置,再对由此而得到的压缩文字列组合的邮件上的收件人姓名地址组及它的行、位置、文字大小及行的斜度等进行判别。
文字选出部103是对作为住址而检出的文字列进行逐一地选出处理。作为这种文字选出技术可以考虑采用例如本申请人的特公昭63-57831号公报中所公开的技术。
特公昭63-57831公报中,在把输入操作信号沿与扫描线方向垂直的方向进行压缩并更新的同时,依次存贮压缩的扫描信号中每个文字模块的压缩幅度,并将压缩的扫描信号与输入扫描信号进行比较,对于压缩的连续文字模块所对应的输入扫描信号中不表示文字的部分场合所作的文字选出动作进行检测,并读出以文字选出的同步状态所存贮的压缩幅度。
文字识别部104把选出的文字与预先记入的文字库105进行比较,以辨认所选出的文字。在文字库105中事先记入了约3000个汉字、数字与符号等,文字识别部104中的文字识别结果是以例如JIS码形态输出的,即,对于选出的文字为“1”与“府”的情况下,文字识别部105中的文字识别结果分别以JIS码的“2331”与“495C”输出,作为这种文字识别技术,可以采用本申请人提出的特开平1-94490号与特开平2-137080号公报中所公开的技术。
在特开平1-94490号公报中,把识别用字库中同一类目的标准图形模块化,在该类目內使中途停止对照的设定值逐次变小地予以更新,而且在其不一致为0时中止该类目的对照,然后把对于1个类目的1个最小不一致数作为结果来输出。
在特开平2-137080号公报中,从特征图形存贮部中读取特征图形信号,从参考图形存贮部中读取各读出对象字种的每个参考图形,在求特征图形各部分领域与参考图形上对应部分领域之间的不同度时,把附加了记述特征图形各部分领域特征的各方向的特征系列与对于各特征系列相邻部分领域上的邻接的特征系列的一部而得到的系列以附加多个的方式形成多种类的特征系列,在各方向上,在原特征系列与所形成的多种类特征系列的每一个和与原特征系列对应的参考图形的特征系列之间进行非线性耦合,由于各方向的非线性耦合的评定值是把其最小值的总合定为部分领域之间的不同度,由此就确定出文字图形与各字种参考图形之间的不同度,根据此不同度进行分类,并把所分出的结果加以输出。
字种判定部106是依据从文字识别部104输出的住址所用的文字的辨认结果来判定字种(汉字、数字、符号等),即,当文字识别部104中的文字识别结果以JIS码输出时,其JIS码若是2300号位(编码的前3位是233)则判定该文字是“0”~“9”的阿拉伯数字,若JIS码在3000号位以上(编码的第1位在3以上)则判定该文字是汉字。对于标记符等符号也同样地进行判定,图3表示字种判字结果的一例。
地址识别部107则首先按照字种判定部106中的判定结果对与住址对应的输入文字列从其开头部分依次地检测其字种,并把数字或符号的连续部分视做街名码而予以暂时存贮。再检出输入文字列的字种从汉字到数字的转换点,即检出住所表示号的开始位置,并把此开始位置以后的数字与符号视为住所表示号,然后,结合暂时存贮的街名码与住所表示号来识别住所。
下面,再对这种住址识别装置作具体的说明。
在纸件上,例如,像图2所示的相当于住址的文字列记载为“183-123府中市日新町1-10”,此文字列是由住址开头所记载的街名码1A,都道府县市区街名1B及住所表示号1C组成的。
首先,图象提取部101把该纸件上的文字与符号等转换为图象电信号(图4所示的步骤401)。此提取出的图象信号被输给住址位置检出部102,住址位置检出部102检出住址位置(步骤402),并提取与住址相当的文字列,即“183-123府中市日新町1-10”的图象信号。
然后,把住址位置检出部102中所提取的输入文字列在文字选出部103中逐个地进行文字选出(步骤403),再在文字识别部104把该选出的文字分别与文字库105中的內容加以对照,即,文字识别部104是在使文字位置返回初始值(i=1步骤404)的同时,字库号返回初始值(j=1步骤405),并将文字位置P(i)的文字与字库号No.D(j)的文字进行对照比较(步骤406)。图5(a)示出了输入文字列与文字位置P(i)的关系,图5(b)中表示字库号No.D(j)与字库、类目(JIS码)、字种之间的关系。
文字识别部104在文字位置P(i)的文字与字库No.D(j)的文字不一致时,使j=j+1(步骤408)后,返回步骤406。若文字位置P(i)的文字与字库No.D(j)的文字一致时,则进入步骤409。在409中,存贮r(i)的对照结果的类目(JIS码)(参见图5c),检查是否i=n?(步骤410),若i≠n,使i=i+1(步骤411),并返回步骤405。步骤410中,若i=n,把对照结果r(1)~r(n)从文字识别部104输出至字种判定部106,即,以对照结果r(1)~r(n)作为文字识别结果,用图5(d)中所示的JIS码输出。
字种判定部106中,接受来自识别部104的对照结果r(1)~r(n),并把对照结果的存贮位置返回初始值(i=1步骤412),然后根据对照结果r(i)的类目对字种进行判定(步骤413),并将其判定字种存入k(i)中(步骤414)。图6(a)中示出了字种与类目(JIS码)之间的关系,即,若“2330”≤r(i)≤“2339”时,判定为数字,若r(i)=“213D”判定为符号,r(i)≥3000判字为汉字,并把判定结果存入k(i)中。然后,检查是否i=n?(步骤415),若i≠n,使i=i+1(步骤416)后,返回步骤413。在步骤415中若i=n,则把判定结果k(1)~k(n)从字种判定部106传给地址识别部107,即把判定结果k(1)~k(n)作为字种判定结果,如图6(c)所示的加以输出。
地址识别部107是从字种判定部106接收判定结果k(1)~k(n),使对照结果与判定结果的存入位置返回初始值(i=1,步骤417),使最后结果的存入位置回返至初始值(j=1,步骤418)。然后,检测判定结果k(i)(步骤419),若为数字或符号,把对照结果r(i)的类目存入最后结果f(j)中(步骤420),使j=j+1(步骤421),进入步骤422中。在步骤419中,若其判定结果k(i)为汉字,则直接进入步骤422。在步骤422中,检查是否i=n,若i≠n,使i=i+1(步骤423),并返回步骤419。在步骤422中,若i=n,则把在步骤420中所得到的最后结果f(1)~f(m)认定为住址(参见图6(b))。
即,住址识别部107是把对应于住址的输入文字列从头依次地对字种进行检测,首先,把数字或符号的连续部分“183-123”看做街名,并予暂时存贮。再检出输入文字列中的字种从汉字变为数字的变换点,即检出住所表示号的开始位置,并把开始位置以后的数字与符号“1-10”看做住所表示号。然后,将暂存的街名码“183-123”与住所表示号“1-10”结合起来识别住址。
实施例2下面,参照附图来说明本发明的第2实施例。
在此实施例中,对相当于住址的输入文字列逐字地进行文字识别,首先通过识别输入文字列中的市区名来检出市区名与街名之边界,再从文字识别结果检出街名码,并检出与此街名码对应的文字数,然后,根据市区名与街名的边界位置和街名的文字数来检出住所表示号的开始记载位置,并把此开始位置以后的输入文字列作为住所表示号检出。把此住所表示号与街名码相结合就是住址识别结果。
图7是表示实施例2结构的方框图,图象提取部101、地址位置检出部102、文字选出部103、文字识别部104及字库105的结构均与上述实施例1相同,故对重复部分的说明省略了。在本实施例中,是把文字识别部104中的文字识别结果输给街名文字数检索部201、市区名检索部203与地址识别部205。
街名文字数检索部201是对作为文字识别部104中的文字识别结果的地址相对应的输入文字列从开头部分依次地进行检查,检出街名码,并予以暂时存贮。然后用图8中所示的预登记的有街名码及与此街名码对应的街名文字数的街名文字数表202对与此街名码相对应的街名文字数进行检索。
市区名检索部203是把文字识别部104中的文字识别结果与预登记有市区名的市区名表204的內容进行比较而进行市区名检索,这样检索出市区名,并检出输入文字列中的市区名与其后所记载的街名之间的边界位置。在此,市区名表204,如图9中所示,登记的是日本全国的市区名及与其对应的文字的JIS码。而且,此市区名表204的容量,从现状来看限定在约3000市区名的程度,与登记有街名的表容量相比是非常小的。
地址识别部205是根据与街名文字数检索部201所检索的街名码对应的街名文字数与市区名检索部202所检出的市区名和街名的边界位置来检出住所表示号。于是就把此住所表示号和在街名文字数检索部201中暂存的街名码相结合地来作为住址的识别结果。
下面,具体地说明这种地址识别装置。
在这种实施方式中,纸件上记载着如图2所示的相当于住址的文字列“183-123府中市日新町1-10”。
首先,图象提取部101把纸件上的文字与符号等变成电气图象信号(图4所示的步骤401)。把所提取的图象信号输送给住址位置检出部102。住址位置检出部102检出住址位置(步骤402)、提取与住址相符的文字列、即,“183-123府中市日新町1-10”的图象信号。
然后,将在住址位置检出部102中所提取的输入文字列在文字选出部103中逐字进行选择(步骤403)。再把选出的文字在文字识别部104中每一个均与字库105的內容进行对照。再后的处理与实施例1中的说明相同(步骤404~411)、文字识别部104把对照结果r(1)~r(n)作为文字识别结果以图5(d)所示的JIS码输出。
街名文字数检索部201从文字识别部104得到对照结果r(1)~r(n)、从开头部分依次地对此对照结果r(1)~r(n)进行检查,提取与街名码相符的类目(图10中步骤501),即,对作为文字识别部104中的文字识别结果的住址相对应的输入文字列从开头部分起进行检查,检出街名码“183-123”并予以暂存。然后,在图8所示的街名文字数表202中检索与此街名码“183-123”对应的街名“日新町”的文字数“3”,并将其存入CNO中(CNO=“3”,步骤502)。
与街名文字数检索部201中的处理同时,市区名检索部203把文字识别部104中的文字识别结果与预登记有市区名的市区名表204的內容进行比较,而检索市区名“府中市”。这样,在检索出其市区名“府中市”时,检出记有都道府县市区街名部分的输入文字列“府中市日新町”中市区名“府中市”与街名“日新町”的边界位置。
即,市区名检索部203把市区名的开头位置设定为i=8(步骤503)。然后使市区名表位置回返初始值(j=1,步骤504),并把市区名表204的C(j)的文字码与r(8)以后的结果进行比较(步骤505)。如果市区名表204的C(j)的文字码与r(8)以后的结果不一致,在步骤506中为NO则进入步骤507,并使j=j+1,返回步骤505。若市区名表204的C(j)的文字码与r(8)以后的结果一致,则与步骤506中的YES对应,进入步骤508。在步骤508中,把市区名与街名的边界,即街名的开头位置存入CST中。在此场合下,由于所得到的市区名是“府中市”,故CST=“11”。
住址识别部205是根据与街名检索部201中检出的街名码对应的街名文字数“3”(CNO=“3”)及在市区名检索部203中检出的市区名“府中市”和街名“日新町”的边界位置(CST=“11”)来算出住所表示号的开始位置JST(JST=CNO+CST,步骤509),并把在此住所表示号开始位置JST以后的记载文字“1-10”看做是住所表示号。然后,将此住所表示号“1-10”与暂存在街名文字数检索部201的街名码“183-123”结合起来作为住址识别结果“183-123 1-10”。
即,住址识别部205把与街名码相符的对照结果r(1)~r(7)存入最后结果f(1)~f(7)中(步骤510),并把相当于住所表示号的对照结果r(JST)以后的信息存入最后结果f(8)以后中(步骤511),由此而得到与图6(b)中所示的相同的最后结果f(1)~f(m)。
实施例3下面,参照


本发明的第3实施例。
本实施例是在例如所处理的大量纸件中有很多预先指定的特定地域,即使该指定的特定地域中的街名码并未记载在相当于住址的输入文字列中时,也能识别住址的装置。即,准备好有关此特定地域的登记有街名及与其街名相对应的街名码的字库,由输入文字列中所记载的街名推断出街名码。
图11是表示实施例3结构的方框图,图象提取部101、地址位置检出部102、文字选出部103、文字识别部104及字库105都与上述实施例1中相同,故省略重复部分的说明。在此实施例中,把文字识别部104中的文字识别结果传输到市区名检索部301、街名检索部303、街名文字数检索部305及住址识别部306中。
市区名检索部301将文字识别部104中的文字识别结果与预登记有市区名的市区名表302的內容进行比较而对市区名进行检索。并在检索市区名时检出记载有都道府县市区街名部分的输入文字列中的市区名与街名之间的边界,把其检出的结果输出到街名检索部303与住址识别部306中。
在市区名表302中,如图12所示,在所登记的市区名中与预先指定的特定地域相符的市区名上记载街名标志为“有”,而不相符的市区名上则记载街名标志“无”。在与由市区名检索部301所检索的市区名相对应的街名标志为“有”的场合,把街名标志“有”输给街名检索部303。而在检索出的市区名的街名标志为“无”时,把街名标志“无”传给街名文字数检索部305。在此,尽可能把街名标志为“有”的市区名指定为例如被处理的纸件与其它地域相比多很多的地域。
街名检索部303是在接收到来自市区名检索部301的街名标志“有”的输出时,根据从市区名检索部301输出的市区名与街名之间的边界位置及从文字识别部104输出的文字识别结果,将市区名以后的文字列的文字识别结果与登记有预定的特定地域街名的街名表进行比较对照,检索街名。在此街名表上,如图13所示,登记有街名及与该街名对应的街名码。街名检索部303输出其所检到的街名及街名对应的街名码。进而,此街名表上所登记的街名,只限于预先指定的特定地域內的街名,所以与登记有日本全国街名的情况相比,其所使用的容量很小。
街名文字数检索部305,是在接收来自市区名检索部301的街名标志“无”的输出的场合下,对于与作为文字识别部104中的文字识别结果的住址相对应的输入文字列从开头起依次进行检查,检出街名码并暂时存贮。然后,用图8中所示的预登记有街名码与对应该街名码的街名文字数的街名文字数表202对与上述码对应的街名文字数进行检索。
地址识别部306,是在检索到市区名检索部301中的街名标志“有”的情况下,根据从文字识别部104所输出的输入文字列的文字识别结果、从市区名检索部301所输出的市区名与街名间的边界位置及从街名检索部303所输出的街名来检出住所表示号,并将此住所表示号与街名检索部303的街名码结合在一起来识别住址。
当检索到市区名检索部301中的街名标志“无”时,根据从文字识别部104输出的输入文字列的文字识别结果,从市区名检索部301输出的市区名与街名间的边界位置及从街名文字数检索部305输出的街名文字数来检出住所表示号的起始位置,并检出该起始位置以后的文字来作为住所表示号。然后,将此住所表示号与街名文字数检索部305中暂存的街名码相结合的来识别住址。
下面,再对这种住址识别装置加以具体地说明。
在此实施例中,纸件上记载着如图2所示的相当于住址的文字列“183-123府中市日新町1-10”。
首先,图象提取部101把该纸件上的文字与符号等变成电气图象信号(图4中步骤401)。把所提取的图象信号传给住址位置检出部102。住址位置检出部102检出住址位置(步骤402)、提取相当于住址的输入文字列,即,“183-123府中市日新町1-10”的图象信号。
然后,把住址位置检出部102中提取的输入文字列在文字选出部103中逐字选出(步骤403)。再分别把所选出的文字在文字识别部104中与字库105的內容相对照,之后,进行与在实施例1中所说明的同样的处理(步骤404~411),文字识别部104把对照结果r(1)~r(n)作为文字识别结果,以如图5(d)中所示的JIS码进行输出。
市区名检索部301是将文字识别部104中的文字识别结果与预登记有市区名的市区名表302的內容进行比较,检索出市区名“府中市”,然后,在检索出市区名的条件下检出记载都道府县区街名部分的输入文字列中市区名“府中市”与街名“日新町”的边界位置,并把此输出结果输给街名检索部303与住址识别部306。此外由于检出的市区名“府中市”,是与如图12中所示的预先指定的特定地域相符的,故检出街名标志为“有”,由此把街名标志“有”输出给街名检索部303。此时,由于市区名检索部301未把街名标志“无”传给街名文字数检索部305,故它不动作。
街名检索部303接受来自市区名检索部301的街名标志“有”的输出,根据从市区名检索部301所输出的市区名“府中市”与街名“日新町”间的边界位置及从文字识别部104输出的文字识别结果,用街名表304来检索街名“日新町”,把检出的街名及与街名所对应的街名码输给住址识别部306。
住址识别部306是根据从文字识别部104输出的输入文字列的文字识别结果、从市区名检索部301输出的市区名“府中市”与街名“日新町”间的边界位置及从街名检索部303所输出的街名来检出住所表示号“1-10”,把此住所表示号“1-10”与从街名检索部303输出的街名码“183-123”结合在一起作为住址“183-123 1-10”来加以识别。
即,市区名检索部301接收来自文字识别部104的对照结果r(1)~r(n),并使市区名表位置返回初始值(j=1,图10中步骤504)。然后,将市区名表C(j)的文字码与r(8)以后的结果进行比较(步骤505),若是一致,则把此时的j存入CFL中(CFL=j,图14中步骤601),再检测街名标志g(CFL)的有、无(步骤602)、街名标志g(CFL)若为无,与步骤603中的NO相对应,把街名标志“无”送入街名文字数检索部305。由此,图10中步骤508以后的处理是借助于街名文字数检索部305及住址识别部306来实现的。若街名标志g(CFL)为有,则与步骤603中的YES对应,除了把街名的开头位置存入CST中(步骤604)之外,还把该街名的开头位置CST及街名标志“有”送入街名检索部303。
街名检索部303接收来自市区名检索部301的街名标志“有”,把街名表位置返回初始值(j=1,步骤605),并把街名表t(j)的文字码与r(CST)以后的结果进行对照(步骤606)。若街名表t(j)的文字码与r(CST)以后的结果不一致,则在步骤607中对应于NO,进入步骤608,使j=j+1,并返回步骤606。若街名表t(j)的文字码与r(CST)以后的结果一致,则与步骤607中的YES对应,进入步骤609。在步骤609中,把与r(CST)以后的结果一致的街名表t(j)表示的街名与街名码向住址识别部306输出。此时,把街名码的各文字的类目从头开始存入r′(1)~r′(7)中,并以其作为对照结果r′(1)~r′(7)输给住址识别部306。
住址识别部306中求出来自市区名检索部301的市区名与街名的边界位置、即街名的开头位置CST,以及来自街名检索部303的街名的住所表示号的开头位置JST(步骤610)。再把来自街名检索部303的对照结果r′(1)~r′(7)存入最后结果f(1)~f(7)中(步骤611)。把住所表示号的开头位置JST以后的对照结果r(JST)看做住所表示号,并把与此住所表示号相当的对照结果r(JST)以后信号作为最后结果f(8)以后来存贮,借此而得到如图6(b)中所示的相同的最后结果f(1)~f(m)。
邮件自动处理系统在上述各种实施方式中,把作为住址而识别出的“183-123 1-10”,变成例如条形码等,若把此条形码打印在纸件上,就能极大地提高邮件自动处理系统的处理效率,这种情况下的邮件自动处理系统的概要示于图15中。图中,2-1是纸件供给部、2-2是光学文字识别部、2-3是条形码打印部、2-4(2-41~2-4n)为收集部、2-5是门控制器、2-6是输送道、2-7(2-71~2-7n)为闸门。另外,3-1为纸件供给部、3-2为条形码读出部、3-3(3-31~3-3n)是收集部、3-4是门控制器、3-5为输送道、3-6(3-61~3-6n)是闸门。
在这种邮件自动处理系统中,把纸件从纸件供给部2-1供至输送道2-6。当纸件4到达光学文字识别部2-2时,光学文字识别部2-2检出纸件上记载的相当于住址的文字列,用本发明的方式对地址进行识别,即若在纸件4上记载着“183-123府中市日新町1-10”,则把“183-123 1-10”作为住址来识别。然后,光学文字识别部2-2把此识别了的住址“183-123 1-10”送入条形码打印部2-3中。条形码打印部2-3把来自光学文字识别部2-2的住址“183-123 1-10”变换成条形码,并在经光学文字识别部2-2送来的纸件4的既定部位上打印该条形码。
这种印有条形码的纸件4被送到收集部2-4。在那里,由光学文字识别部2-2识别的纸件4的住址“183-123 1-10”还送到门控制器2-5,门控制器2-5根据所送来住址“183-123 1-10”控制闸门2-71~2-7n的开闭。借此纸件4被收集在与由光学识别部2-2所识别的住址“183-123 1-10”相对应的收集部2-4中。
从纸件供给部3-1来的纸件4,即用上述方法印上条形码的纸件4供至输送道3-5中。当纸件4到达条形码读出部3-2时,条形码读出部3-2读出纸件4上所印的条形码。然后把读出的条形码內容送入门控制器3-4中。门控制器3-4按送来条形码的內容控制闸门3-61~3-6n的开闭。借此而把纸件4收集在与条形码读出部3-2读出的条形码所表示的住址相对应的收集部3-3中。
虽然在上述各种实施方式中是以日本国內为对象的、住址形式是汉字、符号及数字的组合而加以说明的,但对于中国或韩国等的纸件也可以使用同样的方法。图16(a)是表示中国邮件的例子,图16(b)是韩国邮件的例子。中国的邮件也和日本一样,其相当于都道府县市区街名的部分是用汉字记载的,而住所表示号是用数字代表的。在韩国的邮件中,相当于都道府县市区街名的部分是用高丽文记载的,住所表示号是用数字及标记等符号表示的。
从以上的说明可以明了,在本发明的第1与第6发明中,由于把街名码与住所表示号结合起来作为地址来加以辨认,使之与由预定数字组成的街名码相对应,无需登记庞大数量的街名就能高速、高精度地读出地址。
而第2与第7发明是在第1与第6发明中,把输入文字列从开头部分依次对字种进行检索而检出街名码与住所表示号的,除了有第1与第6发明的效果外,还能收到使街名码与住所表示号的检出更加可靠的效果。
第3与第8发明是在第1与第6发明中,用第1表对与街名码相对应的街名文字数进行检索,用第2表对组成输入文字列的市区名进行检索,并根据所检索的街名的文字数与市区名检出住所表示号的,除了具有第1与第6发明的效果外,还可有以使街名码与住所表示号的检出更加可靠的效果。
第4与第9发明是在第3与第8发明中,在第2表上所登记的市区名中的预先指定的特定地域市区名上附加街名标志,在检到的市区名上附加有街名标志的情况下,根据文字识别结果与检索的市区名用第3表检索出输入文字列中所载的街名及与该名对应的街名码,并根据所检出的市区名与街名而检出住所表示号的,除了有第3与第8发明的效果以外,还会有即便在未记载街名码的情况下也能可靠地识别住址的效果。
第5与第10发明是在第4与第9发明中,根据每个地域所处理纸件的多少来预先指定附加有街名码的特定地域的,除了有第4与第9发明的效果外,还可以用少的登记街名而得到大的效果。
第11发明是用第1发明的住址识别方法,由送来纸件上所记载的表示住址的输入文字列来识别地址,把识别的地址变换成条形码并打印在上述纸件上,按照其所印的条形码而对印有这种条形码的纸件进行处理的,除有第1发明的效果外,还可以收到按照条形码、即识别的住址而自动地把纸件分类、收集的效果。
权利要求
1.一种住址识别方法,其特征在于,对表示住址的含有与纸件上所记载的街名等对应的街名码、地域名及住所表示号的输入文字列进行图象提取,对此图象提取的输入文字列进行逐字地选出,并分别将该文字与预先登记了文字信息的字库內容进行对照比较而进行文字识别,根据此文字识别的结果检出上述街名码及上述住所表示号,把所检出的街名码及住所表示号组合在一起作为住址加以识别。
2.如权利要求1所述的方法,其特征在于,根据上述文字识别结果判定上述输入文字列中各文字的字种,对上述输入文字列从其开头部分依次地进行字种检测以检出街名码及住所表示号。
3.如权利要求1中所述的方法,其特征在于,设置预先登记有与街名码相对应的街名文字数的第1表及预先登记有市区名的第2表,根据上述文字识别结果检出街名码,用上述第1表来检索与该街名码对应的街名文字数,根据上述文字识别结果用上述第2表来检索构成上述输入文字列的市区名,再根据由此检索出的街名文字数及市区名对住所表示号进行检索。
4.如权利要求3所述的住址识别方法,其特征在于在上述第2表中所载市区名中预先指定的特定地域的市区名上附加街名标志,对于检出的市区名附加有街名标志的场合,根据上述文字识别结果及检出的市区名,用预先登记有与附加街名标志的市区名对应的街名及与该街名所对应的街名码的第3表来检索对应于输入文字列中记载的街名及与该街名所对应的街名码、再根据检出的市区名及街名来检出住所表示号。
5.如权利要求4所述的住址识别方法,其特征在于,根据每个地域所处理纸件的多少预先指定附加街名标志的特定地域。
6.一种住址识别装置,其特征在于,它设有把表示住址的、含有对应于纸件上记载的街名等的街名码、地域名及住所表示号的输入文字列进行图象提取的图象提取部件,把由该图象提取部件所图象提取的输入文字列逐字地选出,并分别把该文字与预先登记有文字信息的字库內容对照比较并进行文字识别的文字识别部件,根据在文字识别部件中对输入文字列的文字识别结果对上述街名码及上述住所表示号进行检出的检出部件,把在该检出部件中检出的街名码及住所表示号组合在一起作为地址来进行识别的识别部件。
7.如权利要求6所述的地址识别装置,其特征在于,上述检出部件设有根据上述文字识别部件的文字识别结果对上述输入文字列中各字的字种进行判断的字种判定部件,通过对上述输入文字列从开头部分起依次地进行字种检测而检出街名码及住所表示号。
8.如权利要求6所述的住址识别装置,其特征在于,上述检出部件设有预先登记有与街名码相对应的街名文字数的第1表与预先登记有市区名的第2表,根据上述文字识别部件的文字识别结果检出街名码,用上述第1表对与该街名码相对应的街名文字数进行检索的街名文字数检索部件,以及根据上述文字识别部件的文字识别结果用上述第2表对构成上述输入文字列的市区名进行检索的市区名检索部件;根据上述街名文字数检索部件中检出的文字数与在上述市区名检索部件中检出的市区名来检出住所表示号。
9.如权利要求8所述的地址识别装置,其特征在于在上述第2表中所登记的市区名中预先指定的特定地域的市区名上附加街名标志,在上述市区名检索部件所检索的市区名上附有街名标志的场合,根据上述文字识别部件的文字识别结果及上述市区名检索部件检索的市区名,利用预登记有与附加上述街名标志的市区名相对应的街名、及与该街名相对应的街名码的第3表,对上述输入文字列中记载的街名及对应于该街名的街名码进行检索的街名检索部件,根据在上述市区名检索部件中所检索的市区名及在上述街名检索部件中检索的街名而检出住所表示号。
10.如权利要求9所述的住址识别装置,其特征在于根据每个地域处理纸件的多少来预先指定附加上述街名标志的特定地域。
11.一种纸件类自动处理系统,其特征在于,它设有用权利要求1中所述的住址识别方法从输送的纸件上所载的、表示住址的输入文字列来识别住址的住址识别装置,把由该住址识别装置识别的住址变成条形码并打印在上述纸件上的条形码印字装置,以及对用该条形码印字装置印有条形码的纸件按照所印的条形码进行处理的处理装置。~47,用于USPS自动地址读出分拣机(1985))公开了。至于设置有对纸件上所载文字进行扫描、把扫描图形作为单词单位而进行提取的单词提取装置,和存有表示住址的预先设定地址库图形的存贮装置,以及把由单词提取装置所提取的单词按纸件上记载顺序进行排列并与地址库图形进行比较的比较装置,借助于选出与在该比较装置中的比较结果最接近的组合而识别地址的方法,已在例如特公昭62-62388号公报中公开了。然而,在这种过去的住址识别装置中,必须把作为读出对象的全部地名都记录在地址库中。例如,对于日本,都道府县市区名约3000个,若再包含街名约有120000个,若要记录这么多地名则地址库存贮内容就相当庞大了。因为,存在着使装置规模变大的问题。此外,还由于要进行对照比较的件数太多,有处理速度非常慢的问题。为了解决这样的问题,本发明的目的是提供一种不登记庞大数量的街名而能高速、高精度地读出住址的住址识别方法与住址识别装置。还提供一种能进行把所读出的地址变成条形码,并打印处理在纸件上的纸件类自动处理系统。为了实现此目的,第1发明(权利要求1所述的发明)与第6发明(权利要求6所述的发明)是对纸件上所载的街名所对应的街名编码,表示含有地域名(都道府县市区街名)及住所表示号码的住址的输入文字列进行图像提取,对图象提取出的文字逐字选出并把各个文字与记录有文字信息的字库內容进行对照比较以预先对该文字进行识别,根据该文字识别的结果检出街名编码与住所表示号码,结合此检出的街名编码与住所表示号码来进行地址识别。第2发明(权利要求2所述的发明)与第7发明(权利要求7所述的发明)是在第1发明与第6发明中,根据文字识别的结果而判定输入文字列中各字的字种,并把输入的文字列从起始部分依次进行字种检测而检出街名编码与住所表示号的。例如在第2与第7发明中,依据文字识别的结果来判定输入文字列中各文字的字种(汉字、数字、符号等的不同),从起始部分开始对输入的文字列依次进行字种检测,把最初的数字或符号的连续部分视做街名码,再依据字种的变化,例如输入文字列从汉字变为数字或符号的变化而把其数字或符号作为住所表示号检出。第3发明(权利要求3所述的发明)与第8发明(权利要求8所述的发明)是在第1与第6发明中设置预先登记与街名编码对应的街名文字数的第1表与预先登记有市区名的第2表,按照文字识别结果检出街名码,并用第1表对对应于街名码的街名文字数进行检索,按照文字识别的结果用第2表对构成输入文字列的市区名进行检索,由此检索出的街名的文字数与市区名来检出住所表示号码。例如,在第3与第8发明中,按照文字识别的结果而把数字或符号连续部分看做是街名码,用第1表对与该街名码对应的街名文字数进行检索,再根据文字识别结果,把构成输入文字列的市区名在第2表中进行检索,然后,按照从第1表中检出的街名文字数与从第2表中检得的市区名来检出住所表示号的开始位置,并把从此开始位置以后的文字列作为住所表示号码。第4发明(权利要求4所述的发明)与第9发明(权利要求9所述的发明)是在第3与第8发明中在登记到第2表中的市区名內所预先指定的特定地域中的市区名上附加街名标志,在检索到的市区名上附
全文摘要
一种地址识别方法与装置,它无需登记庞大数量的街名而能高速、高精度地识别地址。它有对图象提取出的输入文字列逐字地选出并把各字与预先登记有文字信息的字库105的内容对照而进行文字识别的文字识别部104;根据文字识别部104中的文字识别结果而对输入文字列中各字的字种进行判定的字种判定部106;将输入文字列从头依次地检测其字种、检出街名码及住址表示号,并将检出的街名码及住址表示号合并作为住址加以识别的住址识别部107。
文档编号G06K9/00GK1148221SQ9511634
公开日1997年4月23日 申请日期1995年8月8日 优先权日1994年8月8日
发明者西康雄, 板本康治, 山内俊史, 金子一郎 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1