用于建立地址数据库的设备及其方法

文档序号:6468793阅读:203来源:国知局
专利名称:用于建立地址数据库的设备及其方法
技术领域
本发明涉及一种用于建立地址数据库的设备及其方法。
更具体地,本发明涉及一种用于从其中分别写入地址的邮件中提取地址
并使用所提取的地址建立地址数据库的设备、及其方法。
本发明受到MIC/IITA的IT R&D规划[2006-X-001-02, Development of Element Technology for Real-time Postal Distribution (用于实时邮政分发的基 本技术的开发)]支持。
背景技术
地址信息可以与许多不同的对象一起使用,并且对自动分类邮件的性能 具有很大影响。因此,建立准确的地址数据库是提高邮件服务效率的必要条 件之一。
结果,存在如下的需要收集全国的(countrywide)地址信息、使用所 述地址信息建立地址数据库、并然后连续管理和充分利用所述数据库。
而且,需要动员人力资源和连续付出努力,并且难以很好地建立地址数 据库。为了这些原因,最近在韩国已经实现了建立邮件地址数据库的尝试。
在相关技术中,邮件地址数据库通过以下方法建立其中由邮政服务雇 员收集地址,并排列和输入地址。然而,因为在收集邮件地址时遗漏一些邮 件地址、并且操作者在输入地址时可能犯错误,所以存在降低了地址数据库 可靠性和质量的问题。
为了解决所述问题,可能通过利用自动分类器来连续检查并补充地址数 据库而改善它的质量。然而,这由于建立地址数据库的初始处理中的反复试 验而导致巨大花费。
6而且,即使地址数据库最初是完美的,但由于重复地进行邮件地址的创 建和废弃,所以地址数据库的完美性在一段时间之后也降低。相应地,为了 维持地址数据库的数据与国家中的实际邮件地址之间的对应关系,没有选 择,只有依靠诸如收集邮件地址的邮政服务雇员和其他人的努力。这连续地 导致了建立和維持地址数据库的巨大花费。
此外,可能通过使用自动识别技术来从邮件中提取地址信息。然而,在 所提取的地址信息的可靠性方面存在问题。相应地,难以将地址信息的提取 应用于建立可以依赖的地址数据库。
在这个背景技术部分公开的上面信息仅仅是为了增强对本发明背景技 术的理解,并因此它可能包含没有形成对于本领域普通技术人员而言在这个 国家中已知的现有技术的信息。

发明内容
已努力做出本发明以提供用于通过验证从邮件的地址中读取的地址信 息来建立具有高可靠性的地址数据库的设备、及其方法。
本发明的示范实施例提供了 一种利用包括地址的地址图像来建立地址
数据库的设备。所述设备包括地址读取单元,用于从地址图像中读取地址; 读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数 的累积值;有效地址存储单元,用于存储包括多个实际存在的有效地址的有 效地址数据库;以及有效地址提取单元,用于根据从读取结果存储单元加载 的所读取的地址的累积值是否大于预定阈值,来将所读取的地址存储在有效 地址存储单元中。
本发明的又一实施例提供了 一种用于利用包括地址的地址图像来建立 地址数据库的方法。所述方法包括存储从地址图像中读取的地址和表示所 读取的地址的读取次数的累积值;确定所读取的地址的累积值是否大于预定 阈值;以及当所读取的地址的累积值大于预定阈值时,将所读取的地址存储 在有效地址数据库中,其中所述有效地址数据库包括实际存在的有效地址。
本发明的又一实施例提供了 一种用于利用包括地址的地址图像来建立 地址数据库的设备。所述设备包括地址读取单元,用于从地址图像中读取 地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读 取次数的累积值;有效地址存储单元,用于存储包括多个在世界上实际存在
7的有效地址的有效地址数据库;有效地址候选者提取单元,用于根据从读取 结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取 的地址设置为有效地址候选者;和有效地址验证单元,用于输出有效地址候 选者和与其对应的地址图像,地址管理员向该有效地址验证单元提供关于所 述有效地址候选者是否与地址图像的地址相同的信息,并且基于所述信息在 有效地址数据库中存储有效地址候选者。
本发明的又一实施例提供了 一种用于利用包括地址的地址图像来建立 地址数据库的方法。所述方法包括存储从地址图像中读取的地址和表示所 读取的地址的读取次数的累积值;当所读取的地址的累积值大于预定阈值 时,将所读取的地址设置为有效地址候选者;输出有效地址候选者和与其对 应的地址图像,并被提供从地址管理员输入的、关于所述有效地址候选者是 否与地址图像的地址相同的信息;以及基于所述信息将所述有效地址候选者 存储在有效地址数据库中,其中所述有效地址数据库包括实际存在的有效地 址。
根据本发明的实施例,通过验证从邮件的地址中读取的地址信息、并基 于所述地址信息来建立地址数据库,可能改善地址数据库的可靠性和完整 性。
除了读取地址信息之外,执行维持地址数据库的数据以对应于实际的邮 件地址。结果,这允许减少建立地址数据库所需要的花费和努力。


图1示出了根据本发明第一示范实施例的、用于建立有效地址数据库的 设备的构造。
图2示出了根据本发明第一示范实施例的、用于建立有效地址数据库的 方法的流程图。
图3示出了根据本发明第二示范实施例的、用于建立有效地址数据库的 设备的构造。
图4示出了才艮据本发明第二示范实施例的、用于在线实时地建立有效地 址数据库的方法的流程图。
图5示出了根据本发明第二示范实施例的、用于在线实时地建立有效地 址数据库的方法中的步骤S493的详细处理的流程图。图6示出了根据本发明第二示范实施例的、用于离线地建立有效地址数 据库的方法中的用于存储读取结果的处理的流程图。
图7示出了根据本发明第二示范实施例的、用于离线地建立有效地址数 据库的方法中的用于向地址数据库添加有效地址候选者的处理的流程图。
图8示出了根据本发明第二示范实施例的、用于离线地建立有效地址数 据库的方法中的用于从地址数据库中删除无效地址候选者的处理的流程图。
具体实施例方式
在接下来的详细描述中,简单通过图示的方式已经仅仅示出并描述了本 发明的特定示范实施例。如本领域的技术人员将实现的,可以以各种不同的 方式修改所描述的实施例,而都不脱离本发明的精神或范围。相应地,附图 和描述将实际上被认为是图示性的而不是限制性的。贯穿说明书中,相同的 附图标记指定相同的元件。
另外,除非明确地相反描述,词语"包括"以及诸如"包含,,或"含有" 的变型将被理解为意指包括所陈述的元件但并不排除任何其它元件。
现在,将详细说明根据本发明示范实施例的、用于建立有效地址数据库 的设备及其方法。
图1示出了根据本发明第一示范实施例的、用于建立有效地址数据库的 设备的构造。
参考图1,本发明第一示范实施例的有效地址数据库建立设备100包括 地址图像提供单元110、地址读取单元120、读取结果存储单元U0、有效地 址提取单元140、和有效地址存储单元180。
地址图像提供单元110扫描在其上写入地址的邮件,生成地址图像,并 将它提供到地址读取单元120。
这里,地址图像提供单元110可以是类似自动邮件分类器的用于自动提 供邮件的装置、或者是用于提供由照相机或扫描仪扫描的图像的装置、以及 其它。
地址读取单元120对包括字符或条形码的地址图像执行预处理,并识别 它以生成与该地址图像对应的地址字符串。而且,地址读取单元120通过使 用类似条形码读取、字符识别、和地址解译的技术,来自动地从地址图像提 供单元IIO所提供的地址图像中读取地址。这里,由于不能够通过对地址数据库的地址执行后处理来利用可读取地
址的识别装置从地址数据库获得新添加的地址信息,所以地址读取单元120
从地址图像中读取地址,而没有使用地址数据库。
而且,地址读取单元120不仅读取包括字符串的地址,还读取由条形码 构成的地址信息。相应地,它可能能够减少读取地址中的错误。
读取结果存储单元130存储并管理由地址读取单元120读取的多个地址。
在这个情况下,当输入了与已经存储在读取结果存储单元130中的地址 等同的地址时,读取结果存储单元130生成地址的累积值(accumulated value),并将它存储为与所述地址匹配。这里,累积值用于提取有效地址。
读取结果存储单元130存储地址字符串,并照原样存储类似住宅门牌号 码和街区编号或建筑物的房间号的详细信息。
在这个情况下,在执行地址解译和地址信息的后处理之后,读取结果存 储单元130可使用类似行政区域的名称的地址信息。
当执行地址解译时,由于根据地址组织来建立行政区域名称数据库相对 容易,所以执行类似街区编号和房间号的详细地址信息的提取和分析。
有效地址提取单元140加载并分析所读取的地址、和作为通过读取多个 地址图像获得的结果并被存储在读取结果存储单元130中的那些地址的累积 值。然后,有效地址提取单元140从所读取的地址中提取具有高可能性的地 址,所述可能性表示地址可能真实有效。
这里,有效地址提取单元140检查累积值,确定高于预定阈值的累积值 的所读取的地址作为有效地址,并将该有效地址存储在有效地址存储单元 180中。
有效地址存储单元180存储并管理包括真实有效地址的有效地址数据
库。、 「 - a 、 '、
单元120读取的地址所需要的信息,并且还提供有效地址提取单元MO从在 读取结果存储单元130中存储的多个所读取的地址中提取有效地址所需要的信息。
此外,有效地址存储单元180存储被有效地址提取单元MO确定为真实 存在地址的有效地址。现在,参考图2,将描述根据本发明第一示范实施例的、用于建立有效 地址数据库的方法。
图2示出了根据本发明第一示范实施例的、用于建立有效地址数据库的 方法的流程图。
根据本发明第 一 示范实施例的方法涉及如下的处理当输入地址图像 时,实时地确定地址图像的地址是否是有效地址,并基于有效地址建立有效 地址数据库。
首先,地址图像提供单元110通过扫描一封邮件的地址(即,邮件上被 写入地址的部分)来生成地址图像,并将所述地址图像提供到地址读取单元 120 (S210)。地址读取单元120从所述地址图像中读取地址(S220),并将 所读取的地址和所读取的地址的累积值存储在读取结果存储单元130中 (S230 )。
接下来,有效地址提取单元140加载包括所读取的地址及其累积值的读 取地址结果,并确定所述累积值中的每一个是否大于预定的阈值(S240)。
在步骤S240中,当累积值大于预定的阈值时,有效地址提取单元140 通过检查具有该累积值的所读取的地址是否处于有效地址存储单元180的有 效地址数据库中,来确定它是否是新的有效地址(S250)。
在步骤S250中,当由于具有该累积值的所读取的地址没有处于有效地 址数据库中而确定所述所读取的地址是新的有效地址时,有效地址提取单元
140将所述所读取的地址设置为新的有效地址并将它存储在有效地址存储单 元180的有效地址数据库中(S260 )。
然而,当在步骤S240中所读取的地址不具有大于预定阈值的累积值时、 或当在步骤S250中具有该累积值的所读取的地址没有被确定为新的有效地 址时,终止本方法的上面处理。
图3示出了根据本发明第二示范实施例的、用于建立有效地址数据库的 设备。
参考图3,根据本发明第二示范实施例的有效地址数据库建立设备300 包括地址图像提供单元310、地址读取单元320、读取结果存储单元330、 有效地址候选者提取单元340、有效地址验证单元350、无效地址候选者提 取单元360、无效地址验证单元370、和有效地址存储单元380。
这里,根据本发明第二示范实施例的有效地址数据库建立设备的结构与根据本发明第一示范实施例的所述设备的结构类似。因此,将省略与第一示 范实施例的那些构成元件相同的构成元件的描述。
有效地址候选者提取单元340加载并分析已经累积并存储在读取结果存 储单元330中的读取结果,并然后提取具有高可能性的地址,所述可能性表 示地址可能是真实有效的。
这里,象第一示范实施例的有效地址提取单元140—样,有效地址候选 者提取单元340使用累积的统计来选择有效地址。
例如,在地址读取结果已经累积了有规则的时间段之后、或者在地址读 取结果的数量满足预定的数量之后,将在读取结果中出现超过阈值次数的地 址确定为真实存在的有效地址。当被确定为有效地址的地址没有包括在有效 地址存储单元3 80的有效地址数据库中时,将该地址设置为有效地址候选者。
有效地址验证单元350验证有效地址候选者提取单元340所提取的地 址,即,有效地址候选者。这里,有效地址验证单元350输出有效地址候选 者以及地址图像,所述地址图像是通过地址图像提供单元310扫描邮件获得 的、并且基于选择有效地址候选者。而且,有效地址验证单元350被提供有 地址管理员的输入,该地址管理员用于确定有效地址候选者的有效性,并且 由于有效地址候选者与地址图像的地址相同,所以有效地址验证单元350在 有效地址存储单元380的有效地址数据库中存储-波地址管理员确定为有效的 有效地址候选者。
在这个情况下,有效地址验证单元350输出基于选择有效地址候选者的 地址图像作为视频场景(scene ),从而地址管理员看见该视频场景并确定是 否正确地执行了地址图像的读取。
这里,验证有效地址可被分类为用于确定地址读取单元320所读取并 提供的地址是否等同于地址图像的地址的处理;以及用于确定在一封邮件中 是否真的使用了所提供的地址的处理。
在这个情况下,可基于对正被讨论的区域的认知来执行后面的处理。因 此,需要诸如所述区域的邮政服务雇员或市政公务员的人员。
由于一个人难以执行两个处理,所以如偶尔需要的,有效地址验S正单元 350可通过基于地址图像来确定读取结果的有效性并验证将要添加的有效地 址的有效性,来执行有效地址的验证。
添加有效地址可通过以下两种方法来实现在线实时有效地址数据库添加方法,用于只要输入读取结果就确定读取结果的地址是否是有效地址;和离线有效地址数据库添加方法,用于通过分析累积的读取结果的同时来提取有效地址。
无效地址候选者提取单元360加载并分析在读取结果存储单元330中已经累积的读取结果,并从有效地址存储单元380的地址中提取地址可能实际不存在的高可能性的地址。
这里,无效地址候选者提取单元360使用累积的统计来选择无效地址。
例如,在地址读取结果已经累积了有规则的时间段之后、或者在地址读取结果的数量满足预定的数量之后,将在读取结果中出现低于阈值次数的地址确定为无效地址。当净皮确定为无效地址的地址存储在有效地址存储单元380的有效地址数据库中时,将该地址设置为无效地址候选者。
无效地址验证单元370输出无效地址候选者以及地址图像,所述地址图像是通过地址图像提供单元310扫描邮件获得的、并且基于选择无效地址候选者。而且,无效地址验证单元370被提供有地址管理员的输入,该地址管理员用于确定无效地址候选者的无效性,并且当因为无效地址候选者与该地址图像的地址相同所以该地址管理员确定该无效地址候选者无效时,该无效地址验证单元370从有效地址数据库中删除该无效地址候选者。
在这个情况下,无效地址验证单元370输出基于选择无效地址候选者的地址图像作为视频场景,从而地址管理员看见该视频场景并确定是否正确地执行了读取地址图像。
接下来,将参考附图描述用于建立在线实时有效地址的方法和用于建立离线有效地址数据库的方法。
在线实时有效地址数据库建立方法当通过地址图像提供单元310输入地址图像时实时地确定该地址图像的地址是否是有效地址,并当该地址图像被确定为有效地址时将该地址图^^的地址添加到有效地址it据库中。
离线有效地址数据库建立方法在超过预定数目的地址图像被累积在读取结果存储单元330中之后确定所述地址图像的地址是有效地址,并然后将被确定为有效地址的所述地址图像的地址添加到有效地址数据库中。
现在,将描述在线实时有效地址数据库建立方法。
图4示出了根据本发明第二示范实施例的在线实时有效地址数据库建立方法的流程图。图5示出了在线实时有效地址数据库建立方法的步骤的流程
13将参考图4和图5描述在线实时有效地址数据库建立方法。地址图像提供单元310通过扫描一封邮件的被写入地址的部分来生成地
址图像,并将所述地址图像输入到地址读取单元320 (S410)。地址读取单
元320从地址图像中读取地址(S420),并将所读取的地址存储到读取结果
存储单元330 ( S430 )。
在这个情况下,在读取结果存储单元330中存在多个所读取的地址和与
每个所读取的地址对应的累积值,其中累积值表示读取并存储对应的所读取
的地址的累积次数。
的地址和其累积值(S440 ),并确定该所读取的地址的累积值是否小于预定的阈值(S450)。
当所读取的地址的累积值小于预定的阈值时,有效地址候选者提取单元340调整预定的阈值(S460 )。
这里,4艮据接下来的等式1和2来调整所述预定的阈值。(等式l)
T = max((kxE/P), L)
(k>0, L>0, k和L是常数)(等式2)
T = max((kXN/D), L)(k>0, 1>0, k和L是常数)
这里,T表示作为用于确定有效地址的参考的阈值,N表示所提供的地址图像的总数,E表示具有有效地址的邮件数量(E〈-N), D表示在一区域中的邮政投递分支机构的数目,而P表示其中出现有效地址邮件的邮政投递分支机构的数目。
而且,N、 E、 D、 P>m。 L表示最小的阈值,而m表示在^:递邮件时使用的邮政投递分支机构的最小数目。
当n(a)表示所读取的地址的出现积累频率时,如果n(a)〉二T,则所读取的地址是有效地址,而如果n(a)〈T,则所读取的地址是无效地址。
然后,有效地址候选者提取单元340确定是否输入来自地址图像提供单元310的新的所读取的地址并将其存储在读取结果存储单元330中(S470 ),
其间,在步骤S450中,当所读取的地址的累积值不小于预定阈值时,有效地址候选者提取单元340确定该所读取的地址作为有效地址。然后,有效地址候选者提取单元340确定所读取的地址是否在有效地址存储单元380的有效地址数据库中(S480)。
当所读取的地址不在有效地址存储单元380的有效地址数据库中时,有效地址候选者提取单元340确定当前的模式是否是自动添加模式,该自动添加模式用于当确定了有效地址时自动将有效地址存储在有效地址存储单元380的有效地址数据库中(S491 )。
当当前模式不是自动添加模式时,如图5所示,有效地址验证单元350输出有效地址候选者提取单元340所确定的有效地址候选者、以及与该有效地址候选者对应的并且从地址图像提供单元310 >|是供的地址图像(S493b )。然后,地址管理员向有效地址验证单元350提供关于该有效地址候选者是否等同于地址图像的地址的信息(S493c )。
在这个情况下,用于按照出现累积频率的顺序来排列有效地址候选者以便改善地址管理员的处置效率的步骤S493a可以插入在步骤S493与步骤S493b之间。
如图4所示,有效地址验证单元350基于^U也址管理员输入的信息来确定有效地址候选者是否与地址图像的地址相同(S494 )。
当有效地址候选者与地址图像的地址相同时,有效地址验证单元350将该有效地址候选者添加到有效地址存储单元380的有效地址数据库中,并前进到步骤S460。
然而,当有效地址候选者与地址图像的地址不相同时,执行对在读取结果存储单元330中存储的有效地址候选者的累积值的补偿,并然后执行步骤S460。
这里,例如,因为有效地址候选者不等同于地址图像的地址,所以有效地址候选者提取单元340从该有效地址候选者的累积值中减去"1"。
其间,在步骤S491中,当当前模式是自动添加模式时,有效地址验证单元350确定由有效地址候选者提取单元340确定的有效地址候选者是否处于有效地址存储单元380的有效地址数据库中(S492 )。当由有效地址候选者提取单元340确定的有效地址候选者处于有效地址存储单元380的有效地址数据库中时,有效地址验证单元350前进到步骤S460。然而,当它不在有效地址数据库中时,有效地址验证单元350前进到步骤S495。
接下来,将描述离线有效地址数据库建立方法。
图6示出了根据本发明第二示范实施例的、离线有效地址数据库建立方法中的用于存储读取结果的处理的流程图。图7和图8分别示出了根据本发明第二示范实施例的、离线有效地址数据库建立方法中的、用于向有效地址数据库添加有效地址候选者的处理的流程图、和用于从有效地址数据库中删除无效地址候选者的处理的流程图。
首先,将参考图6描述离线有效地址数据库建立方法中的用于存^f诸读取结果的处理。
地址图像提供单元310通过扫描一封邮件的被写入地址的部分来生成地址图像,并将所述地址图像输入到地址读取单元320 (S610)。地址读取单元320从地址图像中读取地址(S620),并将所读取的地址存储到读取结果存储单元330 ( S630 )。
在这个情况下,在读取结果存储单元330中存在多个所读取的地址和与每个所读取的地址对应的累积值,其中所述累积值表示读取并存储对应的所读取的地址的累积次数。
然后,地址图像提供单元310确定是否通过扫描一封新邮件而生成了新的地址图像(S640),并且当没有生成新的地址图像时终止处理。
这里,当生成了新的地址图像时,地址图像提供单元310重复步骤S610-S640。
接下来,参考图7,将描述根据本发明第二示范实施例的、离线有效地址数据库建立方法中的用于向有效地址数据库添加有效地址候选者的处理。
当已经过去预定的时间时,例如当在开始用于在读取结果存储单元330中存储读取结果的处理之后已经过去了预定时间时,或者当从地址图像中读取的读取结果的数目超过预定的数目时,有效地址候选者提取单元340从读取结果存储单元330加载读取结果(S710),并分析与该读取结果的所读取的地址对应的累积值(S720 )。
有效地址候选者提取单元340从读取结果之中选择如下的地址,该地址具有超过预定阈值的累积值、并且不在有效地址存储单元380的有效地址数据库中(S730)。
这里,所选择的地址被设置为有效地址候选者。
有效地址验证单元350从有效地址候选者提取单元340所选择的有效地址候选者之中选择一个,并确定当前模式是否是用于在有效地址存储单元380的有效地址数据库中自动存储有效地址候选者的自动添加模式(S750 )。
当在步骤S750中当前模式是自动添加模式时,有效地址验证单元350将所选择的有效地址候选者存储在有效地址存储单元380的有效地址数据库中(S760),并确定在有效地址候选者提取单元340所选择的有效地址候选者之中是否存在由于未被选择而被留下的任何有效地址候选者(S770 )。
当存在被留下的有效地址候选者时,有效地址-验证单元350前进到步骤S740。
其间,当在步骤S750中当前模式不是自动添加模式时,有效地址验证单元350输出所选择的有效地址候选者以及与其对应的地址图像,以便地址管理员看见。然后,根据地址管理员的验证向有效地址验证单元"0提供输入(S780 )。
有效地址验证单元350基于地址管理员的输入来确定所输出的有效地址候选者是否与该地址图像的地址相同(S790)。
当所输出的有效地址候选者等同于该地址图像的地址时,有效地址验证单元350前进到步骤S760,而当所输出的有效地址候选者不同于该地址图像的地址时,有效地址验证单元350前进到步骤S770。
接下来,参考图8,将描述根据本发明第二示范实施例的、离线有效地址数据库建立方法中的用于从有效地址数据库中删除无效地址候选者的处理。
当已经过去预定的时间时,例如当在开始用于在读取结果存储单元330中存储读取结果的处理之后已经过去了预定时间时,或者当从地址图#^中读取的读取结果的数目超过预定的数目时,无效地址候选者提取单元360从读取结果存储单元330加载读取结果(S810),并分析与该读取结果的所读取的地址对应的累积值(S820 )。
无效地址候选者提取单元360从读取结果之中选择如下的地址,该地址具有小于预定阈值的累积值、并且处于有效地址存储单元380的有效地址数据库中(S830)。
这里,所选择的地址被设置为无效地址候选者。
无效地址验证单元370从无效地址候选者提取单元360所选择的无效地 址候选者之中选择一个,并确定当前模式是否是用于从有效地址存储单元 380的有效地址数据库中自动删除无效地址候选者的自动删除模式(S850 )。
当在步骤S850中当前模式是自动删除模式时,无效地址-验证单元370 将所选择的无效地址候选者从有效地址存储单元380的有效地址数据库中删 除(S860),并确定在无效地址候选者提取单元360所选择的无效地址候选 者之中是否存在由于未被选择而被留下的无效地址候选者(S870)。
当存在被留下的无效地址候选者时,无效地址验证单元370前进到步骤 S8復
其间,当在步骤S850中当前模式不是自动删除模式时,无效地址验证 单元370输出所选择的无效地址候选者以及与其对应的地址图像,以便地址 管理员看见。然后,根据地址管理员的验证向无效地址验证单元370提供输 入(S880 )。
无效地址验证单元370基于地址管理员的输入来确定所输出的无效地址 候选者是否与该地址图像的地址相同(S890)。
当所输出的无效地址候选者与该地址图像的地址相同时,无效地址验证 单元370前进到步骤S860,而当所输出的无效地址候选者不等同于该地址 图像的地址时,无效地址验证单元370前进到步骤S870。
本发明的上述示范实施例并不仅仅通过方法和设备来实施。可替换地, 可以通过用于执行与本发明示范实施例的配置对应的功能的程序、或者在其 上记录所述程序的记录介质来实现上述示范实施例。本发明所属领域的技术 人员可以容易地从上述示范实施例的描述中导出这些实施例。尽管已经结合 当前净皮认为是实用示范实施例的内容描述了本发明,但是要理解,本发明不 限于所公开的实施例,而是相反,本发明意名夂覆盖在所附权利要求的精神和 范围内包括的各种修改和等效安排。
权利要求
1. 一种用于利用包括地址的地址图像来建立地址数据库的设备,所述设备包括地址读取单元,用于从地址图像中读取地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;有效地址存储单元,用于存储包括多个实际存在的有效地址的有效地址数据库;以及有效地址提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址存储在有效地址存储单元中。
2. 根据权利要求1的设备,其中,当所读取的地址的累积值大于预定 阈值时,有效地址提取单元确定所读取的地址作为有效地址,并将所读取的 地址存储在有效地址存储单元中。
3. 根据权利要求1的设备,其中,当所读取的地址的累积值大于预定 阈值、并且在有效 相同的地址时, 中。
4. 一种用于利用包括地址的地址图像来建立地址数据库的方法,所述 方法包括以下步骤存储从地址图像中读取的地址和表示所读取的地址的读取次数的累积值;确定所读取的地址的累积值是否大于预定阈值;以及 当所读取的地址的累积值大于预定阈值时,将所读取的地址存储在有效地址数据库中,其中所述有效地址数据库包括实际存在的有效地址。
5. 根据权利要求4的方法,其中,当所读取的地址的累积值大于预定定步骤将所读取的地址存储在有效地址数据库中。
6. —种用于利用包括地址的地址图像来建立地址数据库的设备,所述设备包括地址读取单元,用于从地址图像中读取地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取 次数的累积值;有效地址存储单元,用于存储包括多个在世界上实际存在的有效地址的 有效地址数据库;有效地址候选者提取单元,用于根据从读取结果存储单元加载的所读取 的地址的累积值是否大于预定阈值,来将所读取的地址设置为有效地址候选 者;以及有效地址验证单元,用于输出有效地址候选者和与其对应的地址图像, 向该有效地址验证单元提供关于所述有效地址候选者是否与地址图像的地 址相同的信息,所述信息由地址管理员输入,并且所述有效地址^^证单元基 于所述信息在有效地址数据库中存储有效地址候选者。
7. 根据权利要求6的设备,其中,当所读取的地址的累积值大于预定 阈值、并且在有效地址存储单元的有效地址数据库中不存在与所读取的地址 相同的地址时,有效地址提取单元将所读取的地址设置为有效地址候选者。
8. 根据权利要求7的设备,其中,当从地址管理员输入的信息指明有 效地址候选者与地址图像的地址相同时,有效地址-睑证单元将有效地址候选 者存储在有效地址存储单元的有效地址数据库中。
9. 根据权利要求8的设备,其中,当从地址管理员输入的信息指明有 效地址候选者不同于地址图像的地址时,有效地址验证单元补偿有效地址候 选者的累积值,所述累积值被存储在读取结果存储单元中。
10. 根据权利要求6的设备,其中,有效地址提取单元基于地址图像的 数目、具有有效地址的邮件的数目、处于与所提供的地址图像对应的区域中 的邮政投递分支机构的数目、和其中出现有效地址邮件的邮政投递分支机构 的数目,来调整所述预定阈值。
11. 根据权利要求10的设备,其中有效地址提取单元基于接下来的等 式之一来调整预定的阈值T = max((kXE/P), L)(k>0, L>0, k和L是常数)T = max((kxN/D), L)(k〉0, L>0, k和L是常数) 其中,地址图像的数目为N,具有有效地址的邮件的数目为E,处于与所提 供的地址图像对应的区域中的邮政投递分支机构的数目为D,并且其中出现 有效地址邮件的邮政投递分支机构的数目为P。
12. 根据权利要求10的设备,其中所述有效地址提取单元还包括 无效地址候选者提取单元,用于当所读取的地址的累积值小于预定阈值时,将所读取的地址设置为无效地址候选者,所述无效地址候选者具有表示 地址可能实际不存在的可能性;以及无效地址验证单元,用于输出无效地址候选者和与其对应的地址图像, 并且当从地址管理员输入关于无效地址候选者与地址图像的地址相同的信 息时,从有效地址数据库删除所述无效地址候选者。
13. —种用于利用包括地址的地址图像来建立地址^据库的方法,所述 方法包括以下步骤存储从地址图像中读取的地址和表示所读取的地址的读取次数的累积值;当所读取的地址的累积值大于预定阈值时,将所读取的地址设置为有效 地址候选者;输出有效地址候选者和与其对应的地址图像,并^皮提供从地址管理员输 入的、关于所述有效地址候选者是否与地址图像的地址相同的信息;以及基于所述信息将所述有效地址候选者存储在有效地址数据库中,其中所 述有效地址数据库包括实际存在的有效地址。
14. 根据权利要求13的方法,其中,当所读取的地址的累积值大于预述设置所读取的地址的步骤将所读取的地址设置为有效地址候选者。
15. 根据权利要求14的方法,其中,当从地址管理员输入指明有效地 址候选者与地址图像的地址相同的信息时,所述存储有效地址候选者的步骤 将有效地址候选者存储在有效地址数据库中。
16. 根据权利要求15的方法,其中,当从地址管理员输入用于指明有 效地址候选者不同于地址图像的地址的信息时,所述存储有效地址候选者的步骤补偿与有效地址候选者对应的累积值。
17. 根据权利要求13的方法,其中,当所读取的地址的累积值不大于 预定阈值、并且在有效地址数据库中存在与所读取的地址相同的地址时,所 述设置所读取的地址的步骤将所读取的地址设置为无效地址候选者。
18. 根据权利要求17的方法,还包括基于地址图像的数目、具有有效地址的邮件的数目、处于与所提供的地 址图像对应的区域中的邮政投递分支机构的数目、和其中出现有效地址邮件 的邮政投递分支机构的数目,来调整所述预定阈值。
19. 根据权利要求18的方法,其中所述调整预定阈值的步骤基于接下 来的等式之一 来调整预定的阈值T = max((kXE/P), L)(k>0, L〉0, k和L是常数)T = max((kxN/D), L)(k〉0, L>0, k和L是常数) 其中,地址图像的数目为N,具有有效地址的邮件的数目为E,处于与所提 供的地址图像对应的区域中的邮政投递分支机构的数目为D,并且其中出现 有效地址邮件的邮政投递分支机构的数目为P。
全文摘要
本发明涉及一种用于建立地址数据库的设备及其方法。根据本发明的设备包括地址读取单元,用于从地址图像中读取地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;有效地址存储单元,用于存储包括多个实际存在的有效地址的有效地址数据库;以及有效地址提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址存储在有效地址存储单元中。根据本发明,通过验证从被写入在一封邮件上的地址信息中读取的地址来建立地址数据库,从而改善了地址数据库的可靠性和完整性。
文档编号G06Q50/00GK101458702SQ200810186709
公开日2009年6月17日 申请日期2008年12月12日 优先权日2007年12月13日
发明者张升翼, 朴钟兴, 金湖然 申请人:韩国电子通信研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1