一种判断地址是否标准化、地址标准化的方法及系统与流程

文档序号:18475387发布日期:2019-08-20 20:58阅读:627来源:国知局
一种判断地址是否标准化、地址标准化的方法及系统与流程

本发明涉及通讯地址技术领域,尤其是一种判断地址是否标准化、地址标准化的方法及系统。



背景技术:

目前地理信息系统(gis)在各个系统中运用越来越广泛,而且通讯地址技术的应用与人们的生活息息相关,例如邮政的信件往来、银行业务系统、公安部门的信息管理系统等都需要对地址数据进行存储、识别、更新等处理。通讯地址的不规范或者不标准,将会给人们带来诸多的不便。例如:由于用户地址的不规范,邮政系统需要投入大量的人力和物力去解决如何识别正确的、标准的通讯地址,否则将会造成错误投递、重复投递的情况,而随着邮政业务数据的增长,这种投入将相应地进行扩大,这种情况对邮政系统来说将难以承受。银行业务系统中也存在着用户地址的不规范问题,倘若银行业务系统没有对用户地址进行标准化的处理,随着业务系统的数据量增大,不同数据库的不兼容性,银行业务系统将面临着处理速度较慢、效率低下,业务系统数据混乱的现象,很容易造成客户的损失和流失。

由于一些老系统的数据库中存在的大批量非空间数据(没有经纬度坐标),在对旧系统进行改造升级时,需要增加上图标注、区域分析等功能,但由于地址采集没有标准、造成与标准地址匹配的概率很低。升级系统非常困难。因此,判断地址是否标准化以及将地址进行标准化处理是非常必要的。



技术实现要素:

本发明提出了一种判断地址是否标准化、地址标准化的方法及系统。

在一个方面,本发明提出了一种判断地址是否标准化的方法,包括以下步骤:

s1:将采集地址进行清洗转换,其中采集地址中的汉语数字转换为阿拉伯数字;

s2:按地址层级进行采集地址的拆分;

s3:对采集地址拆分后各个层级分别与标准地址库中的地址进行命中分析;

s4:利用每个层级的命中情况、预设的层级权重系数和层级之间的影响系数,获得采集地址的地址分值;

s5:利用采集地址的地址分值与预设的分值阈值比较,判断采集地址是否完成地址标准化。

在可选实施例中,步骤s4中的每个层级的权重系数不同,并且权重随层级的递增而增大。通过不同层级的权重系数的设定,使地址分值的计算更加的合理准确。

在可选实施例中,层级之间的影响系数具体表现为其他层级与标准库的命中对当前层级的权重系数的影响程度,其他层级与当前层级间隔越大,影响系数越小。凭借影响系数的设置,进一步增强的地址分值结果的准确性。

在可选实施例中,权重系数和影响系数均采用百分数的形式。最终获得的地址分值也为百分制的形式,凭借百分制的形式可以更直观的进行地址分值的判断。

在可选实施例中,采集地址的地址分值具体包括每个层级的地址分值之和。通过各个层级的地址分值之和,获得采集地址的总的地址分值,能够客观的反应出采集地址的地址匹配命中情况。

在可选实施例中,层级的地址分值具体表现为层级的命中情况与层级的综合系数的乘积,综合系数具体表现为层级的权重系数和影响系数之和。命中情况和综合系数的乘积反映了该层级的地址分值情况。

在可选实施例中,地址分值的计算公式为其中si表示i层级对应的权重系数,xi表示i层级的地址段是否命中,xj表示j层级的地址段是否命中,取值为:0表示未命中、1表示命中,aij表示第j层级是否命中对i层级的权重系数si的影响系数。

在可选实施例中,步骤s3的命中分析具体包括:利用路名+门牌号在标准库中进行匹配,获得命中的标准地址集合rn,根据采集地址的室号在标准地址集合rn中进行命中分析。利用路名+门牌号的精准匹配模式可以高效的进行采集地址的标准化判断,

在可选实施例中,步骤s3的命中分析还包括利用拆分获得与路名匹配命中的标准地址集合pn,提取采集地址中门牌号和/或室号之前的数字与标准地址集合pn进行命中分析。在无法采用路名+门牌号的精准匹配模式的情况下,使用路名匹配命中,再根据门牌号和/或室号前的数字的提取来进行后续的匹配,可以保证采集地址得到有效的命中匹配,防止出现遗漏的情况。

在可选实施例中,步骤s5具体为利用计算出的地址分值s与预设的分值阈值ls进行比对,若s>ls,表示采集地址的标准化成功,若s<ls,表示采集地址的标准化失败。凭借预设的分值阈值来对采集地址的标准化进行判断可以直观的获得采集地址的命中情况。

根据本发明的另一方面,提出了一种地址标准化的方法,包括如上文的判断地址是否标准化的方法,该方法还包括将判断为标准化成功的采集地址与标准地址库内的地址建立映射关系。

根据本发明的第三方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时上述方法。

根据本发明的第四方面,提出一种判断地址是否标准化的系统,该系统包括:

标准地址库,配置用于作为采集地址比对的标准;

地址清洗转换单元,配置用于对采集地址按标准地址语言进行清洗转换;

拆分单元,配置用于按地址层级进行采集地址的拆分;

计算单元,配置用于利用每个层级的命中情况、层级的权重系数和层级之间的影响系数,计算获得采集地址的地址分值;

判断单元,配置用于判断采集地址是否完成标准化。

根据本发明的第五方面,提出了一种地址标准化的系统,包括如上文的判断地址是否标准化的系统,还包括映射单元,配置用于将标准化成功的采集地址与标准地址库中的地址建立映射关系。

本发明对采集地址按标准地址库的层级进行拆分,分别对各个层级进行命中匹配分析,根据命中情况和预设层级的权重系数和层级之间的影响系数计算各个层级的地址分值,最终获得采集地址的地址分值,通过与设定的分值阈值进行对比分析判断采集地址是否完成标准化。极大的提高了匹配的效率,解决了现有系统过于陈旧,采集地址混乱无法拓展,方便系统的改造升级,有利于地址业务的统一。

附图说明

包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本发明的一个实施例的判断地址标准化的方法流程图;

图2是本发明的一个具体的实施例的地址分值计算方法的流程图;

图3是本发明的一个实施例的地址标准化的方法流程图;

图4是本发明的一个实施例的判断地址标准化的系统图;

图5是本发明的一个实施例的地址标准化的系统图;

图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了本发明的一个实施例的一种判断地址标准化的方法,该方法包括以下步骤:

s101:将采集地址进行清洗转换,其中采集地址中的汉语数字转换为阿拉伯数字;例如“**市**区**路八十三号”转化为“**市**区**路83号”,将采集地址进行汉语数字转换为阿拉伯数字可以更容易的进行匹配命中,提高判断效率。

在具体的实施例中,采集地址的转换还包括将地方性的地址语言习惯转换为标准地址库的表达,例如栋、单元、弄等地方性的地址语言,统一转换为门牌号。

s102:按地址层级进行采集地址的拆分。按省、市、区或县、街道或镇、社区或村、路名、门牌号和室号8个层级进行拆分,形成标准地址库,每一层级的地址用相应的代码来表示,其中省对应代码1、市对应代码2、区或县对应代码3、街道或镇对应代码4、社区或村对应代码5、路名对应代码6、门牌号对应代码7、室号对应代码8。

s103:对采集地址拆分后各个层级分别与标准地址库中的地址进行命中分析。分别对拆分后的采集地址的各个层级与标准地址库中的地址层级进行分析比对,判断各个层级的地址是否命中标准地址库中的地址层级。

s104:利用每个层级的命中情况、预设的层级权重系数和层级之间的影响系数,获得采集地址的地址分值。命中情况具体表现为采集地址的每一个拆分层级与标准地址库中的相应层级的匹配情况,若采集地址的该层级与标准地址库中的对应层级一致,表示采集地址在该层级命中;若不一致,则表示为未命中。

在具体的实施例中,预设的层级权重系数具体包括各层级的基本权重和波动权重,各层级的基本权重一致,波动权重随着层级代码的增大而增大,因此,层级的代码越大,该层级对应的预设权重系数就越大。可以理解为,越靠后的层级对应的地址信息更加具体精确,其相应占据的权重比例就更加大。

作为示例,各层级对应的权重系数可以根据层级代码的递增而设置为1%-8%,代码1所对应的省层级的权重系数可以为1%、代码2所对应的市层级的权重系数可以为1.5%,代码3所对应的市层级的权重系数可以为2.5%,代码4所对应的市层级的权重系数可以为3%,代码5所对应的市层级的权重系数可以为4%,代码6所对应的市层级的权重系数可以为5%.代码7所对应的室号的权重系数可以为6%,代码8所对应的市层级的权重系数可以为7%。应当认识的是,各层级的权重系数可以根据实际应用的需要进行调整,满足不同的应用场景的需求。

层级之间的影响系数具体表现为其他层级与标准库的命中情况对当前层级的权重系数的影响程度,其他层级与当前层级间隔越大,其命中与否对当前层级的影响系数就越小。引入权重系数和影响系数来进行地址分值的计算,更加全面的考虑了各个层级是否命中对结果的影响程度和不同层级之间是否命中的相互影响,综合来计算采集地址的地址分值,可以使判断的结果更加合理和准确。

在具体的实施例中,地址分值的计算公式为其中si表示i层级对应的权重系数,xi表示i层级的地址段是否命中,xj表示j层级的地址段是否命中,取值为:0表示未命中、1表示命中,aij表示第j层级是否命中对i层级的所述权重系数si的影响系数,si和aij均为百分数的形式,最终计算获得的地址分值s也为百分数的形式,更加便于后续标准化程度的判断。

作为示例,层级之间的影响系数可以设定为相邻两层级间的影响系数为1.75%,两层级之间间隔1个层级的影响系数为1.5%,间隔2个层级的影响系数为1.25%...间隔6个层级的影响系数为0.25%。例如a12表示第2层级是否命中对第1层级的权重系数s1的影响系数为1.75%,a18表示第8层级是否命中对第1层级的权重系数s1的影响系数为0.25%。应当认识的是,层级之间的影响系数可以根据实际应用的需要进行调整,满足不同的应用场景的需求。

s105:利用采集地址的地址分值与预设的分值阈值比较,判断采集地址是否完成地址标准化。通过预设的分值阀值比较可以直观的判断采集地址的命中情况,完成采集地址的标准化判断。

作为示例,预设的分值阈值可以被设置为80%,当采集地址计算得出的地址分值大于预设的分值阈值,代表采集地址完成标准化匹配,反之,采集地址计算得出的地址分值小于预设的分值阈值,代表采集地址标准化匹配失败。应当理解,预设的分值阈值可以根据实际的使用需求设置为合理的数值,方便各种场景的判断。

图2示出了根据本发明实施例的地址分值计算方法的流程图,该方法包括以下步骤:

步骤s201:形成标准地址库。

在本实施例中,具体包括步骤s2011将标准地址进行拆分,按省、市、区或县、街道或镇、社区或村、路名、门牌号和室号8个层级进行拆分,拆分后形成标准地址库;还包括步骤s2012语言习惯收集,例如栋、单元、弄等地方性的地址语言,为后续采集地址中存在相关语言习惯的地址语言提供转换依据。

步骤s202采集地址处理。同理对采集地址进行拆分,按省、市、区或县、街道或镇、社区或村、路名、门牌号和室号8个层级进行拆分。

在本实施例中,采集地址处理之前还包括两个步骤:步骤s2021根据语言习惯进行地址清洗转换,采集地址的清洗转换包括将地方性的地址语言习惯转换为标准地址库的表达,例如栋、单元、弄等地方性的地址语言,统一转换为门牌号;步骤s2022汉语数字与阿拉伯数字转化,将采集地址中的汉语数字转换为阿拉伯数字;例如“**市**区**路八十三号”转化为“**市**区**路83号”,将采集地址进行汉语数字转换为阿拉伯数字可以更容易的进行匹配命中,提高判断效率。

步骤s203模式构建。构建模式2031,具体包括两种模式:模式1为路名+门牌号的精准匹配模式,模式2为路名的匹配模式。

步骤s204进行模式判定,根据采集地址的拆分结果,进行模式判定,选择合适的模式进行地址分值的计算。

在具体的实施例中,步骤s2051得到n种跟路名+门牌号有关的标准地址rn,并设置路名字段值x6=1,门牌号x7=1。用采集地址作为计算元将每一个地址中的路名+门牌号作为模式1,基于多模式匹配算法,用采集地址作为计算源,去匹配所有标准地址的模式,计算结果为n种跟路名+门牌号有关的标准地址rn。例如,例如采集地址为“**市**区**大厦**路22栋1101室”,标准地址为“**市**区**路22号1101室”,则将“**路22号”作为模式1,所以匹配结果为**路22号底下的所有地址。设置x6=1;x7=1。

步骤s2052对rn根据门牌号降序并循环;然后利用步骤s2053正则匹配“.*路名+门牌号+室号.*”匹配采集地址。

步骤s2054判断是否匹配,若匹配进入下一步骤s2055设置x8=1,随后进入最终步骤s207根据公式计算地址分值s;若不匹配则直接进入步骤s207根据公式计算地址分值s。

在另一种模式下,当路名与门牌号之间存在其他干扰性的地址语言导致无法使用模式1进行精准匹配,则进入模式2,即步骤s2061得到n种跟路名有关的标准地址pn,设置路名字段值x6=1。将每一个地址中的路名作为一种模式,基于多模式匹配算法,用采集地址作为计算源,去匹配所有标准地址的模式,计算结果为n种跟路名有关的标准地址pn。例如采集地址为“**市**区**路**大厦22号1101室”,标准地址为“**市**区**路22号1101室”,则将“**路”作为一种模式,所以匹配结果为**路底下的所有地址。首先将路名拆分出来,如果拆分成功,则将路名填充到地址段中,设置x6=1。

步骤s2062门牌号提取。利用正则表达式“\\d{1,}号”,提取出采集地址中第一个出现号之前的数字,作为其门牌号,进行匹配。

步骤s2063判断是否提取到门牌号,若提取到门牌号,则进入下一步骤s2064设置门牌号字段值x7=1;并进行室号拆分提取,若未提取到门牌号,则直接进入步骤s207根据公式计算地址分值s。

在提取到门牌号的基础上,进入步骤s2065判断是否提取到室号,若提取到室号,进入下一步骤s2066设置室号字段值x8=1,若未提取到室号则直接进入步骤s207根据公式计算地址分值s。利用正则表达式“\\d{1,}室|\\d{1,}单元”,提取出采集地址中的室号,循环pn的地址,如果地址以“路名+n+号”结尾,将门牌号填充到地址段中,设置x7=1;如果地址以“路名+n+号+s+室”结尾,将室号填充到地址段中,设置x8=1。

在具体的实施例中,若采集地址中如果出现“-”或者“、”,则将采集地址拆分成两个地址,每个地址重复上述步骤进行匹配。例如“**市**区**街道**路363-369号五楼之三”则拆分成“**市**区**街道**路363号五楼之三”和“**市**区**街道**路369号五楼之三”两个地址进行匹配。

作为示例,对采集地址进行上述模式的匹配,成功匹配至门牌号,未能匹配室号,此时根据公式层级1的地址至层级7的地址皆为命中,x1至x7都为1,层级8的地址未命中,x8=0,根据公式可以计算得出地址分值s=79%,若预设的分值阈值为80%,则可以判断采集地址标准化失败。

继续参考图3,其示出了根据本申请的地址标准化的方法的一个实施例的流程图。该方法包括步骤s301判断地址是否标准化的方法,步骤s301判断地址是否标准化的方法即为上文中所述的所有步骤;另外还包括步骤s302将判断为标准化成功的采集地址与标准地址库内的地址建立映射关系。通过建立映射关系把判断为标准化成功的采集地址与其对应的标准地址库内的地址联系起来,使地址库更加完善。

本发明的实施例还涉及一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上文中的方法。该计算机程序包含用于执行流程图所示的方法的程序代码。需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。

进一步参考图4,作为对上述图1所示的实施例描述的方法的实现,本申请提供了一种判断地址是否标准化的系统的一个实施例,该系统实施例与图1所示的方法实施例相对应,该系统具体可以应用于各种电子设备中。

如图4所示,本实施例的判断地址是否标准化的系统包括标准地址库401、地址清洗转换单元402、拆分单元403、计算单元404和判断单元405。:

标准地址库401,配置用于作为采集地址比对的标准,根据现有的标准地址,按省、市、区或县、街道或镇、社区或村、路名、门牌号和室号8个层级进行拆分,并收集地方地址语言习惯,形成标准地址库,为后续的匹配分析提供数据基础。

地址清洗转换单元402,配置用于对所述采集地址按标准地址语言进行清洗转换;确保数据计算的准确性,可以有效的避免人为操纵带来的相应问题,极大的减少了人力资源的投入。

拆分单元403,配置用于按地址层级进行所述采集地址的拆分,具体为按省、市、区或县、街道或镇、社区或村、路名、门牌号和室号8个层级进行拆分。

计算单元404,配置用于利用每个所述层级的命中情况、所述层级的权重系数和所述层级之间的影响系数,计算获得所述采集地址的地址分值。命中情况具体表现为采集地址的每一个拆分层级与标准地址库中的相应层级的匹配情况,若采集地址的该层级与标准地址库中的对应层级一致,表示采集地址在该层级命中;若不一致,则表示为未命中。

在具体的实施例中,地址分值的计算公式为其中si表示i层级对应的权重系数,xi表示i层级的地址段是否命中,xj表示j层级的地址段是否命中,取值为:0表示未命中、1表示命中,aij表示第j层级是否命中对i层级的所述权重系数si的影响系数,si和aij均为百分数的形式,最终计算获得的地址分值s也为百分数的形式,更加便于后续标准化程度的判断。波动权重随着层级代码的增大而增大,因此,层级的代码越大,该层级对应的预设权重系数就越大。层级之间的影响系数具体表现为其他层级与标准库的命中情况对当前层级的权重系数的影响程度,其他层级与当前层级间隔越大,其命中与否对当前层级的影响系数就越小。引入权重系数和影响系数来进行地址分值的计算,更加全面的考虑了各个层级是否命中对结果的影响程度和不同层级之间是否命中的相互影响,综合来计算采集地址的地址分值,可以使判断的结果更加合理和准确。

判断单元405,配置用于判断所述采集地址是否完成标准化。通过预设的分值阀值比较可以直观的判断采集地址的命中情况,完成采集地址的标准化判断。

该系统的各个单元可以在专用硬件上实施,也可以在通用的可编程逻辑器件中实施,或者由软硬件组合体来实施。

进一步参考图5,作为对上述图3所示的实施例描述的方法的实现,本申请提供了一种地址标准化的系统的一个实施例,该系统实施例与图3所示的方法实施例相对应,该系统具体可以应用于各种电子设备中。

如图5所示,本实施例的地址标准化的系统包括判断地址是否标准化的系统501和映射单元502。

判断地址是否标准化的系统501,该系统包括图4中判断地址是否标准化的系统的所有单元。

映射单元502,配置用于将标准化成功的采集地址与标准地址库中的地址建立映射关系。通过建立映射关系把判断为标准化成功的采集地址与其对应的标准地址库内的地址联系起来,使地址库的系统更加完善且便于地址业务的统一。

该系统的各个单元可以在专用硬件上实施,也可以在通用的可编程逻辑器件中实施,或者由软硬件组合体来实施。

下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统600的结构示意图。图6示出的终端设备或服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有系统600操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。

以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

根据本发明的一种判断地址是否标准化、地址标准化的方法及系统,对采集地址进行清洗转换并按地址层级进行采集地址的拆分,对采集地址拆分后各个层级分别与标准地址库中的地址进行命中分析,利用每个层级的命中情况、预设的层级权重系数和层级之间的影响系数,通过公式计算获得采集地址的地址分值,与预设的分值阈值比较,判断采集地址是否完成地址标准化。同时将判断标准化成功的采集地址与标准地址库进行映射,实现地址标准化的全过程,极大的提高了地址匹配的效率,完美的解决了现有系统中采集地址杂乱无章,没有标准、与标准地址匹配概率低下的缺点,也解决了采集地址混乱无法拓展的问题,便于地址系统升级改造,有利于实现地址业务的统一。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1