一种人口数据的智能匹配方法_2

文档序号:9376407阅读:来源:国知局
[0036] 其中,根据待匹配对象的匹配类别、匹配范围、匹配分值、匹配方法、权重、匹配阈 值配置匹配规则步骤包括:
[0037] 接收用户输入或选择的匹配类别;
[0038] 接收用户输入或选择的一组配置项,包括匹配范围、匹配分值、匹配方法、权重;
[0039] 接收用户输入或选择的完全匹配阈值、相似匹配阈值、未匹配阈值;
[0040] 根据用户输入或选择的上述数据生成匹配规则。
[0041] 其中,当所述匹配类型为定位匹配时,输入的匹配参数为公民身份号码和/或姓 名,通过查询人口历史信息库中的公民身份号码变更信息进行匹配和/或通过查询人口历 史信息库中的姓名变更信息或查询生僻字代码对照表进行姓名生僻字匹配,返回结果为人 员ID、匹配值、匹配度代码和匹配原因代码。
[0042] 其中,当所述匹配类型为基础信息匹配时,输入的匹配参数为公民身份号码、姓 名、性别、民族、出生日期、出生地中的至少一项数据项,匹配时根据每一项匹配结果分值落 在的阈值范围,判断其匹配值,即为完全匹配、相似匹配或未匹配,返回结果项为匹配值、匹 配度代码和匹配原因代码。
[0043] 其中,当所述匹配方法为信息项目变更匹配时,输入的匹配参数为公民身份号码、 姓名以及性别、民族、出生日期、出生地中的至少一项数据项,匹配时即对公民身份号码、姓 名以及性别、出生日期、民族、出生地中的至少一项是否做过变更进行匹配,返回结果为匹 配值、匹配度代码和匹配原因代码。
[0044] 其中,当所述匹配方法为行政区划代码轨迹匹配时,输入的匹配参数为行政区划 代码,匹配时对出生地、户籍地址含有区或县级以上行政区划代码进行匹配,返回结果为匹 配值、匹配度代码和匹配原因代码。
[0045] 其中,当所述匹配方法为生僻字匹配时,输入的匹配参数为姓名、出生地,匹配时 对姓名、出生地中含有生僻字进行匹配,通过"Unicode编码"查询生僻字对照表信息,如果 是替代字,则定义为完全匹配,如果是谐音字,则根据匹配分值的定义规则向智能匹配引擎 返回相似匹配分值,如果未查询到生僻字信息,则返回无匹配信息,返回结果为匹配值、匹 配度代码和匹配原因代码。
[0046] 其中,为匹配类别分别配置不同的接口,在执行匹配操作时,根据所要执行的匹配 类别进行相应接口的匹配调度,生成智能匹配结果。
[0047] 以下为本发明一个软件实现的例子:
[0048] 1、智能匹配配置管理
[0049] 智能匹配配置管理是实现灵活的定义每一类匹配规则,并为业务服务调用智能匹 配引擎配置需要应用的匹配规则。
[0050] 匹配规则涉及配置项的名词解释如下:
[0051] 应用范围:标识调用智能匹配引擎的业务,即应用范围。如基准校核、基准叠加、核 查、比对以及每一类服务的每一组的服务标识等。
[0052] 匹配类别:规范匹配接口的类别,即定位匹配、基础信息匹配、业务信息匹配。
[0053] 匹配范围:智能匹配引擎根据匹配类别判断能够对哪些数据项进行匹配,数据项 的范围以及针对该数据项的匹配方法为匹配范围。如定位匹配的匹配范围为公民身份号码 +姓名。
[0054] 匹配分值:系统对每一次匹配结果进行打分。
[0055] 单项阈值:对基础信息匹配时,针对每项匹配范围的匹配结果设定的阈值,为单项 阈值。
[0056] 综合阈值:对定位匹配时,针对匹配范围的每一个匹配数据项的匹配结果设定权 重,多个匹配数据项的匹配结果根据权重加权处理后,得到综合的分值,对这个综合分值设 定上下限,即为综合阈值。本期定位匹配的综合阈值为公民身份号码和姓名两个数据项的 整体阈值。
[0057] 图2是本发明一个实施例的智能匹配引擎匹配规则配置流程图,如图所示,匹配 规则定义步骤如下:
[0058] 第一步,输入"匹配类别";
[0059] 第二步,输入一组配置项包括"匹配范围"、"匹配分值"、"匹配方法"、"权重",可输 入多组,不可重复输入;
[0060] 第三步,输入"完全匹配阈值"、"相似匹配阈值"、"未匹配阈值";
[0061] 第四步,保存,生成匹配规则。
[0062] 图3为对应于图2实施例的新增智能匹配配置的界面图。
[0063] 为业务服务调用智能匹配引擎时配置匹配规则,首先通过选择"应用范围"(即应 用的业务服务),然后选择"匹配类别"(即某一类匹配规则)可多选,保存生成智能匹配规 则与业务服务的对应关系。
[0064] 相关数据如下表所示。
[0065]表 1

[0072] 表4智能匹配匹配规则表(ZNPP_PPGZ)
[0073]
[0074]

[0082] 2、智能匹配引擎
[0083] 智能匹配引擎提供三个调用接口,即定位匹配接口、基础信息匹配接口、业务信息 匹配接口。性能上采用多线程编程方式提高引擎的执行效率。
[0084] 2. 1匹配调度
[0085] 功能说明:匹配调度根据匹配类别调用匹配引擎提供的接口,生成智能匹配结果。
[0086] 匹配引擎接口定义如下:
[0087] 1、定位匹配接口
[0088] 输入参数:公民身份号码+姓名
[0089] 返回结果:人员ID、匹配值、匹配度代码和匹配原因代码。详见代码表。
[0090] 匹配规则说明:
[0091] 输入参数"公民身份号码"通过查询人口历史信息库中的公民身份号码变更信息 进行匹配;"姓名"通过查询人口历史信息库中的姓名变更信息或查询生僻字代码对照表进 行生僻字匹配。
[0092] 返回结果"人员ID"匹配成功时返回第一个匹配成功时对应的人员ID,匹配不成 功时不返回值;"匹配值"匹配成功时返回公民身份号码,匹配不成功时不返回值;"匹配 度"根据公民身份号码匹配分值、姓名匹配分值及相应的权重,计算加权总分,根据加权总 分落在阈值范围,判断匹配度,即为完全匹配、相似匹配或未匹配;"匹配原因代码"匹配成 功时返回公民身份号码变更匹配对应代码;匹配不成功时不返回值。
[0093] 分值、权重、阈值在智能匹配配置管理模块中可配置。
[0094] 例如,公民身份号码变更匹配权重为0. 6 ;姓名中生僻字匹配权重为0. 4。公民身 份号码变更匹配成功,分值可取100分;公民身份号码匹配不成功,得分为〇 ;姓名不再匹 配;定义为未匹配。
[0095] 2、基础信息匹配接口
[0096] 输入参数:公民身份号码、姓名、性别、民族、出生日期、出生地中的任意一项数据 项。
[0097] 返回结果项:匹配值、匹配度代码和匹配原因代码。详见代码表。
[0098] 匹配规则说明:根据每一项匹配结果分值落在的阈值范围,判断是匹配度,即为完 全匹配、相似匹配或未匹配。
[0099] 图4为本发明一个实施例的智能匹配引擎定位匹配流程图。
[0100] 相关数据如下。
[0101] 表 8
[0102]
[0106] 表10匹配度代码表
[0107] LomJ 信息项目变史匹Sd
[0112] 信息项目变更匹配:即对公民身份号码、姓名、性别、出生日期、民族、出生地(行 政区划区县级以上代码)等是否做过变更
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1