名单名称匹配方法及装置与流程

文档序号:37194321发布日期:2024-03-01 13:07阅读:20来源:国知局
名单名称匹配方法及装置与流程

本发明涉及大数据,尤其涉及名单名称匹配方法及装置。


背景技术:

1、本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、制裁合规风险是银行经营面临的首要合规风险,名单监控则是制裁合规管理的基础工作,而名称匹配算法是名单监控中最重要的核心功能。现在的名单监控中主要是根据名称匹配算法计算出来的相似度来确定是否产生告警,因此名称评分算法的准确性直接决定了名单监控系统的有效性。


技术实现思路

1、本发明实施例提供一种名单名称匹配方法,用以对待匹配的名称和金融名单中的名称进行相似度匹配,精度高,该方法包括:

2、对待匹配的名称和金融名单中的名称进行分词,得到两个名称的多个分词;

3、分别依据相似度匹配规则列表中每个相似度匹配规则,基于两个名称的多个分词,计算每个相似度匹配规则对应的两个名称中分词对的相似度;

4、根据每个相似度匹配规则对应的两个名称中分词对的相似度,确定两个名称对应的分词对列表;

5、根据分词对列表及每个分词的权重,计算两个名称的相似度。

6、本发明实施例还提供一种名单名称匹配装置,用以对待匹配的名称和金融名单中的名称进行相似度匹配,精度高,该装置包括:

7、分词模块,用于对待匹配的名称和金融名单中的名称进行分词,得到两个名称的多个分词;

8、分词对相似度计算模块,用于分别依据相似度匹配规则列表中每个相似度匹配规则,基于两个名称的多个分词,计算每个相似度匹配规则对应的两个名称中分词对的相似度;

9、分词对列表确定模块,用于根据每个相似度匹配规则对应的两个名称中分词对的相似度,确定两个名称对应的分词对列表;

10、名称相似度计算模块,用于根据分词对列表及每个分词的权重,计算两个名称的相似度。

11、本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述名单名称匹配方法。

12、本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述名单名称匹配方法。

13、本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述名单名称匹配方法。

14、本发明实施例中,对待匹配的名称和金融名单中的名称进行分词,得到两个名称的多个分词;分别依据相似度匹配规则列表中每个相似度匹配规则,基于两个名称的多个分词,计算每个相似度匹配规则对应的两个名称中分词对的相似度;根据每个相似度匹配规则对应的两个名称中分词对的相似度,确定两个名称对应的分词对列表;根据分词对列表及每个分词的权重,计算两个名称的相似度。与现有技术中匹配算法简单,无法适应复杂变形的技术方案相比,本发明实施例提供了多种分词匹配规则,适应复杂变形,并且在计算相似度的过程中确定两个名称对应的分词对列表,从而精确地计算名称间的相似度。



技术特征:

1.一种名单名称匹配方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,在得到每个名称的多个分词之后,还包括:

3.如权利要求1所述的方法,其特征在于,在计算每个相似度匹配规则对应的两个名称中分词对的相似度之前,还包括:

4.如权利要求1所述的方法,其特征在于,根据每个相似度匹配规则对应的两个名称中分词对的相似度,确定两个名称对应的分词对列表,包括:

5.如权利要求1所述的方法,其特征在于,相似度匹配规则包括精准匹配,模糊匹配,首字母缩写匹配,对私姓名昵称匹配,相似数字字母匹配,拼写不同但发音相同规则中的其中一种或任意组合。

6.如权利要求1所述的方法,其特征在于,在确定两个名称对应的分词对列表之后,还包括:

7.如权利要求1所述的方法,其特征在于,采用如下公式,根据分词对列表及每个分词的权重,计算两个名称的相似度:

8.如权利要求1所述的方法,其特征在于,还包括:

9.如权利要求8所述的方法,其特征在于,根据每个包含该分词的名称的数量和所有名称的数量,确定该分词的权重,包括:

10.如权利要求8所述的方法,其特征在于,还包括:

11.一种名单名称匹配装置,其特征在于,包括:

12.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10任一所述方法。

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至10任一所述方法。

14.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至10任一所述方法。


技术总结
本发明公开了一种名单名称匹配方法及装置,可用于大数据技术领域,该方法包括:对待匹配的名称和金融名单中的名称进行分词,得到两个名称的多个分词;分别依据相似度匹配规则列表中每个相似度匹配规则,基于两个名称的多个分词,计算每个相似度匹配规则对应的两个名称中分词对的相似度;根据每个相似度匹配规则对应的两个名称中分词对的相似度,确定两个名称对应的分词对列表;根据分词对列表及每个分词的权重,计算两个名称的相似度。本发明可以对待匹配的名称和金融名单中的名称进行相似度匹配,精度高。

技术研发人员:余孟泽,董震,陈云
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/2/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1