无分隔符名称匹配方法及装置与流程

文档序号:37125175发布日期:2024-02-22 21:35阅读:14来源:国知局
无分隔符名称匹配方法及装置与流程

本发明涉及大数据,尤其涉及无分隔符名称匹配方法及装置。


背景技术:

1、本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、现在的名单监控中主要是基于词的搜索,分词结果的准确性决定了最终筛查结果的准确性。目前现有银行交易系统中有些报文的栏位数据是客户自己输入的,为了规避客户可能会对原始的名称单词进行自由的切分组合,如swift报文中对每行的长度有限制,导致一个单词被拆分到两行存放。这些场景下,现有的分词拆分出来的单词跟名称实际的单词列表差距较大,基于词的搜索无法正确的从输入中筛查出名单名称。


技术实现思路

1、本发明实施例提供一种无分隔符名称匹配方法,用以解决基于词搜索的筛查系统在分词错误情况造成漏报的现象,该方法包括:

2、对金融名单中所有实体的所有名称进行分词,获得每个名称的单词列表;

3、将每个单词列表中所有单词拼接为一个匹配字符串;

4、根据多个匹配字符串及关联的实体信息,构建名称匹配自动机;

5、在获得待分析报文后,形成待分析字符串;

6、将待分析字符串输入至名称匹配自动机中进行匹配,获得实体列表;

7、从实体列表中剔除满足误命中判断条件的实体信息。

8、本发明实施例还提供一种无分隔符名称匹配装置,用以解决基于词搜索的筛查系统在分词错误情况造成漏报的现象,该装置包括:

9、分词模块,用于对金融名单中所有实体的所有名称进行分词,获得每个名称的单词列表;

10、字符串拼接模块,用于将每个单词列表中所有单词拼接为一个匹配字符串;

11、自动机构建模块,用于根据多个匹配字符串及关联的实体信息,构建名称匹配自动机;

12、字符串获得模块,用于在获得待分析报文后,形成待分析字符串;

13、匹配模块,用于将待分析字符串输入至名称匹配自动机中进行匹配,获得实体列表;

14、误命中剔除模块,用于从实体列表中剔除满足误命中判断条件的实体信息。

15、本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述无分隔符名称匹配方法。

16、本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述无分隔符名称匹配方法。

17、本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述无分隔符名称匹配方法。

18、本发明实施例中,对金融名单中所有实体的所有名称进行分词,获得每个名称的单词列表;将每个单词列表中所有单词拼接为一个匹配字符串;根据多个匹配字符串及关联的实体信息,构建名称匹配自动机;在获得待分析报文后,形成待分析字符串;将待分析字符串输入至名称匹配自动机中进行匹配,获得实体列表;从实体列表中剔除满足误命中判断条件的实体信息。本发明实施例通过对匹配字符串构建名称匹配自动机,再进行实体列表匹配,解决了以往基于词搜索的筛查系统在分词错误情况造成漏报的现象。



技术特征:

1.一种无分隔符名称匹配方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,在获得每个名称的单词列表之后,还包括:

3.如权利要求1所述的方法,其特征在于,根据多个匹配字符串及对应的实体信息,构建名称匹配自动机,包括:

4.如权利要求1所述的方法,其特征在于,所述实体信息至少包括实体标识,组合对象和名称内容;

5.如权利要求1所述的方法,其特征在于,在获得待分析报文后,形成待分析字符串,包括:

6.如权利要求1所述的方法,其特征在于,将待分析字符串输入至名称匹配自动机中进行匹配,获得实体列表,包括:

7.一种无分隔符名称匹配装置,其特征在于,包括:

8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。


技术总结
本发明公开了一种无分隔符名称匹配方法及装置,该方法包括:对金融名单中所有实体的所有名称进行分词,获得每个名称的单词列表;将每个单词列表中所有单词拼接为一个匹配字符串;根据多个匹配字符串及关联的实体信息,构建名称匹配自动机;在获得待分析报文后,形成待分析字符串;将待分析字符串输入至名称匹配自动机中进行匹配,获得实体列表;从实体列表中剔除满足误命中判断条件的实体信息。本发明可以解决基于词搜索的筛查系统在分词错误情况造成漏报的现象。

技术研发人员:余孟泽,陈云
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/2/21
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1