一种报文名单检索拦截算法

文档序号:8342739阅读:502来源:国知局
一种报文名单检索拦截算法
【技术领域】
[0001] 本发明涉及报文拦截领域,尤指一种报文名单检索拦截算法。
【背景技术】
[0002] 传统的黑名单检索算法存在一些弊端,针对不同语种,单词长短,单词拼接,处理 结果差异较大。不能针对具体名单、报文场次做不同权重设置,误中率较高。且对于SWIFT 报文缺乏灵活的拦截规则配置功能。
[0003] 目前通常的名单匹配算法,是通过计算报文单词与名单单词匹配的百分比来计算 报文权重,将匹配结果达到一定百分比(例如:80% )的报文做命中拦截处理。报文中与名 单单词百分百相同的单词才会参与权重计算,例如:报文里有单词Bin,名单里有单词Ben, 则报文单词Bin不参与权重计算。目前部分银行,以及中行B0C2000、反洗钱监测与分析系 统亚太实例均采用上述名单匹配算法。
[0004] 上述的现有算法是通过单词做精确匹配,与名单里名称相似的报文单词并不参与 计算。当报文信息中由于某些原有,单词以不同顺序排列或连接在一起,将导致不命中,存 在误放危险。另外,对于特定场次本身不会录入名称信息,即使与名单匹配上了也无实际意 义。原有算法无法针对特定场次设置不同权重,以至于无法避免此类报文的误中。

【发明内容】

[0005] 本发明目的在于解决上述无法针对特定场次设置不同权重,以至于无法避免此类 报文的误中这一问题。
[0006] 为达上述目的,本发明提供一种报文名单检索拦截算法,所述拦截算法包含:获取 待检测报文名单,对所述待检测报文名单进行分析,获得复数个报文单词;通过莱温斯坦因 算法将所述复数个报文单词与预先制定的关键词名单中的关键词进行比对处理,根据所述 比对结果获得所述待检测报文名单的报文得分;当所述报文得分高于一阀值时,拦截所述 待检测报文。
[0007] 在上述拦截算法中,所述比对处理包含:通过莱温斯坦因算法判断所述报文单词 与所述关键词相似度,根据所述相似度赋予所述报文单词不同分值,所述报文单词根据对 应的关键词获得分值。
[0008] 在上述拦截算法中,所述预先制定的关键词名单包含:根据所述待检测报文名单 类别,设定对应关键词,将所述关键词整合为所述预先制定的关键词名单。
[0009] 在上述拦截算法中,所述拦截算法还包含:将所述报文单词与预先规定的特定单 词进行比对,当所述报文单词与所述特定单词相同时,拦截所述待检测报文。
[0010] 在上述拦截算法中,所述报文得分包含:所述报文单词对比处理后的总分值、场次 权重、预先制定的关键词权重二者的乘积。
[0011] 在上述拦截算法中,所述场次权重包含:根据拦截场次,设定每一场拦截场次的权 重值。
[0012] 在上述拦截算法中,所述预先制定的关键词名单权重包含:根据预先制定的关键 词名单风险程度,设定每一个预先制定的关键词名单的权重值。
[0013] 在上述拦截算法中,所述拦截算法还包含:通过SWIFT拦截规则配置,将特定场次 的所述待检测报文名单与SWIFT拦截规则作比对,拦截不符合SWIFT拦截规则的所述待检 测报文名单。
[0014] 在上述拦截算法中,对所述待检测报文名单进行分析包含:将所述待检测报文名 单中的标点、特殊符号替换成空格,以空格作为分隔符,将所述待检测报文名单拆解成复数 个待检查的报文单词。
[0015] 本发明的有益技术效果在于:通过本发明所提供的拦截算法,采用分值计算方式, 每命中一个单词计为1分,与名单单词相似的报文单词则通过莱温斯坦因算法计算小数得 分。每个名单可以设置不同的权重,每个报文场次也可以设置不同权重。最后报文得分等于 所有场次报文的最大得分,每个场次最大得分等于报文单词(精确得分+模糊匹配得分)* 场次权重*名单权重。另外针对特定高风险单词,系统会对全报文做匹配,无论出现在报文 的何处,报文都会被命中拦截。最后,通过SWIFT拦截规则配置,可以将特定场次输入内容 与SWIFT规范不符的报文做拦截。
【附图说明】
[0016] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不 构成对本发明的限定。在附图中:
[0017] 图1为本发明所提供的报文名单检索拦截算法的流程图。
【具体实施方式】
[0018] 为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合实施例和附 图,对本发明做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明, 但并不作为对本发明的限定。
[0019] 请参考图1所示,图1为本发明所提供的报文名单检索拦截算法的流程图,其中包 含:步骤S101获取待检测报文名单,对所述待检测报文名单进行分析,获得复数个报文单 词;步骤S102通过莱温斯坦因算法将所述复数个报文单词与预先制定的关键词名单中的 关键词进行比对处理,根据所述比对结果获得所述待检测报文名单的报文得分;步骤S103 当所述报文得分高于一阀值时,拦截所述待检测报文。
[0020] 在上述拦截算法中,对所述待检测报文名单进行分析包含:将所述待检测报文名 单中的标点、特殊符号替换成空格,以空格作为分隔符,将所述待检测报文名单拆解成复数 个待检查的报文单词。
[0021] 在上述拦截算法的步骤S102中,所述比对处理还包含:通过莱温斯坦因算法判断 所述报文单词与所述关键词相似度,根据所述相似度赋予所述报文单词不同分值,所述报 文单词根据对应的关键词获得分值。在该实施例中,根据关键词与其对应的报文单词的相 似程度,对该报文单词赋予不同分值,如当前报文单词为bin,而关键词为ben,此时,根据 莱温斯坦因算法对该报文单词bin赋予一个小数分值,用于后期比较结果的计算,以此通 过该分值的方式克服现有技术中采用百分比拦截中无法准确拦截不合规的报文。
[0022] 在上述实施例中,将莱温斯坦因算法用在针对每个报文单词与名单单词做相似度 模糊匹配得分计算的方式如下:
[0023] D(A,B),表示单词A和B之间的Levenshtein距离
[0024] -例:D(PETER,PATER) =ID(MIKE,MICKEY) = 2D(LINDA,LINDA) = 0
[0025] L(A,B),表示单词A和B中较小的长度
[0026] -例:L(KING,QUEEN) = 4
[0027] int(num),表示大于或等于num的最小整数,也就是向上取整
[0028] -例:int(l. 2) = 2
[0029] M(A,B),表示单词A和B的模糊匹配率,也就是:
【主权项】
1. 一种报文名单检索拦截算法,其特征在于,所述拦截算法包含: 获取待检测报文名单,对所述待检测报文名单进行分析,获得复数个报文单词; 通过莱温斯坦因算法将所述复数个报文单词与预先制定的关键词名单中的关键词进 行比对处理,根据所述比对结果获得所述待检测报文名单的报文得分; 当所述报文得分高于一阀值时,拦截所述待检测报文。
2. 根据权利要求1所述的报文名单检索拦截算法,其特征在于,所述比对处理包含:通 过莱温斯坦因算法判断所述报文单词与所述关键词相似度,根据所述相似度赋予所述报文 单词不同分值,所述报文单词根据对应的关键词获得分值。
3. 根据权利要求1所述的报文名单检索拦截算法,其特征在于,所述预先制定的关键 词名单包含;根据所述待检测报文名单类别,设定对应关键词,将所述关键词整合为所述预 先制定的关键词名单。
4. 根据权利要求1所述的报文名单检索拦截算法,其特征在于,所述拦截算法还包含: 将所述报文单词与预先规定的特定单词进行比对,当所述报文单词与所述特定单词相同 时,拦截所述待检测报文。
5. 根据权利要求1所述的报文名单检索拦截算法,其特征在于,所述报文得分包含:所 述报文单词对比处理后的总分值、场次权重、预先制定的关键词权重=者的乘积。
6. 根据权利要求5所述的报文名单检索拦截算法,其特征在于,所述场次权重包含:根 据拦截场次,设定每一场拦截场次的权重值。
7. 根据权利要求5所述的报文名单检索拦截算法,其特征在于,所述预先制定的关键 词名单权重包含:根据预先制定的关键词名单风险程度,设定每一个预先制定的关键词名 单的权重值。
8. 根据权利要求1-7中任一项所述的报文名单检索拦截算法,其特征在于,所述拦截 算法还包含;通过SWIFT拦截规则配置,将特定场次的所述待检测报文名单与SWIFT拦截规 则作比对,拦截不符合SWIFT拦截规则的所述待检测报文名单。
9. 根据权利要求1所述的报文名单检索拦截算法,其特征在于,对所述待检测报文名 单进行分析包含;将所述待检测报文名单中的标点、特殊符号替换成空格,W空格作为分隔 符,将所述待检测报文名单拆解成复数个待检查的报文单词。
【专利摘要】本发明提供了一种报文名单检索拦截算法,所述拦截算法包含:获取待检测报文名单,对所述待检测报文名单进行分析,获得复数个报文单词;通过莱温斯坦因算法将所述复数个报文单词与预先制定的关键词名单中的关键词进行比对处理,根据所述比对结果获得所述待检测报文名单的报文得分;当所述报文得分高于一阀值时,拦截所述待检测报文。通过本发明所提供的拦截算法,采用分值计算方式,通过莱温斯坦因算法计算相似关键词得分,对每个名单设置不同的权重,每个报文场次也设置不同权重;以最终结果确定是否拦截报文,不仅减少了传统拦截算法的误中率,而且还灵活多变大大增加了对不合规报文的命中率。
【IPC分类】H04L29-06
【公开号】CN104660608
【申请号】CN201510100426
【发明人】戴准宇, 汪盛, 金鼎立, 李宏声
【申请人】中国银行股份有限公司
【公开日】2015年5月27日
【申请日】2015年3月6日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1