异常通信号码的识别方法、装置、存储介质及电子设备与流程

文档序号:33941549发布日期:2023-04-26 01:54阅读:60来源:国知局
异常通信号码的识别方法、装置、存储介质及电子设备与流程

本技术涉及人工智能,特别涉及一种异常通信号码的识别方法、异常通信号码的识别系统、计算机存储介质及电子设备。


背景技术:

1、目前社会上频发电信诈骗案件,电信诈骗不但使受害者蒙受财产甚至人身损失,而且会损害社会信任环境、破坏社会和谐稳定。

2、在预防和打击电信诈骗中,电信运营商积极参与,维护正常电信秩序,保障社会公众的正当权益;目前该领域对电信诈骗的预防和识别上没有较为完备的智能系统与方案,因此亟需创新研究一种异常通信号码的识别方法,以将识别到的异常通信号码提供给相关部门做关停等处理,从而可以有效预防电信诈骗案件发生,营造有效遏制电信诈骗的法制环境,同时在降低用户投诉率上也将起到至关重要的作用。

3、需要说明的是,上述背景技术部分公开的信息仅用于加强对本技术的背景的理解。


技术实现思路

1、本技术的目的在于提供一种异常通信号码的识别方法、异常通信号码的识别系统、计算机存储介质及电子设备,进而至少在一定程度上提高对异常通信号码的检测准确率。

2、本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。

3、根据本技术的第一方面,提供一种异常通信号码的识别方法,包括:

4、获取与目标特征对应的多组通信数据,对所述通信数据进行预处理以生成数据宽表,其中各组所述通信数据对应不同的通信号码;对所述数据宽表中的通信数据进行标准化处理,并将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分;获取与所述目标特征中的关键特征所对应的目标通信数据,将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所述通信号码进行分类,以输出与各所述通信号码对应的分类信息。

5、根据本技术的第二方面,提供一种异常通信号码的识别装置,包括:

6、宽表生成模块,用于获取与目标特征对应的多组通信数据,对所述通信数据进行预处理以生成数据宽表,其中各组所述通信数据对应不同的通信号码;评分模块,用于对所述数据宽表中的通信数据进行标准化处理,并将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分;分类模块,用于获取与所述目标特征中的关键特征所对应的目标通信数据,将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所述通信号码进行分类,以输出与各所述通信号码对应的分类信息。

7、在本技术的一个实施例中,所述宽表生成模块配置为:对所述用户特征数据进行数据清洗和数据整合,以生成所述数据宽表,其中,所述数据清洗是进行异常值处理和缺失值处理,所述数据整合是将不同途径获取的相同特征对应的数据进行整合。

8、在本技术的一个实施例中,所述评分模块配置为:

9、当所述通信数据的值越大,所述通信号码为异常号码的概率越大时,根据公式(1)进行所述标准化处理:

10、

11、当所述通信数据的值越大,所述通信号码为异常号码的概率越小时,根据公式(2)进行所述标准化处理:

12、

13、其中,xij为第i个通信号码对应第j个特征的通信数据,xij*为对xij进行标准化处理后得到的数据,min(xj)为所有通信号码对应的第j个特征中的最小通信数据,max(xj)为所有通信号码对应的第j个特征中的最大通信数据。

14、在本技术的一个实施例中,所述目标特征包括多个特征;所述评分模块配置为:获取与各所述特征对应的熵权值,将与各所述特征对应的熵权值和标准化处理后的通信数据相乘,以获取与各所述特征对应的子评分;将所有所述特征对应的所述子评分相加,以获取所述异常评分。

15、在本技术的一个实施例中,所述关键特征为呼出离散度和拒接次数;所述分类模块包括:输入单元,用于将与各所述通信号码对应且特征为呼出离散度和拒接次数的目标通信数据以及与各所述通信号码对应的异常评分输入至所述分类模型;分类单元,用于通过所述分类模型根据预设规则对所述目标通信数据和所述异常评分进行处理,以获取与各所述通信号码对应的分类信息;其中,所述预设规则是根据异常评分、呼出离散度和拒接次数所确定的规则。

16、在本技术的示例性实施例中,所述分类模型为决策树模型或者随机森林模型;所述预设规则包括第一规则、第二规则和第三规则,所述第一规则的表达式为:异常评分>异常评分阈值and呼出离散度>第一呼出离散度阈值and拒接次数>第一拒接次数阈值,所述第二规则的表达式为:异常评分>异常评分阈值and呼出离散度∈呼出离散度区间and拒接次数>第二拒接次数阈值,所述第三规则的表达式为:异常评分>异常评分阈值and呼出离散度<第二呼出离散度阈值and拒接次数>第二拒接次数阈值,其中,所述第一呼出离散度阈值不同于所述第二呼出离散度阈值,所述第一拒接次数阈值不同于所述第二拒接次数阈值。

17、在本技术的示例性实施例中,所述分类单元配置为:当所述目标通信数据和所述异常评分满足所述第一规则时,判定所述通信号码为欺诈骚扰号码;当所述目标通信数据和所述异常评分满足所述第二规则时,判定所述通信号码为具有异常行为的通信号码;当所述目标通信数据和所述异常评分满足所述第三规则时,判定所述通信号码为定向骚扰号码。

18、在本技术的示例性实施例中,当所述通信号码为欺诈骚扰号码时,所述异常通信号码的识别装置还配置为:对所述欺诈骚扰号码对应的异常评分进行百分制转换,以获取与所述异常评分对应的百分制数值;将所述百分制数值与第一阈值和第二阈值进行比较;当所述百分制数值大于或等于所述第一阈值时,将所述通信号码标记为高度疑似欺诈骚扰号码;当所述百分制数值大于或等于所述第二阈值且小于所述第一阈值时,将所述通信号码标记为中度疑似欺诈骚扰号码;当所述百分制数值小于所述第二阈值时,将所述通信号码标记为低度疑似欺诈骚扰号码。

19、在本技术的示例性实施例中,所述异常通信号码的识别装置还配置为:在将标准化处理后的所述通信数据输入至熵权法模型之前,获取与标记为欺诈骚扰号码的通信号码对应且与所述目标特征对应的通信数据样本;对所述通信数据样本进行预处理和标准化处理,以获取目标通信数据样本;根据所述目标通信数据样本确定第i个欺诈骚扰号码对应第j个目标特征的特征比重;根据所述特征比重确定所述第i个欺诈骚扰号码对应第j个目标特征的熵值;根据所述熵值确定所述第i个欺诈骚扰号码对应第j个目标特征的差异系数;根据所述差异系数确定所述第i个欺诈骚扰号码对应第j个目标特征的熵权值;其中,i、j均为正整数。

20、在本技术的示例性实施例中,所述异常通信号码的识别装置还配置为:在获取多组与目标特征对应的通信数据之前,获取对应多维特征的通信数据,对所述通信数据进行预处理,以生成数据宽表;对所述数据宽表中各维度的特征进行相关性分析,以获取所述目标特征;其中,所述对应多维特征的通信数据包括标记为欺诈骚扰号码的通信号码所对应的通信数据和标记为非欺诈骚扰号码的通信号码所对应的通信数据。

21、根据本技术的第三方面,提供一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的异常通信号码的识别方法。

22、根据本技术的第四方面,提供一种电子设备,其特征在于,包括:

23、处理器;以及

24、存储器,用于存储所述处理器的可执行指令;

25、其中,所述处理器配置为经由执行所述可执行指令来执行上述的异常通信号码的识别方法。

26、由上述技术方案可知,本技术示例性实施例中的异常通信号码的识别方法、异常通信号码的识别装置、计算机存储介质及电子设备至少具备以下优点和积极效果:

27、本技术中的异常通信号码的识别方法,获取多组与目标特征对应的通信数据,对通信数据进行预处理以生成数据宽表,其中各组通信数据对应不同的通信号码;接着对数据宽表中的通信数据进行标准化处理,并将标准化处理后的通信数据输入至熵权法模型,通过熵权法模型根据不同特征对应的熵权值确定与各通信号码对应的异常评分;然后获取与目标特征中的关键特征所对应的目标通信数据,将与各通信号码对应的目标通信数据和异常评分输入至分类模型,通过分类模型对各通信号码进行分类,以输出与各通信号码对应的分类信息。本技术中的异常通信号码的识别方法,通过熵权法模型能够准确计算通信号码的异常评分,进而通过分类模型能够根据预设规则对通信号码进行精准分类,提高了异常通信号码的识别准确性。

28、本技术应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1