号码识别方法、装置、设备以及计算机可读存储介质与流程

文档序号:33320314发布日期:2023-03-03 20:04阅读:31来源:国知局
号码识别方法、装置、设备以及计算机可读存储介质与流程

[0001][0002]
本发明涉及计算机技术领域,尤其涉及一种号码识别方法、装置、设备以及计算机可读存储介质。


背景技术:

[0003]
随着运营商逐步完善的涉诈管控体系,在加大打击通信涉诈力度的同时,不可避免的是误判量也将随之提升,造成针对正常用户进行误处置的行为,对正常用户日常使用造成影响。目前运营商主要通过对涉案号码的分析以及业务人员经验开发涉诈模型,对涉诈号码的识别准确度较低,导致对用户号码进行处置准确度低。


技术实现要素:

[0004]
本发明的主要目的在于提供一种号码识别方法、装置、设备以及计算机可读存储介质,旨在解决如何提高涉诈号码的处理准确度的问题。
[0005]
为实现上述目的,本发明提供的一种号码识别方法,所述号码识别方法包括以下步骤:
[0006]
获取涉诈号码,提取所述涉诈号码的用户特征;
[0007]
将所述用户特征输入预设的概率预测模型,得到所述涉诈号码的复机概率;
[0008]
获取环境指标并根据所述环境指标确定策略等级;
[0009]
根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略。
[0010]
在一实施例中,所述获取环境指标并根据所述环境指标确定策略等级的步骤包括:
[0011]
获取所述环境指标,所述环境指标包括涉案指标、基础指标以及业务指标,所述涉案指标至少包括预设时长内的涉诈号码数量,所述基础指标至少包括数据覆盖量,所述业务指标至少包括漫游天数、终端切换次数和/或号码渠道;
[0012]
根据所述涉案指标、所述基础指标以及所述业务指标确定所述策略等级。
[0013]
在一实施例中,所述根据所述涉案指标、所述基础指标以及所述业务指标确定所述策略等级的步骤包括:
[0014]
根据所述涉案指标确定的识别策略的第一策略等级;
[0015]
若所述第一策略等级是预设等级,则将所述第一策略等级作为所述识别策略的策略等级;
[0016]
若所述第一策略等级不是预设等级,则根据所述基础指标与所述业务指标确定识别策略的第二策略等级,将所述第二策略等级作为所述识别策略的策略等级。
[0017]
在一实施例中,所述根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略的步骤包括:
[0018]
根据所述策略等级确定概率阈值;
[0019]
判断所述复机概率是否小于所述概率阈值;
[0020]
在所述涉诈号码的所述复机概率小于所述概率阈值时,关停所述涉诈号码、呼叫限制所述涉诈号码或者二次实名认证所述涉诈号码。
[0021]
在一实施例中,所述将所述用户特征输入预设的概率预测模型的步骤之前,还包括:
[0022]
获取训练样本,所述训练样本包括关停后复机号码以及关停后未复机号码;
[0023]
提取所述训练样本的目标用户特征;
[0024]
根据所述目标用户特征训练预设的神经网络模型;
[0025]
将收敛后的所述神经网络模型作为概率预测模型。
[0026]
在一实施例中,所述提取所述训练样本的目标用户特征的步骤包括:
[0027]
提取所述训练样本的待确定用户特征,所述待确定用户特征的数量大于所述目标用户特征的数量;
[0028]
根据预设算法确定待确定的用户特征的特征重要性以及信息价值iv值,所述特征重要性由随机森林算法确定;
[0029]
根据所述特征重要性以及所述信息价值在待确定的用户特征中确定目标用户特征。
[0030]
在一实施例中,所述获取涉诈号码的步骤包括:
[0031]
获取多个待识别的用户号码,并提取所述用户号码的特征;
[0032]
将所述用户号码的特征输入预设的号码识别模型,得到所述涉诈号码。
[0033]
为实现上述目的,本发明还提供一种号码识别装置,所述号码识别装置包括:
[0034]
获取模块,用于获取涉诈号码,提取所述涉诈号码的用户特征;
[0035]
预测模块,用于将所述用户特征输入预设的概率预测模型,得到所述涉诈号码的复机概率;
[0036]
确定模块,用于获取环境指标并根据所述环境指标确定策略等级;
[0037]
处理模块,用于根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略。
[0038]
为实现上述目的,本发明还提供一种号码识别设备,所述号码识别设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上执行的号码识别程序,所述号码识别程序被所述处理器执行时实现如上所述的号码识别方法的各个步骤。
[0039]
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有号码识别程序,所述号码识别程序被处理器执行时实现如上所述的号码识别方法的各个步骤。
[0040]
本发明提供的一种号码识别方法、装置、设备以及计算机可读存储介质,获取涉诈号码并提取涉诈号码的用户特征;将用户特征输入预设的概率预测模型,得到涉诈号码的复机概率;获取环境指标并根据环境指标确定策略等级;根据复机概率以及策略等级确定涉诈号码的处理策略。通过确定策略等级以及复机概率设置对涉诈号码处理策略,根据策略等级对不同的复机概率的涉诈号码进行处理,在策略等级较严峻时,概率预测模型预测得到的复机概率较高也会对涉诈号码进行处理,根据策略等级和预测得到的复机概率共同确定对涉诈号码的处理,提高了涉诈号码处理的准确度。
附图说明
[0041]
图1为本发明实施例涉及的号码识别设备的硬件结构示意图;
[0042]
图2为本发明号码识别方法的第一实施例的流程示意图;
[0043]
图3为本发明号码识别方法的第二实施例的步骤s30的细化流程示意图;
[0044]
图4为本发明号码识别方法的第三实施例的步骤s30的细化流程示意图;
[0045]
图5为本发明号码识别方法的第四实施例的流程示意图;
[0046]
图6为本发明号码识别装置的逻辑结构示意图。
[0047]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0048]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0049]
本发明实施例的主要解决方案是:获取涉诈号码并提取涉诈号码的用户特征;将用户特征输入预设的概率预测模型,得到涉诈号码的复机概率;获取环境指标并根据环境指标确定策略等级;根据复机概率以及策略等级确定涉诈号码的处理策略。
[0050]
通过确定策略等级以及复机概率设置对涉诈号码处理策略,根据策略等级对不同的复机概率的涉诈号码进行处理,在策略等级较严峻时,概率预测模型预测得到的复机概率较高也会对涉诈号码进行处理,根据策略等级和预测得到的复机概率共同确定对涉诈号码的处理,提高了涉诈号码处理的准确度。
[0051]
作为一种实现方案,号码识别设备可以如图1所示。
[0052]
本发明实施例方案涉及的是号码识别设备,号码识别设备包括:处理器 101,例如cpu,存储器102,通信总线103。其中,通信总线103用于实现这些组件之间的连接通信。
[0053]
存储器102可以是高速ram存储器,也可以是稳定的存储器 (non-volatilememory),例如磁盘存储器。如图1所示,作为一种计算机可读存储介质的存储器102中可以包括号码识别程序;而处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0054]
获取涉诈号码,提取所述涉诈号码的用户特征;
[0055]
将所述用户特征输入预设的概率预测模型,得到所述涉诈号码的复机概率;
[0056]
获取环境指标并根据所述环境指标确定策略等级;
[0057]
根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略。
[0058]
在一实施例中,处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0059]
获取所述环境指标,所述环境指标包括涉案指标、基础指标以及业务指标,所述涉案指标至少包括预设时长内的涉诈号码数量,所述基础指标至少包括数据覆盖量,所述业务指标至少包括漫游天数、终端切换次数和/或号码渠道;
[0060]
根据所述涉案指标、所述基础指标以及所述业务指标确定所述策略等级。
[0061]
在一实施例中,处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0062]
根据所述涉案指标确定的识别策略的第一策略等级;
[0063]
若所述第一策略等级是预设等级,则将所述第一策略等级作为所述识别策略的策
略等级;
[0064]
若所述第一策略等级不是预设等级,则根据所述基础指标与所述业务指标确定识别策略的第二策略等级,将所述第二策略等级作为所述识别策略的策略等级。
[0065]
在一实施例中,处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0066]
根据所述策略等级确定概率阈值;
[0067]
判断所述复机概率是否小于所述概率阈值;
[0068]
在所述涉诈号码的所述复机概率小于所述概率阈值时,关停所述涉诈号码、呼叫限制所述涉诈号码或者二次实名认证所述涉诈号码。
[0069]
在一实施例中,处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0070]
获取训练样本,所述训练样本包括关停后复机号码以及关停后未复机号码;
[0071]
提取所述训练样本的目标用户特征;
[0072]
根据所述目标用户特征训练预设的神经网络模型;
[0073]
将收敛后的所述神经网络模型作为概率预测模型。
[0074]
在一实施例中,处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0075]
提取所述训练样本的待确定用户特征,所述待确定用户特征的数量大于所述目标用户特征的数量;
[0076]
根据预设算法确定待确定的用户特征的特征重要性以及信息价值iv值,所述特征重要性由随机森林算法确定;
[0077]
根据所述特征重要性以及所述信息价值在待确定的用户特征中确定目标用户特征。
[0078]
在一实施例中,处理器101可以用于调用存储器102中存储的号码识别程序,并执行以下操作:
[0079]
获取多个待识别的用户号码,并提取所述用户号码的特征;
[0080]
将所述用户号码的特征输入预设的号码识别模型,得到所述涉诈号码。
[0081]
基于上述号码识别设备的硬件构架,提出本发明号码识别方法的实施例。
[0082]
参照图2,图2为本发明号码识别方法的第一实施例,所述号码识别方法包括以下步骤:
[0083]
步骤s10,获取涉诈号码,提取所述涉诈号码的用户特征;
[0084]
具体的,涉诈号码是模型识别或者人工筛选出涉及诈骗的用户号码,由于模型识别依赖于模型的训练数据的选取,或者人工筛选依赖于人工经验,因此模型识别和人工筛选都存在不准确的情况,导致筛选出来的涉诈号码可能是非涉诈号码。因此,需要对筛选出来的涉诈号码进行进一步的处理。
[0085]
提取涉诈号码的用户特征,其中,用户特征可以是涉诈号码对应的用户基础信息、通信行为、漫游行为以及消费行为等特征。获取涉诈号码可以是通过模型识别得到的,获取多个待识别的用户号码,并提取用户号码的特征;将用户号码的特征输入预设的号码识别模型,得到涉诈号码。其中,号码识别模型可以是依靠不同规则建立的识别模型,可以是通
信类规则的识别模型、渠道类规则的识别模型、业务类规则的识别模型、地域类规则的识别模型和/ 或终端类规则的识别模型。
[0086]
步骤s20,将所述用户特征输入预设的概率预测模型,得到所述涉诈号码的复机概率;
[0087]
具体的,将用户特征输入预设的概率预测模型,获取概率预测模型预测得到的涉诈号码的复机概率,其中,复机概率是将涉诈号码关停后,用户申请复机的概率。
[0088]
步骤s30,获取环境指标并根据所述环境指标确定策略等级;
[0089]
具体的,获取环境指标,环境指标可以包括一段时间内的涉诈号码的数量,策略等级可以分为多个等级,示例性的,可以将策略等级分为严峻模式、一般模式以及宽松模式。若每年3月的涉诈号码的数量是全年中最高的,则在每年3月时,将涉诈号码的策略等级设置为严峻模式;若每年11月的涉诈号码的数量是全年中最低的,则在每年11月时,将涉诈号码的策略等级设置为宽松模式。
[0090]
步骤s40,根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略。
[0091]
具体的,根据复机概率以及策略等级确定涉诈号码的处理策略,处理策略可以包括在涉诈号码的复机概率小于概率阈值时,确定涉诈号码为异常号码,对涉诈号码进行处理,处理方式可以是关停涉诈号码,呼叫限制或者进行二次实名认证。在涉诈号码的复机概率大于或者等于概率阈值时,确定涉诈号码为正常号码,其中,根据策略等级确定概率阈值。
[0092]
处理策略还可以包括根据策略等级确定准确率,根据准确率和复机概率确定涉诈号码。示例性的,当准确率为90%时,复机概率乘上准确率90%等于涉诈号码的最终的复机概率,根据最终的复机概率确定是否对涉诈号码进行处理,处理方式可以是关停涉诈号码,呼叫限制或者进行二次实名认证。
[0093]
在本实施例的技术方案中,获取涉诈号码并提取涉诈号码的用户特征;将用户特征输入预设的概率预测模型,得到涉诈号码的复机概率;获取环境指标并根据环境指标确定策略等级;根据复机概率以及策略等级确定涉诈号码的处理策略。通过确定策略等级以及复机概率设置对涉诈号码处理策略,根据策略等级对不同的复机概率的涉诈号码进行处理,在策略等级较严峻时,概率预测模型预测得到的复机概率较高也会对涉诈号码进行处理,根据策略等级和预测得到的复机概率共同确定对涉诈号码的处理,提高了涉诈号码处理的准确度。
[0094]
参照图3,图3为本发明号码识别方法的第二实施例,基于第一实施例,所述步骤s30包括:
[0095]
步骤s31,获取所述环境指标,所述环境指标包括涉案指标、基础指标以及业务指标,所述涉案指标至少包括预设时长内的涉诈号码数量,所述基础指标至少包括数据覆盖量,所述业务指标至少包括漫游天数、终端切换次数和/或号码渠道;
[0096]
步骤s32,根据所述涉案指标、所述基础指标以及所述业务指标确定所述策略等级。
[0097]
具体的,环境指标表示当前网络环境的涉诈号码的数据,环境指标包括涉案指标、基础指标以及业务指标。其中,涉案指标至少包括预设时长内的涉诈号码数量,例如相关部门通报的涉诈号码以及举报的涉诈号码。基础指标至少包括数据覆盖量,相关部门通报的
涉诈号码以及举报的涉诈号码为依据,确定涉诈号码与模型识别的覆盖度、时效性或者涉诈号码涉案案件类型统计等,并统计各时间周期同比、环比、均值等,例如近7日涉案举报通报的涉诈号码环比指标。业务指标至少包括漫游天数、终端切换次数和/或号码渠道;还可以包括业务使用情况,例如本月沉默天数、地域情况,例如本月省外漫游天数、通信情况,例如近3日非亲情网主叫次数、渠道情况,例如线上渠道放号标识、终端类情况,例如本月终端切换次数,并统计各时间周期同比、环比、均值等,例如非亲情网主叫次数环比指标。
[0098]
根据涉案指标、基础指标以及业务指标确定策略等级,可以是根据涉案指标、基础指标以及业务指标共同确定策略等级。
[0099]
还可以是根据涉案指标确定的识别策略的第一策略等级;若第一策略等级是预设等级,则将第一策略等级作为识别策略的策略等级;若第一策略等级不是预设等级,则根据基础指标与业务指标确定识别策略的第二策略等级,将第二策略等级作为所述识别策略的策略等级。
[0100]
在本实施例的技术方案中,获取环境指标,环境指标包括涉案指标、基础指标以及业务指标,根据涉案指标、基础指标以及业务指标确定策略等级。根据环境指标确定对涉诈号码的处理策略,根据策略等级对不同的复机概率的涉诈号码进行处理,提高了涉诈号码处理的准确性。
[0101]
参照图4,图4为本发明号码识别方法的第三实施例,基于第一或第二实施例,所述步骤s30包括:
[0102]
步骤s33,根据所述策略等级确定概率阈值;
[0103]
步骤s34,判断所述复机概率是否小于所述概率阈值;
[0104]
步骤s35,在所述涉诈号码的所述复机概率小于所述概率阈值时,关停所述涉诈号码、呼叫限制所述涉诈号码或者二次实名认证所述涉诈号码。
[0105]
具体的,在涉诈号码的复机概率小于概率阈值时,确定涉诈号码为异常号码,对涉诈号码进行关停、呼叫限制或者二次实名认证等处理。在涉诈号码的复机概率大于或者等于概率阈值时,确定涉诈号码为正常号码,不对涉诈号码进行处理,其中概率阈值由策略等级确定。不同地区对应的策略等级可能不同,在涉诈概率较高的地区,策略等级为严峻模式,在涉诈概率较低的地区,策略等级为宽松模式,在涉诈概率一般的地区,策略等级为一般模式。
[0106]
示例性的,涉诈号码的预测复机概率和实际复机率如下表所示:
[0107][0108]
由上述表格可知,随着涉诈概率值的提升,涉诈号码的预测复机率和实际复机率逐步降低。
[0109]
示例性的,当策略等级为严峻模式时,概率阈值为0.9,当涉诈号码的复机概率小于0.9时,确定涉诈号码为异常号码,对涉诈号码进行关停、呼叫限制或者二次实名认证等处理。在涉诈号码的复机概率大于或者等于0.9时,确定涉诈号码为正常号码。当策略等级为一般模式时,概率阈值为0.5,当涉诈号码的复机概率小于0.5时,确定涉诈号码为异常号码,对涉诈号码进行关停、呼叫限制或者二次实名认证等处理。在涉诈号码的复机概率大于或者等于0.5 时,确定涉诈号码为正常号码。当策略等级为宽松模式时,概率阈值为0.1,当涉诈号码的复机概率小于0.1时,确定涉诈号码为异常号码,对涉诈号码进行关停、呼叫限制或者二次实名认证等处理。在涉诈号码的复机概率大于或者等于0.1时,确定涉诈号码为正常号码。
[0110]
在本实施例的技术方案中,在涉诈号码的复机概率小于概率阈值时,确定涉诈号码为异常号码;在涉诈号码的复机概率大于或者等于概率阈值时,确定涉诈号码为正常号码,其中,根据策略等级确定概率阈值。根据策略等级对不同的复机概率的涉诈号码进行处理,提高了不同时间或者地区等情况下涉诈号码处理的准确性。
[0111]
参照图5,图5为本发明号码识别方法的第四实施例,基于第一至第三中任一实施例,所述步骤s20之前,还包括:
[0112]
步骤s50,获取训练样本,所述训练样本包括关停后复机号码以及关停后未复机号码;
[0113]
步骤s60,提取所述训练样本的目标用户特征;
[0114]
步骤s70,根据所述目标用户特征训练预设的神经网络模型;
[0115]
步骤s80,将收敛后的所述神经网络模型作为概率预测模型。
[0116]
具体的,获取训练样本,训练样本包括关停后复机的号码以及关停后未复机的号码。提取训练样本的目标用户特征,根据目标用户特征训练预设的神经网络模型,将收敛后的神经网络模型作为概率预测模型。
[0117]
提取训练样本的目标用户特征,可以先提取训练样本的待确定用户特征,待确定用户特征的数量大于目标用户特征的数量;根据预设算法确定待确定的用户特征的特征重要性以及信息价值iv值,其中,特征重要性由随机森林算法确定;根据特征重要性以及信息价值在待确定的用户特征中确定目标用户特征。
[0118]
采用机器学习中性能较好的xgboost模型来对疑似涉诈号码关停处置后的复机概率进行预测。xgboost算法是以决策树为基础的一种梯度提升算法,在算法适用性、运行效率和鲁棒性等方面均有所提升。xgboost算法通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。最终的总分类器由每轮训练得到的弱分类器加权求和得到。xgboost算法主要流程如下:
[0119]
设作为输入的训练样本为i={(x1,y1),(x2,y2),...,(xm,ym)},样本标签为 yi(i=1,2,...,m)。最大迭代次数为t,损失函数为l,正则化系数为λ,γ,弱学习器为h(x),输出为强学习器f(x)。对于第t轮迭代,损失函数为:
[0120][0121]
其中,f
t-1
(xi)为t-1轮训练输出的强学习器,hi(xi)为t轮训练的弱学习器,j是第t棵决策树叶子节点的个数,ω
ij
是第j个叶子节点的最优值。对第t轮迭代,有:
[0122]
计算第i个样本,其中,i=1,2,...,m;在当前轮损失函数l
t
基于f
t-1
(xi)的一阶导数g
ii
,二阶导数h
ii
。计算所有样本的一阶导数和、二阶导数和:
[0123][0124]
基于当前节点尝试分裂决策树,默认分数score=0,g
t
和h
t
为当前需要分裂的节点的一阶二阶导数之和。设当前节点左右子树的一阶、二阶导数和为 g
t
、h
t
、gr和hr,样本特征总数为n,对于第k个样本特征rk(k=1,2,...,n):
[0125]gl
=0,h
l
=0
[0126]
将样本按rk排序,依次计算第i个样本的左右子树的一、二阶导数和:g
l
=g
l
+g
ti
,gr=g-g
l
[0127]hl
=h
l
+h
ti
,hr=h-h
l
[0128]
更新score值:
[0129][0130]
基于最大score值对应的划分特征和特征值对子树进行分裂。如果最大 score值为0,则当前决策树建立完毕,计算所有叶子区域的ω
ij
,得到弱学习器hi(x),更新强学习器fi(x),进入下一轮弱学习器迭代。如果最大score值不等于0,则继续尝试分裂决策树。
[0131]
不同的号码识别模型对应一个概率预测模型,概率预测模型由号码识别模型对应的数据类型的训练样本训练得到,示例性的,通信类规则的识别模型对应通信类规则的概率预测模型、渠道类规则的识别模型对应渠道类规则的概率预测模型、业务类规则的识别模型对应业务类规则的概率预测模型、地域类规则的识别模型对应地域类规则的概率预测
模型,和/或,终端类规则的识别模型对应终端类规则的概率预测模型。
[0132]
在本实施例的技术方案中,获取训练样本,提取训练样本的目标用户特征;根据目标用户特征训练预设的神经网络模型;将收敛后的神经网络模型作为概率预测模型。通过训练得到的概率预测模型对涉诈号码的复机概率进行预测,提高了涉诈号码处理的效率。
[0133]
参照图6,本发明还提供一种号码识别装置,所述号码识别装置包括:
[0134]
获取模块100,用于获取涉诈号码,提取所述涉诈号码的用户特征;
[0135]
预测模块200,用于将所述用户特征输入预设的概率预测模型,得到所述涉诈号码的复机概率;
[0136]
确定模块300,用于获取环境指标并根据所述环境指标确定策略等级;
[0137]
处理模块400,用于根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略。
[0138]
在一实施例中,在获取环境指标并根据所述环境指标确定策略等级方面,所述确定模块300具体用于:
[0139]
获取所述环境指标,所述环境指标包括涉案指标、基础指标以及业务指标,所述涉案指标至少包括预设时长内的涉诈号码数量,所述基础指标至少包括数据覆盖量,所述业务指标至少包括漫游天数、终端切换次数和/或号码渠道;
[0140]
根据所述涉案指标、所述基础指标以及所述业务指标确定所述策略等级。
[0141]
在一实施例中,在根据所述涉案指标、所述基础指标以及所述业务指标确定所述策略等级方面,所述确定模块300具体用于:
[0142]
根据所述涉案指标确定的识别策略的第一策略等级;
[0143]
若所述第一策略等级是预设等级,则将所述第一策略等级作为所述识别策略的策略等级;
[0144]
若所述第一策略等级不是预设等级,则根据所述基础指标与所述业务指标确定识别策略的第二策略等级,将所述第二策略等级作为所述识别策略的策略等级。
[0145]
在一实施例中,在根据所述复机概率以及所述策略等级确定所述涉诈号码的处理策略方面,所述处理模块400具体用于:
[0146]
根据所述策略等级确定概率阈值;
[0147]
判断所述复机概率是否小于所述概率阈值;
[0148]
在所述涉诈号码的所述复机概率小于所述概率阈值时,关停所述涉诈号码、呼叫限制所述涉诈号码或者二次实名认证所述涉诈号码。
[0149]
在一实施例中,在将所述用户特征输入预设的概率预测模型之前,所述预测模块200具体用于:
[0150]
获取训练样本,所述训练样本包括关停后复机号码以及关停后未复机号码;
[0151]
提取所述训练样本的目标用户特征;
[0152]
根据所述目标用户特征训练预设的神经网络模型;
[0153]
将收敛后的所述神经网络模型作为概率预测模型。
[0154]
在一实施例中,在提取所述训练样本的目标用户特征方面,所述预测模块200具体用于:
[0155]
提取所述训练样本的待确定用户特征,所述待确定用户特征的数量大于所述目标
用户特征的数量;
[0156]
根据预设算法确定待确定的用户特征的特征重要性以及信息价值iv值,所述特征重要性由随机森林算法确定;
[0157]
根据所述特征重要性以及所述信息价值在待确定的用户特征中确定目标用户特征。
[0158]
在一实施例中,在获取涉诈号码方面,所述获取模块100用于:
[0159]
获取多个待识别的用户号码,并提取所述用户号码的特征;
[0160]
将所述用户号码的特征输入预设的号码识别模型,得到所述涉诈号码。
[0161]
本发明还提供一种号码识别设备,所述号码识别设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上执行的号码识别程序,所述号码识别程序被所述处理器执行时实现如上实施例所述的号码识别方法的各个步骤。
[0162]
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有号码识别程序,所述号码识别程序被处理器执行时实现如上实施例所述的号码识别方法的各个步骤。
[0163]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0164]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、系统、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、系统、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、系统、物品或者装置中还存在另外的相同要素。
[0165]
通过以上的实施方式的描述,本邻域的技术人员可以清楚地了解到上述实施例系统可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如 rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,停车管理设备,空调器,或者网络设备等)执行本发明各个实施例所述的系统。
[0166]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术邻域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1