模型训练方法、装置及电子设备与流程

文档序号:35336954发布日期:2023-09-07 00:06阅读:68来源:国知局
模型训练方法、装置及电子设备与流程

本申请涉及数据识别领域,具体而言,涉及一种模型训练方法、装置及电子设备。


背景技术:

1、通讯信息骚扰诈骗治理是一项系统性工程,具有长期性、反复性和复杂性等特点,骚扰诈骗分子利用技术漏洞、管理缺位以及用户防范意识薄弱实施诈骗,给治理工作带来严峻挑战。

2、目前互联网安全公司提供的手机管家能够提供来电标签提醒,但这类方式准确率较低,且不能阻断电话呼入,也不能阻止电话接听和后续可能发生的受诈行为,且该类软件部署本身存在数据安全风险等问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种模型训练方法、装置及电子设备,以至少解决相关技术中基于手机管家提供的来电标签提醒进行诈骗电话识别造成的识别准确率较低,安全性较差的技术问题。

2、根据本申请实施例的一个方面,提供了一种模型训练方法,包括:获取运营商网元操作域对应的第一历史话单数据,以及运营商计算域对应的第二历史话单数据;从第一历史话单数据与第二历史话单数据中获取符合超短呼叫行为的信令特征以及通话行为特征;根据信令特征与通话行为特征对机器学习模型进行训练,得到目标机器学习模型,其中,机器学习模型用于对目标号码对应的目标话单进行识别,确定目标号码是否为疑似诈骗号码。

3、可选地,在得到目标机器学习模型之后,方法还包括:获取待分析的目标号码,基于机器学习模型对目标号码对应的目标话单进行分析,确定目标号码是否为疑似诈骗号码。

4、可选地,在基于机器学习模型对目标号码对应的目标话单进行分析之前,包括:确定目标话单的通话属性,其中,通话属性包括:本地属性或外呼属性,其中,本地属性对应的本地呼叫次数大于外呼属性对应的本次呼叫次数;根据通话属性确定是否对目标机器学习模型进行更新,其中,在确定对目标机器学习模型进行更新的情况下,调整目标机器学习模型在训练过程中,第一历史话单数据对应的第一信令特征、第一通话行为特征所占的第一权重,以及第二历史话单数据对应的第二信令特征、第二通话行为特征所占的第二权重;采用调整后的第一信令特征、第一通话行为特征所占的第一权重,以及调整后的第二信令特征、第二通话行为特征所占的第二权重对目标机器学习模型进行训练,得到新的目标训练模型。

5、可选地,根据通话属性确定是否在对目标机器学习模型进行更新,包括:获取目标机器学习模型在历史时段训练过程中,第一信令特征、第一通话行为特征所占的第三权重,以及第二历史话单数据对应的第二信令特征、第二通话行为特征所占的第四权重;在通话属性为本地属性的情况下,如果第三权重小于预设权重,或者第四权重大于预设权重,则对目标学习模型进行更新。

6、可选地,根据通话属性确定是否在对目标机器学习模型进行更新,包括:获取目标机器学习模型在历史时段训练过程中,第一信令特征、第一通话行为特征所占的第三权重,以及第二历史话单数据对应的第二信令特征、第二通话行为特征所占的第四权重;在通话属性为外呼属性的情况下,如果第三权重大于预设权重,或者第四权重小于预设权重,则目标学习模型进行更新。

7、可选地,在确定目标号码是否为疑似诈骗号码之后,方法还包括:在确定目标号码为疑似诈骗号码的情况下,获取疑似诈骗号码对应的检测指标,其中,检测指标包括:短时响铃占比、通话失败率以及拨打对端号码离散度;在短时响铃占比、通话失败率以及拨打对端号码离散度中至少有两个检测指标大于其对应的预设值的情况下,确定疑似诈骗号码为诈骗号码,并将诈骗号码发送至运营商,以用于运营商对诈骗号码进行关停处理。

8、可选地,根据信令特征与通话行为特征对机器学习模型进行训练,得到目标机器学习模型,包括:根据信令特征、通话行为特征确定正样本及负样本对应的用户特征,其中,正样本包括:符合诈骗类型的号码,负样本包括:未标记诈骗的号码;对用户特征进行特征提取,其中,提取到的特征包括:号码特征、基本特征以及扩展特征;采用随机森林算法求取号码特征、基本特征以及扩展特征各自对应的基尼指数,其中,基尼指数越小,则不纯度越低;基于基尼指数对各个特征进行排序,筛选出排名在前n位的特征作为目标特征;基于目标特征对机器学习模型进行训练,得到目标机器学习模型。

9、可选地,在确定目标号码是否为疑似诈骗号码之后,方法还包括:在确定目标号码为疑似诈骗号码的情况下,对疑似诈骗号码的类型进行聚类分析,确定各个疑似诈骗号码所属的诈骗类型,针对不同诈骗类型生成提示信息,并将提示信息发送至目标对象侧的终端。

10、根据本申请实施例的另一方面,还提供了一种识别疑似诈骗号码的方法,包括:获取待分析的目标号码;基于机器学习模型对目标号码对应的目标话单进行分析,确定目标号码是否为疑似诈骗号码,其中,机器学习模型为根据信令特征与通话行为特征训练得到的,信令特征与通话行为特征为对运营商网元操作域对应的第一历史话单数据,以及运营商计算域对应的第二历史话单数据进行筛选得到的。

11、根据本申请实施例的另一方面,还提供了一种模型训练装置,包括:第一获取模块,用于获取运营商网元操作域对应的第一历史话单数据,以及运营商计算域对应的第二历史话单数据;第二获取模块,用于从第一历史话单数据与第二历史话单数据中获取符合超短呼叫行为的信令特征以及通话行为特征;确定模块,用于根据信令特征与通话行为特征对机器学习模型进行训练,得到目标机器学习模型,其中,机器学习模型用于对目标号码对应的目标话单进行识别,确定目标号码是否为疑似诈骗号码。

12、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行任意一种模型训练方法。

13、根据本申请实施例的另一方面,还提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现任意一种模型训练方法。

14、在本申请实施例中,采用基于机器学习模型对疑似诈骗电话进行识别的方式,通过获取运营商网元操作域对应的第一历史话单数据,以及运营商计算域对应的第二历史话单数据;从第一历史话单数据与第二历史话单数据中获取符合超短呼叫行为的信令特征以及通话行为特征;根据信令特征与通话行为特征对机器学习模型进行训练,得到目标机器学习模型,其中,机器学习模型用于对目标号码对应的目标话单进行识别,确定目标号码是否为疑似诈骗号码,达到了基于学习模型对疑似诈骗电话进行识别的目的,从而实现了提高疑似诈骗电话识别率,以及提高终端安全性,避免数据等隐私泄露的技术效果,进而解决了相关技术中基于手机管家提供的来电标签提醒进行诈骗电话识别造成的识别准确率较低,安全性较差技术问题。



技术特征:

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在得到目标机器学习模型之后,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,在基于所述机器学习模型对所述目标号码对应的目标话单进行分析之前,包括:

4.根据权利要求3所述的方法,其特征在于,根据所述通话属性确定是否在对所述目标机器学习模型进行更新,包括:

5.根据权利要求3所述的方法,其特征在于,根据所述通话属性确定是否在对所述目标机器学习模型进行更新,包括:

6.根据权利要求1所述的方法,其特征在于,在确定所述目标号码是否为所述疑似诈骗号码之后,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,根据所述信令特征与所述通话行为特征对机器学习模型进行训练,得到目标机器学习模型,包括:

8.根据权利要求1所述的方法,其特征在于,在确定所述目标号码是否为所述疑似诈骗号码之后,所述方法还包括:

9.一种识别疑似诈骗号码的方法,其特征在于,包括:

10.一种模型训练装置,其特征在于,包括:

11.一种非易失性存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述模型训练方法。

12.一种电子设备,其特征在于,包括:


技术总结
本申请公开了一种模型训练方法、装置及电子设备。其中,该方法包括:获取运营商网元操作域对应的第一历史话单数据,以及运营商计算域对应的第二历史话单数据;从第一历史话单数据与第二历史话单数据中获取符合超短呼叫行为的信令特征以及通话行为特征;根据信令特征与通话行为特征对机器学习模型进行训练,得到目标机器学习模型,其中,机器学习模型用于对目标号码对应的目标话单进行识别,确定目标号码是否为疑似诈骗号码。本申请解决了相关技术中基于手机管家提供的来电标签提醒进行诈骗电话识别造成的识别准确率较低,安全性较差的技术问题。

技术研发人员:张俊祥,邢学锋,陈辰,尚春雷
受保护的技术使用者:中国电信股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1