账户识别方法和系统的制作方法

文档序号:8282598阅读:171来源:国知局
账户识别方法和系统的制作方法
【技术领域】
[0001] 本申请涉及互联网安全领域,具体而言,涉及一种账户识别方法和系统。
【背景技术】
[0002] 现有技术中通常采用有目标地训练模型的方法来实现对账户的使用者的识别,最 为典型的方法包括:
[0003] 1)决策树一首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然 后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。
[0004] 2)评分卡模型--首先根据用户的历史资料,利用一定的信用评分模型或者算 法,得到不同等级的分数或者排序,然后依据用户的分数或者排序来决定客户风险水平。
[0005] 上述两种有目标地训练模型的方法通常需要预先对事实样本数据进行采集,也 艮P,需要获知账户是否被与该账户对应的用户所使用的历史事实记录,例如,可以通过客户 电话的投诉实现对事实样本数据的采集,然后依靠采集到的事实样本数据为模型同时提供 输入和输出,实现对模型的训练。然而,由于这样采集来的样本的特征通常不具有代表性, 从而导致得出的识别模型的准确性通常较差。此外,这种账户识别方法中的建模周期通常 较长,并且在用户群体的使用习惯随时间发生变化时,通常需要重新建模,总之无论是建模 还是重新建模都给系统造成了额外的开销,造成了系统资源的浪费。
[0006] 针对上述问题,目前尚未提出有效的解决方案。

【发明内容】

[0007] 本申请的主要目的在于提供一种账户识别方法和系统,以至少解决由于现有的账 户识别方法采用有目标地训练模型的方式所导致的需要依赖大量的事实样本数据的问题。
[0008] 根据本申请的一个方面,提供了一种账户识别方法,包括:获取待识别账户的同一 属性的信息一致链相关信息,并根据上述信息一致链相关信息来对上述待识别账户进行第 一识别判断;至少根据上述第一识别判断的结果来判断上述待识别账户是否被与上述待识 别账户对应的用户使用;其中,上述信息一致链相关信息包括以下之一:信息一致链的长 度,其中,上述信息一致链包括属于上述同一属性、且内容与上述待识别账户对应的用户的 注册信息相互一致的一个或多个指标,上述信息一致链的长度表示上述信息一致链中包括 的上述指标的个数;上述信息一致链的长度和上述信息一致链中包含预定重要指标的个 数;或者上述信息一致链的长度、上述信息一致链中包含预定重要指标的个数和上述信息 一致链对应的一致指数。
[0009] 可选地,上述属性包括多个,其中,上述根据上述信息一致链相关信息来对上述待 识别账户进行第一识别判断包括:根据上述信息一致链相关信息获取每个上述待识别账户 的每个属性对应的属性等级,其中,上述属性对应的属性等级表示基于上述属性判断出的 上述待识别账户上被与上述待识别账户对应的用户使用的相对概率;根据所有上述待识别 账户在每个上述属性的每个概率等级上的分布情况来判断每个上述待识别账户的广度识 别等级,其中,上述待识别账户的广度识别等级表示上述待识别账户被与上述待识别账户 对应的用户使用的相对概率。
[0010] 可选地,上述每个属性包括第一属性,其中,上述根据上述信息一致链相关信息获 取每个上述待识别账户的每个属性对应的属性等级包括:根据所有上述待识别账户的第一 属性的信息一致链的长度的分布获取每个上述待识别账户的上述第一属性对应的属性等 级,其中,对于所有上述待识别账户中上述信息一致链的长度相同的第一待识别账户,根据 上述第一待识别账户的第一属性的信息一致链的长度的分布和上述第一待识别账户的上 述第一属性的信息一致链中包含预定重要指标的个数获取上述第一待识别账户的上述第 一属性对应的属性等级;对于所有上述待识别账户中上述信息一致链的长度相同且上述包 含预定重要指标的个数相同的第二待识别账户,根据上述第二待识别账户的第一属性的信 息一致链的长度的分布和上述第二待识别账户的上述第一属性的信息一致链中包含预定 重要指标的个数以及上述信息一致链对应的一致指数获取上述第二待识别账户的上述第 一属性对应的属性等级。
[0011] 可选地,在上述至少根据上述第一识别判断的结果来判断上述待识别账户是否被 与上述待识别账户对应的用户使用之前,上述账户识别方法包括:获取上述待识别账户的 活跃时间和上述待识别账户被与上述待识别账户不对应的用户使用的占比,并根据上述活 跃时间和上述占比对上述待识别账户进行第二识别判断;其中,上述至少根据上述第一识 别判断的结果来判断上述待识别账户是否被与上述待识别账户对应的用户使用包括:根据 上述第一识别判断的结果和上述第二识别判断的结果来判断上述待识别账户是否被与上 述待识别账户对应的用户使用。
[0012] 可选地,上述根据上述活跃时间和上述占比对上述待识别账户进行第二识别判断 包括:根据每个上述待识别账户的活跃时间获取每个上述待识别账户的活跃等级,并根据 每个上述待识别账户被与上述待识别账户不对应的用户使用的占比获取每个上述待识别 账户的占比等级;根据所有上述待识别账户在每个上述活跃等级和上述每个占比等级上的 分布情况来判断每个上述待识别账户的深度识别等级,其中,上述待识别账户的深度识别 等级表示上述待识别账户被与上述待识别账户对应的用户使用的相对概率。
[0013] 可选地,上述根据每个上述待识别账户的活跃时间获取每个上述待识别账户的活 跃等级包括:根据每个上述待识别账户的活跃时间与所有上述待识别账户中最长的活跃时 间之间的比例来获取每个上述待识别账户的活跃等级,其中,属于每个上述活跃等级的上 述待识别账户的个数之间的差值小于预定阈值。
[0014] 可选地,上述根据每个上述待识别账户被与上述待识别账户不对应的用户使用的 占比获取每个上述待识别账户的占比等级包括:根据每个上述待识别账户的上述占比与 所有上述待识别账户中最大的占比之间的比例来获取每个上述待识别账户的占比等级,其 中,属于每个上述占比等级的上述待识别账户的个数之间的差值小于预定阈值。
[0015] 可选地,上述根据上述第一识别判断的结果和上述第二识别判断的结果来判断上 述待识别账户是否被与上述待识别账户对应的用户使用包括:根据每个上述待识别账户的 广度识别等级和深度识别等级获取与上述待识别账户对应的用户使用的相对概率。
[0016] 根据本申请的另一方面,还提供了一种账户识别系统,包括:第一识别单元,用于 获取待识别账户的同一属性的信息一致链相关信息,并根据上述信息一致链相关信息来对 上述待识别账户进行第一识别判断;判断单元,用于至少根据上述第一识别判断的结果来 判断上述待识别账户是否被与上述待识别账户对应的用户使用;其中,上述信息一致链相 关信息包括以下之一:信息一致链的长度,其中,上述信息一致链包括属于上述同一属性、 且内容与上述待识别账户对应的用户的注册信息相互一致的一个或多个指标,上述信息一 致链的长度表示上述信息一致链中包括的上述指标的个数;上述信息一致链的长度和上述 信息一致链中包含预定重要指标的个数;或者上述信息一致链的长度、上述信息一致链中 包含预定重要指标的个数和上述信息一致链对应的一致指数。
[0017] 可选地,上述属性包括多个,其中,上述第一识别单元包括:第一获取模块,用于根 据上述信息一致链相关信息获取每个上述待识别账户的每个属性对应的属性等级,其中, 上述属性对应的属性等级表示基于上述属性判断出的上述待识别账户上被与上述待识别 账户对应的用户使用的相对概率;第一判断模块,用于根据所有上述待识别账户在每个上 述属性的每个概率等级上的分布情况来判断每个上述待识别账户的广度识别等级,其中, 上述待识别账户的广度识别等级表示上述待识别账户被与上述待识别账户对应的用户使 用的相对概率。
[0018] 可选地,上述每个属性包括第一属性,其中,上述第一获取模块包括:第一获取子 模块,用于根据所有上述待识别账户的第一属性的信息一致链的长度的分布获取每个上述 待识别账户的上述第一属性对应的属性等级,其中,对于所有上述待识别账户中上述信息 一致链的长度相同的第一待识别账户,根据上述第一待识别账户的第一属性的信息一致链 的长度的分布和上述第一待识别账户的上述第一属性的信息一致链中包含预定重要指标 的个数获取上述第一待识别账户的上述第一属性对应的属性等级;对于所有上述待识别账 户中上述信息一致
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1