一种同用户账户识别方法及装置与流程

文档序号:19366104发布日期:2019-12-10 20:51阅读:232来源:国知局
一种同用户账户识别方法及装置与流程

本申请涉及网络技术领域,尤其涉及一种同用户账户识别方法及装置。



背景技术:

目前,互联网在为用户带来便利的同时,也带来了用户信息泄漏、账户盗用等网络安全问题。为了保证用户信息安全,在用户请求进行认证、修改登录名、找寻密码等时,通常需要对用户的验证信息进行核实,以确认用户当前操作的账户(比如正在修改登录名的账户)与关联的历史账户(修改登录名前的账户)是否属于同一用户,在确认为同一用户之后,才会处理用户请求。

现有的进行同用户账户识别的方案主要有两种:在一种方案中,是从已知的同用户账户对的账户信息中提取出同用户账户对所具有的相同的账户信息(比如身份证号码),将提取出的该相同的账户信息作为后续验证两个账户是否属于同一用户的依据。这种方案对已知数据的依赖性较高,如果没有大量已知的属于同一用户的账户对样本,将无法进行后续的同用户识别;而在实际实施中,获取大量已知的同用户账户对在实现上较为困难,需要耗费大量人力和时间成本对实际用户进行调查取证,因此这种方案在实际执行中并不可行。在另一种方案中,直接基于主观理解设定一些判定规则,比如在满足身份信息和物流地址信息等一致的情况下,确认两个账户属于同一用户,显然,这种方案由于缺乏客观认证过程,进行同用户识别的准确性较低。

综上,现有的同用户账户识别方案存在实现困难,成本较高、且识别准确性较低的问题。



技术实现要素:

本申请实施例提供一种同用户账户识别方法及装置,用以解决现有的同用户账户识别方案存在实现困难,成本较高、且识别准确性较低的问题。

本申请实施例提供一种同用户账户识别方法,包括:

服务器根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;其中,每个同用户样本账户对中的两个账户属于同一用户;

针对多种账户信息中的每一种账户信息,所述服务器根据在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定该种账户信息在进行同用户账户识别时的重要度;

针对任一对待识别账户,所述服务器根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,判断所述任一对待识别账户是否属于同一用户。

可选地,服务器根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对,包括:

针对每一对样本账户,若该对样本账户所具有的相同的账户信息的个数大于第一个数阈值,则确定该对样本账户为同用户样本账户对。

可选地,服务器根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对,包括:

针对需要确定在进行同用户账户识别时的重要度的任一种账户信息,根据每对样本账户所具有的除该种账户信息之外的相同的账户信息,确定在确定所述任一种账户信息的重要度时所采用的多个同用户样本账户对。

可选地,根据每对样本账户所具有的除所述任一种账户信息之外的相同的账户信息,确定在确定所述任一种账户信息的重要度时所采用的多个同用户样本账户对,包括:

针对每一对样本账户,若该对样本账户所具有的除所述任一种账户信息之外的相同的账户信息的个数大于第二个数阈值,则确定该对样本账户为在确定所述任一种账户信息的重要度时所采用的同用户样本账户对。

可选地,针对多种账户信息中的每一种账户信息,所述服务器根据在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定该种账户信息在进行同用户账户识别时的重要度,包括:

针对多种账户信息中的每一种账户信息,所述服务器将具有相同的该种账户信息的同用户样本账户对的个数,与确定的同用户样本账户对的总个数的比值,确定为该种账户信息在进行同用户账户识别时的重要度。

可选地,针对任一对待识别账户,所述服务器根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,判断所述任一对待识别账户是否属于同一用户,包括:

所述服务器根据所述任一对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,确定该任一对待识别账户属于同一用户的概率;

若确定的该任一对待识别账户属于同一用户的概率大于设定概率阈值,则确定该任一对待识别账户属于同一用户。

可选地,所述服务器根据该任一对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,确定该任一对待识别账户属于同一用户的概率,包括:

所述服务器将该任一对待识别账户所具有的所述至少一种相同的账户信息对应的重要度之和,与确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度之和的比值,确定为该任一对待识别账户属于同一用户的概率。

本申请另一实施例提供一种同用户账户识别装置,包括:

第一确定模块,用于根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;其中,每个同用户样本账户对中的两个账户属于同一用户;

第二确定模块,用于针对多种账户信息中的每一种账户信息,根据在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定该种账户信息在进行同用户账户识别时的重要度;

判断模块,用于针对任一对待识别账户,根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,判断所述任一对待识别账户是否属于同一用户。

本申请实施例可以基于每对样本账户所具有的相同的账户信息,来确定多个同用户样本账户对,从而无需专门获取已知的同用户账户对;并且,本申请实施例是基于实际采集的账户数据确定的每种账户信息的重要度,而不是凭借主观理解;除此之外,这种基于每种账户信息的重要度进行同用户账户识别的方式,由于不仅考虑了账户信息的种类,还考虑了每种账户信息对同用户账户识别的贡献度,因此增加了进行同用户账户识别的准确性。

附图说明

图1为本申请实施例一提供的同用户账户识别方法流程图;

图2为本申请实施例二提供的同用户账户识别方法流程图;

图3为本申请实施例三提供的同用户账户识别方法流程图;

图4为基于l个样本账户对所具有的相同或不同的账户信息,得到的每种账户信息的重要度的示意图;

图5为识别账户1和账户2是否属于同一用户的示意图;

图6为本申请实施例四提供的同用户账户识别装置结构示意图。

具体实施方式

本申请实施例中,服务器根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;针对多种账户信息中的每一种账户信息,根据在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定该种账户信息在进行同用户账户识别时的重要度;针对任一对待识别账户,根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,判断所述任一对待识别账户是否属于同一用户。

可见,本申请实施例可以基于每对样本账户所具有的相同的账户信息,来确定多个同用户样本账户对,从而无需专门获取已知的同用户账户对;并且,本申请实施例是基于实际采集的账户数据确定的每种账户信息的重要度,而不是凭借主观理解;除此之外,这种基于每种账户信息的重要度进行同用户账户识别的方式,由于不仅考虑了账户信息的种类,还考虑了每种账户信息对同用户账户识别的贡献度,因此增加了进行同用户账户识别的准确性。

下面结合说明书附图对本申请实施例作进一步详细描述。

实施例一

如图1所示,为本申请实施例一提供的同用户账户识别方法流程图,包括以下步骤:

s101:服务器根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;其中,每个同用户样本账户对中的两个账户属于同一用户。

这里的账户信息可以包括用户在服务器注册账户时的注册信息,也可以包括服务器采集的用户操作过程中的信息,还可以包括用户的操作设备及网络环境信息,比如可以包括身份证号、姓名、银行卡号、手机号、媒体接入控制(mediaaccesscontrol,mac)地址、互联网协议(internetprotocol,ip)地址、物流收货地址等。本申请实施例可以应用于客户账户信息管理系统中。

在具体实施过程中,服务器可以采集多个样本账户,将其两两组合成样本账户对,其中,每个样本账户都可以与其它样本账户组成样本账户对。

该步骤中,根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;比如,若任一对样本账户所具有的相同的账户信息的个数大于第一个数阈值,则确定该对样本账户属于同一用户;再比如,若任一对样本账户所具有的相同的账户信息的个数大于第一个数阈值、且具有相同的预设的n(n为正整数)种账户信息中的至少一种(比如身份证号码),则确定该对样本账户属于同一用户。

s102:针对多种账户信息中的每一种账户信息,所述服务器根据在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定该种账户信息在进行同用户账户识别时的重要度。

在具体实施过程中,可以预先设置多种进行同用户账户识别的账户信息,针对预设的多种账户信息中的每一种账户信息,采用上述步骤s101和s102确定其在进行同用户账户识别时的重要度;也可以基于s101确定出的每对样本账户所具有的相同的账户信息(比如任一对样本账户之间具有相同的身份信息、使用的终端设备信息、网络地址信息、物流地址信息等中的一种或多种),确定用于进行同用户账户识别的多种账户信息(比如确定采用身份信息、使用的终端设备信息、网络地址信息、物流地址信息等来进行同用户账户识别)。

在具体实施过程中,针对任一种账户信息,可以直接将具有相同的该种账户信息的账户样本对的个数,确定为该种账户信息在进行同用户账户识别时的重要度(详见实施例二的描述);或者,也可以将具有相同的该种账户信息的账户样本对的个数与确定的属于同一用户的样本账户对的个数的比值确定为该种账户信息在进行同用户账户识别时的重要度(详见实施例三的描述)。

s103:针对任一对待识别账户,所述服务器根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,判断所述任一对待识别账户是否属于同一用户。

在具体实施过程中,可以将该对待识别账户所具有的至少一种相同的账户信息分别对应的重要度相加求和,若得到的和值大于设定阈值,则确定该对待识别账户属于同一用户。或者,可以根据该对待识别账户所具有的至少一种相同的账户信息分别对应的重要度,以及s102中涉及到的多种账户信息分别对应的重要度,确定该任一对待识别账户属于同一用户的概率;若该概率大于设定概率阈值,则确定该任一对待识别账户属于同一用户(详见实施例二和实施例三的描述)。

实施例二

该实施二中,根据每对样本账户所具有的所有相同的账户信息的个数,确定属于同一用户的样本账户对。

如图2所示,为本申请实施例二提供的同用户账户识别方法流程图,包括以下步骤:

s201:服务器根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;其中,每个同用户样本账户对中的两个账户属于同一用户。

这里,针对每一对样本账户,若该对样本账户所具有的相同的账户信息的个数大于第一个数阈值,则确定该对样本账户属于同一用户。

s202:服务器针对预设的多种账户信息中的每一种账户信息,将在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定为该种账户信息在进行同用户账户识别时的重要度。

该实施例一中,针对每一种账户信息,确定的同用户样本账户对的个数都是相同的,因此,针对任一种账户信息,可以直接将在所有同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定为该种账户信息在进行同用户账户识别时的重要度。

s203:针对任一对待识别账户,服务器根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,确定该任一对待识别账户属于同一用户的概率。

这里,可以将该任一对待识别账户所具有的所述至少一种相同的账户信息对应的重要度之和,与确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度之和的比值,确定为该任一对待识别账户属于同一用户的概率。

s204:若确定的该任一对待识别账户属于同一用户的概率大于设定概率阈值,则确定该任一对待识别账户属于同一用户。

实施例三

该实施三中,针对任一需要确定在进行同用户账户识别时的重要度的账户信息,根据每对样本账户所具有的除该任一账户信息之外的其它相同的账户信息的个数,确定同用户样本账户对。采用这种方式确定同用户样本账户对,可以排除需要确定在进行同用户账户识别时的重要度的账户信息本身对同用户样本账户对识别的影响。

如图3所示,为本申请实施例三提供的同用户账户识别方法流程图,包括以下步骤:

s301:服务器针对预设的多种账户信息中的任一种账户信息,根据每对样本账户所具有的除该种账户信息之外的相同的账户信息,确定多个同用户样本账户对。

这里,针对采集的多对样本账户中的每一对样本账户,若该对样本账户所具有的除所述任一种账户信息之外的相同的账户信息的个数大于第二个数阈值,则确定该对样本账户属于同一用户,也即为在确定该任一种账户信息的重要度时所采用的同用户样本账户对。

比如预设的多种账户信息包括:身份证号、姓名、银行卡号、手机号、mac地址、ip地址、和物流收货地址。针对其中任一种账户信息,若一对样本账户中除该种账户信息之外的三种以上的账户信息相同,则认为该对样本账户属于同一用户。比如,针对身份证号这种账户信息,若存在一对样本账户,该对样本账户具有相同的姓名、银行卡号和手机号,则可以确定该对样本账户为同用户样本账户对。

s302:服务器将确定的同用户样本账户对中,具有相同的所述任一种账户信息的样本账户对的个数,与确定的同用户样本账户对的个数的比值,确定为所述任一种账户信息在进行同用户账户识别时的重要度。

这里,由于针对每种账户信息确定出的同用户样本账户对的个数可能不同,因此,针对任一种账户信息,需要将具有相同的该种账户信息的同用户样本账户对的个数除以确定出的与该种账户信息对应的同用户样本账户对的个数,得到该种账户信息的重要度。比如,针对身份证号这种账户信息,根据基于s301确定出的同用户样本账户对的个数m,以及在m个同用户样本账户对中,具有相同的身份证号的样本账户对的个数l,将l/m确定为身份证号的重要度。

如图4所示,为基于l个样本账户对所具有的相同或不同的账户信息,得到的每种账户信息的重要度的示意图。在确定这7种账户信息中的账户信息i(账户信息1~7依次为身份证号、姓名、银行卡号、手机号、mac地址、ip地址、和物流收货地址)的重要度时,首先,针对每一对样本账户,判断除账户信息i之外的6种账户信息中是否存在大于k(比如k=3)种账户信息相同,若存在,则确定该对样本账户属于同一用户;然后,在所有属于同一用户的x对样本账户中,查看具有相同的账户信息i的样本账户对的个数y;最后,确定账户信息i的重要度a_i=y/x。

s303:针对任一对待识别账户,服务器根据该对待识别账户所具有的至少一种相同的账户信息,以及预设的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,确定该任一对待识别账户属于同一用户的概率。

这里,可以将该任一对待识别账户所具有的所述至少一种相同的账户信息对应的重要度之和,与确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度之和的比值,确定为该任一对待识别账户属于同一用户的概率。

如图5所示,为识别账户1和账户2是否属于同一用户的示意图。假定s302中确定出账户信息1~7(账户信息1~7依次为身份证号、姓名、银行卡号、手机号、mac地址、ip地址、和物流收货地址)的重要度分别为a1~a7,用向量表示为(a1,a2,a3,a4,a5,a6,a7);账户1和账户2具有相同的身份证号、姓名、手机号、mac地址,以及物流收货地址,其余账户信息不同,则可以采用向量表示账户1和账户2之间的账户信息关系为(1,1,0,1,1,0,1),其中第i个分量位置处若为1,则表示账户1和账户2之间的账户信息i相同,若为0,则表示账户1和账户2之间的账户信息i不同。最后,得到账户1和账户2属于同一用户的概率p为:

s304:若确定的该任一对待识别账户属于同一用户的概率大于设定概率阈值,则确定该任一对待识别账户属于同一用户。

基于同一发明构思,本申请实施例中还提供了一种与同用户账户识别方法方法对应的同用户账户识别方法装置,由于该装置解决问题的原理与本申请实施例同用户账户识别方法方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。

实施例四

如图6所示,为本申请实施例四提供的同用户账户识别装置结构示意图,包括:

第一确定模块61,用于根据每对样本账户所具有的相同的账户信息,确定多个同用户样本账户对;其中,每个同用户样本账户对中的两个账户属于同一用户;

第二确定模块62,用于针对多种账户信息中的每一种账户信息,根据在确定的多个同用户样本账户对中,具有相同的该种账户信息的同用户样本账户对的个数,确定该种账户信息在进行同用户账户识别时的重要度;

判断模块63,用于针对任一对待识别账户,根据该对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,判断所述任一对待识别账户是否属于同一用户。

可选地,所述第一确定模块61具体用于:

针对每一对样本账户,若该对样本账户所具有的相同的账户信息的个数大于第一个数阈值,则确定该对样本账户为同用户样本账户对。

可选地,所述第一确定模块61具体用于:

针对需要确定在进行同用户账户识别时的重要度的任一种账户信息,根据每对样本账户所具有的除该种账户信息之外的相同的账户信息,确定在确定所述任一种账户信息的重要度时所采用的多个同用户样本账户对。

可选地,所述第一确定模块61具体用于:

针对每一对样本账户,若该对样本账户所具有的除所述任一种账户信息之外的相同的账户信息的个数大于第二个数阈值,则确定该对样本账户为在确定所述任一种账户信息的重要度时所采用的同用户样本账户对。

可选地,所述第二确定模块62具体用于:

针对多种账户信息中的每一种账户信息,所述服务器将具有相同的该种账户信息的同用户样本账户对的个数,与确定的同用户样本账户对的总个数的比值,确定为该种账户信息在进行同用户账户识别时的重要度。

可选地,所述判断模块63具体用于:

所述服务器根据所述任一对待识别账户所具有的至少一种相同的账户信息,以及确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度,确定该任一对待识别账户属于同一用户的概率;若确定的该任一对待识别账户属于同一用户的概率大于设定概率阈值,则确定该任一对待识别账户属于同一用户。

可选地,所述判断模块63具体用于:

将该任一对待识别账户所具有的所述至少一种相同的账户信息对应的重要度之和,与确定的多种账户信息中每种账户信息在进行同用户账户识别时的重要度之和的比值,确定为该任一对待识别账户属于同一用户的概率。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1