用户身份的处理方法及装置的制造方法

文档序号:10725040阅读:127来源:国知局
用户身份的处理方法及装置的制造方法
【专利摘要】本发明提供一种用户身份的处理方法及装置。其方法包括:获取待处理用户的行为数据;根据身份转化器将所述待处理用户的行为数据转化为身份特征向量,所述身份特征向量用于唯一标识所述待处理用户的行为数据;根据身份处理器对所述待处理用户的身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份。通过采用本发明的上述技术方案,可以实现根据待处理用户的行为数据对待处理用户的身份进行确定,与现有技术相比,可以有效地保证用户身份的确定的准确性,并有效地提高用户身份的确定效率,以便于后续根据确定的用户身份进行与该用户身份相关的信息推送,进而有效地提高信息推送的效率。
【专利说明】
用户身份的处理方法及装置
【技术领域】
[0001]本发明涉及大数据处理技术领域,尤其涉及一种用户身份的处理方法及装置。【【背景技术】】
[0002]随着科技的快速发展、移动终端使用的普及,伴随着移动终端的各种应用也越来越多,大大地方便了人们的生活。
[0003]各种应用服务商为了更加有效地向用户推广各种服务相关信息,需要先确定用户的身份,这样才可以保证推送信息的准确性,以提高推送效率。现有技术中,用户身份的确定过程较为繁琐,例如很多应用服务商采用激励用户的方式让用户在注册某些应用或者服务的时候,主动提供身份信息。但是这种用户身份的方式仍然无法保证获取到的用户身份的准确性。
[0004]因此,现有的上述技术方案确定用户身份的效率较低。

【发明内容】

[0005]本发明提供了一种用户身份的处理方法及装置,以提高用户身份的确定效率。
[0006]本发明提供一种用户身份的处理方法,所述方法包括:
[0007]获取待处理用户的行为数据;
[0008]根据身份转化器将所述待处理用户的行为数据转化为身份特征向量,所述身份特征向量用于唯一标识所述待处理用户的行为数据;
[0009]根据身份处理器对所述待处理用户的身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份。
[0010]本发明还提供一种用户身份的处理装置,所述装置包括:
[0011]获取模块,用于获取待处理用户的行为数据;
[0012]转化模块,用于根据身份转化器将所述待处理用户的行为数据转化为身份特征向量,所述身份特征向量用于唯一标识所述待处理用户的行为数据;
[0013]处理模块,用于根据身份处理器对所述待处理用户的身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份。
[0014]本发明的用户身份的处理方法及装置,通过采用上述技术方案,实现根据待处理用户的行为数据对待处理用户的身份进行确定,与现有技术相比,可以有效地保证用户身份的确定的准确性,并有效地提高用户身份的确定效率,以便于后续根据确定的用户身份进行与该用户身份相关的信息推送,进而有效地提高信息推送的效率。
【【附图说明】】
[0015]图1为本发明的用户身份的处理方法实施例一的流程图。
[0016]图2为本发明的用户身份的处理方法实施例二的流程图。
[0017]图3为本发明的用户身份的处理装置实施例一的结构图。
[0018]图4为本发明的用户身份的处理装置实施例二的结构图。
【【具体实施方式】】
[0019]为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
[0020]图1为本发明的用户身份的处理方法实施例一的流程图。如图1所示,本实施例的用户身份的处理方法,具体可以包括如下步骤:
[0021]100、获取待处理用户的行为数据;
[0022]本实施例的待处理用户的行为数据可以为对该待处理用户的历史行为进行采集得到的,待处理用户的行为数据具体可以为一条有关联的数据,该条数据中可以包括很多字段。实际应用中,采集该待处理用户的行为数据的时候,可以结合设定身份进行有针对性的获取。例如设定身份为车主,在获取该待处理用户的行为数据时,可以倾向于获取该待处理用户的与车主相关的行为数据。例如这些行为数据可以包括该待处理用户的一段时间内的地图检索次数和使用天数、基本信息点(point of interest;poi)检索次数和天数、公交路线检索、驾车路线检索、步行路线检和地铁线路检索次数,检索次数占比和天数、用户地图使用时间累计时长、用户使用地图天数、与车相关的各检索词的检索次数,检索次数在与车相关检索总次数中的占比和天数等等。其中每个Poi可以包含四方面信息:名称、类别、经度玮度以及附近的酒店饭店商铺等信息,该Poi信息也可以称之为“导航地图信息”。其中与车相关的检索词包含:加油站、汽车服务、汽车销售、4S店、汽车美容、汽车保养、汽车装饰、洗车、汽车配件、汽车检验场等。
[0023]101、根据身份转化器将待处理用户的行为数据转化为身份特征向量;
[0024]由于后续的身份处理器无法对待处理用户的行为数据进行处理,本实施例中需要先对该待处理用户的行为数据进行转化,转化后的身份特征向量用于唯一标识待处理用户的行为数据,例如本实施例的身份特征向量可以采用数字O和I构成。
[0025]102、根据身份处理器对待处理用户的身份特征向量进行处理,以确定待处理用户的身份是否为设定身份。
[0026]本实施例的身份处理器可以待处理用户的身份特征向量进行处理,实现对待处理用户的身份进行识别,以确定待处理用户的身份是否为设定身份。本实施例的设定身份可以为车主,或者还可以为其他的如绘画从业者、或者某艺术特长从业者、或者其他机械或者工程类的从业者等等。
[0027]本实施例的用户身份的处理方法,通过采用上述技术方案,实现根据待处理用户的行为数据对待处理用户的身份进行确定,与现有技术相比,可以有效地保证用户身份的确定的准确性,并有效地提高用户身份的确定效率,以便于后续根据确定的用户身份进行与该用户身份相关的信息推送,进而有效地提高信息推送的效率。
[0028]进一步可选地,在上述图1所示的技术方案的基础上,步骤101之前,还可以包括如下步骤a:根据设定身份用户的第一行为数据集和非设定身份用户的第二行为数据集,生成身份转化器。
[0029]具体地,本实施例的设定身份用户的第一行为数据集和非设定身份用户的第二行为数据集也可以预先收集的,例如可以从每一个用户在互联网上的访问记录中获取。第一行为数据集中包括多个设定身份用户的行为数据,每一个设定身份用户的行为数据中可以包括多个字段的数据。每一个设定身份用户的行为数据中的多个字段的数据作为一条有关联的数据来存储,这样,在第一行为数据集中多个设定身份的用户的行为数据就是按照用户一条一条来存储。同理第二行为数据集中包括多个非设定身份用户的行为数据,其存储方式参考上述第一行为数据集中的行为数据存储方式,多个非设定身份的用户的行为数据也是按照用户一条一条来存储。根据设定身份用户的第一行为数据集中设定身份用户的行为数据和非设定身份用户的第二行为数据集中的非设定身份用户的行为数据,可以找出属于设定身份用户的行为数据的一些共性,以及不属于特定身份用户的个性,这样,可以根据第一行为数据集和第二行为数据集,生成身份转化器。该身份转化器不仅可以根据行为数据对待处理用户的身份进行识别,同时还可以根据识别结果生成身份特征向量。
[0030]本实施例中第一行为数据集中包括的设定身份的用户的数量与第二行为数据集中包括的非设定身份的用户的数量可以相同,也可以不相同;具体地的数量可以为20、500或者800等任意数值;而且第一行为数据集中包括的设定身份的用户的数量与第二行为数据集中包括的非设定身份的用户的数量,得到的身份转化器和身份处理器进行身份转化和身份处理的准确性越高。
[0031]例如本实施例的设定身份可以为车主,非设定身份即为非车主。根据车主的第一行为数据集和非车主的第二行为数据集中的所有行为数据,可以训练一个身份转化器,该身份转化器能够实现将用户的行为数据转化为一个对应的身份特征向量,以简化行为数据的表示方式,方便后续根据身份特征向量进行用户身份的识别。
[0032]例如该步骤a具体可以为:采用第一行为数据集中的每一个设定身份用户的行为数据和第二行为数据集中的每一个非设定身份用户的行为数据,训练预设的身份转化模型,得到身份转化器。
[0033]本实施例的身份转化模型具体可以采用随机森林(randomforest)或者梯度提升决策树(Gradient Boost Decis1n Tree;GBDT)实现。
[0034]例如,可以将第一行为数据集中包括的设定身份的用户的行为数据与第二行为数据集中包括的非设定身份的用户的行为数据,统称为训练数据。然后利用这些训练数据训练random forest或者GBDT模型,可以分别获得N颗决策树,其中决策树的颗树N由训练过程中配置的决策树个数参数控制,可以根据实际需求在训练前进行配置。对N颗决策树中的每一颗树的叶节点都进行编号,例如第η颗决策树的第m个叶节点为(n,m)。对每条训练数据,每颗树都会有一个叶节点输出该用户是设定身份用户的概率,如果概率大于指定阈值,可以将结果标记为I,否者为O。而由于每条训练数据的用户的身份是确定,当输出的结果与已知的用户的身份不一致时,可以调整对应的random forest或者GBDT模型,以调整最终获得的N颗决策树,提高N颗决策树对用户身份识别的准确性。通过使用训练数据中的所有已知用户身份的行为数据对random forest或者GBDT模型进行训练,最终得到N颗决策树即为最终得到的身份转化器,该身份转化器可以根据行为数据对用户的身份进行识别,同时还可以根据识别结果生成唯一一个身份特征向量。例如,对于每一个用户的行为数据,该N颗树的叶子节点可以输出获得一个N*M向量,其中M为叶子节点数最多的决策树的叶子节点个数。如果第η颗树的第m个叶子节点判别训练数据的标记为I,则第((n-l)*M+m)位元素为I,否者为0,不输出结果的叶节点对应的元素为O。如果某颗决策树的叶子节点数低于M,超出叶子节点个数后面的元素用O补足缺失的叶子节点。由于训练数据中的每一条行为数据对应的用户的身份都是确定,这样,根据这些身份确定的用户的行为数据,可以训练该N颗决策树能够识别用户身份的能力,同时对于每一条用户的行为数据,该N颗决策树可以对应输出一个对应的身份特征向量。训练之后的N颗决策树参数都固定了,可以准确实现对待处理用户身份的认定,此时该N颗决策树可以形成一个身份转化器。
[0035]进一步可选地,在上述图1所示实施例的技术方案的基础上,在步骤102之前,还可以包括步骤b:根据第一行为数据集、第二行为数据集和身份转化器,生成身份处理器。
[0036]例如,该步骤b具体实现时可以包括如下两个步骤:
[0037](bl)将第一行为数据集中的每一个设定身份用户的行为数据和第二行为数据集中的每一个非设定身份用户的行为数据,分别输入至身份转化器中,得到第一行为数据集中的每一个设定身份用户的身份特征向量和第二行为数据集中的每一个非设定身份用户的身份特征向量;
[0038](b2)采用第一行为数据集中的每一个设定身份用户的身份特征向量和第二行为数据集中的每一个非设定身份用户的身份特征向量,训练预设的身份处理模型,得到身份处理器。
[0039]由于身份转化器可以实现用户的行为数据至对应的身份特征向量的转化,本实施例中在生成身份转化器之后,可以将第一行为数据集中的每一个设定身份用户的行为数据和第二行为数据集中的每一个非设定身份用户的行为数据,分别通过身份转化器,转化为特征向量,这样,可以得到第一行为数据集中对应的第一特征向量集合和第二行为数据集对应的第二特征向量集合。然后将第一特征向量集合和第二特征向量集合中的特征向量分别作为训练数据,训练预设的身份处理模型,以得到身份处理器。例如,该预设的身份处理模型具体可以为逻辑回归模型。由于第一特征向量集合中的特征向量均为设定用户的特征向量,这样,将第一特征向量集合中的特征向量输入至预设的身份处理模型中,可以计算出该特征向量对应的用户是否为预设身份的用户的概率,如果概率大于或者等于预设概率阈值,可以确定该用户为预设身份的用户;否则如果概率小于预设概率阈值,则说明需要调整该预设的身份处理模型,使得计算的概率值大于该预设概率阈值。通过采用第一特征向量集合和第二特征向量集合中的所有特征向量,不断地训练该预设的身份处理模型,也不断地调整该预设的身份处理模型,得到该身份处理器。
[0040]例如采用GBDT模型训练是决策树个数设置为3颗树时,训练处的决策树最多可以有4个叶子节点。针对某用户&的行为数据,叶子节点(1,1),(2,2),(3,4)给出的判别结果为分别为I,O,I,则待处理用户的行为数据对应的O-1属性的身份特征向量为(1,0,0,0,0,0,
0,0,0,0,0,1),标粗的为给出判别结果的叶节点对应的判别结果值。
[0041]进一步可选地,在上述图1所示实施例的技术方案的基础上,步骤102具体可以包括如下步骤:
[0042](Cl)根据身份处理器计算待处理用户的身份特征向量对应的待处理用户为设定身份的用户的概率值;
[0043](c2)判断概率值是否大于或者等于预设概率阈值;若是,确定待处理用户为设定身份的用户;否则确定该待处理用户的不是设定身份的用户。
[0044]本实施例的概率值可以在训练过程中根据经验选取。
[0045]上述实施例的技术方案,与现有技术相比,可以有效地保证用户身份的确定的准确性,并有效地提高用户身份的确定效率,以便于后续根据确定的用户身份进行与该用户身份相关的信息推送,进而有效地提高信息推送的效率。
[0046]图2为本发明的用户身份的处理方法实施例二的流程图。本实施例中结合上述实施例的技术方案,以设定身份为车主,非设定身份为非车主为例,描述本发明的技术方案。如图2所示,本实施例的用户身份的处理方法,具体可以包括如下步骤:
[0047]200、采集车主的第一行为数据集和非车主的第二行为数据集;
[0048]例如,具体可以从互联网上的用户数据中采集该第一行为数据集和第二行为数据集。其中第一行为数据集中包括多个车主的行为数据,第二行为数据集中包括多个非车主的行为数据。
[0049]本实施例的行为数据中包括与车相关的多个字段的行为数据,详细可以参考上述实施例的记载,在此不再赘述。
[0050]201、利用车主的第一行为数据集和非车主的第二行为数据集中的行为数据,对random forest或者GBDT模型进行训练,得到的N颗决策树作为身份转化器;
[0051]具体的训练原理可以参考上述实施例的记载,在此不再赘述。最终得到的N颗决策树中叶子节点数最多的决策树对应的叶子节点数为M。
[0052]202、将车主的第一行为数据集和非车主的第二行为数据集中的行为数据,分别采用身份转化器进行转换,得到车主的第一行为数据集对应的第一身份特征向量集和非车主的第二行为数据集对应的第二身份特征向量集;
[0053]由于每一条行为数据可以通过身份转换器唯一转换一个对应身份特征向量。这样车主的第一行为数据集中的每一个车主的行为数据和车主的第一身份特征向量中的一个身份特征向量一一对应,非车主的第二行为数据集中的每一个非车主的行为数据和非车主的第二身份特征向量中的一个身份特征向量--对应。
[0054]203、利用车主的第一行为数据集对应的第一身份特征向量集和非车主的第二行为数据集对应的第二身份特征向量集中的特征向量,对逻辑回归模型进行训练,得到身份处理器;
[0055]具体的训练原理可以参考上述实施例的记载,在此不再赘述。
[0056]204、获取待处理用户的行为数据;
[0057]205、将待处理用户的行为数据输入至身份处理器中,计算该待处理用户为车主的概率值;
[0058]206、判断概率值是否大于或者等于预设概率阈值;若是,确定待处理用户为车主;否则确定该待处理用户为非车主。
[0059]采用本实施例的上述方法也可以实现对其它预设身份的用户的识别。
[0060]随着互联网的发展,用车出行,洗车,汽车保养等与车相关的互联网服务逐渐被人们接受。在这些与车相关的互联网应用中,车主是所有服务的核心,因此获取未知的车主身份变得非常重要,尤其是在业务推广和发展用户的过程中。采用本实施例的上述方法,可以准确、高效地获取到待处理用户是否为车主,以便于后续根据用户的车主身份进行车辆相关的信息推送,进而有效地提高信息推送的效率。
[0061]图3为本发明的用户身份的处理装置实施例一的结构图。如图3所示,本实施例的用户身份的处理装置,具体可以包括:获取模块10、转化模块11和处理模块12。
[0062]其中获取模块10用于获取待处理用户的行为数据;转化模块11用于根据身份转化器将获取模块10获取的待处理用户的行为数据转化身份特征向量,身份特征向量用于唯一标识待处理用户的行为数据;处理模块12用于根据身份处理器对转化模块11转化的待处理用户的身份特征向量进行处理,以确定待处理用户的身份是否为设定身份。
[0063]本实施例的用户身份的处理装置,通过采用上述模块实现用户身份的处理的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述实施例的记载,在此不再赘述。
[0064]图4为本发明的用户身份的处理装置实施例二的结构图。如图4所示,本实施例的用户身份的处理装置,在上述图3所示实施例的技术方案的基础上,进一步还包括如下技术方案。
[0065]如图4所示,本实施例的用户身份的处理装置还包括身份转化器生成模块13。该身份转化器生成模块13用于根据设定身份用户的第一行为数据集和非设定身份用户的第二行为数据集,生成身份转化器。
[0066]进一步可选地,本实施例的用户身份的处理装置中的身份转化器生成模块13具体用于采用第一行为数据集中的每一个设定身份用户的行为数据和第二行为数据集中的每一个非设定身份用户的行为数据,训练预设的身份转化模型,得到身份转化器。其中转化模块11具体地用于根据与身份转化器生成模块13生成的身份转化器,将获取模块10获取的待处理用户的行为数据转化身份特征向量。
[0067]进一步可选地,如图4所示,本实施例的用户身份的处理装置中还包括身份处理器生成模块14。其中身份处理器生成模块14用于根据第一行为数据集、第二行为数据集和身份转化器生成模块13生成的身份转化器,生成身份处理器。
[0068]进一步可选地,身份处理器生成模块14具体用于将第一行为数据集中的每一个设定身份用户的行为数据和第二行为数据集中的每一个非设定身份用户的行为数据,分别输入至身份转化器生成模块13生成的身份转化器中,得到第一行为数据集中的每一个设定身份用户的身份特征向量和第二行为数据集中的每一个非设定身份用户的身份特征向量;采用第一行为数据集中的每一个设定身份用户的身份特征向量和第二行为数据集中的每一个非设定身份用户的身份特征向量,训练预设的身份处理模型,得到身份处理器。
[0069]例如本实施例的预设的身份处理模型包括逻辑回归模型。
[0070]进一步可选地,如图4所示,本实施例的用户身份的处理装置中,处理模块12具体包括:计算单元121和判断单元122。
[0071]其中计算单元121用于根据身份处理器生成模块14生成的身份处理器计算转化模块11转化的待处理用户的身份特征向量对应的待处理用户为设定身份的用户的概率值;判断单元122用于判断计算单元121计算的概率值是否大于或者等于预设概率阈值;若是,确定待处理用户为设定身份的用户。
[0072]本实施例的用户身份的处理装置,通过采用上述模块实现用户身份的处理的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述实施例的记载,在此不再赘述。
[0073]在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0074]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0075]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0076]上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,R0M)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0077]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【主权项】
1.一种用户身份的处理方法,其特征在于,所述方法包括: 获取待处理用户的行为数据; 根据身份转化器将所述待处理用户的行为数据转化为身份特征向量,所述身份特征向量用于唯一标识所述待处理用户的行为数据; 根据身份处理器对所述待处理用户的身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份。2.根据权利要求1所述的方法,其特征在于,根据身份转化器将所述待处理用户的行为数据转化为身份特征向量之前,所述方法还包括: 根据设定身份用户的第一行为数据集和非设定身份用户的第二行为数据集,生成所述身份转化器。3.根据权利要求2所述的方法,其特征在于,根据设定身份用户的第一行为数据集和非设定身份用户的第二行为数据集,生成所述身份转化器,具体包括: 采用所述第一行为数据集中的每一个所述设定身份用户的行为数据和所述第二行为数据集中的每一个所述非设定身份用户的行为数据,训练预设的身份转化模型,得到所述身份转化器。4.根据权利要求2所述的方法,其特征在于,根据身份处理器对所述身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份之前,所述方法还包括: 根据所述第一行为数据集、所述第二行为数据集和所述身份转化器,生成所述身份处理器。5.根据权利要求4所述的方法,其特征在于,根据所述第一行为数据集、所述第二行为数据集和所述身份转化器,生成所述身份处理器,具体包括: 将所述第一行为数据集中的每一个所述设定身份用户的行为数据和所述第二行为数据集中的每一个所述非设定身份用户的行为数据,分别输入至所述身份转化器中,得到所述第一行为数据集中的每一个所述设定身份用户的身份特征向量和所述第二行为数据集中的每一个所述非设定身份用户的身份特征向量; 采用所述第一行为数据集中的每一个所述设定身份用户的身份特征向量和所述第二行为数据集中的每一个所述非设定身份用户的身份特征向量,训练预设的身份处理模型,得到所述身份处理器。6.根据权利要求5所述的方法,其特征在于,所述预设的身份处理模型包括逻辑回归模型。7.根据权利要求1-6任一所述的方法,其特征在于,所述根据身份处理器对所述待处理用户的身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份,具体包括: 根据所述身份处理器计算所述待处理用户的身份特征向量对应的所述待处理用户为所述设定身份的用户的概率值; 判断所述概率值是否大于或者等于预设概率阈值;若是,确定所述待处理用户为所述设定身份的用户。8.一种用户身份的处理装置,其特征在于,所述装置包括: 获取模块,用于获取待处理用户的行为数据; 转化模块,用于根据身份转化器将所述待处理用户的行为数据转化为身份特征向量,所述身份特征向量用于唯一标识所述待处理用户的行为数据; 处理模块,用于根据身份处理器对所述待处理用户的身份特征向量进行处理,以确定所述待处理用户的身份是否为设定身份。9.根据权利要求8所述的装置,其特征在于,所述装置还包括: 身份转化器生成模块,用于根据设定身份用户的第一行为数据集和非设定身份用户的第二行为数据集,生成所述身份转化器。10.根据权利要求9所述的装置,其特征在于,所述身份转化器生成模块,具体用于采用所述第一行为数据集中的每一个所述设定身份用户的行为数据和所述第二行为数据集中的每一个所述非设定身份用户的行为数据,训练预设的身份转化模型,得到所述身份转化器。11.根据权利要求9所述的装置,其特征在于,所述装置还包括: 身份处理器生成模块,用于根据所述第一行为数据集、所述第二行为数据集和所述身份转化器,生成所述身份处理器。12.根据权利要求11所述的装置,其特征在于,所述身份处理器生成模块,具体用于: 将所述第一行为数据集中的每一个所述设定身份用户的行为数据和所述第二行为数据集中的每一个所述非设定身份用户的行为数据,分别输入至所述身份转化器中,得到所述第一行为数据集中的每一个所述设定身份用户的身份特征向量和所述第二行为数据集中的每一个所述非设定身份用户的身份特征向量; 采用所述第一行为数据集中的每一个所述设定身份用户的身份特征向量和所述第二行为数据集中的每一个所述非设定身份用户的身份特征向量,训练预设的身份处理模型,得到所述身份处理器。13.根据权利要求12所述的装置,其特征在于,所述预设的身份处理模型包括逻辑回归模型。14.根据权利要求8-13任一所述的装置,其特征在于,所述处理模块,具体包括: 计算单元,用于根据所述身份处理器计算所述待处理用户的身份特征向量对应的所述待处理用户为所述设定身份的用户的概率值; 判断单元,用于判断所述概率值是否大于或者等于预设概率阈值;若是,确定所述待处理用户为所述设定身份的用户。
【文档编号】G06F17/30GK106095915SQ201610405268
【公开日】2016年11月9日
【申请日】2016年6月8日
【发明人】王超
【申请人】百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1