基于运营商的用户标签验证方法、装置和电子设备与流程

文档序号:16147492发布日期:2018-12-05 16:45阅读:286来源:国知局
基于运营商的用户标签验证方法、装置和电子设备与流程

本发明涉及通信技术领域,尤其涉及一种基于运营商的用户标签验证方法、装置和电子设备。

背景技术

随着数据时代来临,人们的各种信息都可以在it系统中进行记录。在企业营销活动中,为了可以更好的理解客户,以用户为中心,提高用户体验,可以进行用户画像。通过用户画像,企业可以更好的识别高价值客户,潜在客户等,从而提高交叉销售,提高用户转换率,实现精准营销。目前用户画像系统的构建主要是对用户标签的构造,但是由于采用的标准不同,面向的行业不同以及所使用的数据质量的差异导致用于构建画像系统的用户标签繁杂凌乱,准确度低,并且管理起来复杂繁琐,为了解决该问题,需要对用户标签进行清洗。

现有技术中对用户标签进行清洗时,通常基于用户的基本信息进行分析,如对上网注册id和手机设备id等基本信息进行分析判断等,此类用户标签的清洗和整理方法简单单一,远远不能满足行业应用所要求的标签真实有效、精准丰富和管理简便的技术特征。

因此,如何有效降低当前用户画像系统中用户标签繁杂凌乱问题,提高用户标签的准确度是亟待解决的技术问题之一。



技术实现要素:

本发明实施例提供一种基于运营商的用户标签验证方法、装置和电子设备,用以解决现有技术中用户标签系统中用户标签繁杂凌乱问题,提高用户标签的准确度。

本发明实施例提供一种基于运营商的用户标签验证方法,包括:

根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商;并

根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;以及

根据所述用户状态信息,确定所述用户标签的真实度测量值;

将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;并

根据所述比较结果,对所述用户标签进行验证。

本发明实施例提供一种基于运营商的用户标签验证装置,包括:

第一确定单元,用于根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商;

获取单元,用于根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;

第二确定单元,用于根据所述用户状态信息,确定所述用户标签的真实度测量值;

比较单元,用于将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;

验证单元,用于根据所述比较结果,对所述用户标签进行验证。

本发明实施例提供一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行本申请实施例提供的基于运营商的用户标签验证方法。

本发明实施例提供一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的基于运营商的用户标签验证方法。

本发明实施例提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,其中,当所述程序指令被计算机执行时,使所述计算机执行本申请实施例提供的基于运营商的用户标签验证方法。

本发明的有益效果:

本发明实施例提供的基于运营商的用户标签验证方法、装置和电子设备,根据第三方服务平台提供的被测用户的用户身份标识,确定所述被测用户使用的运营商,然后在根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;以及根据所述用户状态信息,确定所述用户标签的真实度测量值;将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;并根据所述比较结果,对所述用户标签进行验证。采用本发明提供的方法,基于运营商对用户标签进行验证,不仅可以实现对用户标签的清洗,还有效降低了用户画像系统中用户标签的繁杂凌乱问题,提高了用户标签的准确度。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明实施例一提供的基于运营商的用户标签验证方法的流程示意图;

图2为本发明实施例一提供的为被测用户扩展用户标签的流程示意图;

图3为本发明实施例一提供的判断所述被测用户是否满足扩展用户标签条件的流程示意图;

图4为本发明实施例一提供的为所述被测用户添加若干个用户标签的流程示意图;

图5为本发明实施例一提供的针对添加的每一用户标签输出所述被测用户的标签目录的流程示意图;

图6为本发明实施例一提供的对被测用户的用户标签进行匹配的方法的流程示意图;

图7为本发明实施例二提供的另一种基于运营商的用户标签验证方法的流程示意图;

图8为本发明实施例三提供的基于运营商的用户标签验证装置的结构示意图;

图9为本发明实施例五提供的电子设备的硬件结构示意图。

具体实施方式

本发明实施例提供一种基于运营商的用户标签验证方法、装置和电子设备,根据第三方服务平台提供的被测用户的用户身份标识,确定所述被测用户使用的运营商,然后在根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;以及根据所述用户状态信息,确定所述用户标签的真实度测量值;将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;并根据所述比较结果,对所述用户标签进行验证。不仅解决了现有技术中用户标签系统存在的用户标签繁杂凌乱问题,还有效提高了用户标签的准确度。

需要说明的是,本发明实施例提供的基于运营商的用户标签验证方法可以应用于用户画像系统中,且本发明实施例可以为第三方服务平台提供服务,例如,第三方服务平台可以是淘宝网、京东、银行等金融机构。

以淘宝网为例进行说明,用户在注册淘宝网时,一般会填一些基本信息,其中手机号是必须填写的;另外淘宝网可能会引导用户填写一下自己平时需要购买或感兴趣的东西,如化妆品,衣服等,这些就构成了该用户的用户标签,淘宝网会根据用户的用户标签向用户推送相应的产品。然而注册时有些用户可能会填一些虚假的信息,基于此导致用户标签不准确,由此淘宝网为了真实准确地向用户推送一些产品,提高经济效益,会确认用户标签的准确性,本发明实施例提供的基于运营商的用户标签验证方法可以实现对用户标签的验证。

例如,淘宝网根据用户a注册时填写的兴趣爱好为“运动”,淘宝网为了验证“运动”这一用户标签是否准确,则向用户画像系统提供用户a的手机号和“运动”这一用户标签,其中,用户a的手机号即为用户a的用户身份标识,用户画像系统首先根据淘宝网提供的用户a的手机号确定用户a所使用的运营商,例如移动运营商;然后再利用用户a的手机号从确定出的运营商获取与用户a的“运动”用户标签相关的用户状态信息;并根据所述用户状态信息,确定用户a的“运动”用户标签的真实度测量值,再将所述真实度测量值与用户a的“运动”用户标签对应的预设阈值进行比较,得到比较结果,根据所述比较结果对对用户a的“运动”用户标签进行验证,如果得出所述比较结果为所述真实度测量值不小于所述“运动”用户标签对应的预设阈值,则确定对用户a的“运动”用户标签验证通过;如果得出所述比较结果为所述真实度测量值小于所述“运动”用户标签对应的预设阈值,则确定对用户a的“运动”用户标签验证不通过。由此实现对淘宝网提供的用户a的“运动”用户标签的验证和清洗。

进一步地,当利用本发明提供的基于运营商的用户标签验证方法的用户画像系统确定用户a的“运动”用户标签验证失败后,则表明用户a的“运动”用户标签为虚假标签,并将验证失败结果告知淘宝网,由此淘宝网在获知该结果后即可不频繁向用户a推送各种与运动相关的产品。

为了使得淘宝网更加了解用户a网购倾向,提高淘宝网的推送效率,采用本发明提供的方法的用户画像系统在对用户a的“运动”用户标签验证通过后,还可以判断用户a是否满足扩展用户标签条件,如果满足则为用户a添加若干个用户标签,然后根据添加了的用户标签输出用户a的标签目录,丰富了用户a的标签目录,并将得出的标签目录提供给淘宝网,使得淘宝网更加了解用户a的网购倾向及定位。

此外,在输出用户a的标签目录的同时,还可以根据用户a的标签目录,对用户a进行分类,如用户a为女性,则将用户a归为一级目录女性目录下,此外在该目录下,还可以设置多个二级目录,如根据兴趣爱好为运动的目录,喜欢网购的目录等,根据这些二级目录可以根据用户a的标签目录,用户a添加到对应的二级目录下,方便第三方服务平台查看。

另外,为了使得向第三方服务平台提供的用户的标签目录更有可信度,本发明提供的方法应用于用户画像系统中,还可以输出日志信息,如将对用户a的“运动”用户标签的验证过程生成一条日志信息,或者为用户a扩展用户标签的过程生成一条日志信息,由此将日志信息展示给第三方服务平台后,有利于第三方服务平台获知用户标签的验证和添加过程,进而使得第三方服务平台根据该日志信息判断是否利用用户画像系统提供的用户的标签目录更新第三方服务平台存储的该用户的标签目录,从而使得本发明提供的方法能够满足不同行业基于用户画像为基础的应用。

以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

实施例一

如图1所示,为本发明实施例一提供的基于运营商的用户标签验证方法的流程示意图,可以包括以下步骤:

s11、根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商。

具体实施时,所述身份标识信息可以为以下至少一项信息:被测用户的手机号码、身份证号码、姓名、邮箱等。以手机号码为例进行说明,利用本发明提供的方法的用户画像系统在获知被测用户的手机号码时,可以确定该手机号属于移动运营商、联通运营商和电信运营商中的哪一个,由此可以得到被测用户所使用的运营商。

如果所述身份标识信息为身份证号码,则可以分别向移动运营商、联通运营商和电信运营商发送查询请求,如果查询到该身份证号码最近通常用移动运营商,则确定被测用户所使用的运营商为移动运营商。由于用户在使用各种应用时,这些应用均会让用户输入手机号码来确认用户的身份,也就是说用户的手机号码为目前各应用中识别该用户必不可少的信息,因此,利用用户的手机号码查询用户信息较为快捷。由此当第三方服务平台提供的用户身份标识信息为身份证号码后,在确定出该身份证号码所注册过的运营商时,还可以基于运营商,根据该身份证号码确定出在归属于该运营商的被测用户的手机号码,再利用确定出的手机号码进行用户标签验证。

s12、根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息。

以被测用户的用户身份标识为手机号码为例进行说明,根据所述被测用户的手机号码,可以从运营商查找到被测用户利用其手机号码执行的所有记录,如通话记录,短信、上网行为和消费行为等。

较佳地,所述用户状态信息至少包括以下一项:被测用户的年龄、职业、地理位置信息、上网行为信息、消费信息、积分兑换信息、短信和通话记录。

具体实施时,用户画像系统在确定出被测用户所使用的运营商为移动运营商时,可以向该移动运营商发送用户状态信息获取请求,该请求中携带有被测用户的手机号码,移动运营商在获取该用户状态信息获取请求后,根据该请求中携带的被测用户的手机号码查询被测用户的用户状态信息。

以被测用户的用户标签“青年”用户标签为例进行说明,根据被测用户的手机号码利用运营商数据可以对应到被测用户的年龄、职业、地理位置、上网行为、消费行为、短信、通话记录和社会关系,基于此来判断被测用户的用户标签是否真实。

例如,以判断被测用户的“青年”用户标签是否真实为例进行说明,需要利用运营商数据根据被测用户的手机号码获取与“青年”用户标签相关的用户状态信息,如需要通过年龄、证件号码、在网时长、充值额度、采用联系人等用户状态信息来衡量被测用户的青年”用户标签的真实度,则需要获取上述用户状态信息。

s13、根据所述用户状态信息,确定所述用户标签的真实度测量值。

在步骤s12中获取与“青年”用户标签相关的用户状态信息后,可以利用大数据叠加综合分析来判断“青年”用户标签的真实度。该真实度是个评分过程,由用户画像系统输出该“青年”用户标签的真实度评分。如果被测用户在运营商大数据计算出该评分低于一定的阀值,则表示该“青年”用户标签为假,反之则为真。如果输出的标签判定为假,最后由管理员决定是否可以由本发明提供的实施例给出的真实标签去替换这个假的用户标签。

较佳地,可以根据所述用户状态信息,按照公式(1)确定用户标签的真实度测量值:

其中,vf表示用户标签的真实度测量值;

n表示与用户标签相关的用户状态信息的数量;

vi表示第i个用户状态信息;

scorei表示第i个用户状态信息对应的权重;

β表示用户标签的修正值。

具体实施时,以“青年”用户标签为例进行说明,在验证“青年”用户标签是否真实是,需要利用与“青年”用户标签相关的用户状态信息来判定,即需要利用年龄、证件号码、在网时长、充值额度和常用联系人5个用户状态信息来计算“青年”用户标签的真实度测量值,在按照公式(1)计算时,需要分别确定这5个用户状态信息的权重,其中,权重scorei和修正值β是利用大量真实用户样本进行测量得到的,其为定值。比如,计算“青年”这个用户标签时,年龄的权重占40分,证件号的权重占40分,在网时长的权重占10分,充值额度的权重占5分,常用联系人的权重占5分。

需要说明的是,在利用用户状态信息确定被测用户的真实度测量值时,需要将用户状态信息转换成相应的值,也就是说,在利用公式(1)确定用户标签的真实度测量值时,需要将年龄、证件号码、在网时长等换算成对应的数值,然后再代入到公式(1)中,例如可以将用户状态信息进行归一化处理等。

具体实施时,在确定公式(1)中用户状态信息的权重时,同样是基于运营商进行确定的,大致过程为:利用运营商数据库获取大量真实可靠的、与用户标签相关的样本,相当于公式(1)中vf为已知,也就是说公式(1)中权重scorei和修正值β为未知量。在确定未知量时,而权重的数量与用户状态信息的数量相同,如有n个用户状态信息,则需要确定n个权重,进而再确定一个修正值。也就是说需要确定n+1个未知量。在确定这n+1个未知量时,还以“青年”用户标签为例进行说明,获取与“青年”用户标签相关的大量样本,并获取这些样本的用户状态信息,将其进行换算后带入公式(1)中,由于vf为已知,例如vf=100,由于未知量有n+1个,则需要至少n+1个样本来确定这些未知量,由此即可确定出权重和修正值。较佳地,为了保证确定出的权重和修正值的准确性,还可以采用交叉验证的方法,获得最佳值权重和修正值。

s14、将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果。

具体实施时,针对每一用户标签,该用户标签对应预设阈值可能相同也可能不同,具体根据经验值确定。

较佳地,该用户标签对应的预设阈值是基于该用户标签,利用运营商数据获取大量样本训练得出的。例如,鉴别“青年”的用户标签是否真实,首先本发明实施例已经利用运营商数据中大量真实用户样本计算得出了一个阀值,即该“青年”用户标签对应的预设阈值,比如年龄在15-34岁的给40分,证件号码中年龄的计算也符合15-34岁的再给40分,在网时长小于360个月的给10分,充值额度在10-100的给10分,常用联系人年龄在15-34岁的给5分。按照人工经验在用户数据满足80分以上就可以判定青年标签为真,因此,“青年”用户标签对应的预设阀值可以设定为80。

s15、根据所述比较结果,对所述用户标签进行验证。

具体实施时,在执行步骤s15时,如果所述比较结果为所述真实度测量值不小于所述用户标签对应的预设阈值,则确定对被测用户的用户标签验证通过;或者如果所述比较结果为所述真实度测量值小于所述用户标签对应的预设阈值,则确定对被测用户的用户标签验证不通过。

基于步骤s11~s15的实施,通过利用运营商对被测用户的用户标签进行验证,不仅可以实现对用户标签的清洗,还有效降低了用户画像系统中用户标签的繁杂凌乱问题,提高了用户标签的准确性。

本发明实施例提供的基于运营商的用户标签验证方法可以应用于用户画像系统中,当向用户画像系统输入被测用户的用户标签时,只有利用运营商数据验证通过后,才能执行对被测用户标签目录的整理;当利用运营商数据对用户标签未验证通过时,则表明被测用户的用户标签为假标签,不具有向该用户推送相应信息的意义,由此可以实现对被测用户的用户标签的清洗。

此外,由于运营商对用户登记时采用实名制登记,因此运营商记录的用户的数据真实度得到较大的提供,由此利用运营商数据来验证被测用户的用户标签的真实度,其验证结果的可信度有较大提高,从而提高了用户标签的准确度。

具体实施时,所述被测用户的标签可以但不限于为青年、白领、网购、旅行、还贷、时尚和炒股等等。

进一步地,本发明实施例不仅为了验证被测用户的用户标签的真实度,还为了向第三方服务平台提供关于被测用户更加丰富多样的用户标签。为此,本发明实施例还提供了在利用运营商验证被测用户的用户标签通过时,进一步地为被测用户扩展用户标签,参考图2所示的流程,包括以下步骤:

s21、判断被测用户是否满足扩展用户标签条件,如果是,则执行步骤s22;否则执行步骤s24。

具体实施时,如果步骤s21中判断出被测用户满足扩展用户标签条件,则为被测用户扩展用户标签,由此实现被测用户的用户标签的多样化。

较佳地,在执行步骤s21中判断所述被测用户是否满足扩展用户标签条件时,可以按照图3所示的方法实施,可以包括以下步骤:

s31、根据所述被测用户的身份标识信息,基于确定出的运营商判断所述被测用户是否存在社交联系人,如果是,则执行步骤s32;否则执行步骤s33。

s32、确定所述被测用户满足扩展用户标签条件。

s33、确定所述被测用户不满足扩展用户标签条件。

具体实施时,可以根据被测用户的手机号码,基于运营商数据判断该被测用户是否存在亲情号码,和/或根据所述被测用户的通话记录、短信,判断被测用户月平均或周平均通话时长是否大于预设时长或者判断月平均或周平均通话次数是否大于预设通话次数,和/或根据被测用户的地理位置信息对应的局域网号(短号)判断用户是否存在常用联系人等,如果存在,则确定所述被测用户满足扩展用户标签条件;如果不存在,则确定被测用户不满足扩展用户标签条件。

较佳地,在步骤s33确定被测用户满足可扩展用户标签条件时,还包括:

利用确定出的运营商确定所述被测用户的社交联系人。

具体实施时,每个用户都对应有社会关系网络,比如父母、妻子、好友。一般该用户的社会行为会受到来自亲密社会关系人的行为影响,比如父母喜欢吃什么菜,很可能该用户也喜欢什么菜、再比如好友的兴趣爱好,很可能该用户也有这样的兴趣爱好。

因此,基于运营商数据的社会关系网络的分析,本发明实施例可以根据被测用户的手机号码定位到该用户的父母、妻子、好友。即在利用步骤s11~s15对被测用户的用户标签验证通过后,如果该被测用户的亲密社会关系人中存在不同的标签,则可以将这些用户标签继承给被测用户。例如,被测用户的父母具有“炒股”、“保健”等用户标签;该被测用户的妻子具有“旅游”、“美食”用户标签;其好友具有“理财”、“移民”用户标签。且这6个用户标签是被测用户没有的,则将这三种标签全部继承给该被测用户,由此可以进一步丰富被测用户的用户标签,让用户画像更加丰满真实。

s22、为所述被测用户添加若干个用户标签。

具体实施时,在执行步骤s22时,可以按照图4所示的方法执行,包括以下步骤:

s41、针对确定出的每一社交联系人,确定该社交联系人的标签目录。

具体实施时,所述社交联系人可以为被测用户的父母、妻子和好友等,因此可以根据每一社交联系人,确定该社交联系人的标签目录。

本发明实施例提供的用户画像系统,预先根据运营商数据,分别为已在运营商数据注册过的用户确定了标签目录。因此,可以根据被测用户的手机号码,确定出被测用户父母、妻子等社交联系人的手机号码,基于此可以确定出社交联系人的标签目录。例如确定出被测用户的妻子的标签目录包括青年、白领、旅游、美食、个体户和理财等用户标签。被测用户的标签目录包括青年、白领、运动用户标签。

s42、从该社交联系人的标签目录中选择与被测用户的标签目录中包含的任一用户标签不相同的用户标签。

具体实施时,被测用户妻子的标签目录与被测用户的标签目录相比,可以确定出有旅游、美食、个体户和理财四个用户标签是被测用户没有的。

s43、将从所有社交联系人的标签目录中分别选择出的用户标签确定为所述被测用户要添加的用户标签。

根据步骤s42中确定出的旅游、美食、个体户和理财这四个用户标签,为被测用户添加上这四个用户标签。此时添加的四个用户标签并没有直接添加到被测用户的最终标签目录中,由于添加的这四个用户标签可能对于被测用户来说并不是准确的,因此可以先暂存到缓存中,做进一步判断处理,即执行步骤s23的过程。

s23、根据添加的若干个用户标签,输出所述被测用户的标签目录。

较佳地,在执行步骤s23时,针对添加的每一用户标签,可以按照图5所示的方法执行,包括以下步骤:

例如,针对步骤s43中为被测用户添加的旅游、美食、个体户和理财这四个用户标签,为了提高用户标签的准确度,需要针对每一个用户标签,执行步骤s51~s55的过程。

s51、利用所述被测用户的身份标识信息,从所述运营商再次获取与该用户标签相关的用户状态信息。

具体实施时,以个体户为例进行说明,在为被测用户添加“个体户”这一用户标签后,为了提高用户标签的准确度,因此还需要根据被测用户的手机号码,利用运营商数据查找与“个体户”用户标签相关的用户状态信息,如可以定位到被测用户的地理位置信息、通话记录、短信上网信息和常用联系人等等。

s52、根据所述用户状态信息,确定该用户标签的真实度测量值。

具体实施时,在确定该用户标签的真实度测量值时,依然可以按照公式(1)进行确定。即确定步骤s51中“个体户”用户标签的真实度测量值时,具体到每个用户状态信息时,如地理位置信息的关键词包括商铺、商场,其权重可以为30;通话和短信过滤关键词包括电商、工厂、贸易公司的电话开头,所占权重为40;常用联系人里过滤包含具有个体户标签、税务、工商的关键数字,所占权重为30。如果按照人工经验值,达到100分的用户可以具备“个体户”用户标签,则修正值β可以为0。

s53、判断所述真实度测量值是否不小于该用户标签对应的预设阈值,如果是,则执行步骤s54;否则执行步骤s55。

具体实施时,针对不同的用户标签,其对应的预设阈值可能不同,可以根据经验值进行确定。

s54、将该用户标签添加到所述被测用户的标签目录中并输出。

具体实施时,在步骤s53中确定出所述“个体户”用户标签的真实度测量值大于“个体户”用户标签对应的预设阈值时,则可以将“个体户”用户标签添加到被测用户的标签目录中,此外,由于第三服务平台提供的被测用户的用户标签可能不在用户画像系统存储的被测用户的标签目录中,有可能已经存在于被测用户的标签目录中,则如果存在则不添加到标签目录中,如果不存在则将被测用户的用户标签添加至标签目录中。

进一步地,还可以利用所述被测用户的用户标签更新所述被测用户的标签目录。

s55、保持所述被测用户的标签目录不变并输出。

在步骤s53中若判断出所述“个体户”用户标签的真实度测量值小于该用户标签对应的预设阈值时,则表明被测用户不是个体户,则不需要将“个体户”用户标签添加至被测用户的标签目录中,直接利用所述被测用户的用户标签更新所述被测用户的标签目录。

s24、保持所述被测用户的标签目录不变。

较佳地,为了使得向第三方服务平台提供的用户的标签目录更有可信度,本发明提供的方法应用于用户画像系统中,可以在输出被测用户的标签目录时,还可以输出根据标签目录对用户进行的用户分类和日志信息。如将对被测用户的“青年”用户标签的验证过程生成一条日志信息,或者为被测用户扩展“个体户”用户标签的过程生成一条日志信息,由此将日志信息展示给第三方服务平台后,有利于第三方服务平台获知用户标签的验证和添加过程,进而使得第三方服务平台根据该日志信息判断是否利用用户画像系统提供的用户的标签目录更新第三方服务平台存储的该用户的标签目录,从而使得本发明提供的方法能够满足不同行业基于用户画像为基础的应用。

具体地,在执行步骤s11~15和步骤s21~s24步骤后,用户标签已经经过了清洗以及被测用户的标签目录也进行了整理。根据运营商数据用户样本计算得出的用户标签目录一共两级,每个二级标签都有对应的属性组合和阀值计算,该目录在本发明实施例做成一个hash对照表,外部输入的用户标签在执行标签目录匹配后,会在每个对应的目录进行一次计算,执行验真、继承、多态、归类的清洗整理操作,如果运营商数据样本计算的目录中没有包含用户特有的标签,则用户画像系统将该标签归类为其他,同时将该标签目录通过日志、数据库、后台页面等等的形式输出,可以极大的方便提高管理员对用户标签的管理。最后,本发明实施例可以方便的基于两级目录对用户进行分类,给出统计数据,比如青年人有多少,个体商户有多少,消费能力的分布,等等。

较佳地,在执行步骤s11之前,即在利用运营商数据对被测用户的用户标签进行验证之前,还包括图6所示的流程,包括以下步骤:

s61、利用正则表达式将所述第三方服务平台提供的被测用户的用户标签与存储的所述被测用户的标签目录中包含的用户标签进行匹配,得到标签目录中、与被测用户的用户标签相匹配的用户标签。

具体实施时,本发明实施例中,基于运营商数据的每一用户的标签目录是在其全量用户样本大数据计算的基础上得出的,比如一级目录中职业类型对应的二级目录包含的用户标签有个体户、白领、学生、律师、医生、教师、政府等等。

具体实施时,第三方服务平台提供给用户画像系统的被测用户的用户标签可能与本发明基于运营商数据确定出的被测用户的标签目录中的用户标签名字不同,例如第三方服务平台提供的用户标签为“青少年”或“中年”用户标签,而本发明基于运营商数据确定出的被测用户的标签目录中只有“青年”用户标签,由此可以利用数据库检索和正则表达式将所述“青少年”用户标签匹配到本发明提供的标签目录中的“青年”用户标签。如果匹配不到,则将该用户标签归为其它目录,并由系统管理员进行选择和执行具体的管理操作,如可以通过计算该用户标签的真实度,如果其超过标签计算阈值,则将为被测用户添加该用户标签。

需要说明的是,本发明实施例基于运营商数据确定的用户的标签目录一共两级,一级目录比如基本信息、消费信息、信用记录、社会关系、职业类型、兴趣爱好、子女教育、其他等等,二级目录比如基本信息包括年龄、婚姻、性别、籍贯等等。

s62、将所述标签目录中、与被测用户的用户标签相匹配的用户标签重新确定为所述第三方服务平台提供的被测用户的用户标签。

具体实施时,当步骤s61匹配成功时,将匹配后的用户标签确定为被测用户的用户标签,然后再对所述用户标签进行验证。

较佳地,具体实施时,通过运营商数据中的社会关系、通话、上网、消费、信用、积分兑换、地理位置等信息来更新、删除用户标签,提升标签的多态性和丰富度。按照上述步骤s61~s62提供的两级标签目录,运营商数据样本计算可以提供一个丰富的标签目录。如果该用户在执行步骤s61~s62的用户标签匹配的过程中,在对应的标签目录中没有查到相关的用户标签,则本发明实施例则计算该用户的数据,如果其结果超过对应的标签目录中的标签计算阀值,则给该用户增加上此标签;如果该用户的用户标签可以在标签目录中检索到,则验证该标签的真实度,标签为假的话,则更新或者删除此标签;最后将用户的剩余的标签归类到其他目录。

本发明实施例一提供的基于运营商的用户标签验证方法,根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商;并根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;以及根据所述用户状态信息,确定所述用户标签的真实度测量值;将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;并根据所述比较结果,对所述用户标签进行验证,不仅可以实现对用户标签的清洗,还有效降低了用户画像系统中用户标签的繁杂凌乱问题,提高了用户标签的准确度;此外,在利用运营商对被测用户的用户标签验证通过后,判断所述被测用户是否满足扩展用户标签条件;以及在判断结果为是时,为所述被测用户添加若干个用户标签;根据添加的若干个用户标签,输出所述被测用户的标签目录,由此扩展了被测用户的标签目录,提升了用户的标签目录的多态性,使得用户画像系统更加真实丰富。

实施例二

为了进一步理解本发明提供的基于运营商的用户标签验证方法,可以参考图7所示的流程示意图,包括以下步骤:

s71、利用正则表达式将所述第三方服务平台提供的被测用户的用户标签与存储的所述被测用户的标签目录中包含的用户标签进行匹配,得到标签目录中、与被测用户的用户标签相匹配的用户标签。

具体实施时,可以参考实施例一中步骤s61的执行过程,将第三方服务平台提供的被测用户的用户标签匹配到应用本发明的用户画像系统存储的、基于运营商数据确定的被测用户的标签目录中的用户标签。如将第三方服务平台提供的“青少年”用户标签对应到本发明中基于运营商数据确定的标签目录中的“青年”用户标签等,重复之处不再赘述。

s72、将所述标签目录中、与被测用户的用户标签相匹配的用户标签重新确定为所述第三方服务平台提供的被测用户的用户标签。

具体实施时,当步骤s71匹配成功时,将匹配后的用户标签确定为被测用户的用户标签,然后再对所述用户标签进行验证。

s73、根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商。

s74、根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息。

s75、根据所述用户状态信息,确定所述用户标签的真实度测量值。

s76、判断所述真实度测量值是否不小于所述用户标签对应的预设阈值,如果是,则执行步骤s78;否则执行步骤s77。

s77、确定对被测用户的用户标签验证不通过。

s78、确定对被测用户的用户标签验证通过。

具体实施时,执行步骤s73~s78的步骤,可以参考实施例一中步骤s11~s15的步骤,重复之处不再赘述。

本发明实施例二步骤s73~s78的执行过程中,当向用户画像系统输入被测用户的用户标签时,只有利用运营商数据验证通过后,才能执行对被测用户标签目录的整理;当利用运营商数据对用户标签未验证通过时,则表明被测用户的用户标签为假标签,不具有向该用户推送相应信息的意义,由此可以实现对被测用户的用户标签的清洗。

此外,由于运营商对用户登记时采用实名制登记,因此运营商记录的用户的数据真实度得到较大的提供,由此利用运营商数据来验证被测用户的用户标签的真实度,其验证结果的可信度有较大提高,从而提高了用户标签的准确度。

具体实施时,所述被测用户的标签可以但不限于为青年、白领、网购、旅行、还贷、时尚和炒股等等。

进一步地,本发明实施例不仅为了验证被测用户的用户标签的真实度,还为了向第三方服务平台提供关于被测用户更加丰富多样的用户标签。为此,本发明实施例还提供了在利用运营商验证被测用户的用户标签通过时,进一步地参考步骤s79~s719的实施过程为被测用户扩展用户标签:

s79、根据所述被测用户的身份标识信息,基于确定出的运营商判断所述被测用户是否存在社交联系人,如果是,则执行步骤s711;否则执行步骤s710。

s710、确定所述被测用户不满足扩展用户标签条件。

具体实施时,本发明实施例二中步骤s79和s710的执行可以参考实施例一种步骤s31和步骤s33的实施,重复之处步骤赘述。

s711、利用确定出的运营商确定所述被测用户的社交联系人。

s712、针对确定出的每一社交联系人,确定该社交联系人的标签目录。

s713、从该社交联系人的标签目录中选择与被测用户的标签目录中包含的任一用户标签不相同的用户标签。

s714、将从所有社交联系人的标签目录中分别选择出的用户标签确定为所述被测要用户添加的用户标签。

具体实施时,本发明实施例二中步骤s712~s714的实施可以参考实施例一中步骤s41~s43的执行,重复之处步骤赘述。

s715、利用所述被测用户的身份标识信息,从所述运营商再次获取与该用户标签相关的用户状态信息。

s716、根据所述用户状态信息,确定该用户标签的真实度测量值。

s717、判断所述真实度测量值是否不小于该用户标签对应的预设阈值,如果是,则执行步骤s718;否则执行步骤s719。

s718、将该用户标签添加到所述被测用户的标签目录中并输出。

s719、保持所述被测用户的标签目录不变并输出。

具体实施时,本发明实施例二中步骤s715~s719的实施可以参考实施例一中步骤s51~s55的执行,重复之处步骤赘述。

本发明实施例二提供的基于运营商的用户标签验证方法,在利用运营商数据对被测用户的用户标签进行验证时,通过根据第三方服务平台提供的被测用户的身份标识信息,获取与所述用户标签相关的用户状态信息,然后根据所述用户状态信息确定用户标签的真实度测量值,当所述真实度测量值不小于所述用户标签对应的预设阈值时,确定用户标签验证通过,当所述用户标签的真实度测量值小于所述用户标签对应的预设阈值时,则表明所述用户标签验证失败,由此不仅可以实现对用户标签的清洗,还有效降低了用户画像系统中用户标签的繁杂凌乱问题,提高了用户标签的准确度;提供了用户标签的准确度;此外,待被测用户的用户标签验证通过后,判断所述被测用户是否满足扩展用户标签条件,具体为根据被测用户的身份标识信息,基于运营商数据判断被测用户身份存在社交联系人,如果存在则确定被测用户满足扩展用户标签条件;以及在判断出被测用户具有扩展用户标签条件后,针对每一社交联系人,确定该社交联系人的标签目录;从该社交联系人的标签目录中选择与被测用户的标签目录中包含的任一用户标签不相同的用户标签;将从所有社交联系人的标签目录中分别选择出的用户标签确定为所述被测用户添加的用户标签;由此实现了对被测用户的用户标签的扩展,使得被测用户的用户画像更加丰富;最后根据所述被测用户的用户标签和添加的若干个用户标签,整理并输出所述被测用户的标签目录。采用本发明提供的方法,通过利用运营商数据对用户标签进行验证。同时还为扩展了用户的标签目录,提升了用户的标签目录的多态性,使得用户画像系统更加真实丰富。

实施例三

基于同一发明构思,本发明实施例中还提供了一种基于运营商的用户标签验证装置,由于上述装置解决问题的原理与基于运营商的用户标签验证方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。

如图8所示,为本发明实施例三提供的基于运营商的用户标签验证装置的结构示意图,包括第一确定单元81、获取单元82、第二确定单元83、比较单元84和验证单元85,其中:

第一确定单元81,用于根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商;

获取单元82,用于根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;

第二确定单元83,用于根据所述用户状态信息,确定所述用户标签的真实度测量值;

比较单元84,用于将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;

验证单元85,用于根据所述比较结果,对所述用户标签进行验证。

具体实施时,所述验证单元85,具体用于如果所述比较结果为所述真实度测量值不小于所述用户标签对应的预设阈值,则确定对被测用户的用户标签验证通过;或者如果所述比较结果为所述真实度测量值小于所述用户标签对应的预设阈值,则确定对被测用户的用户标签验证不通过。

较佳地,所述装置,还包括:判断单元、添加单元和输出单元,其中:

所述判断单元,用于在所述验证单元确定对被测用户的用户标签验证通过之后,判断所述被测用户是否满足扩展用户标签条件;

所述添加单元,用于在所述判断单元的判断结果为是时,为所述被测用户添加若干个用户标签;

所述输出单元,用于根据添加的若干个用户标签,输出所述被测用户的标签目录。

具体实施时,所述判断单元,具体用于根据所述被测用户的身份标识信息,基于确定出的运营商判断所述被测用户是否存在社交联系人;如果存在,则确定所述被测用户满足扩展用户标签条件;如果不存在,则确定所述被测用户不满足扩展用户标签条件。

优选地,所述装置,还包括:

第三确定单元,用于在所述判断单元确定出所述被测用户满足扩展用户标签条件之后,利用确定出的运营商确定所述被测用户的社交联系人;

所述添加单元,具体用于在所述判断单元的判断结果为是时,针对确定出的每一社交联系人,确定该社交联系人的标签目录;从该社交联系人的标签目录中选择与被测用户的标签目录中包含的任一用户标签不相同的用户标签;将从所有社交联系人的标签目录中分别选择出的用户标签确定为所述被测用户要添加的用户标签。

具体实施时,所述输出单元,具体用于根据添加的每一用户标签,均执行以下过程:利用所述被测用户的身份标识信息,从所述运营商再次获取与该用户标签相关的用户状态信息;根据所述用户状态信息,确定该用户标签的真实度测量值;如果所述真实度测量值不小于该用户标签对应的预设阈值,则将该用户标签添加到所述被测用户的标签目录中并输出;或者如果确定出所述真实度测量值小于该用户标签对应的预设阈值,则保持所述被测用户的标签目录不变并输出。

优选地,所述用户状态信息至少包括以下一项:被测用户的年龄、职业、地理位置信息、上网行为信息、消费信息、积分兑换信息、短信和通话记录;以及

所述第二确定单元83或所述输出单元,具体用于根据所述用户状态信息,按照下述公式确定用户标签的真实度测量值:

其中,vf表示用户标签的真实度测量值;

n表示与用户标签相关的用户状态信息的数量;

vi表示第i个用户状态信息;

scorei表示第i个用户状态信息对应的权重;

β表示用户标签的修正值。

较佳地,所述装置,还包括:匹配单元和重新确定单元,其中:

所述匹配单元,用于在所述第一确定单元根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商之前,利用正则表达式将所述第三方服务平台提供的被测用户的用户标签与存储的所述被测用户的标签目录中包含的用户标签进行匹配,得到标签目录中、与被测用户的用户标签相匹配的用户标签;

所述重新确定单元,用于将所述标签目录中、与被测用户的用户标签相匹配的用户标签重新确定为所述第三方服务平台提供的被测用户的用户标签。

为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。

实施例四

本申请实施例四提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任一方法实施例中任一项基于运营商的用户标签验证方法。

实施例五

图9是本发明实施例五提供的实施基于运营商的用户标签验证方法的电子设备的硬件结构示意图,如图9所示,该电子设备包括:

一个或多个处理器910以及存储器920,图9中以一个处理器910为例。

执行基于运营商的用户标签验证方法的电子设备还可以包括:输入装置930和输出装置940。

处理器910、存储器920、输入装置930和输出装置940可以通过总线或者其他方式连接,图9中以通过总线连接为例。

存储器920作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的基于运营商的用户标签验证方法对应的程序指令/模块/单元(例如,附图8所示的第一确定单元81、获取单元82、第二确定单元83、比较单元84和验证单元85)。处理器910通过运行存储在存储器920中的非易失性软件程序、指令以及模块/单元,从而执行服务器或者智能终端的各种功能应用以及数据处理,即实现上述方法实施例基于运营商的用户标签验证方法。

存储器920可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于运营商的用户标签验证装置的使用所创建的数据等。此外,存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器920可选包括相对于处理器910远程设置的存储器,这些远程存储器可以通过网络连接至基于运营商的用户标签验证装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置990可接收输入的数字或字符信息,以及产生与基于运营商的用户标签验证装置的用户设置以及功能控制有关的键信号输入。输出装置940可包括显示屏等显示设备。

所述一个或者多个模块存储在所述存储器920中,当被所述一个或者多个处理器910执行时,执行上述任意方法实施例中的基于运营商的用户标签验证方法。

上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。

本申请实施例的电子设备以多种形式存在,包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iphone)、多媒体手机、功能性手机,以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:pda、mid和umpc设备等,例如ipad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如ipod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。

(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

实施例六

本申请实施例六提供了一种计算机程序产品,其中,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,其中,当所述程序指令被计算机执行时,使所述计算机执行本申请上述方法实施例中任一项基于运营商的用户标签验证方法。

本发明实施例提供的基于运营商的用户标签验证方法、装置和电子设备,根据第三方服务平台提供的被测用户的用户身份标识,确定被测用户使用的运营商;并根据所述第三方服务平台提供的被测用户的用户标签,利用所述用户身份标识从确定出的运营商获取与所述被测用户的用户标签相关的用户状态信息;以及根据所述用户状态信息,确定所述用户标签的真实度测量值;将所述真实度测量值与所述用户标签对应的预设阈值进行比较,得到比较结果;并根据所述比较结果,对所述用户标签进行验证,不仅可以实现对用户标签的清洗,还有效降低了用户画像系统中用户标签的繁杂凌乱问题,提高了用户标签的准确度;此外,在利用运营商对被测用户的用户标签验证通过后,判断所述被测用户是否满足扩展用户标签条件;以及在判断结果为是时,为所述被测用户添加若干个用户标签;根据添加的若干个用户标签,输出所述被测用户的标签目录,由此扩展了被测用户的标签目录,提升了用户的标签目录的多态性,使得用户画像系统更加真实丰富。

本申请的实施例所提供的基于运营商的用户标签验证装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要基于运营商的用户标签验证装置具有上述功能,都应该在本申请的保护范围之内。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1