一种用户标签生成方法、装置及服务器与流程

文档序号:14403228阅读:146来源:国知局
一种用户标签生成方法、装置及服务器与流程
本发明涉及数据处理
技术领域
,尤其是一种用户标签生成方法、装置及服务器。
背景技术
:在互联网逐渐步入大数据时代后,消费者的一切行为在企业面前似乎都将是“可视化”的。企业的专注点日也开始益聚焦于怎样利用大数据来为精准地向用户提供服务。于是,“用户画像”也就应运而生了。用户画像,即用户信息标签化,就是通过收集与分析用户社会属性、生活习惯、行为等主要信息的数据之后,完美地抽象出一个用户的全貌。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。其中,属性是进行用户画像所需要统计的维度,如性别下的男和女,年龄下的少年、青年、中年、老年,收入等级下的贫困,中低,中等,富裕等。现有技术中用户画像方法主要通过对用户的行为进行监测,而后为用户打上各种标签,但是,现有技术方案存在以下缺点:一般采用简单且单一的用户行为分析方法,导致最终得到的用户标签不够精确全面。技术实现要素:本发明实施例所要解决的一个技术问题是:无法得到精确全面的用户标签。本发明实施例一种用户标签生成方法、装置及服务器。所述技术方案如下:根据本发明实施例的第一方面,提供一种用户标签生成方法,包括:获取用户行为数据;确定待分析属性的类型所对应的分析模型;根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性;根据所述待分析属性生成用户标签。可选的,所述待分析属性包括以下至少一项:基本属性、来访属性、观影属性、时间属性、购买属性;当所述待分析属性为基本属性时,所述基本属性至少包括用户年龄和/或性别,所述根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性,包括:从所述用户行为数据提取用户行为对象;根据所述分析模型确定用户行为对象与所述基本属性的对应关系;根据所述对应关系分析所述基本属性;和/或,当所述待分析属性为来访属性时,所述根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性,包括:从所述用户行为数据中提取用户登录数据;根据所述用户登录数据分析所述来访属性;和/或,当所述待分析属性为观影属性时,所述根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性,包括:从所述用户行为数据中提取影片类型数据,所述影片类型数据包括用户观看过的影片类型和/或用户搜索过的影片类型;根据所述影片类型数据分析所述观影属性;和/或,当所述待分析属性为时间属性时,所述根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性,包括:从所述用户行为数据中提取观影时间数据及影片时间数据;根据所述观影时间数据及影片时间数据分析所述时间属性;和/或,当所述待分析属性为购买属性时,所述根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性,包括:从所述用户行为数据中提取缴费数据;根据所述缴费数据分析所述购买属性。可选的,当所述用户行为对象为影片时,所述根据所述分析模型确定用户行为对象与所述基本属性的对应关系,包括:根据所述分析模型确定所述对应关系为所述影片对应的第一基本属性概率;所述根据所述对应关系分析所述基本属性,包括:根据所述用户行为数据中每部影片对应的第一基本属性概率,计算所述用户对应的第二基本属性概率;根据所述第二基本属性概率确定所述基本属性。可选的,当所述待分析属性为观影属性时,所述根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性,还包括:从所述用户行为数据中提取用户历史搜索数据;根据所述历史搜索数据分析用户的搜索习惯和/或搜索路径;根据所述搜索习惯和/或搜索路径预测所述用户的兴趣影片类型作为所述影片类型数据。可选的,所述方法还包括:获取样本数据,所述样本数据包括用户的基本属性及用户观看过的第一影片;根据所述样本数据确定所述第一影片对应的基本属性概率及所述用户对应的基本属性概率;根据所述用户对应的基本属性概率确定用户观看过的第二影片对应的基本属性概率;通过上述方式进行多轮迭代后,根据得到的每部影片对应的基本属性概率,生成所述基本属性对应的分析模型。根据本发明实施例的第二方面,提供一种用户标签生成装置,包括:第一获取模块,用于获取用户行为数据;第一确定模块,用于确定待分析属性的类型所对应的分析模型;分析模块,用于根据所述分析模型对所述用户行为数据进行分析,得到所述待分析属性;第一生成模块,用于根据所述待分析属性生成用户标签。可选的,所述待分析属性包括以下至少一项:基本属性、来访属性、观影属性、时间属性、购买属性;所述分析模块包括:第一提取子模块,用于当所述待分析属性为基本属性时,所述基本属性至少包括用户年龄和/或性别,从所述用户行为数据提取用户行为对象;第一确定子模块,用于根据所述分析模型确定用户行为对象与所述基本属性的对应关系;第一分析子模块,用于根据所述对应关系分析所述基本属性;和/或,所述分析模块包括:第二提取子模块,用于当所述待分析属性为来访属性时,从所述用户行为数据中提取用户登录数据;第二分析子模块,用于根据所述用户登录数据分析所述来访属性;和/或,所述分析模块包括:第三提取子模块,用于当所述待分析属性为观影属性时,从所述用户行为数据中提取影片类型数据,所述影片类型数据包括用户观看过的影片类型和/或用户搜索过的影片类型;第三分析子模块,用于根据所述影片类型数据分析所述观影属性;和/或,所述分析模块包括:第四提取子模块,用于当所述待分析属性为时间属性时,从所述用户行为数据中提取观影时间数据及影片时间数据;第四分析子模块,用于根据所述观影时间数据及影片时间数据分析所述时间属性;和/或,所述分析模块包括:第五提取子模块,用于当所述待分析属性为购买属性时,从所述用户行为数据中提取缴费数据;第五分析子模块,用于根据所述缴费数据分析所述购买属性。可选的,第一确定子模块,用于当所述用户行为对象为影片时,根据所述分析模型确定所述对应关系为所述影片对应的第一基本属性概率;第一分析子模块,用于根据所述用户行为数据中每部影片对应的第一基本属性概率,计算所述用户对应的第二基本属性概率;根据所述第二基本属性概率确定所述基本属性。可选的,所述分析模块还包括:第六提取子模块,用于当所述待分析属性为观影属性时,从所述用户行为数据中提取用户历史搜索数据;第六分析子模块,用于根据所述历史搜索数据分析用户的搜索习惯和/或搜索路径;预存子模块,用于根据所述搜索习惯和/或搜索路径预测所述用户的兴趣影片类型作为所述影片类型数据。可选的,所述装置还包括:第二获取模块,用于获取样本数据,所述样本数据包括用户的基本属性及用户观看过的第一影片;第二确定模块,用于根据所述样本数据确定所述第一影片对应的基本属性概率及所述用户对应的基本属性概率;第三确定模块,用于根据所述用户对应的基本属性概率确定用户观看过的第二影片对应的基本属性概率;第二生成模块,用于通过上述方式进行多轮迭代后,根据得到的每部影片对应的基本属性概率,生成所述基本属性对应的分析模型。根据本发明实施例的第三方面,提供一种用户标签生成服务器,其特征在于,包括:上述各个装置实施例所述的装置。本实施例中,针对不同类型的待分析属性,采用不同的方式进行确定,这样,可以精确地确定每种待分析属性,并且全面获得用户的属性信息,为用户生成更加准确全面的标签,以便为企业提供了足够的信息基础,帮助企业快速找到精准用户群体及用户需求等更为广泛的反馈信息。下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。附图说明构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释本发明的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:图1是本发明实施例示出的用户标签生成方法的流程图;图2是本发明另一实施例示出的用户标签生成方法的流程图;图3是本发明实施例示出的用户标签生成装置的框图;图4是本发明实施例示出的分析模块的框图;图5是本发明另一实施例示出的分析模块的框图;图6是本发明另一实施例示出的分析模块的框图;图7是本发明另一实施例示出的分析模块的框图;图8是本发明另一实施例示出的分析模块的框图;图9是本发明另一实施例示出的分析模块的框图;图10是本发明另一实施例示出的用户标签生成装置的框图。具体实施方式现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。本发明实施例可以应用于计算机系统/服务器,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。本发明实施例可应用于网络侧服务器中,服务器通过对用户属性的分析,得到全面准确的多个用户标签。图1是本发明实施例示出的用户标签生成方法的流程图。如图1所示,该用户标签生成方法包括以下步骤:步骤s11,获取用户行为数据。步骤s12,确定待分析属性的类型所对应的分析模型。步骤s13,根据分析模型对用户行为数据进行分析,得到待分析属性。步骤s14,根据待分析属性生成用户标签。本实施例中,针对不同类型的待分析属性,采用不同的方式进行确定,这样,可以精确地确定每种待分析属性,并且全面获得用户的属性信息,为用户生成更加准确全面的标签,以便为企业提供了足够的信息基础,帮助企业快速找到精准用户群体及用户需求等更为广泛的反馈信息。其中,待分析属性包括以下至少一项:基本属性、来访属性、观影属性、时间属性、购买属性。基本属性可以包括以下至少一项:用户年龄、性别等。来访属性可以包括:偶然/长期用户。观影属性可以包括以下至少一项:观看影片类别、兴趣影片类型等。时间属性可以包括以下至少一项:观看短视频/长视频等。购买属性可以包括以下至少一项:忠诚/不忠诚、有钱(购买能力强)/没钱(购买能力弱)等。其中,对于基本属性,对应的分析模型可以预先根据贝叶斯原理通过多轮迭代的方式生成。对于来访属性、观影属性和时间属性,可以通过基于事实的方式确定,即其对应的分析模型为根据实际的用户行为参数,得到相应的属性信息。对于购买属性,则可以根据预先设定的规则确定,即其对应的分析模型为用户缴费数据与预设购买属性之间的对应关系。在一个实施例中,当待分析属性为基本属性时,基本属性至少包括用户年龄和/或性别,上述步骤s13包括:步骤a1,从用户行为数据提取用户行为对象。步骤a2,根据分析模型确定用户行为对象与基本属性的对应关系。步骤a3,根据对应关系分析基本属性。其中,当用户行为对象为影片时,步骤a2包括:根据分析模型确定对应关系为影片对应的第一基本属性概率;步骤a3包括:根据用户行为数据中每部影片对应的第一基本属性概率,计算用户对应的第二基本属性概率;根据第二基本属性概率确定基本属性。例如,所要分析的基本属性为用户的性别。根据用户行为数据提取到用户行为对象为影片《甄嬛传》。预先生成的分析模型中,影片《甄嬛传》与性别的对应关系为,70%女性。则根据该分析模型,可确定该用户有70%的可能性为女性,可以将该用户的性别确定为女性。又例如,根据用户行为数据提取到用户行为对象为影片《甄嬛传》、《楚乔传》和《三生三世十里桃花》。预先生成的分析模型中,影片《甄嬛传》与性别的对应关系为,70%女性,观影人数为6千万;影片《楚乔传》与性别的对应关系为,75%女性,观影人数为5千万;影片《三生三世十里桃花》与性别的对应关系为,78%女性,观影人数为8千万。则根据该分析模型以及每个影片的观影人数,可计算出该用户为女性的可能性为:可以将该用户的性别确定为女性。当用户观看的影片为多部时,确定用户性别的方式除上述方式外还可以有多种。例如,可以预先根据观影人数为每部影片确定性别权重,如下表所示,观影人数n性别权重n≤1百万0.11百万<n≤5百万0.25百万<n≤1千万0.41千万<n≤5千万0.55千万<n≤1亿0.7n>1亿0.9这样,当用户观看过影片a、b、c,对应的观影人数和性别比例分别为:3百万,70%女性;2千万,50%女性;7千万,30%女性。根据上述性别权重表,计算得到该用户为女性的概率为:70%*0.2+40%*0.5+20%*0.7=48%。即该用户为男性的概率为52%,则可将该用户的性别确定为男性。在一个实施例中,当待分析属性为来访属性时,上述步骤s13包括:步骤b1,从用户行为数据中提取用户登录数据。步骤b2,根据用户登录数据分析来访属性。例如,根据用户实际登录应用程序的时间和退出应用程序的时间,以及连续登录应用程序的天数等用户实际行为,确定用户来访属性,偶然用户或长期用户等。在一个实施例中,当待分析属性为观影属性时,上述步骤s13包括:步骤c1,从用户行为数据中提取影片类型数据,影片类型数据包括用户观看过的影片类型和/或用户搜索过的影片类型。步骤c2,根据影片类型数据分析观影属性。例如,根据用户以往观看过的影片的影片类型确定;或者,根据用户搜索过的影片的影片类型确定。另外,当待分析属性为观影属性时,上述步骤s13还包括:步骤d1,从用户行为数据中提取用户历史搜索数据;步骤d2,根据历史搜索数据分析用户的搜索习惯和/或搜索路径;步骤d3,根据搜索习惯和/或搜索路径预测用户的兴趣影片类型作为影片类型数据。例如,根据用户历史搜索数据,分析得到用户搜索习惯为每周五至周日晚上搜索“美剧”、“更新”,搜索路径为从百度首页到各个视频网站。则可确定该用户兴趣影片类型为正处于播出状态的美国电视剧。在一个实施例中,当待分析属性为时间属性时,上述步骤s13包括:步骤e1,从用户行为数据中提取观影时间数据及影片时间数据;步骤e2,根据观影时间数据及影片时间数据分析时间属性。例如,根据用户的观影时间点、观影时间总长度、每个影片的长度,确定用户的时间属性。例如,用户经常看短视频,则用户的时间属性为短视频。又如,用户经常看电影、电视剧、综艺节目,每个视频的长度都在40分钟以上,则用户的时间属性为长视频。在一个实施例中,当待分析属性为购买属性时,上述步骤s13包括:步骤f1,从用户行为数据中提取缴费数据;步骤f2,根据缴费数据分析购买属性。例如,预先设定多种规则,如连续多个月缴纳会员费,则确定用户忠诚;只缴纳1个月会员费,然后长期未缴费,则确定用户不忠诚。如用户一次性缴纳1年的会员费,未参加各种优惠活动,则确定用户有钱;用户间断的每次缴纳1个月的会员费,还参加优惠活动,则确定用户没钱。本发明实施例中,针对不同类型的待分析属性,采用不同的方式进行确定,这样,可以精确地确定每种待分析属性,并且全面获得用户的属性信息,为用户生成更加准确全面的标签,以便为企业提供了足够的信息基础,帮助企业快速找到精准用户群体及用户需求等更为广泛的反馈信息。图2是本发明另一实施例示出的用户标签生成方法的流程图。如图2所示,该方法还包括:步骤s21,获取样本数据,样本数据包括用户的基本属性及用户观看过的第一影片。步骤s22,根据样本数据确定第一影片对应的基本属性概率及用户对应的基本属性概率。步骤s23,根据用户对应的基本属性概率确定用户观看过的第二影片对应的基本属性概率。步骤s24,通过上述方式进行多轮迭代后,根据得到的每部影片对应的基本属性概率,生成基本属性对应的分析模型。例如,可以预先准备10万个样本用户数据,样本数据包括用户的详细信息,及用户的性别及观看过的影片。如果该10万个样本用户均观看过《甄嬛传》,其中,70%为女性,则建立影片《甄嬛传》对应的性别概率为70%女性;均观看过《楚乔传》,75%为女性,则建立影片《楚乔传》对应的性别概率为70%女性;均观看过《三生三世十里桃花》,78%为女性,则建立影片《三生三世十里桃花》对应的性别概率为78%女性。当获取到新用户的用户行为数据时,该新用户观看过这三部影片,则确定该新用户为女性的概率为75%。如果该用户还观看了影片《致青春》,则可在《致青春》中增加75%女性的记录。根据观看《致青春》的所有用户的性别概率,可确定该影片对应的性别概率,如76%女性。若再有新用户观看了《致青春》,则可根据该影片76%为女性的性别概率确定该新用户的性别概率。如此迭代,不断增加影片的性别属性和用户的性别属性,可以准确分析出所有影片和用户对应的性别属性。其他基本属性的确定方式与上述性别属性的确定方式相同,在此不再赘述。下述为本发明装置实施例,可以用于执行本发明方法实施例。图3是本发明实施例示出的用户标签生成装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图3所示,该用户标签生成装置,包括:第一获取模块31,用于获取用户行为数据;第一确定模块32,用于确定待分析属性的类型所对应的分析模型。分析模块33,用于根据分析模型对用户行为数据进行分析,得到待分析属性。第一生成模块34,用于根据待分析属性生成用户标签。在一个实施例中,待分析属性包括以下至少一项:基本属性、来访属性、观影属性、时间属性、购买属性。图4是本发明实施例示出的分析模块的框图,如图4所示,分析模块33包括:第一提取子模块41,用于当待分析属性为基本属性时,基本属性至少包括用户年龄和/或性别,从用户行为数据提取用户行为对象;第一确定子模块42,用于根据分析模型确定用户行为对象与基本属性的对应关系。第一分析子模块43,用于根据对应关系分析基本属性。图5是本发明另一实施例示出的分析模块的框图,如图5所示,分析模块33包括:第二提取子模块51,用于当待分析属性为来访属性时,从用户行为数据中提取用户登录数据。第二分析子模块52,用于根据用户登录数据分析来访属性。图6是本发明另一实施例示出的分析模块的框图,如图6所示,分析模块33包括:第三提取子模块61,用于当待分析属性为观影属性时,从用户行为数据中提取影片类型数据,影片类型数据包括用户观看过的影片类型和/或用户搜索过的影片类型。第三分析子模块62,用于根据影片类型数据分析观影属性。图7是本发明另一实施例示出的分析模块的框图,如图7所示,分析模块33包括:第四提取子模块71,用于当待分析属性为时间属性时,从用户行为数据中提取观影时间数据及影片时间数据;第四分析子模块72,用于根据观影时间数据及影片时间数据分析时间属性。图8是本发明另一实施例示出的分析模块的框图,如图8所示,分析模块33包括:第五提取子模块81,用于当待分析属性为购买属性时,从用户行为数据中提取缴费数据;第五分析子模块82,用于根据缴费数据分析购买属性。在另一实施例中,第一确定子模块32,用于当用户行为对象为影片时,根据分析模型确定对应关系为影片对应的第一基本属性概率;第一分析子模块33,用于根据用户行为数据中每部影片对应的第一基本属性概率,计算用户对应的第二基本属性概率;根据第二基本属性概率确定基本属性。图9是本发明另一实施例示出的分析模块的框图,如图9所示,分析模块33还包括:第六提取子模块63,用于当待分析属性为观影属性时,从用户行为数据中提取用户历史搜索数据;第六分析子模块64,用于根据历史搜索数据分析用户的搜索习惯和/或搜索路径;预存子模块65,用于根据搜索习惯和/或搜索路径预测用户的兴趣影片类型作为影片类型数据。图10是本发明另一实施例示出的用户标签生成装置的框图,如图10所示,该装置还包括:第二获取模块35,用于获取样本数据,样本数据包括用户的基本属性及用户观看过的第一影片;第二确定模块36,用于根据样本数据确定第一影片对应的基本属性概率及用户对应的基本属性概率;第三确定模块37,用于根据用户对应的基本属性概率确定用户观看过的第二影片对应的基本属性概率;第二生成模块38,用于通过上述方式进行多轮迭代后,根据得到的每部影片对应的基本属性概率,生成基本属性对应的分析模型。本发明还提供一种用户标签生成服务器,包括上述各个装置实施例中的装置。本实施例中,针对不同类型的待分析属性,采用不同的方式进行确定,这样,可以精确地确定每种待分析属性,并且全面获得用户的属性信息,为用户生成更加准确全面的标签,以便为企业提供了足够的信息基础,帮助企业快速找到精准用户群体及用户需求等更为广泛的反馈信息。本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1