一种用户画像的标签生成方法和装置与流程

文档序号:12747814阅读:394来源:国知局
一种用户画像的标签生成方法和装置与流程

本发明涉及大数据技术领域,特别是涉及一种用户画像的标签生成方法和装置。



背景技术:

在互联网逐渐步入大数据时代后,不可避免的为企业及消费者行为带来一系列改变与重塑,其中最大的变化莫过于,通过对消费者的行为进行分析,使消费者在企业面前变成一种可视化的对象。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据为消费者提供精准营销服务,进而从中深入挖掘潜在的商业价值。以上这些可以通过“用户画像”的方法实现对用户的描述。

用户画像也叫用户信息标签,是企业通过收集与分析消费者的社会属性、生活习惯、消费行为等主要信息后,完美地抽象出一个用户的商业全貌。用户画像能够为企业提供足够的信息基础,以帮助企业快速找到精准用户群体和用户群体的需求。发明人在实施本申请的过程中发现,用户画像的标签是除去用户基本属性(如昵称、年龄、性别、所在地等)之外、通过具体条件进行判断后打上的标签,当需要修改条件时,都需要重新修改相应代码,无法快速灵活地达到目标,另外还增加了开发人员的劳动强度。



技术实现要素:

有鉴于此,本发明提供了一种用户画像的标签生成方法和装置,以解决无法快速灵活地修改标签的判断条件的问题。

为了解决上述问题,本发明公开了一种用户画像的标签生成方法,应用于大数据处理系统,所述标签生成方法包括如下步骤:

根据用户的业务需求准备基础数据;

根据所述业务需求定义标签的规则;

生成与所述规则对应的规则库;

利用所述规则库对所述基础数据进行判断,得到所述用户画像的标签。

可选的,所述生成与所述规则对应的规则库,包括:

根据所述规则生成多条规则项;

根据所述业务需求对所述规则项进行组合,得到所述规则库。

可选的,所述根据所述规则生成多条规则项,包括:

根据所述规则,通过Jsoup表达式和正则表达式相结合的方式依次生成所述规则项。

可选的,所述根据所述业务需求对所述规则项进行组合,得到所述规则库,包括:

根据所述业务需求对所述规则项进行组合,通过Jsoup表达式和正则表达式相结合的方式生成所述规则库。

相应的,为了保证上述方法的实施,本发明还提供了一种用户画像的标签生成装置,应用于大数据处理系统,所述标签生成装置包括:

数据准备模块,用于根据用户的业务需求准备基础数据;

规则定义模块,用于根据所述业务需求定义标签的规则;

规则库生成模块,用于生成与所述规则对应的规则库;

标签生成模块,用于利用所述规则库对所述基础数据进行处理,得到所述用户画像的标签。

可选的,所述规则库生成模块包括:

规则项生成单元,用于根据所述规则生成多条规则项;

规则项组合单元,用于根据所述业务需求对所述规则项进行组合,得到所述规则库。

可选的,所述规则项生成单元用于根据所述规则,通过Jsoup表达式和正则表达式相结合的方式依次生成所述规则项。

可选的,所述规则项组合单元用于根据所述业务需求对所述规则项进行组合,并通过Jsoup表达式和正则表达式相结合的方式生成所述规则库。

从上述技术方案可以看出,本发明实施例提供了一种用户画像的标签生成方法和装置,该方法和装置应用于大数据处理系统,具体为根据用户的业务需求准备基础数据和标签的规则;根据用户的需求配置与规则对应的规则库;最后利用规则库对基础数据进行处理,得到用户画像的标签。当需要修改标签的判断条件时,仅对规则库进行重新配置就可以实现,而无需修改代码,从而能够解决无法快速灵活地修改标签的判断条件的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的一种用户画像的标签生成方法实施例的步骤流程图;

图2为本发明的另一种用户画像的标签生成方法实施例的步骤流程图;

图3为本发明的一种用户画像的标签生成装置实施例的结构框图;

图4为本发明的另一种用户画像的标签生成装置实施例的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

图1为本发明的一种用户画像的标签生成方法实施例的步骤流程图。

参照图1所示,本实施例提到的用户画像的标签生成方法应用于大数据处理系统,该标签生成方法具体包括如下步骤:

S101:根据用户的需求准备基础数据和标签的规则。

这里的用户是指大数据系统的某一具有特定使用目的的用户,例如大数据继续中存储的大数据为视频网站的用户群的数据,这时的用户是指想要从该用户群数据中挖掘用户的年龄段的广告投放商,以便能够根据用户的年龄段选择投放的广告的类型。

这里基础数据也就是上面提到的视频网站的用户群的数据。同时,还根据用户的定义标签的规则。用户的需求是指用户需要从大数据系统中所想要获得的目标结果,只有确定目标结果才能确定出于该目标结果相适合的规则。

S102:根据用户的需求配置与上述规则对应的规则库。

在确定相应规则后,根据用户的需求配置与与上述规则相对应的规则库,该规则库用户对上述基础数据进行处理。

S103:利用规则库对基础数据进行处理,得到标签。

基础数据即上述根据用户的需求所准备的基础数据,在得到上述规则库后,利用规则库对基础数据进程处理,即得到用户画像的标签。

从上述技术方案可以看出,本实施例提供了一种用户画像的标签生成方法,该方法应用于大数据处理系统,具体为根据用户的业务需求准备基础数据和标签的规则;根据用户的需求配置与上述规则对应的规则库;最后利用规则库对基础数据进行处理,得到用户画像的标签。当需要修改标签的判断条件时,仅对规则库进行重新配置就可以实现,而无需修改代码,从而能够解决无法快速灵活地修改标签的判断条件的问题。

实施例二

图2为本发明的一种用户画像的标签生成方法实施例的步骤流程图。

参照图2所示,本实施例提到的用户画像的标签生成方法应用于大数据处理系统,该标签生成方法具体包括如下步骤:

S201:根据用户的需求准备基础数据和标签的规则。

这里的用户是指大数据系统的某一具有特定使用目的的用户,例如大数据继续中存储的大数据为视频网站的用户群的数据,这时的用户是指想要从该用户群数据中挖掘用户的年龄段的广告投放商,以便能够根据用户的年龄段选择投放的广告的类型。

这里基础数据也就是上面提到的视频网站的用户群的数据。同时,还根据用户的定义标签的规则。用户的需求是指用户需要从大数据系统中所想要获得的目标结果,只有确定目标结果才能确定出于该目标结果相适合的规则。

S202根据所准备的规则生成规则项。

具体来说根据上述规则,并通过Jsoup表达式和正则表达式相结合的方式依次生成所述规则项。例如:

1.儿童用户_1_ch_1[cid](;5;),观影行为cid值为5为儿童用户_1_ch_1行为;

2.儿童用户_1_ch_2[age](512003|512004|512008),同上;

3.儿童用户_1_ch_3[video](30275|30278|30279|30282),同上;

4.儿童用户_2_ch_1[cid](;1021;),同上;

5.儿童用户_2_ch_2[age](512003|512004|512013|511002|512005|512014),同上;

6.儿童用户_2_ch_3[video](542015|542016),同上。

Jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。这里的Jsoup表达式是指符合该解析器的规则的表达式。

正则表达式又称正规表示法、常规表示法。具体为使用单个字符串来描述、匹配一系列符合某个句法规则。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

S203:根据用户的需求对规则项进行组合,得到规则库。

即根据用户具体的业务需求,并通过Jsoup表达式和正则表达式相结合的方式生成该规则库,例如:

1.儿童用户儿童用户_1|儿童用户_2;

符合儿童用户_1或者儿童用户_2条件的用户为儿童用户行为

2.儿童用户_1儿童用户_1_ch_1&儿童用户_1_ch_2&儿童用户_1_ch_3;

符合儿童用户_1_ch_1、儿童用户_1_ch_2、儿童用户_1_ch_3三个条件的观影行为的为儿童用户_1行为;

3.儿童用户_2儿童用户_3_ch_1&儿童用户_3_ch_2&儿童用户_3_ch_3;

同上。

S204:利用规则库对基础数据进行处理,得到标签。

基础数据即上述根据用户的需求所准备的基础数据,在得到上述规则库后,利用规则库对基础数据进程处理,即得到用户画像的标签。

例如:最终得到用户A的行为:[cid:’;5;’,video:’30275;30278’,age:’512003;512004’],通过规则库判断其符合“儿童用户_1”的规则,从而判定用户A的高级标签为儿童用户。

从上述技术方案可以看出,本实施例提供了一种用户画像的标签生成方法,该方法应用于大数据处理系统,具体为根据用户的业务需求准备基础数据和标签的规则;根据用户的需求配置与规则对应的规则库;最后利用规则库对所述基础数据进行处理,得到用户画像的标签。当需要修改标签的判断条件时,仅对规则库进行重新配置就可以实现,而无需修改代码,从而能够解决无法快速灵活地修改标签的判断条件的问题。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

实施例三

图3为本发明的一种用户画像的标签生成装置实施例的结构框图。

参照图3所示,本实施例提到的用户画像的标签生成装置应用于大数据处理系统,该标签生成装置具体包括数据准备模块10、规则库配置模块20和标签生成模块30。

数据准备模块10用于根据用户的需求准备基础数据和规则。

这里的用户是指大数据系统的某一具有特定使用目的的用户,例如大数据继续中存储的大数据为视频网站的用户群的数据,这时的用户是指想要从该用户群数据中挖掘用户的年龄段的广告投放商,以便能够根据用户的年龄段选择投放的广告的类型。

这里基础数据也就是上面提到的视频网站的用户群的数据。同时,还根据用户的需求定义标签的规则。用户的需求是指用户需要从大数据系统中所想要获得的目标结果,只有确定目标结果才能确定出于该目标结果相适合的规则。

规则库配置模块20用于在确定相应的规则后,根据用户的需求配置与上述规则对应的规则库。

标签生成模块30用于利用规则库对基础数据进行处理,得到标签。

基础数据即上述根据用户的需求所准备的基础数据,在得到上述规则库后,利用规则库对基础数据进程处理,即得到用户画像的标签。从上述技术方案可以看出,本实施例提供了一种用户画像的标签生成装置,该装置应用于大数据处理系统,具体为根据用户的业务需求准备基础数据和标签规则;根据用户的需求配置与规则对应的规则库;最后利用规则库对基础数据进行处理,得到用户画像的标签。当需要修改标签的判断条件时,仅对规则库进行重新配置就可以实现,而无需修改代码,从而能够解决无法快速灵活地修改标签的判断条件的问题。

实施例四

图4为本发明的另一种用户画像的标签生成装置实施例的结构框图。

参照图4所示,本实施例提到的用户画像的标签生成装置应用于大数据处理系统,该标签生成装置具体包括数据准备模块10、规则库配置模块20和标签生成模块30。

数据准备模块10用于根据用户的需求准备基础数据和标签的规则。

这里的用户是指大数据系统的某一具有特定使用目的的用户,例如大数据继续中存储的大数据为视频网站的用户群的数据,这时的用户是指想要从该用户群数据中挖掘用户的年龄段的广告投放商,以便能够根据用户的年龄段选择投放的广告的类型。

这里基础数据也就是上面提到的视频网站的用户群的数据。同时,还根据用户的需求定义标签的规则。用户的需求是指用户需要从大数据系统中所想要获得的目标结果,只有确定目标结果才能确定出于该目标结果相适合的规则。

规则库配置模块20用于配置与上述规则对应的规则库。

在确定相应规则后,根据该规则生成与规则相对应的规则库,下面一个具体实例说明规则库的确定方法,该规则库生成模块20具体包括规则项生成单元21和规则项组合单元22。

规则项生成单元21用于根据上述规则生成规则项,具体来说根据上述规则,并通过Jsoup表达式和正则表达式相结合的方式依次生成所述规则项。例如:

1.儿童用户_1_ch_1[cid](;5;),观影行为cid值为5为儿童用户_1_ch_1行为;

2.儿童用户_1_ch_2[age](512003|512004|512008),同上;

3.儿童用户_1_ch_3[video](30275|30278|30279|30282),同上;

4.儿童用户_2_ch_1[cid](;1021;),同上;

5.儿童用户_2_ch_2[age](512003|512004|512013|511002|512005|512014),同上;

6.儿童用户_2_ch_3[video](542015|542016),同上。

Jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。这里的Jsoup表达式是指符合该解析器的规则的表达式。

正则表达式又称正规表示法、常规表示法。具体为使用单个字符串来描述、匹配一系列符合某个句法规则。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

规则项组合单元22用于根据具体业务需求对规则项进行组合,得到规则库。该单元同样根据具体的业务需求,并通过Jsoup表达式和正则表达式相结合的方式生成该规则库,例如:

1.儿童用户儿童用户_1|儿童用户_2;

符合儿童用户_1或者儿童用户_2条件的用户为儿童用户行为

2.儿童用户_1儿童用户_1_ch_1&儿童用户_1_ch_2&儿童用户_1_ch_3;

符合儿童用户_1_ch_1、儿童用户_1_ch_2、儿童用户_1_ch_3三个条件的观影行为的为儿童用户_1行为;

3.儿童用户_2儿童用户_3_ch_1&儿童用户_3_ch_2&儿童用户_3_ch_3;

同上。

标签生成模块30用于利用规则库对基础数据进行处理,得到标签。

基础数据即上述根据用户的需求所准备的基础数据,标签生成模块30在得到上述规则库后,利用规则库对基础数据进程处理,即得到用户画像的标签。

例如:最终得到用户A的行为:[cid:’;5;’,video:’30275;30278’,age:’512003;512004’],通过规则库判断其符合“儿童用户_1”的规则,从而判定用户A的高级标签为儿童用户。

从上述技术方案可以看出,本实施例提供了一种用户画像的标签生成装置,该装置应用于大数据处理系统,具体为根据用户的业务需求准备基础数据和标签的规则;根据用户的需求生成与规则对应的规则库;利用规则库对基础数据进行处理,最终得到用户画像的标签。当需要修改标签的判断条件时,仅对规则库进行重新配置就可以实现,而无需修改代码,从而能够解决无法快速灵活地修改标签的判断条件的问题。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1