用户画像生成方法和装置与流程

文档序号：14911287发布日期：2018-07-10 23:29阅读：174来源：国知局

本发明涉及计算机互联网领域，具体而言，涉及一种用户画像生成方法和装置。

背景技术：

随着互联网和移动应用的高速发展，现实社会中的人们越来越多地依赖互联网去解决现实生活中的一些问题以及用来优化解决过程、提高解决效率，基于这种大环境，大量的个人用户信息和用户行为信息充斥在互联网中，形成了有价值的“数据宝藏”，从这些“数据宝藏”中可以挖据出非常有用的信息和商机，于是，越来越多的学者、研究机构和商业性质的企业通过对互联网上海量用户产生的海量信息进行“有效信息筛选”和“信息挖据”来建立用户画像，以期获得精准化的销售线索，其中，用户画像又称用户角色(Persona)，作为一种勾画目标用户、联系用户诉求与设计方向的有效工具，用户画像在各领域得到了广泛的应用。

现有技术中形成用户画像的方法有两种，第一种方法通过获取关于用户的人物基本属性，比如性别、年龄(区间)、学历等等，从而构建一个看似较为丰满的人物形象作为用户画像；第二种方法通过在web端网站或移动端app上各种有状态改变(例如页面载入、页面跳转等)和有交互的地方进行“埋点”，从而对每个能够反映用户行为的节点关键指标进行统计，从而得出关于用户行为的一些信息，比如在一级页面流失的用户占比是多少，百分之多少的用户点击了网页广告位展示的广告等信息，从而得出一系列基于无标识人物统计的用户行为画像。

上述第一种方法通过对人物的基础属性进行统计从而生成人物画像，其存在的缺陷在于能够获取到的信息(如性别，年龄等)不足以支撑一个有高价值的用户画像，而高价值的信息(如职业，薪酬收入水平，亲友关系，家庭住址等)通常都是具有高保密性，难以获取到，因此通过这种方法而得到的人物画像的应用意义并不大；第二种方法通过对用户在互联网上产生的一系列行为进行画像，从而得出关于用户行为特点的一系列基于统计的结论，但是其存在的缺陷在于：第一，无法通过这些基于“埋点”的用户行为关键指标的统计去定位具体的人群，即一定程度上很难提供参考价值较大的销售线索等；第二，无法单纯通过这种画像方法保证用户的行为具有一定的稳定性，即有可能被计入统计值的一些用户行为并不是用户平常会发生的行为，并非基于用户习惯或者说用户心理认知模型，而是一种随机行为，例如某用户原本是一个狂热的TVB剧爱好者，某一天该用户心血来潮在微博上搜索了一些最新日剧或者最近流行的手游等消息，但这并不能说明该用户是一个日剧或者手游高价值目标受众。

针对现有技术中使用用户账户信息构建用户画像时，由于信息不充足造成的用户画像不全面以及使用用户行为信息构建用户画像时，由于无法定位到具体的人群造成的不能生成个人画像的问题，目前尚未提出有效的解决方案。

技术实现要素：

本发明实施例提供了一种用户画像生成方法和装置，以至少解决现有技术中使用用户账户信息构建用户画像时，由于信息不充足造成的用户画像不全面以及使用用户行为信息构建用户画像时，由于无法定位到具体的人群造成的不能生成个人画像的技术问题。

根据本发明实施例的一个方面，提供了一种用户画像生成方法，包括：从用户访问的网站获取用户账户信息和用户行为信息；根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签，以及根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签；其中，用户账户标签数据库用于存储多种用户账户信息和标签，以及多种用户账户信息和标签之间的匹配关系，用户行为标签数据库用于存储多种用户行为信息和标签，以及多种用户行为信息和标签之间的匹配关系；根据用户账户信息标签和用户行为信息标签，得到用户画像。

根据本发明实施例的另一方面，还提供了一种用户画像生成装置，包括：获取模块，用于从用户访问的网站获取用户账户信息和用户行为信息；第一标签生成模块，用于根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签；其中，用户账户标签数据库用于存储多种用户账户信息和标签，以及多种用户账户信息和标签之间的匹配关系；第二标签生成模块，用于根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签；其中，用户行为标签数据库用于存储多种用户行为信息和标签，以及多种用户行为信息和标签之间的匹配关系；画像生成模块，用于根据用户账户信息标签和用户行为信息标签，得到用户画像。

在本发明实施例中，采用用户账户信息和用户行为信息相结合的方式，通过从用户访问的网站获取用户账户信息和用户行为信息，并根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签，以及根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签，然后根据用户账户信息标签和用户行为信息标签，最终得到用户画像，达到了生成较全面的用户画像并可定位到具体的人群的目的，从而实现了使用户画像更为丰满、价值更高、适应性更强的技术效果，进而解决了现有技术中使用用户账户信息构建用户画像时，由于信息不充足造成的用户画像不全面以及使用用户行为信息构建用户画像时，由于无法定位到具体的人群造成的不能生成个人画像的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例1的一种用户画像生成方法的流程图；

图2是根据本发明实施例1的一种可选的用户画像生成方法的流程图；

图3是根据本发明实施例2的一种用户画像生成装置的结构图；

图4是根据本发明实施例2的一种可选的用户画像生成装置的结构图；

图5是根据本发明实施例2的一种可选的用户画像生成装置的结构图；

图6是根据本发明实施例2的一种可选的用户画像生成装置的结构图；以及

图7是根据本发明实施例2的一种可选的用户画像生成装置的结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，提供了一种用户画像生成方法的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的用户画像生成方法，如图1所示，该方法包括如下步骤：

步骤S102，从用户访问的网站获取用户账户信息和用户行为信息。

具体的，用户的账户信息可以来自于用户在网站上注册账号时填写的信息，可以是用于标识用户基本属性的信息，用户在注册账号时，网站会提供一系列的填写项来供客户填写，包括姓名、性别、年龄、血型、归属地、喜好(包括喜好颜色、食物、运动、书籍、电影、音乐等)等，根据网站的行业性，网站还会提供给客户一些选项来让用户选择关注信息，例如，音乐网站会将音乐按照风格、年代或者明星进行分类，在用户注册账户的时候就让用户选择关注哪些风格的、哪些年代的或者哪些明星的歌曲并对用户的选择进行记录，以方便后期推送更新；对于一些网站，例如房产网站、汽车网站等，在用户进行注册的时候，还会让用户提供一些认证信息，例如汽车网站会让用户选择是否是认证车主，如果是，还会提供一些填写项或者选择项来获取用户的认证车辆信息，包括车的品牌、型号、颜色等。

用户的行为信息可以来自于用户在访问网站时候的一些具体行为，包括但不仅仅限于用户在网站中发布帖子的行为、回复帖子的行为、用户在网站的停留时间、回访次数、回访相隔天数、用户使用的搜索关键词等。

上述步骤S102中，基于网站的行业性，从用户访问的网站来获取信息能够结合行业特点和行业背景，获取到的信息更加的专业化，从而可以使最终生成的用户画像更加的专业化，从而让用户画像应用型更强、价值更高。

步骤S104，根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签，以及根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签；其中，用户账户标签数据库用于存储多种用户账户信息和标签，以及多种用户账户信息和标签之间的匹配关系，用户行为标签数据库用于存储多种用户行为信息和标签，以及多种用户行为信息和标签之间的匹配关系。

具体的，用户账户标签数据库中存储了用户账户信息、标签以及用户账户信息与标签的匹配关系，在已知用户账户信息的情况下，可以通过用户账户标签数据库查找到与该用户账户信息匹配的标签，也就是用户账户信息标签；用户行为标签数据库存储了用户行为信息、标签以及用户行为信息与标签的匹配关系，在已知用户行为信息的情况下，可以通过用户行为标签数据库查找到与该用户行为信息匹配的标签，也就是用户行为信息标签；通过预先构建用户账户标签数据库以及用户行为标签数据库，在获取到用户账户信息和用户行为信息后，就可以查询到与用户账户信息匹配的标签以及与用户行为信息匹配的标签。

此处需要说明的是，步骤S104中实际上包括根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签和根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签两个操作步骤，该两个操作步骤并没有限制执行顺序，可以同时执行，也可以先后执行，先后的顺序也没有限定。

可选的，用户账户标签数据库以及用户行为标签数据库都是动态更新的数据库，可以对数据库中的内容进行删除、更改、增加、更新等操作，以保证数据库的可靠性。

需要注意的是，用户账户标签数据库中，用户账户信息和标签的关系并不一定是一一对应的，可能多个用户账户信息对应同一个标签，也可能一个用户账户信息对应多个标签；用户行为标签数据库中，同样可能多个用户行为信息对应同一个标签，也可能一个用户行为信息对应多个标签。

在一种可选的实施例中，用户账户标签数据库中，在用户账户信息为出生年为1980年至1989时或者年龄是27岁至36岁时，对应的标签均为“80后”，因此如果用户年龄为27岁，通过查询用户账户标签数据库，可以得到“80后”的标签。

在一种可选的实施例中，用户行为标签数据库中，可以将类似“我打算买...”、“我对...感兴趣”等类似的信息匹配“兴趣为...”的标签，例如用户发的帖子中包含了“我打算下个月买宝马X5”的用户行为信息，通过查询用户行为标签数据库，可以得到“兴趣为宝马”或“兴趣为宝马X5”的标签。

步骤S106，根据用户账户信息标签和用户行为信息标签，得到用户画像。

具体的，在得到用户账户信息标签和用户行为信息标签后，就可以将用户账户信息标签和用户行为信息标签结合起来，共同构成用户画像，相比于仅使用用户账户信息或用户行为信息生成用户画像，本实施例中生成的画像更加全面和丰富。

通过上述步骤S102-步骤S106，本发明上述实施例采用用户账户信息和用户行为信息相结合的方式，通过从用户访问的网站获取用户账户信息和用户行为信息，并根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签，以及根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签，然后根据用户账户信息标签和用户行为信息标签，最终得到用户画像，达到了生成较全面的用户画像并可定位到具体的人群的目的，从而实现了使用户画像更为丰满、价值更高、适应性更强的技术效果，进而解决了现有技术中使用用户账户信息构建用户画像时，由于信息不充足造成的用户画像不全面以及使用用户行为信息构建用户画像时，由于无法定位到具体的人群造成的不能生成个人画像的技术问题。此处需要说明的是，通过上述实施例，不仅能够生成个人画像，也能够生成群体画像。

在一种可选的实施例中，用户账户信息包括如下至少之一：用户名、性别、归属地、年龄、用户认证信息和用户关注信息。

具体的，不同网站中记录的用户账户信息是不相同的，以上只是给出了比较常见的几种，本实施例中的用户账户信息不仅仅限于上述实施例中给出的几种以及前文中提及其他用户账户信息，还包括现有的以及随着信息技术的发展，将来有可能会被网站记录的用户账户信息。

在一种可选的实施例中，步骤S104中根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签，包括：

步骤S202，根据用户账户标签数据库，得到与用户认证信息匹配的标签；

步骤S204，根据用户账户标签数据库，得到与用户账户信息中除了用户认证信息之外的其他信息相匹配的标签，根据与其他信息相匹配的标签和预设规则，对与用户认证信息匹配的标签进行筛选，得到与用户账户信息相匹配的用户账户信息标签。

具体的，在用户账户信息中包括用户认证信息的情况下，可以从户账户信息与标签数据库，得到与用户认证信息匹配的标签，但是为了保证标签的可靠性，可以使用用户账户信息中的其他信息以及预设规则对与用户认证信息匹配的标签进行二次筛选，删除与用户认证信息匹配的标签中明显矛盾或者不合理或者不符合预设规则的标签，其中，预设规则中也包括在出现明显矛盾的情况下对标签的取舍规则，例如，根据用户账户标签数据库，可以得到与用户认证信息匹配的标签，同样可以得到与用户账户信息中的其他信息相匹配的标签，在存在标签矛盾的情况下，预设规则中可以规定是保留与用户认证信息匹配的标签，还是保留与用户账户信息中的其他信息相匹配的标签。

在一种可选的实施例中，从一个汽车网站获取到的用户账户信息中，用户的性别为“男”，认证车辆信息为“车的品牌为甲壳虫，车的颜色为粉色”，用户关注信息中用户关注“男士推荐车”，使用用户账户标签数据库查询到与认证车辆信息匹配的一个标签为“女性偏爱车型”，首先根据用户的性别和用户关注信息，可以确定用户为男性，并且可以由如下预设规则：在刻画具体用户画像时，在确定用户性别的情况下，可以删除生成的标签中带有性别推测的标签，因此综合上述信息，可以将生成的“女性偏爱车型”标签删除。

通过上述步骤S202-步骤S204，在用户账户信息中包括用户认证信息的情况下，可以对与用户认证信息对应的标签进行二次筛选，以使最终得到的用户账户信息标签更为准确可靠。

在一种可选的实施例中，用户行为信息包括用户行为的文本信息和时间信息，因此步骤S104中根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签之前，包括步骤S108：对用户行为信息进行预处理；其中，对用户行为信息进行预处理，包括：对文本信息进行文本挖掘，以及根据时间信息对用户行为信息进行时效性分级和/或重要性分级。

具体的，在得到用户行为信息后，由于用户行为信息可能包括多种多样的信息数据，并不是所有的行为信息都可以用来生成用户画像，所以需要对用户行为信息进行预处理，在使用用户行为的文本信息和时间信息生成用户画像的情况下，可以使用文本挖掘工具对用户行为中的文本信息进行文本挖掘，按照预设文本挖掘规则去除文本信息中无用的信息，筛选得到有价值、可用性强的文本信息，再结合文本信息对应的时间信息，可以对文本信息的时效性和重要性进行确定，例如，可以预先设置一个时间范围，在该预设时间范围内的文本信息时效性强，比较重要；而不在该预设时间范围内的文本信息时效性差，不够重要；具体的，可以对用户行为信息进行时效性分级和/或重要性分级，例如，可以简单的将时效性分为时效性强、弱两个等级，也可以具体划分为多于两个的等级。

在一种可选的实施例中，步骤S104中根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签，包括：

步骤S402，根据用户行为信息的时效性分级和/或重要性分级对用户行为信息进行筛选，得到筛选后的用户行为信息。

步骤S404，根据用户行为标签数据库，得到与筛选后的用户行为信息相匹配的用户行为信息标签。

具体的，在对用户行为信息进行时效性分级和/或重要性分级后，可以对用户行为信息进行筛选，例如可以选择要对哪些时效性级别的用户行为信息进行匹配，和/或对哪些重要性级别的用户行为信息进行匹配，一般来说，由时效性高、重要性强的用户行为信息得到的用户画像的价值更高，因此通过对用户行为信息的筛选，可以根据时效性和重要性排除时效性差、不够重要的用户行为信息。

通过上述步骤S108，给出了在用户行为信息为文本信息和时间信息时对用户行为信息进行预处理的方式，经过预处理的用户行为信息与预构建的用户行为标签数据库的匹配性更好，避免在用户行为信息包含的无用信息太多噪音太大的情况下，查询用户行为标签数据库时过慢或查找不到在用户行为标签数据库中存储的用户行为信息导致无法匹配出标签的情况发生。

在一种可选的实施例中，步骤S106包括步骤S302：根据用户账户信息标签的权重和用户行为信息标签的权重，采用多源信息融合算法，得到用户画像。

具体的，在得到用户账户信息标签和用户行为信息标签后，可以生成根据用户账户信息标签和用户行为信息标签生成用户画像，其中可以采用基于标签权重的多源信息融合算法，在预构建用户账户标签数据库和用户行为标签数据库时，对每个标签的权重也进行了定义，标签的权重大小可以表示标签的可信度，也就是标签的权重越大，可信度越高，标签的权重越小，可信度越低。其中，多源信息融合算法已经是成熟的算法，在此不做赘述。

通过上述步骤S302，给出了采用多源信息融合算法，根据用户账户信息标签的权重和用户行为信息标签的权重得到用户画像的方式，通过本实施例，可以生成更加客观、更少冗余、更有价值用户画像。

在一种可选的实施例中，如图2所示，在构建汽车行业的用户画像时，可以选择汽车行业的信源网站，例如汽车之家、易车网、爱卡汽车、太平洋汽车等，用户在访问上述信源网站时，会留下用户账户信息和用户行为信息，因此可以通过用户访问的网站获取得到用户账户信息和用户行为信息。

用户账户信息可以包括性别、归属地、年龄、关注车辆信息、车辆认证信息等，其中关注车辆信息对应于前文的用户关注信息，车辆认证信息对应于前文的用户认证信息，车辆认证信息包括用来标识该用户“是否是认证车主”的信息字段，当该用户是认证车主的时候，还包括该用户的认证车辆信息，若该用户不是认证车主，则“是否是认证车主”的信息字段为空。

在预先构建好的用户账户标签数据库中可以具体包括汽车行业的汽车行业知识库，汽车行业知识库的主体研究对象(第一列)是某一款确定的车型，其后面的列中的信息均是对该款车型的客观特点和主观特点进行刻画的标签，即汽车行业知识库中的每一行，表示由若干个用于刻画某款具体车型的标签组成的车辆信息；将认证车主的认证车辆信息与汽车行业知识库中的第一列的车型信息进行匹配，找到认证车辆信息的车型信息，将车型信息对应的标签抽取出来，用于标记该认证车主，再根据该认证车主的其他账户信息和凭行业数据和经验预先制定的规则进行标签的二次筛选，删除第一次抽取的标签中不合理的一些标签，最后，获得用于标识该认证车主的用户账户信息标签；如果是未认证车主，可以先匹配“关注车辆信息”的标签，再根据用户账户信息中的其他信息来对标签进行二次筛选。

用户行为信息可以是用户在网站中发布帖子、回复帖子等行为的文本信息和时间信息，其中文本信息包括但不限于文本类型、标题、主体内容等，对文本信息进行文本挖掘处理后，结合时间信息，可以判定文本信息的时效性和重要程度，之后根据预处理后的信息查询用户行为标签数据库，也可以命名为汽车行业用户行为意图匹配数据库，该数据库可以是根据以往海量的基于汽车行业特点的用户行为信息分析和挖掘所得到的能够标识较为典型的“用户言论—行为”对应关系从而生成一些行为标签，通过查询可以得到用于刻画用户行为特点的用户行为信息标签。

在得到用户账户信息标签和用户行为信息标签后，由用户账户信息标签和用户行为信息标签共同构成用户画像数据库，使用基于标签的用户画像算法，例如基于标签权重的多源信息融合算法，就可以得到较为丰富和完整的用户画像，之后可以采取适当的方式对用户画像的结果进行展示。

以下是采用上述实施例得到的个人用户画像结果：

用户名：XXX。

性别：男。

年龄：35。

常居地：北京。

(认证)拥有车型：奥迪A6L。

感兴趣车型(排名分先后)：1.奥迪Q7；2.宝马X5；3.路虎。

感兴趣话题：自驾游；户外；摄影；儿童。

购买意图预测：SUV；动力好；运动；35-70w。

颜色偏好：香槟色；宝蓝色。

品牌偏好：奥迪；宝马。

以下是采用上述实施例得到的群体用户画像结果：

前置条件：

车系：SUV。

价格区间：35-70万。

结果：

最受关注车型TOP3：汉兰达；普拉多；锐界。

最受欢迎颜色TOP3：白色；红色；黑色。

最受关注关键指标词：动力；空间；舒适性。

目标消费者特征：

性别：男性。

年龄：30-50岁。

常居地：一二线城市。

家庭成员数：3个及以上。

其他爱好：户外运动；自驾游；摄影；钓鱼。

实施例2

根据本发明实施例，提供了一种用户画像生成装置的产品实施例，图3是根据本发明实施例的用户画像生成装置，如图3所示，该装置包括获取模块101、第一标签生成模块103、第二标签生成模块105和画像生成模块107。

其中，获取模块101，用于从用户访问的网站获取用户账户信息和用户行为信息。

第一标签生成模块103，用于根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签；其中，用户账户标签数据库用于存储多种用户账户信息和标签，以及多种用户账户信息和标签之间的匹配关系。

第二标签生成模块105，用于根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签其中，用户行为标签数据库用于存储多种用户行为信息和标签，以及多种用户行为信息和标签之间的匹配关系。

画像生成模块107，用于根据用户账户信息标签和用户行为信息标签，得到用户画像。

需要说明的是，上述实施例中，第一标签生成模块103和第二标签生成模块105共同构成标签生成模块，上述实施例中并不限定第一标签生成模块103和第二标签生成模块105的执行顺序，第一标签生成模块103和第二标签生成模块105可以同时执行其功能，也可以按照先后顺序执行，先后的顺序也没有限定，图3的示图中给出了只是其中第一标签生成模块103和第二标签生成模块105同时执行的情况，本发明并不限于图3所示的顺序。

本发明的上述实施例采用用户账户信息和用户行为信息相结合的方式，通过获取模块101从用户访问的网站获取用户账户信息和用户行为信息，并通过第一标签生成模块103根据用户账户标签数据库，得到与用户账户信息相匹配的用户账户信息标签，以及通过第二标签生成模块105根据用户行为标签数据库，得到与用户行为信息相匹配的用户行为信息标签，然后通过画像生成模块107根据用户账户信息标签和用户行为信息标签，最终得到用户画像，达到了生成较全面的用户画像并可定位到具体的人群的目的，从而实现了使用户画像更为丰满、价值更高、适应性更强的技术效果，进而解决了现有技术中使用用户账户信息构建用户画像时，由于信息不充足造成的用户画像不全面以及使用用户行为信息构建用户画像时，由于无法定位到具体的人群造成的不能生成个人画像的技术问题。此处需要说明的是，通过上述实施例，不仅能够生成个人画像，也能够生成群体画像。

在一种可选的实施例中，用户账户信息包括如下至少之一：用户名、性别、归属地、年龄、用户认证信息和用户关注信息。

在一种可选的实施例中，如图4所示，第一标签生成模块103包括第一生成模块201和第二生成模块203，第一生成模块201，用于根据用户账户标签数据库，得到与用户认证信息匹配的标签；第二生成模块203，用于根据用户账户标签数据库，得到与用户账户信息中除了用户认证信息之外的其他信息相匹配的标签，根据与其他信息相匹配的标签和预设规则，对与用户认证信息匹配的标签进行筛选，得到与用户账户信息相匹配的用户账户信息标签。

通过上述第一生成模块201和第二生成模块203，在用户账户信息中包括用户认证信息的情况下，第二生成模块203可以对通过第一生成模块201得到的与用户认证信息对应的标签进行二次筛选，以使最终得到的用户账户信息标签更为准确可靠。

在一种可选的实施例中，用户行为信息可以包括用户行为的文本信息和时间信息，因此如图5所示，装置还可以包括预处理模块109，用于对用户行为信息进行预处理；其中，对用户行为信息进行预处理，包括：对文本信息进行文本挖掘，以及根据时间信息确定对用户行为信息进行时效性分级和/或重要性分级。

通过上述预处理模块109，给出了在用户行为信息为文本信息和时间信息时对用户行为信息进行预处理的方式，经过预处理的用户行为信息与预构建的用户行为标签数据库的匹配性更好，避免在用户行为信息包含的无用信息太多噪音太大的情况下，查询用户行为标签数据库时过慢或查找不到在用户行为标签数据库中存储的用户行为信息导致无法匹配出标签的情况发生。

在一种可选的实施例中，如图6所示，第二标签生成模块105包括筛选模块401和第三生成模块403，筛选模块401，用于根据用户行为信息的时效性分级和/或重要性分级对用户行为信息进行筛选，得到筛选后的用户行为信息；第三生成模块403，用于根据用户行为标签数据库，得到与筛选后的用户行为信息相匹配的用户行为信息标签。

通过上述筛选模块401和第三生成模块403，可以根据时效性和重要性排除时效性差、不够重要的用户行为信息。在一种可选的实施例中，如图7所示，画像生成模块107包括第一画像生成模块301，用于根据用户账户信息标签的权重和用户行为信息标签的权重，采用多源信息融合算法，得到用户画像。

通过上述第一画像生成模块301，给出了采用多源信息融合算法，根据用户账户信息标签的权重和用户行为信息标签的权重得到用户画像的方式，通过本实施例，可以生成更加客观、更少冗余、更有价值用户画像。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈怡然;刘嘉
技术所有人：北京国双科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。