用户画像方法和用于用户画像的装置与流程

文档序号：12719605阅读：1251来源：国知局

本发明涉及数据通信领域，尤其是一种用户画像方法和用于用户画像的装置。

背景技术：

在现有技术中，主要有三种途径对用户进行画像：(1)通过用户网页浏览记录、上网踪迹跟踪等方式收集用户信息，如cookie、网页植入、搜索引擎等方法，其缺点是数据不够精确，以致很难将数据直接关联到特定类型的用户；(2)通过用户注册的电商网站、专业网站等基于注册信息的网络行为对用户进行分析，其优点是可以收集用户在相应网站的相关信息，缺点是这些信息局限于特定领域，无法与外部数据源关联，难以对用户进行精准的画像；(3)通过专业机构信息获取用户的实名制信息，输出标签，然而，标签内容仅取决于实名制信息涉及的领域。

技术实现要素：

本发明实施例所要解决的一个技术问题是：如何对用户进行精准的用户画像。

根据本发明实施例的第一个方面，提供了一种用户画像方法，包括：获取欲画像用户的全景数据；根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述；其中，标签库根据所有用户的全景数据构建或/和根据应用需求构建，其中，全景数据包括实名制基础数据、通信数据、位置数据以及上网行为数据中的至少两种数据。

在一个实施例中，根据所有用户的全景数据构建标签库包括：将所有用户的全景数据进行聚类得到不同的标签，以构建标签库。

在一个实施例中，根据所有用户的全景数据构建标签库还包括：将所有用户的全景数据与标签库中已有的标签进行匹配，并将所有用户的全景数据中没有匹配到标签的数据进行聚类得到不同的标签，以构建标签库。

在一个实施例中，对根据应用需求构建的标签库中的标签根据应用的反馈进行更新。

在一个实施例中，根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述包括：将欲画像用户的全景数据与标签库中的标签进行匹配，其中匹配到的标签包括关键标签和各非关键标签；根据关键标签将各个非关键标签关联起来，以对欲画像用户进行多维度描述。

在一个实施例中，根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述包括：将欲画像用户的全景数据与标签库中的标签进行匹配；根据预定的目标从匹配到的标签中查找与目标相关的标签，对目标相关的标签进行交叉、嵌套、关联、重新生成处理，以对欲画像用户进行目标维度的描述。

根据本发明实施例的第二个方面，提供一种用于用户画像的装置，包括：用户数据获取模块，用于获取欲画像用户的全景数据；用户画像模块，用于根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述；标签库构建模块，用于根据所有用户的全景数据构建标签库或/和根据应用需求构建标签库；其中，全景数据包括实名制基础数据、通信数据、位置数据以及上网行为数据中的至少两种数据。

在一个实施例中，标签库构建模块用于将所有用户的全景数据进行聚类得到不同的标签，以构建标签库。

在一个实施例中，标签库构建模块还用于将所有用户的全景数据与标签库中已有的标签进行匹配，并将所有用户的全景数据中没有匹配到标签的数据进行聚类得到不同的标签，以构建标签库。

在一个实施例中，标签库构建模块包括标签库更新单元，用于对根据应用需求构建的标签库中的标签根据应用的反馈进行更新。

在一个实施例中，用户画像模块用于将欲画像用户的全景数据与标签库中的标签进行匹配，其中匹配到的标签包括关键标签和各非关键标签，并根据关键标签将各个非关键标签关联起来，以对欲画像用户进行多维度描述。

在一个实施例中，用户画像模块包括匹配单元和画像单元；匹配单元用于将欲画像用户的全景数据与标签库中的标签进行匹配；画像单元用于根据预定的目标从匹配到的标签中查找与目标相关的标签，对目标相关的标签进行交叉、嵌套、关联、重新生成处理，以对欲画像用户进行目标维度的描述。

本发明通过获取欲画像用户的全景数据，对欲画像用户进行多个维度的描述，使用户画像结果更为精准。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本发明用户画像方法的一个实施例的流程示意图。

图2示出本发明用于用户画像的装置的一个实施例的结构示意图。

图3示出本发明用于用户画像的系统的一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面参考图1描述本发明一个实施例的用户画像方法。

图1为本发明用户画像方法的一个实施例的流程图。如图1所示，该实施例的方法包括：

步骤S102，获取欲画像用户的全景数据。其中，全景数据包括实名制基础数据、通信数据、位置数据以及上网行为数据中的至少两种数据。

步骤S104，根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述。其中，标签库根据所有用户的全景数据构建或/和根据应用需求构建。

通过获取欲画像用户的全景数据，能够对欲画像用户进行多个维度的描述，使用户画像结果更为精准。

用户画像的基础为构建标签库，本发明提出两种示例性的构建标签库的方式。

第一种标签库构建方式为根据所有用户的全景数据构建，该方式可以包括：将所有用户的全景数据进行聚类得到不同的标签，以构建标签库。上述方法具体可以采用如下步骤实现：首先，将所有用户的全景数据与标签库中已有的标签进行匹配；然后，将所有用户的全景数据中没有匹配到标签的数据进行聚类得到不同的标签，以构建标签库，避免相同标签的重复生成。由于每一个用户的全景数据都包含多维度的信息，因此通过将获取的所有用户的全景数据进行聚类，能够使标签库中具有较为全面的标签。这种方法可以用于生成基础标签并构成标签库。

第二种标签库构建方式为根据应用需求构建。基础标签虽然数量大、范围广、普适性强，但是对于特定的应用、产品或者项目需求，还需要针对性地建立应用标签。应用标签的确定需要进行两个步骤的筛选：第一步为，应用标签能够通过聚类或分类算法的分析，确定其为独立的结果，而非噪音；第二步为，可以对根据应用需求构建的标签库中的标签根据应用的反馈进行更新，即应用标签要经过实际产品的应用，获取用户的反馈，将监测的反馈与之前的结果进行拟合，剔除无效结果，补充有效的结果。以汽车营销方案为例，上述过程例如可以采用以下方法：首先，将汽车类用户的固网和移动DPI(Deep Packet Inspection，深度包检测)的上网数据进行分析，提取临时标签；然后，根据临时标签与汽车营销需求的匹配结果，将其中一部分用户划归到某类潜在用户的群体中；最后，根据方案的营销提高率，回收其中有效的标签和无效的标签，剔除无效标签，将有效的标签确定为应用标签，并添加到标签库中。通过采用这种方法，能够针对特定的应用、产品和项目需求进行用户画像，精确度更高。

对于上述两种标签库构建方式，均可以采用以下方法对标签库进行不同频率的更新。对于标签库中的标签，一种更新方法是是定期更新，定期更新的标签由例如CRM(客户关系管理系统)信息、终端信息等定期更新的数据源生成，并被定期添加到标签库中；另一种更新方法是实时更新，例如对于位置类的标签，需要在短时间内不断对其进行同步，并根据需要，将固定时间段内产生的标签添加到标签库中，以对用户产生的变动进行实时的描述。

由于本发明中用于用户画像的数据源不止一种，因此在画像过程中，需要将不同数据源产生的标签进行绑定，以使绑定后的各个标签均属于同一用户。由此，对于对欲画像用户进行多维度描述的具体过程，可以采用以下步骤：首先，将欲画像用户的全景数据与标签库中的标签进行匹配，其中匹配到的标签包括关键标签和各非关键标签；然后，根据关键标签将各个非关键标签关联起来，以对欲画像用户进行多维度描述。其中，关键标签为在各个数据源聚类出的标签中均可能出现的标签，例如根据用户的实名制基础数据聚类出的标签。通过关键标签，可以识别出哪些非关键标签为该关键标签所属用户的标签，采用这种关联方式，能够将不同数据源中同一用户的标签绑定到该用户，提高了用户画像的精确度。

前述用于构建标签库的基础标签和应用标签适用于较粗的行业环境，例如可以适用用于汽车行业、金融行业、旅游行业，但是直接使用这些标签对用户进行画像无法解决行业中的更具体的问题。为解决这一问题，对欲画像用户进行多维度描述时可以采用如下方法：首先，将欲画像用户的全景数据与标签库中的标签进行匹配，为欲画像用户选择相应的标签；然后，根据预定的目标从匹配到的标签中查找与目标相关的标签，对目标相关的标签进行交叉、嵌套、关联、重新生成处理，以对欲画像用户进行目标维度的描述。上述过程首先为用户匹配标签，然后再从这些用户中选择与目标维度的描述匹配的用户，通过这种双向匹配、描述的方法，实现了用户的精准画像和目标用户的获取。其中，标签的交叉处理指将多个标签合并为一个具有多重属性的标签；标签的嵌套处理指为具有从属关系的多个标签按照其细化程度进行排列和绑定，以适应不同的画像精度的要求；标签的关联处理指将属于同一用户或同一应用的标签进行绑定；标签的重新生成处理指在当前的匹配到的标签无法解决行业中的具体问题时，调整数据源中的数据或者标签生成方法，对标签进行重新生成。

此外，在对欲画像用户进行用户画像的过程中，当标签库中没有相应的标签进行匹配时，可以选择启动爬虫程序到欲画像用户的全景数据的源地址获取原全景数据中不包含的信息，使取回的信息经过机器学习模型算法的分析，能够和标签库中的标签进行匹配。

下面参考图2描述本发明一个实施例的用于用户画像的装置。

图2为本发明用于用户画像的装置的一个实施例的结构图。如图2所示，该实施例的装置包括：用户数据获取模块22，用于获取欲画像用户的全景数据；用户画像模块24，用于根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述；标签库构建模块26，用于根据所有用户的全景数据构建标签库或/和根据应用需求构建标签库；其中，全景数据包括实名制基础数据、通信数据、位置数据以及上网行为数据中的至少两种数据。

其中，标签库构建模块26可以用于将所有用户的全景数据进行聚类得到不同的标签，以构建标签库。

其中，标签库构建模块26还可以用于将所有用户的全景数据与标签库中已有的标签进行匹配，并所有用户的全景数据中没有匹配到标签的数据进行聚类得到不同的标签，以构建标签库。

其中，标签库构建模块26可以包括标签库更新单元，用于对根据应用需求构建的标签库中的标签根据应用的反馈进行更新。

其中，用户画像模块24可以用于将欲画像用户的全景数据与标签库中的标签进行匹配，其中匹配到的标签包括关键标签和各非关键标签，并根据关键标签将各个非关键标签关联起来，以对欲画像用户进行多维度描述。

其中，用户画像模块24可以包括匹配单元和画像单元；匹配单元用于将欲画像用户的全景数据与标签库中的标签进行匹配；画像单元用于根据预定的目标从匹配到的标签中查找与目标相关的标签，对目标相关的标签进行交叉、嵌套、关联、重新生成处理，以对欲画像用户进行目标维度的描述。

下面参考图3描述本发明一个实施例的用于用户画像的系统。

图3为本发明用于用户画像的系统的一个实施例的结构图。如图3所示，该实施例的系统包括：数据源平台32、基础能力平台34、产品平台36组成。

数据源平台32用于提供用户的全景数据，用户的全景数据保存在数据库的数据表中。

基础能力平台34用于标签库的构建和用户画像，包括数据预处理模块342、标签数据处理模块344、标签存储模块346和服务模块348。数据预处理模块342用于将汇集、清洗后的数据传输到标签数据处理模块344中；标签数据处理模块344用于根据清洗后的用户全景数据生成标签，还用于将生成的不同数据源中的标签的绑定以及为用户匹配标签；标签存储模块346用于保存标签数据处理模块生成的标签，包括基础标签和应用标签，根据需要，也可以保存其他类型的标签；服务模块348用于展示标签存储模块346中的标签，以及根据标签所进行的报表统计、标签管理等功能。

产品平台36用于对基础能力平台34的标签进行具体应用，同时，基础能力平台34也可以用于根据产品平台36的应用结果完善标签存储结果。

此外，根据本发明的方法还可以实现为一种计算机程序产品，该计算机程序产品包括计算机可读介质，在该计算机可读介质上存储有用于执行本发明的方法中限定的上述功能的计算机程序。本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张宇中;李名洋;王艳;张应福;刘凯毅
技术所有人：中国电信股份有限公司
我是此专利的发明人

上一篇：一种异步实现发票实时上传的方法与流程
上一篇：一种滚筒类设备进口端密封装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。