一种数据的标签方法及装置与流程

文档序号：26840724发布日期：2021-10-08 22:32阅读：170来源：国知局

1.本发明涉及数据处理的技术领域，尤其涉及一种数据的标签方法及装置。

背景技术：

2.随着智能终端的普及，人们使用智能终端进行的经济活动和社交活动的日益频繁，每个用户在日常交流和日常活动中均会产生大量的个人数据。
3.为了方便应用和产品供应商对用户的个人数据作统计和管理，通过用户的个人数据对用户进行打标签是其中一种方式。目前常用的打标签方法是识别用户的当前操作或当前行为，基于用户的当前操作和当前行为匹配对应的行为类型，以用户的行为类型对用户进行打标签。
4.但目前常用的方式有如下技术问题，由于用户的每个行为或每个操作(例如在交易中买卖中，用户的购买、退款、款项追加等行为)并非完全独立，每个行为和动作相互之间可能存在一定的逻辑关系或时间联系，所以，单独以任意一个行为或动作对用户进行打标签的准确率不高，也难以挖掘用户的隐藏含义。

技术实现要素：

5.本发明提出一种数据的标签方法及装置，所述方法可以利用用户以往的行为轨迹数据和当前活动数据进行统筹分析并生成对应的数据标签，提高标签与用户行为的匹配度。
6.本发明实施例的第一方面提供了一种数据的标签方法，所述方法应用于数据中台，所述方法包括：
7.分别采集用户的历史行为数据与当前行为数据；
8.对所述历史行为数据和所述当前行为数据进行行为演变分析，得到用户的行为轨迹数据；
9.基于所述行为轨迹数据计算用户的n个行为属性值，其中，n为大于或等于1的正整数；
10.根据所述n个行为属性值匹配对应的数据标签。
11.在第一方面的一种可能的实现方式中，所述行为轨迹数据包括地点轨迹数据和动作轨迹数据；
12.所述对所述历史行为数据和所述当前行为数据作行为演变分析，得到用户的行为轨迹数据，包括：
13.从所述历史行为数据中提取历史动作数据和历史地点数据，以及从所述当前行为数据中提取当前动作数据和当前地点数据；
14.对所述历史地点数据和所述当前地点数据作数据拼接，得到拼接数据；
15.按照所述拼接数据绘制用户的移动线路得到地点轨迹数据；
16.确定所述历史动作数据中是否包含与所述当前动作数据相同的在先动作数据；
17.若所述历史动作数据中包含与所述当前动作数据相同的在先动作数据，则获取所述在先动作数据对应的在先动作类型，以所述在先动作类型的动作数据为动作轨迹数据；
18.若所述历史动作数据中没有包含与所述当前动作数据相同的在先动作数据，则获取所述当前动作数据对应的当前动作类型，以所述当前动作类型的动作数据为动作轨迹数据。
19.在第一方面的一种可能的实现方式中，所述基于所述行为轨迹数据计算用户的n个行为属性值，包括：
20.从所述地点轨迹数据中提取用户的逗留时间和移动时间；
21.计算所述逗留时间与所述移动时间的时间占比值，以所述时间占比值为行为属性值；
22.将所述动作轨迹数据转换成动作向量；
23.将所述动作向量代入至预设的贝叶斯网络中，得到n个动作概率值，以所述n个动作概率值为行为属性值。
24.在第一方面的一种可能的实现方式中，所述根据所述n个行为属性值匹配对应的数据标签，包括：
25.在多个预设的属性范围值中分别确定每个所述行为属性值的目标属性范围值；
26.以每个所述目标属性范围值对应的预定标签为数据标签。
27.在第一方面的一种可能的实现方式中，在所述以所述当前动作类型为动作轨迹数据的步骤后，所述方法还可以包括：
28.将所述当前动作数据添加至所述历史动作数据中在第一方面的一种可能的实现方式中。
29.本发明实施例的第二方面提供了一种数据的标签装置，所述装置包括：所述装置应用于数据中台，所述装置包括：
30.采集模块，用于分别采集用户的历史行为数据与当前行为数据；
31.分析模块，用于对所述历史行为数据和所述当前行为数据进行行为演变分析，得到用户的行为轨迹数据；
32.计算模块，用于基于所述行为轨迹数据计算用户的n个行为属性值，其中，n为大于或等于1的正整数；
33.匹配模块，用于根据所述n个行为属性值匹配对应的数据标签。
34.在第二方面的一种可能的实现方式中，所述行为轨迹数据包括地点轨迹数据和动作轨迹数据；
35.所述分析模块还用于：
36.从所述历史行为数据中提取历史动作数据和历史地点数据，以及从所述当前行为数据中提取当前动作数据和当前地点数据；
37.对所述历史地点数据和所述当前地点数据作数据拼接，得到拼接数据；
38.按照所述拼接数据绘制用户的移动线路得到地点轨迹数据；
39.确定所述历史动作数据中是否包含与所述当前动作数据相同的在先动作数据；
40.若所述历史动作数据中包含与所述当前动作数据相同的在先动作数据，则获取所述在先动作数据对应的在先动作类型，以所述在先动作类型的动作数据为动作轨迹数据；
41.若所述历史动作数据中没有包含与所述当前动作数据相同的在先动作数据，则获取所述当前动作数据对应的当前动作类型，以所述当前动作类型的动作数据为动作轨迹数据。
42.在第二方面的一种可能的实现方式中，所述计算模块还用于：
43.从所述地点轨迹数据中提取用户的逗留时间和移动时间；
44.计算所述逗留时间与所述移动时间的时间占比值，以所述时间占比值为行为属性值；
45.将所述动作轨迹数据转换成动作向量；
46.将所述动作向量代入至预设的贝叶斯网络中，得到n个动作概率值，以所述n个动作概率值为行为属性值。
47.相比于现有技术，本发明实施例提供的数据的标签方法及装置，其有益效果在于：本发明可以将用户的历史行为数据与当前行为数据进行行为演变分析，以确定用户一系列动作的联系，最后基于行为的联系确定给用户标签，整个过程不但快速有效，而且可以提高打标签的准确率，以及提高标签与用户行为的匹配度，也方便挖掘用户的隐藏含义。
附图说明
48.图1是本发明一实施例提供的一种数据的标签方法的流程示意图；
49.图2是本发明一实施例提供的一种数据的标签装置的结构示意图。
具体实施方式
50.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
51.但目前常用的标签方式有如下技术问题，由于用户的每个行为或每个操作(例如在交易中买卖中，用户的购买、退款、款项追加等行为)并非完全独立，每个行为和动作相互之间可能存在一定的逻辑关系或时间联系，所以，单独以任意一个行为或动作对用户进行打标签的准确率不高，也难以挖掘用户的隐藏含义。
52.为了解决上述问题，下面将通过以下具体的实施例对本技术实施例提供的一种数据的标签方法进行详细介绍和说明。
53.参照图1，示出了本发明一实施例提供的一种数据的标签方法的流程示意图。
54.所述数据的标签方法可以应用于数据中台，所述数据中台可以是通过数据技术，对海量数据进行采集、计算、存储、加工，同时统一标准和口径的处理处理系统。
55.在本实施例中，数据中台把企业或用户的个人数据统一，并在统一之后会形成标准数据，再进行存储，形成大数据资产层，进而为客户提供高效服务。这些服务跟企业的业务或用户个人有较强的关联性。
56.中台的目标是提升效能、数据化运营、更好支持业务发展和创新，是多领域、多bu、多系统的负责协同。中台是平台化的自然演进，这种演进带来“去中心化“的组织模式，突出对能力复用、协调控制的能力，以及业务创新的差异化构建能力。
57.其中，作为示例的，所述数据的标签方法，可以包括：
58.s11、分别采集用户的历史行为数据与当前行为数据。
59.所述历史行为数据包括用户的历史交易行为数据、交易对象、交易动作和交易时间等等，例如，2017年12月15日向xxx公司购买钢材30顿，共花费xxx万元；又或者2019年12月12日在x宝购买电风扇3台，共花费xxx元。所述当前行为数据包括用户当前执行的交易行为数据、当前交易对象、当前交易动作和当前交易时间。例如，用户在2021年5月1日在x鱼中卖出一张显卡，收入xxx元。
60.s12、对所述历史行为数据和所述当前行为数据进行行为演变分析，得到用户的行为轨迹数据。
61.可以对历史行为数据和当前行为数据进行行为演变分析，该行为演变分析具体为用户从执行历史交易数据中的交易动作至执行当前的交易动作的行为逻辑，以查找用户过往的交易动作与当前交易动作的联系。
62.在一可选的实施例中，所述行为轨迹数据包括地点轨迹数据和动作轨迹数据，所述地点轨迹数据为用户执行交易动作的多个地点连接成的轨迹，例如，x宝
‑
x东
‑
x猫
‑
xxx路xxx五金店
‑
xxx路xxx奶茶店。所述动作轨迹数据为用户执行历史交易动作和当前交易动作等一系列动作的串联结果，例如，x宝预定购买
‑
x东收货
‑
x猫退款
‑
xxx路xxx五金店购买。
63.其中，作为示例的，步骤s12可以包括以下子步骤：
64.子步骤s121、从所述历史行为数据中提取历史动作数据和历史地点数据，以及从所述当前行为数据中提取当前动作数据和当前地点数据。
65.具体地，历史动作数据和当前动作数据可以为具体的交易动作，例如，购买、退款、预定或售出等等。历史地点数据和当前地点数据可以为用户执行交易动作的地点，例如，x多多、xxx路xxx五金店或xxx路xxx奶茶店等等。
66.子步骤s122、对所述历史地点数据和所述当前地点数据作数据拼接，得到拼接数据。
67.在本实施例中，可以将历史地点数据和和当前地点数据作数据拼接，具体地，可以是地点的拼接。例如，x宝
‑
x东
‑
x猫
‑
xxx路xxx五金店
‑
xxx路xxx奶茶店。
68.在具体实现中，若用户是使用终端执行的线上交易操作，可以通过终端获取用户执行该操作的定位，以该定位用户的历史地点数据，再将历史地点数据与当前地点数据进行数据拼接。
69.例如，用户在家里执行x宝的购买动作，可以以家的地址为此交易动作的历史地点数据，又例如，用户在公司执行x东的退货动作，可以以公司地址为此交易动作的历史地点数据。拼接后的拼接数据可以为xxx路xx雅苑
‑
xxx路xxx大厦
‑
xxx路xxx五金店
‑
xxx路xxx奶茶店。
70.子步骤s123、按照所述拼接数据绘制用户的移动线路得到地点轨迹数据。
71.接着将拼接的数据绘制成用户的移动轨迹，得到地点轨迹数据。
72.例如，若拼接数据为xxx路xx雅苑
‑
xxx路xxx大厦
‑
xxx路xxx五金店
‑
xxx路xxx奶茶店，则可以以“xxx路xx雅苑”的坐标点为起点，连接“xxx路xx雅苑”至“xxx路xxx大厦”的路线，再从“xxx路xxx大厦”连接“xxx路xxx五金店”的路线，直到“xxx路xxx奶茶店”，形成用户的地点轨迹数据。
73.子步骤s124、确定所述历史动作数据中是否包含与所述当前动作数据相同的在先动作数据。
74.在本实施例中，可以判断历史动作数据是否包含与当前动作数据在先动作数据，从而可以确定用户是否重复执行相同的操作。
75.子步骤s125、若所述历史动作数据中包含与所述当前动作数据相同的在先动作数据，则获取所述在先动作数据对应的在先动作类型，以所述在先动作类型的动作数据为动作轨迹数据。
76.子步骤s126、若所述历史动作数据中没有包含与所述当前动作数据相同的在先动作数据，则获取所述当前动作数据对应的当前动作类型，以所述当前动作类型的动作数据为动作轨迹数据。
77.例如，历史交易动作包括：买入、卖出和预定。若用户的当前动作数据为买入，则确定历史动作数据中包含与当前动作数据相同的在先动作数据，以买入动作对应的动作类型作为动作轨迹数据；若用户的当前动作数据为退货，则确定历史动作数据中没有包含与当前动作数据相同的在先动作数据，以退货动作对应的动作类型作为动作轨迹数据。
78.通过确定用户的动作类型，可以明确用户执行的动作目的，从而可以基于用户的动作目的给用户打标签。
79.由于用户执行了一个在先没有执行的交易动作，为了方便后续可以基于用户当前的交易动作进行相应的标签操作，在其中一种的实施例中，步骤s12可以还包括以下子步骤：
80.子步骤s127、将所述当前动作数据添加至所述历史动作数据中。
81.具体地，可以将该当前动作数据记录在存储历史动作数据的数据库中，并划分为历史动作数据的集合里，以方便后续的动作类型判断。
82.s13、基于所述行为轨迹数据计算用户的n个行为属性值，其中，n为大于或等于1的正整数。
83.在本实施例中，由于用户的行为轨迹数据包括地点轨迹数据和动作轨迹数据，而不同的操作可能隐含不同的目的，为了准确筛选用户的操作目的，从而可以基于用户的操作目的为用户打标签，可以基于用户的行为轨迹数据计算多个相应的行为属性值，每个行为属性值对应一个类型的标签。
84.具体地，行为属性值为用户的行为与该类型的标签的关联度。
85.在其中一种的实施例中，步骤s13可以包括以下子步骤：
86.子步骤s131、从所述地点轨迹数据中提取用户的逗留时间和移动时间。
87.在具体实现中，可以分别提取用户在每个交易地点的逗留时间，该逗留时间为用户执行该交易动作时在交易地点逗留的时间。移动时间为用户在地点轨迹数据中移动所需要的时间。
88.子步骤s132、计算所述逗留时间与所述移动时间的时间占比值，以所述时间占比值为行为属性值。
89.分别计算每个逗留时间与移动时间的比值，得到时间占比值，以时间占比值为行为属性值。
90.例如，用户的地点轨迹数据包括四个地点，每个地点的逗留时间分别为10分钟、20
分钟、5分钟和25分钟。用户在地点轨迹数据中移动所需要的时间为100分钟，计算得到的四个时间占比值分别为0.1、0.2、0.05和0.25。
91.子步骤s133、将所述动作轨迹数据转换成动作向量。
92.在本实施例中，所述动作轨迹数据为用户的动作类型，可以将该动作类型进行向量转换，得到动作向量。
93.子步骤s134、将所述动作向量代入至预设的贝叶斯网络中，得到n个相似动作概率值，以所述n个相似动作概率值为行为属性值。
94.将动作向量代入至预设的贝叶斯网络中，由贝叶斯网络的计算在预定条件下执行每个动作的概率值。预定的条件可以是用户预先设定的条件，可以是人为操作的条件，也可以是环境因素的条件。
95.s14、根据所述n个行为属性值匹配对应的数据标签。
96.在确定n个行为属性值后，可以根据n个行为属性值匹配相应的数据标签。
97.由于生成的行为属性值有多个，为了能准确基于用户的行为属性值匹配相应的标签，在其中一种的实施例中，步骤s14可以包括以下子步骤：
98.子步骤s141在多个预设的属性范围值中分别确定每个所述行为属性值的目标属性范围值。
99.具体地，用户可以预先设定多个属性范围值，例如，0
‑
1为第一个属性范围值，1
‑
2为第二个属性范围值，2
‑
3为第三个属性范围值等等。每个属性范围值可以对应一个或多个标签，标签的内容也可以是用户预先设定的。
100.例如，第一个属性范围值对应主动购买和满意好评，第二个属性范围值对应退货和差评等等。
101.子步骤s142、以每个所述目标属性范围值对应的预定标签为数据标签。
102.在确定每个行为属性值对应的属性值范围后，可以提取每个属性值范围对应的标签，再以该标签为数据标签。
103.在本实施例中，本发明实施例提供了一种数据的标签方法，其有益效果在于：本发明可以将用户的历史行为数据与当前行为数据进行行为演变分析，以确定用户一系列动作的联系，最后基于行为的联系确定给用户标签，整个过程不但快速有效，而且可以提高打标签的准确率，以及提高标签与用户行为的匹配度，也方便挖掘用户的隐藏含义。
104.本发明实施例还提供了一种数据的标签装置，参见图2，示出了本发明一实施例提供的一种数据的标签装置的结构示意图。
105.其中，作为示例的，所述装置应用于数据中台，所述数据的标签装置可以包括：
106.采集模块201，用于分别采集用户的历史行为数据与当前行为数据；
107.分析模块202，用于对所述历史行为数据和所述当前行为数据进行行为演变分析，得到用户的行为轨迹数据；
108.计算模块203，用于基于所述行为轨迹数据计算用户的n个行为属性值，其中，n为大于或等于1的正整数；
109.匹配模块204，用于根据所述n个行为属性值匹配对应的数据标签。
110.进一步的，所述行为轨迹数据包括地点轨迹数据和动作轨迹数据；
111.所述分析模块还用于：
112.从所述历史行为数据中提取历史动作数据和历史地点数据，以及从所述当前行为数据中提取当前动作数据和当前地点数据；
113.对所述历史地点数据和所述当前地点数据作数据拼接，得到拼接数据；
114.按照所述拼接数据绘制用户的移动线路得到地点轨迹数据；
115.确定所述历史动作数据中是否包含与所述当前动作数据相同的在先动作数据；
116.若所述历史动作数据中包含与所述当前动作数据相同的在先动作数据，则获取所述在先动作数据对应的在先动作类型，以所述在先动作类型的动作数据为动作轨迹数据；
117.若所述历史动作数据中没有包含与所述当前动作数据相同的在先动作数据，则获取所述当前动作数据对应的当前动作类型，以所述当前动作类型的动作数据为动作轨迹数据。
118.进一步的，所述计算模块还用于：
119.从所述地点轨迹数据中提取用户的逗留时间和移动时间；
120.计算所述逗留时间与所述移动时间的时间占比值，以所述时间占比值为行为属性值；
121.将所述动作轨迹数据转换成动作向量；
122.将所述动作向量代入至预设的贝叶斯网络中，得到n个动作概率值，以所述n个动作概率值为行为属性值。
123.进一步的，所述匹配模块还用于：
124.在多个预设的属性范围值中分别确定每个所述行为属性值的目标属性范围值；
125.以每个所述目标属性范围值对应的预定标签为数据标签。
126.进一步的，所述装置还可以包括：
127.添加模块，用于将所述当前动作数据添加至所述历史动作数据中。
128.进一步的，本技术实施例还提供了一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例所述的数据的标签方法。
129.进一步的，本技术实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如上述实施例所述的数据的标签方法。
130.以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许可;李嘉荣;李伟健
技术所有人：广州光点信息科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。