一种确定用户标签的方法及装置与流程

文档序号:31766576发布日期:2022-10-12 04:48阅读:128来源:国知局
一种确定用户标签的方法及装置与流程

1.本技术涉及信息处理的技术领域,特别是涉及一种确定用户标签的方法。


背景技术:

2.近年来,随着社会发展需要,我国人口迁移和资金流动相对频繁活跃。用户在不同地区银行办理业务的需求也逐渐增加。但受限于不同区域政策影响,同一用户在不同地区同一家银行办理业务,可能享受不到同样的服务、待遇,进而可能导致客户流失。
3.目前,银行可以通过对大数据(bdp)沙箱中,用户的信息数据进行处理来确定用户的标签。进而可以根据用户标签确定用户重要程度,以为其提供优质服务。但是当确定的用户标签过多时,就无法确定哪些用户标签是确定用户重要程度所需要的用户标签。所以,存在确定的用户标签中可能存在不是确定用户重要程度所需的用户标签,确定用户标签不准确,准确率低的问题。
4.因此,如何提高确定用户标签的准确率,是本领域技术人员亟需解决的技术问题。


技术实现要素:

5.基于上述问题,本技术提供了一种用户标签确定的方法及装置,提高确定用户标签的准确率。本技术实施例公开了如下技术方案。
6.第一方面。本技术提供的一种用户标签确定方法包括:
7.获取第一用户的用户数据;
8.根据所述用户数据确定用户标签集合,所述用户标签集合包括多个用户标签;
9.根据相关系数对所述用户标签集合中的所述多个用户标签进行相关性分析,确定至少一个第一标签,所述第一标签为与确定所述第一用户的重要程度相关的用户标签。
10.可选的,所述方法还包括:
11.对确定的所述至少一个第一标签进行主成成分分析,确定至少一个第二标签,所述第二标签为用于确定所述第一用户的重要程度的主成分用户标签。
12.可选的,所述方法还包括:
13.基于所述确定的至少一个第二标签,和所述样本方差公式,确定所述第二标签对所述第一用户的重要程度的影响的贡献值;
14.确定第二标签中贡献值大于第一阈值的用户标签。
15.可选的,所述第一用户的用户数据,包括:用户身份信息、用户账户信息、用户交易信息、用户金融资产信息、用户标签信息、用户地理位置信息。
16.可选的,所述方法还包括:
17.根据所述用户标签建立统计模型;
18.基于统计模型,对所述用户标签进行展示。
19.可选的,所述方法还包括:
20.根据所述第一标签确定所述第一用户的重要程度;
21.根据所述第一用户的重要程度,为所述第一用户推荐服务。
22.第二方面,本技术提供一种用户标签确定装置,所述装置包括:
23.获取单元,用于获取第一用户的用户数据;
24.第一确定单元,用于根据所述用户数据确定用户标签集合,所述用户标签集合包括多个用户标签;
25.第一分析单元,用于根据相关系数对所述用户标签集合中的所述多个用户标签进行相关性分析,确定至少一个第一标签,所述第一标签为与确定所述第一用户的重要程度相关的用户标签。
26.可选的,所述装置还包括:
27.第二分析单元,用于对确定的所述至少一个第一标签进行主成成分分析,确定至少一个第二标签,所述第二标签为用于确定所述第一用户的重要程度的主成分用户标签。
28.可选的,所述装置还包括:
29.第二确定单元,用于基于所述确定的至少一个第二标签和样本方差公式,确定所述第二标签对所述第一用户的重要程度的影响的贡献值;
30.确定所述第二标签中贡献值大于第一阈值的用户标签。
31.可选的,所述装置还包括:
32.第三确定单元,用于根据所述第一标签确定所述第一用户的重要程度;
33.推荐单元,用于根据所述第一用户的重要程度,为所述第一用户推荐服务。
34.可选的,所述装置还包括:
35.建立单元,用于根据所述用户标签建立统计模型;
36.展示单元,用于基于统计模型,对所述用户标签进行展示。
37.第三方面,本技术实施例提供了一种设备,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行前述第一方面任一项所述的方法。
38.第四方面,本技术实施例提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一项所述的方法。
39.相较于现有技术,本技术具有以下有益效果:
40.本技术中获取第一用户的用户数据,根据用户数据确定用户标签集合,根据相关系数对用户标签集合中的多个用户标签进行相关性分析,确定至少一个第二标签。相对于现有技术中的对大数据(bdp)沙箱中,用户的信息数据进行处理来确定用户的标签的方法。本技术可以对用户信息数据进行处理获得多个用户标签,并对多个用户标签进行相关性分析。对多个用户标签进行相关性分析之后就可以确定哪些用户标签是确定用户重要程度所需要的用户标签,进而滤除掉与确定用户重要程度无关的用户标签。这样,通过对多个用户标签进行相关性分析,就可以克服现有技术中存在的确定的用户标签中可能存在不是确定用户重要程度所需的用户标签,确定用户标签不准确,准确率低的问题。如此,提高了确定用户标签的准确率。
附图说明
41.为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1为本技术实施例提供的一种确定用户标签的方法的流程图;
43.图2为本技术实施例提供的另一种确定用户标签的方法的流程图;
44.图3为本技术实施例提供的确定用户标签装置的一种具体的结构示意图。
具体实施方式
45.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。
46.需要说明的是,本技术提供的一种确定用户标签的方法及装置,用于人工智能领域。上述仅为示例,并不对本技术提供的方法及装置名称的应用领域进行限定。
47.发明人经过研究提出本技术技术方案。本技术可以对用户信息数据进行处理获得多个用户标签,并对多个用户标签进行相关性分析。对多个用户标签进行相关性分析之后就可以确定哪些用户标签是确定用户重要程度所需要的用户标签,进而滤除掉与确定用户重要程度无关的用户标签。这样,通过对多个用户标签进行相关性分析,就可以克服现有技术中存在的确定的用户标签中可能存在不是确定用户重要程度所需的用户标签,确定用户标签不准确,准确率低的问题。如此,提高了确定用户标签的准确率。
48.本技术实施例提供的方法可以在服务器上执行。所述服务器例如可以是计算机等设备。
49.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。下面以本技术实施例提供的方法由数据库执行为例进行说明。为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。下面以本技术实施例提供的方法由第一设备执行为例进行说明。
50.图1为本技术实施例提供的一种确定用户标签方法的流程图,如图1所示该方法包括:
51.s101:获取第一用户的用户数据。
52.第一设备获取第一用户的用户数据,用户数据可以包括用户身份信息、用户账户信息、用户交易信息、用户金融资产信息、用户标签信息、用户地理位置信息。例如:可以获取用户的年龄,用户的账户存款,用户习惯投资的理财产品等。以便根据获取的用户数据确定该用户标签集合。
53.s102:根据所述用户数据确定用户标签集合,所述用户标签集合包括多个用户标签。
54.第一设备在获取用户数据之后,根据获取的用户身份信息、用户账户信息、用户交
易信息、用户金融资产信息、用户标签信息等用户数据,确定包括多个用户标签的用户标签集合。
55.进一步解释,用户标签指的是对用户某个维度特征的描述,例如,可以是对用户的产业的描述,又比如,也可以是对用户教育背景的描述,该用户的学历等,需要说明的是,每个用户的用户标签可能都不一样,而且一个用户可能会确定出多个用户标签。
56.s103:根据相关系数对所述用户标签集合中的所述多个用户标签进行相关性分析,确定至少一个第一标签,所述第一标签为与确定所述第一用户的重要程度相关的用户标签。
57.第一设备在确定用户标签集合之后,根据相关系数对用户标签集合中的多个用户标签进行相关性分析,确定一个或者多个第一标签。以便确定哪些用户标签是确定用户重要程度所需要的用户标签,进而滤除掉与确定用户重要程度无关的用户标签。
58.进一步解释,相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。
59.本技术中通过相关性分析公式(1)从用户标签集合中的多个用户标签中确定出与确定第一用户的重要程度相关的用户标签。其中,公式(1)具体可以是:
60.r=(∑(xi-x_)(yi-y_))/(∑(xi-x_)2∑(yi-y_)2)1/261.=(∑xy-1/n∑x∑y)/((∑x
2-1/n(∑x)2)1/2(∑y
2-1/n(∑y)2)1/2)。
62.其中,r为相关系数,x表示x的数学期望,y表示y的数学期望。
63.当r=1或-1,表示两个指标完全正相关或负相关;
64.r》0,表示两个指标间正相关,趋势相同;
65.r《0,表示两个指标间负相关,趋势相反;
66.r=0,表示两个指标间不相关。
67.本技术中获取第一用户的用户数据,根据用户数据确定用户标签集合,根据相关系数对用户标签集合中的多个用户标签进行相关性分析,确定至少一个第二标签。相对于现有技术中的对大数据(bdp)沙箱中,用户的信息数据进行处理来确定用户的标签的方法。本技术可以对用户信息数据进行处理获得多个用户标签,并对多个用户标签进行相关性分析。对多个用户标签进行相关性分析之后就可以确定哪些用户标签是确定用户重要程度所需要的用户标签,进而滤除掉与确定用户重要程度无关的用户标签。这样,通过对多个用户标签进行相关性分析,就可以克服现有技术中存在的确定的用户标签中可能存在不是确定用户重要程度所需的用户标签,确定用户标签不准确,准确率低的问题。如此,提高了确定用户标签的准确率。
68.在上述介绍的基础上,本技术实施例提供的技术方案还可以在确定用户第一标签之后,根据第一标签确定第一用户的重要程度,根据第一用户的重要程度,为第一用户推荐服务。此实施例称为第二实施例。
69.具体地,在确定用户第一标签之后,可以根据用户的第一标签确定该用户的重要程度,看其是否是重要用户。然后可以根据确定的用户重要程度,为该用户推荐服务。例如,预先设置一个标签阈值,设置一个用户标签为用户账户资金流水1000万,确定用户第一标签之后,就可以看用户的第一标签是否满足标签阈值,也就是说看用户资金流水是否超过1000万,如果满足标签阈值,则可以确定该用户为重要用户。一方面当该用户在不同地区的
同一家银行办理业务时,可以根据该用户重要程度,为其提供相同的优质服务。另一方方面,也可以,,可以根据该用户重要程度,为其推荐价值高的投资理财产品。
70.本具体实施方式与上述具体实施方式的不同之处在于,添加了在确定用户第一标签之后,根据第一标签确定第一用户的重要程度,根据第一用户的重要程度,为第一用户推荐服务的步骤。其余步骤均与上述具体实施方式相同,在此不再展开赘述。
71.图2为本技术实施例提供的另一种确定用户标签的方法的流程图;如图2所示该方法包括:
72.s201:获取第一用户的用户数据。
73.s202:根据用户数据确定用户标签集合。
74.s203:根据相关系数对所述用户标签集合中的所述多个用户标签进行相关性分析,确定至少一个第一标签。
75.可以理解第一标签为与确定第一用户的重要程度相关的用户标签。
76.s204:对确定的所述至少一个第一标签进行主成成分分析,确定至少一个第二标签。
77.第一设备确定第一标签之后,对至少一个第一标签进行主成成分分析,确定至少一个第二标签。
78.进一步解释,主成成分分析是指将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。
79.本技术中对至少一个第一标签通过以下主成成分分析公式(2)确定第二标签,以及第二标签的个数。
80.公式(2)具体为:
81.fp=a1i*zx1+a2i*zx2+
……
+api*zxp;
82.rai=λiai,。可以理解,第二标签为用于确定第一用户的重要程度的主成分用户标签。也就是说从第一标签中确定出第二标签也就是主成分标签。以便更准确的确定哪些用户标签是确定用户重要程度所需要的用户标签。
83.其中,a=(aij)p
×
m=(a1,a2,

am),a为系数。r为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥

≥λp≥0。fp指的是第p个主成分。a2i,
……
,api(i=1,
……
,m)为x的协方差阵σ的特征值所对应的特征向量,zx1,zx2,
……
,zxp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本技术所采用的数据就存在量纲影响[注:数据标准化是指z标准化]。
[0084]
s205:基于所述确定的至少一个第二标签和样本方差公式,确定所述第二标签对所述第一用户的重要程度的影响的贡献值,确定所述第二标签中贡献值大于第一阈值的用户标签。
[0085]
第一设备在确定至少一个第二标签也就是主成分标签之后,将第二标签带入样本方差公式,进行加权求和,得到每个第二标签对第一用户重要程度的影响对应的贡献值。然后确定第二标签中贡献值大于第一阈值的用户标签。其中,第一阈值可以是预先设置,例如,可以设置第一阈值为0.85,则确定第二标签中贡献值大于0.85的用户标签,滤除掉贡献值小于第一阈值的标签。
[0086]
s206:根据所述用户标签建立统计模型,基于统计模型,对所述用户标签进行展示。
[0087]
图3为本技术实施例提供的确定用户标签装置的一种具体实施方式的结构示意图。参照图3所述装置可以包括:
[0088]
获取单元300,用于获取第一用户的用户数据;
[0089]
第一确定单元310,用于根据所述用户数据确定用户标签集合,所述用户标签集合包括多个用户标签;
[0090]
第一分析单元320,用于根据相关系数对所述用户标签集合中的所述多个用户标签进行相关性分析,确定至少一个第一标签,所述第一标签为与确定所述第一用户的重要程度相关的用户标签。
[0091]
可选的,所述装置还包括:
[0092]
第二分析单元,用于对确定的所述至少一个第一标签进行主成成分分析,确定至少一个第二标签,所述第二标签为用于确定所述第一用户的重要程度的主成分用户标签。
[0093]
可选的,所述装置还包括:
[0094]
第二确定单元,用于基于所述确定的至少一个第二标签和样本方差公式,确定所述第二标签对所述第一用户的重要程度的影响的贡献值;
[0095]
确定所述第二标签中贡献值大于第一阈值的用户标签。
[0096]
可选的,所述装置还包括:
[0097]
第三确定单元,用于根据所述第一标签确定所述第一用户的重要程度;
[0098]
推荐单元,用于根据所述第一用户的重要程度,为所述第一用户推荐服务。
[0099]
可选的,所述装置还包括:
[0100]
建立单元,用于根据所述用户标签建立统计模型;
[0101]
展示单元,用于基于统计模型,对所述用户标签进行展示。
[0102]
本技术所提供的装置,获取单元300,用于获取第一用户的用户数据。第一确定单元310,用于根据用户数据确定用户标签集合。第一分析单元320,用于根据相关系数对用户标签集合中的多个用户标签进行相关性分析,确定至少一个第二标签。相对于现有技术中的对大数据(bdp)沙箱中,用户的信息数据进行处理来确定用户的标签的方法。本技术可以对用户信息数据进行处理获得多个用户标签,并对多个用户标签进行相关性分析。对多个用户标签进行相关性分析之后就可以确定哪些用户标签是确定用户重要程度所需要的用户标签,进而滤除掉与确定用户重要程度无关的用户标签。这样,通过对多个用户标签进行相关性分析,就可以克服现有技术中存在的确定的用户标签中可能存在不是确定用户重要程度所需的用户标签,确定用户标签不准确,准确率低的问题。如此,提高了确定用户标签的准确率。
[0103]
本技术实施例还提供了对应的设备以及计算机存储介质,用于实现本技术实施例提供的方案。
[0104]
其中,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行本技术任一实施例所述的方法。
[0105]
所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现本技术任一实施例所述的方法。
[0106]
本技术实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
[0107]
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,rom)/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本技术各个实施例或者实施例的某些部分所述的方法。
[0108]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0109]
以上所述仅是本技术示例性的实施方式,并非用于限定本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1