用于限制用户团体行为的方法、装置、介质及计算机设备与流程

文档序号:28952560发布日期:2022-02-19 11:00阅读:85来源:国知局
用于限制用户团体行为的方法、装置、介质及计算机设备与流程

1.本发明涉及风险控制技术领域,尤其涉及一种用于限制用户团体行为的方法、装置、介质及计算机设备。


背景技术:

2.在直播平台上,通常会存在一些具有类似特征的用户团体。用户团体可能是一个自然人注册的若干小号形成的,也有可能是非法用户通过机器操作形成的。
3.如果用户团队在直播平台的某些业务场景中是有目的地使用非正常手段获利,则需要对用户团队的行为进行限制。但是为了避免误判,一般只有确定某个用户团队在某个业务场景为高风险用户团队时,才会对用户团队的行为进行限制。
4.现有技术中在对用户团队的行为进行限制时,一般是通过行为同步性及制定业务场景中用户的黑名单来实现。但是若某些用户的行为同步并不能说明这些用户存在关联性,也可能只是巧合,因此这种判定用户团队在该场景中是否为高风险用户团队的方式很可能存在误判。而为业务场景制定团体用户黑名单时,因为直播平台业务场景众多,很难将所有的业务场景完全覆盖,因此也有可能存在误判。


技术实现要素:

5.针对现有技术存在的问题,本发明实施例提供了一种用于限制用户团体行为的方法、装置、介质及计算机设备,用于解决现有技术中在直播平台中在对业务场景中用户团队的行为进行限制时,由于对业务场景中用户团队是否为高风险用户团队的识别精度不能确保,导致不能精准限制用户团体行为,进而导致直播平台的权益受损的技术问题。
6.本发明的第一方面,提供一种用于限制用户团体行为的方法,应用在直播平台中,所述方法包括:
7.针对直播平台中的任一业务场景,提取所有用户的风险特征;
8.基于所述风险特征构建分类器,基于所述分类器及所述用户的风险特征,确定各用户在所述业务场景中的个体风险分;每个所述用户对应一个所述个体风险分;
9.针对每一个所述用户,获取所述用户在所述直播平台所有业务场景中的风险特征,将所述风险特征进行拼接,获得风险特征向量;
10.基于各所述用户的所述风险特征向量确定至少一个用户团体;
11.针对每一个所述用户团体,确定所述用户团体中的每个用户在所述用户团体中的重要度;基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分;
12.确定所述用户团体在所述业务场景中的团体分歧度;所述团体分歧度为所述用户团体的群组风险分与各所述用户的加权风险分之间的偏差,所述加权风险分根据所述用户的个体风险分及所述用户在所述用户团体中的重要度确定;
13.根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧
度确定所述用户团体在所述业务场景中的共识得分;
14.判断所述共识得分是否超出预设的共识得分阈值,若超出,则确定所述用户团体在所述业务场景中为高风险用户团体;
15.在所述业务场景中,基于预设的行为限制策略对所述高风险用户团体的行为进行限制。
16.可选的,所述基于所述风险特征构建分类器,包括:
17.根据所述风险特征确定样本数据;所述样本数据包括:正样本数据及负样本数据;所述正样本数据包括具有历史风险行为的用户对应的风险特征,所述负样本数据包括无历史风险行为的用户对应的风险特征;
18.基于预设的机器学习算法对所述样本数据进行训练,获得所述分类器。
19.可选的,所述基于各所述用户的所述风险特征向量确定至少一个用户团体,包括:
20.步骤a,在所有的风险特征向量中随机选择一个所述风险特征向量作为起始中心向量c;
21.步骤b,针对剩余风险特征向量中的任一当前风险特征向量fu,判断所述当前特征向量是否满足公式||c-fu||2《=r;若满足,则将所述当前风险特征向量对应的用户存储至用户集合中;所述r为预设的半径;
22.步骤c,针对所述用户集合,根据公式确定所述用户集合的偏移向量s;所述u为所述用户集合u中的用户;
23.步骤d,确定所述偏移向量的梯度及模长,根据公式c'=cgrad(s)||s||2确定所述第一中心向量c';
24.步骤e,迭代步骤b~步骤d,直至||s||2《ε;所述ε为经验系数,0.01《ε《0.1;其中,每次迭代结束时生成一个对应的用户集合,所述用户集合对应所述用户团体。
25.可选的,所述确定所述用户团体中的每个用户在所述用户团体中的重要度,包括:
26.根据公式确定所述用户团体中的每个用户在所述用户团体中的重要度w(u1,g);其中,所述c(u1,g)为用户u1在所述用户团体g中的活跃度,所述活跃度为用户u1在所述场景中的行为次数;所述u1为所述用户团体g中的任一目标用户;所述v为所述用户团体g中的任一用户。
27.可选的,所述基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分,包括:
28.根据公式确定所述用户团体的群组风险分gr(g,s);其中,所述s为业务场景,所述g为所述业务场景s中的任一用户团体,所述u1为所述业务场景内s中的用户团体g的任一用户;所述r(u1,s)是所述用户团体g的任一用户在所述业务场景s中的个体风险分;w(u1,g)为所述用户团体g中的任一用户在所述用户团体g中的重要度。
29.可选的,所述确定所述用户团体在所述业务场景中的团体分歧度,包括:
30.根据公式确定所述用户团体在所述业务场景中的团体分歧度diff(g,s);其中,所述w(u1,g)r(u1,s)为所述用户团体g中任一用户u1的加权风险分;所述gr(g,s)为用户团体g的群组风险分;所述s为业务场景,所述g为所述用户团体,所述u1为所述用户团体g中的任一用户。
31.可选的,所述根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧度确定所述用户团体在所述业务场景中的共识得分,包括:
32.根据公式f(g,s)=w*gr(g,s)+(1-w)*(1-diff(g,s))确定所述用户团体在所述业务场景中的共识得分f(g,s);其中,所述w为权重系数,0《w《1;所述gr(g,s)为用户团体g的群组风险分;所述diff(g,s)为用户团体g在所述业务场景s中的团体分歧度。
33.本发明的第二方面,提供一种用于限制用户团体行为的装置,所述装置包括:
34.提取单元,用于针对直播平台中的任一业务场景,提取所有用户的风险特征;
35.确定单元,用于基于所述风险特征构建分类器,基于所述分类器及所述用户的风险特征,确定各用户在所述业务场景中的个体风险分;每个所述用户对应一个所述个体风险分;
36.获取单元,用于针对每一个所述用户,获取所述用户在所述直播平台所有业务场景中的风险特征,将所述风险特征进行拼接,获得风险特征向量;
37.基于各所述用户的所述风险特征向量确定至少一个用户团体;
38.针对每一个所述用户团体,确定所述用户团体中的每个用户在所述用户团体中的重要度;基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分;
39.确定所述用户团体在所述业务场景中的团体分歧度;所述团体分歧度为所述用户团体的群组风险分与各所述用户的加权风险分之间的偏差,所述加权风险分根据所述用户的个体风险分及所述用户在所述用户团体中的重要度确定;
40.根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧度确定所述用户团体在所述业务场景中的共识得分;
41.判断单元,用于判断所述共识得分是否超出预设的共识得分阈值,若超出,则确定所述用户团体在所述业务场景中为高风险用户团体;
42.限制单元,用于在所述业务场景中,基于预设的行为限制策略对所述高风险用户团体的行为进行限制。
43.本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一项所述的方法。
44.本发明的第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中任一项所述的方法。
45.本发明提供了一种用于限制用户团体行为的方法、装置、介质及计算机设备,针对直播平台中的任一业务场景,提取出所有用户的风险特征,并基于风险特征确定各用户在业务场景中的个体风险分;基于各个用户在所有业务场景的风险特征确定至少一个用户团
体;这样相当于是基于各个用户的风险特征确定的用户团队,因此在进行风险判定时可以确保准确度;为了进一步提高判定的精度,针对每一个用户团体,确定出用户团体在业务场景中的群组风险分及团体分歧度,基于群组风险分及团体分歧度确定出用户团体在所述业务场景中的共识得分,若共识得分超出阈值,则确定该用户团队为高风险团队;这样相当于综合考虑到了该用户团体的批量行为及内在分歧度,因此能够精准识别出在某个业务场景中存在批量行为且同步性较高的用户团体,提高了识别精度,可以精准限制用户团体的行为,进而确保直播平台的权益。
附图说明
46.图1为本发明实施例一提供的用于限制用户团体行为的方法流程示意图;
47.图2为本发明实施例二提供的用于限制用户团体行为的装置结构示意图;
48.图3为本发明实施例三提供的用于限制用户团体行为的计算机设备结构示意图;
49.图4为本发明实施例三提供的用于限制用户团体行为的计算机介质结构示意图。
具体实施方式
50.为了解决现有技术中在直播平台中在对业务场景中用户团队的行为进行限制时,由于对业务场景中用户团队是否为高风险用户团队的识别精度不能确保,导致不能精准限制用户团体行为,进而导致直播平台的权益受损的技术问题。本发明提供了一种用于限制用户团体行为的方法、装置、介质及计算机设备。
51.下面通过附图及具体实施例对本发明的技术方案做进一步的详细说明。
52.实施例一
53.本实施例提供一种用于限制用户团体行为的方法,如图1所示,方法包括:
54.s110,针对直播平台中的任一业务场景,提取所有用户的风险特征;
55.直播平台的业务场景包括多个,比如包括:登录场景、弹幕场景、宝箱场景、抽奖场景等等。为了提高风险识别的精度,针对直播平台中的任一业务场景,提取出所有用户的风险特征。其中,风险特征包括:用户在业务场景中的行为总数量、用户在业务场景中使用的ip数量、用户在业务场景中使用的设备数量及用户在业务场景使用的客户端数量等等。因为非正常用户团队在进行非正常操作时,设备和ip会在各用户之间反复多次使用,每个用户的行为往往是高频的,因此上述几种风险特征是提高高风险用户团体识别精度所比不可少的信息参数,是用户使用后留下的痕迹,是客观存在的,并非人为主观因素的选取,而是为了解决技术问题对上述用户在业务场景中的行为总数量、用户在业务场景中使用的ip数量、用户在业务场景中使用的设备数量及用户在业务场景使用的客户端数量进行获取(也即符合自然规律的选取)。
56.s111,基于所述风险特征构建分类器,基于所述分类器及所述用户的风险特征,确定各用户在所述业务场景中的个体风险分;每个所述用户对应一个所述个体风险分;
57.提取出各个业务场景中所有用户的风险特征后,基于风险特征构建分类器;具体包括:
58.根据风险特征确定样本数据;样本数据包括:正样本数据及负样本数据;正样本数据包括具有历史风险行为的用户对应的风险特征,负样本数据包括无历史风险行为的用户
对应的风险特征;
59.基于预设的机器学习算法对样本数据进行训练,获得分类器。
60.分类器构建完毕之后,基于分类器及用户在该场景中的所有风险特征,确定各用户在业务场景中的个体风险分;每个用户对应一个个体风险分。
61.举例来说,比如用户u在业务场景s中的所有风险特征为fs,因此可根据公式r(u,s)=cs(fs)确定用户u在业务场景s中的个体风险分r(u,s);其中,cs为分类器。用户u为场景s中的任意一个用户。
62.s112,针对每一个所述用户,获取所述用户在所述直播平台所有业务场景中的风险特征,将所述风险特征进行拼接,获得风险特征向量;
63.针对每一个用户,获取用户在直播平台所有业务场景中的风险特征,将风险特征进行拼接,获得风险特征向量;所有风险特征向量构成用户向量空间。
64.比如,若直播平台包括2个场景,用户u在第一个场景s中有10个风险特征,在第二个场景t中有10个风险特征,那么将两个场景中的风险特征进行拼接,形成一个20维的风险特征向量fu。
65.s113,基于各所述用户的所述风险特征向量确定至少一个用户团体;
66.各个用户的风险特征向量确定出之后,需要基于各用户的所述风险特征向量确定至少一个用户团体,具体包括:
67.步骤a,在所有的风险特征向量中随机选择一个风险特征向量作为起始中心向量c;
68.步骤b,针对剩余风险特征向量中的任一当前风险特征向量fu,判断当前特征向量是否满足公式||c-fu||2《=r;若满足,则将当前风险特征向量对应的用户存储至用户集合中;r为预设的半径;
69.步骤c,针对用户集合,根据公式确定用户集合的偏移向量s;此时用户u为用户集合中的用户;
70.步骤d,确定偏移向量的梯度及模长,根据公式c'=cgrad(s)||s||2确定第一中心向量c';偏移向量的梯度为grad(s),偏移向量的模长为||s||2。
71.步骤e,迭代步骤b~步骤d,直至||s||2《ε;ε为经验系数,0.01《ε《0.1;其中,每次迭代结束时生成一个对应的用户集合,用户集合即为用户团体。ε优选值可为0.5;为了确保用户聚类的精度,因此本实施例中ε取值需大于0.01;为了减小迭代误差,进而确保用户团体的确定精度,ε取值需小于0.1。若ε取值小于0.01时,会将用户团体分的很细,会出现很多小的团体,小的团体置信度不高,造成团体识别不准确;若ε取值大于0.1时,用户团体规模过大,有些用户团体没有被切分开,也会造成团体识别不准确。
72.这种通过不断迭代生成各用户团体的方式,可以基于风险特征提高用户聚类的精度,确保每个用户团体中用户的行为是一致的,进而确保用户团体的确定精度。
73.s114,针对每一个所述用户团体,确定所述用户团体中的每个用户在所述用户团体中的重要度;基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分;
74.在确定出至少一个用户团体后,针对每一个用户团体,确定用户团体中的每个用
户在用户团体中的重要度;基于用户团体中每个用户在用户团体中的重要度及每个用户在业务场景中的个体风险分确定户团体在务场景中的群组风险分。
75.作为一种可选的实施例,确定用户团体中的每个用户在用户团体中的重要度,包括:
76.根据公式确定用户团体中的每个用户在用户团体中的重要度w(u1,g);其中,c(u1,g)为用户u1在用户团体g中的活跃度,为用户团体g中所有用户的活跃度之和;g为任一用户团体;活跃度为用户u1在业务场景中的行为次数;用户u1为用户团体g中的任一目标用户,用户v为用户团体g中的任一用户,用户v包含用户u1。
77.这里,用户u1在用户团体g中的活跃度可根据公式确定;其中,s为任一业务场景;x为直播平台中的所有业务场景,c(u1,g)为用户u1在业务场景s中的行为次数。
78.w(u1,g)的计算原理为:先确定出用户团体g中任意一个用户u1在该团体中的活跃度及所有用户在该团体中的活跃度总和,然后将用户u1在该团体中的活跃度及活跃度总和的比值作为每个用户在用户团体中的重要度。可以看出,每个用户在用户团体的活跃度越高,则该用户在用户团体中的重要度也越高。
79.确定出用户团体中的每个用户在用户团体中的重要度后,根据公式确定用户团体g的群组风险分gr(g,s);其中,s为业务场景,g为业务场景s中的任一用户团体,所述u1为业务场景s内中的用户团体g的任一用户;r(u1,s)为用户团体g中的任一用户在业务场景s中的个体风险分;w(u1,g)为用户团体g中的任一用户在用户团体g中的重要度,|g|为用户团体g中的用户数量。
80.这里,用户团体的群组风险分gr(g,s)的计算原理为:对该用户团体内用户的个体风险分进行加权平均,因此可以得到该用户团体内所有用户的加权风险分之和w(u1,g)可作为权重,因此群组风险分也可以理解为用户风险加权平均分。
81.s115,确定所述用户团体在所述业务场景中的团体分歧度;所述团体分歧度为所述用户团体的群组风险分与各所述用户的加权风险分之间的偏差,所述加权风险分根据所述用户的个体风险分及所述用户在所述用户团体中的重要度确定;
82.各用户团体的群组风险分确定出之后,根据公式确定用户团体g在业务场景s中的团体分歧度diff(g,s);其中,w(u1,g)r(u1,s)为用户团体g中任一用户u1的加权风险分;gr(g,s)为用户团体g的群组风险分;s为业务场景,g为业务场景s中的任一用户团体,u1为用户团体g的任一用户。
83.这里,团体分歧度diff(g,s)的计算原理为:针对任一用户团体,团体分歧度为用户团体的群组风险分gr(g,s)与各用户的加权风险分w(u1,g)r(u1,s)之间的偏差,两者之间的差异越大,说明用户风险和团体风险之间的分歧度越大;利用(w(u1,g)r(u1,s)-gr(g,s))2衡量单个用户的分歧度,单个用户的分歧度求和加总之和得到最终的团体分歧度diff(g,s)。
84.s116,根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧度确定所述用户团体在所述业务场景中的共识得分;
85.用户团体的团体分歧度确定出之后,根据用户团体的群组风险分及用户团体在业务场景中的团体分歧度确定用户团体在业务场景中的共识得分。
86.具体的,根据公式f(g,s)=w*gr(g,s)+(1-w)*(1-diff(g,s))确定用户团体在所述业务场景中的共识得分f(g,s);其中,述w为权重系数,0《w《1;gr(g,s)为用户团体g的群组风险分;diff(g,s)为用户团体g在业务场景s中的团体分歧度。
87.f(g,s)的计算原理为:确定团体分歧度的权重系数及群组风险分的权重系数,再基于团体分歧度、用户团体的群组风险分及各对应的权重系数获得用户团体的共识得分。其中,权重系数根据该业务场景对群组风险的容忍程度确定,容忍程度越高那么群组风险分对应的越低;容忍程度越低那么群组风险分对应的越高。
88.可以看出,团体风险分越高,团体分歧度越低则说明该团体在该业务场景中的风险行为程度及一致性更高,此时用户团体在此业务场景中确认为高风险团体的概率也就越大。
89.本实施例在确定用户团体的共识得分时,同时考虑到了群组风险分及团体分歧度,这样可以确保确定出的高风险用户团队的精度。因为若只考虑到群组风险分,若群组风险分高的话可能是由于用户团体的某一些高分用户引起的,用户之间的分数差异比较大,那么该业务场景中不具有批量行为,不适合对用户团队中的所有用户进行处罚,因此不能将该用户团队直接确定为高风险团队。而若只考虑团队分歧度,若团队分歧度较小,但是也有可能出现群组风险分也比较小的情况,这种情况说明用户团体中的用户虽然在行为上存在一定的同步性,但是不存在高风险的,此时也不适合对用户团体中的用户进行惩罚。
90.s117,判断所述共识得分是否超出预设的共识得分阈值,若超出,则确定所述用户团体在所述业务场景中为高风险用户团体;
91.用户团体在业务场景中的共识得分确定出之后,判断共识得分是否超出预设的共识得分阈值,若超出,则确定用户团体在业务场景中为高风险用户团体,此时需要对用户团体内的用户进行处罚。
92.举例来说,比如在登录场景中的某个用户团体包括4个用户,这4个用户的个体风险分分别为:0.75、0.6、0.7、0.8;这4个用户在用户团体的重要度分别为:0.3、0.2、0.3、0.2。
93.那么,用户团体的群组风险分为:
94.gr(g,s)=0.75*0.3+0.6*0.2+0.7*0.3+0.8*0.2=0.715;
95.团体分歧度为:
96.diff(g,s)=0.3*(0.75-0.715)2+0.2*(0.6-0.715)2+0.3*(0.7-0.715)2+0.2*(0.8-0.715)2=0.0045
97.取w=0.5;
98.共识得分为:
99.f(g,s)=0.5*0.715+0.5*(1-0.0045)=0.86
100.若共识得分的阈值为0.7,说明此用户团体在登录业务场景中为高风险用户团体,需要对该用户团体的用户进行行为限制,比如限制登录等。
101.利用本实施例提供的方法,可以精准识别出高风险用户团队及高风险用户,相比现有技术,本实施例同时考虑到了群组风险分及团体分歧度,这样可以确保确定出的高风险用户团队的精度,进而也可以提高高风险用户的覆盖度,相比现有技术的识别方式,高风险用户的覆盖度可提升10%-15%。
102.s118,在所述业务场景中,基于预设的行为限制策略对所述高风险用户团体的行为进行限制。
103.若确定用户团体在某个业务场景中为高风险用户团体,则基于预设的行为限制策略对高风险用户团体的行为进行限制。
104.举例来说,比如在抽奖场景,若确定某个用户团体在抽奖场景中为高风险用户团体,则对该用户团体中的所有用户的ip进行暂时封禁,禁止抽奖。
105.本实施提供的用于限制用户团体行为的方法,针对直播平台中的任一业务场景,提取出所有用户的风险特征,并基于风险特征确定各用户在业务场景中的个体风险分;基于各个用户在所有业务场景的风险特征确定至少一个用户团体;这样相当于是基于各个用户的风险特征确定的用户团队,因此在进行风险判定时可以确保准确度;为了进一步提高判定的精度,针对每一个用户团体,确定出用户团体在业务场景中的群组风险分及团体分歧度,基于群组风险分及团体分歧度确定出用户团体在所述业务场景中的共识得分,若共识得分超出阈值,则确定该用户团队为高风险团队;这样相当于综合考虑到了该用户团体的批量行为及内在分歧度,因此能够精准识别出在某个业务场景中存在批量行为且同步性较高的用户团体,提高了识别精度,可以精准限制用户团体的行为,进而确保直播平台的权益。
106.基于同样的发明构思,本发明还提供一种用于限制用户团体行为的装置,详见实施例二。
107.实施例二
108.本实施例提供一种用于限制用户团体行为的装置,如图2所述,装置包括:提取单元21、确定单元22、判断单元23及限制单元24;其中,
109.提取单元21,用于针对直播平台中的任一业务场景,提取所有用户的风险特征;所述风险特征包括:所述用户在所述业务场景中的行为总数量、所述用户在所述业务场景中使用的ip数量、所述用户在所述业务场景中使用的设备数量及所述用户在所述业务场景使用的客户端数量;
110.确定单元22,用于基于所述风险特征构建分类器,基于所述分类器及所述用户的风险特征,确定各用户在所述业务场景中的个体风险分;每个所述用户对应一个所述个体风险分;
111.用于针对每一个所述用户,获取所述用户在所述直播平台所有业务场景中的风险特征,将所述风险特征进行拼接,获得风险特征向量;
112.基于各所述用户的所述风险特征向量确定至少一个用户团体;
113.针对每一个所述用户团体,确定所述用户团体中的每个用户在所述用户团体中的重要度;基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分;
114.确定所述用户团体在所述业务场景中的团体分歧度;所述团体分歧度为所述用户团体的群组风险分与各所述用户的加权风险分之间的偏差,所述加权风险分根据所述用户的个体风险分及所述用户在所述用户团体中的重要度确定;
115.根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧度确定所述用户团体在所述业务场景中的共识得分;
116.判断单元23,用于判断所述共识得分是否超出预设的共识得分阈值,若超出,则确定所述用户团体在所述业务场景中为高风险用户团体;
117.限制单元24,用于在所述业务场景中,基于预设的行为限制策略对所述高风险用户团体的行为进行限制。
118.具体的,直播平台的业务场景包括多个,比如包括:登录场景、弹幕场景、宝箱场景、抽奖场景等等。为了提高风险识别的精度,针对直播平台中的任一业务场景,提取单元21用于提取出所有用户的风险特征。其中,风险特征包括:用户在业务场景中的行为总数量、用户在业务场景中使用的ip数量、用户在业务场景中使用的设备数量及用户在业务场景使用的客户端数量等等。因为非正常用户团队在进行非正常操作时,设备和ip会在各用户之间反复多次使用,每个用户的行为往往是高频的,因此上述几种风险特征是提高高风险用户团体识别精度所比不可少的信息参数,是用户使用后留下的痕迹,是客观存在的,并非人为主观因素的选取,而是为了解决技术问题对上述用户在业务场景中的行为总数量、用户在业务场景中使用的ip数量、用户在业务场景中使用的设备数量及用户在业务场景使用的客户端数量进行获取(也即符合自然规律的选取)。
119.提取单元21提取出所有用户的风险特征后,确定单元22用于基于风险特征构建分类器;具体包括:
120.根据风险特征确定样本数据;样本数据包括:正样本数据及负样本数据;正样本数据包括具有历史风险行为的用户对应的风险特征,负样本数据包括无历史风险行为的用户对应的风险特征;
121.基于预设的机器学习算法对样本数据进行训练,获得分类器。
122.分类器构建完毕之后,基于分类器及用户在该场景中的所有风险特征,确定各用户在业务场景中的个体风险分;每个用户对应一个个体风险分。
123.举例来说,比如用户u在业务场景s中的所有风险特征为fs,因此可根据公式r(u,s)=cs(fs)确定用户u在业务场景s中的个体风险分r(u,s);其中,cs为分类器。用户u为场景s中的任意一个用户。
124.确定单元23用于针对每一个用户,获取用户在直播平台所有业务场景中的风险特征,将风险特征进行拼接,获得风险特征向量;所有风险特征向量构成用户向量空间。
125.比如,若直播平台包括2个场景,用户u在第一个场景s中有10个风险特征,在第二个场景t中有10个风险特征,那么将两个场景中的风险特征进行拼接,形成一个20维的风险特征向量fu。
126.各个用户的风险特征向量确定出之后,确定单元23需要基于各用户的所述风险特征向量确定至少一个用户团体,具体包括:
127.步骤a,在所有的风险特征向量中随机选择一个风险特征向量作为起始中心向量c;
128.步骤b,针对剩余风险特征向量中的任一当前风险特征向量fu,判断当前特征向量是否满足公式||c-fu||2《=r;若满足,则将当前风险特征向量对应的用户存储至用户集合中;r为预设的半径;
129.步骤c,针对用户集合,根据公式确定用户集合的偏移向量s;此时用户u为用户集合中的用户;
130.步骤d,确定偏移向量的梯度及模长,根据公式c'=cgrad(s)||s||2确定第一中心向量c';偏移向量的梯度为grad(s),偏移向量的模长为||s||2。
131.步骤e,迭代步骤b~步骤d,直至||s||2《ε;ε为经验系数,0.01《ε《0.1;其中,每次迭代结束时生成一个对应的用户集合,用户集合即为用户团体。ε优选值可为0.5;为了确保用户聚类的精度,因此本实施例中ε取值需大于0.01;为了减小迭代误差,进而确保用户团体的确定精度,ε取值需小于0.1。
132.这种通过不断迭代生成各用户团体的方式,可以基于风险特征提高用户聚类的精度,确保每个用户团体中用户的行为是一致的,进而确保用户团体的确定精度。
133.在确定出至少一个用户团体后,针对每一个用户团体,确定单元23需要确定用户团体中的每个用户在用户团体中的重要度;基于用户团体中每个用户在用户团体中的重要度及每个用户在业务场景中的个体风险分确定户团体在务场景中的群组风险分。
134.作为一种可选的实施例,确定单元23确定用户团体中的每个用户在用户团体中的重要度,包括:
135.根据公式确定用户团体中的每个用户在用户团体中的重要度w(u1,g);其中,c(u1,g)为用户u1在用户团体g中的活跃度,为用户团体g中所有用户的活跃度之和;g为任一用户团体;活跃度为用户u1在业务场景中的行为次数;用户u1为用户团体g中的任一目标用户,用户v为用户团体g中的任一用户,用户v包含用户u1。
136.这里,用户u1在用户团体g中的活跃度可根据公式其中,s为任一业务场景;x为直播平台中的所有场景,c(u1,g)为用户u1在业务场景s中的行为次数。
137.w(u1,g)的计算原理为:先确定出用户团体g中任意一个用户u1在该团体中的活跃度及所有用户在该团体中的活跃度总和,然后将用户u1在该团体中的活跃度及活跃度总和的比值作为每个用户在用户团体中的重要度。可以看出,每个用户在用户团体的活跃度越高,则该用户在用户团体中的重要度也越高。确定出用户团体中的每个用户在用户团体中的重要度后,确定单元23根据公式确定用户团体g的群组风险
分gr(g,s);其中,s为业务场景,g为业务场景s中的任一用户团体,所述u1为业务场景s内中的用户团体g的任一用户;r(u1,s)为用户团体g中的任一用户在业务场景s中的个体风险分;w(u1,g)为用户团体g中的任一用户在用户团体g中的重要度,|g|为用户团体g中的用户数量。
138.这里,用户团体的群组风险分gr(g,s)的计算原理为:对该用户团体内用户的个体风险分进行加权平均,因此可以得到该用户团体内所有用户的加权风险分之和w(u1,g)可作为权重,因此群组风险分也可以理解为用户风险加权平均分。
139.各用户团体的群组风险分确定出之后,确定单元23根据公式确定用户团体g在业务场景s中的团体分歧度diff(g,s);其中,w(u1,g)r(u1,s)为用户团体g中任一用户u1的加权风险分;gr(g,s)为用户团体g的群组风险分;s为业务场景,g为业务场景s中的任一用户团体,u1为用户团体g的任一用户。
140.这里,这里,团体分歧度diff(g,s)的计算原理为:针对任一用户团体,团体分歧度为用户团体的群组风险分gr(g,s)与各用户的加权风险分w(u1,g)r(u1,s)之间的偏差,两者之间的差异越大,说明用户风险和团体风险之间的分歧度越大;利用(w(u1,g)r(u1,s)-gr(g,s))2衡量单个用户的分歧度,单个用户的分歧度求和加总之和得到最终的团体分歧度diff(g,s)。
141.用户团体的团体分歧度确定出之后,确定单元23根据用户团体的群组风险分及用户团体在业务场景中的团体分歧度确定用户团体在业务场景中的共识得分。
142.具体的,根据公式f(g,s)=w*gr(g,s)+(1-w)*(1-diff(g,s))确定用户团体在所述业务场景中的共识得分f(g,s);其中,述w为权重系数,0《w《1,权重系数;gr(g,s)为用户团体g的群组风险分;diff(g,s)为用户团体g在业务场景s中的团体分歧度。
143.f(g,s)的计算原理为:确定团体分歧度的权重系数及群组风险分的权重系数,再基于团体分歧度、用户团体的群组风险分及各对应的权重系数获得用户团体的共识得分。其中,权重系数根据该业务场景对群组风险的容忍程度确定,容忍程度越高那么群组风险分对应的越低;容忍程度越低那么群组风险分对应的越高。
144.可以看出,团体风险分越高,团体分歧度越低则说明该团体在该业务场景中的风险行为程度及一致性更高,此时用户团体在此业务场景中确认为高风险团体的概率也就越大。
145.本实施例在确定用户团体的共识得分时,同时考虑到了群组风险分及团体分歧度,这样可以确保确定出的高风险用户团队的精度。因为若只考虑到群组风险分,若群组风险分高的话可能是由于用户团体的某一些高分用户引起的,用户之间的分数差异比较大,那么该业务场景中不具有批量行为,不适合对用户团队中的所有用户进行处罚,因此不能将该用户团队直接确定为高风险团队。而若只考虑团队分歧度,若团队分歧度较小,但是也有可能出现群组风险分也比较小的情况,这种情况说明用户团体中的用户虽然在行为上存在一定的同步性,但是不存在高风险的,此时也不适合对用户团体中的用户进行惩罚。
146.用户团体在业务场景中的共识得分确定出之后,判断单元23用于判断共识得分是否超出预设的共识得分阈值,若超出,则确定用户团体在业务场景中为高风险用户团体,此时需要对用户团体内的用户进行处罚。
147.举例来说,比如在登录场景中的某个用户团体包括4个用户,这4个用户的个体风险分分别为:0.75、0.6、0.7、0.8;这4个用户在用户团体的重要度分别为:0.3、0.2、0.3、0.2。
148.那么,用户团体的群组风险分为:
149.gr(g,s)=0.75*0.3+0.6*0.2+0.7*0.3+0.8*0.2=0.715;
150.团体分歧度为:
151.diff(g,s)=0.3*(0.75-0.715)2+0.2*(0.6-0.715)2+0.3*(0.7-0.715)2+0.2*(0.8-0.715)2=0.0045
152.取w=0.5;
153.共识得分为:
154.f(g,s)=0.5*0.715+0.5*(1-0.0045)=0.86
155.若共识得分的阈值为0.7,说明此用户团体在登录业务场景中为高风险用户团体,需要对该用户团体的用户进行行为限制,比如限制登录等。
156.利用本实施例提供的方法,可以精准识别出高风险用户团队及高风险用户,相比现有技术,本实施例同时考虑到了群组风险分及团体分歧度,这样可以确保确定出的高风险用户团队的精度,进而也可以提高高风险用户的覆盖度,相比现有技术的识别方式,高风险用户的覆盖度可提升10%-15%。
157.若确定用户团体在某个业务场景中为高风险用户团体,限制单元24用于基于预设的行为限制策略对高风险用户团体的行为进行限制。
158.举例来说,比如在抽奖场景,若确定某个用户团体在抽奖场景中为高风险用户团体,则对该用户团体中的所有用户的ip进行暂时封禁,禁止抽奖。
159.本实施提供的用于限制用户团体行为的方法,针对直播平台中的任一业务场景,提取出所有用户的风险特征,并基于风险特征确定各用户在业务场景中的个体风险分;基于各个用户在所有业务场景的风险特征确定至少一个用户团体;这样相当于是基于各个用户的风险特征确定的用户团队,因此在进行风险判定时可以确保准确度;为了进一步提高判定的精度,针对每一个用户团体,确定出用户团体在业务场景中的群组风险分及团体分歧度,基于群组风险分及团体分歧度确定出用户团体在所述业务场景中的共识得分,若共识得分超出阈值,则确定该用户团队为高风险团队;这样相当于综合考虑到了该用户团体的批量行为及内在分歧度,因此能够精准识别出在某个业务场景中存在批量行为且同步性较高的用户团体,提高了识别精度,可以精准限制用户团体的行为,进而确保直播平台的权益。
160.实施例三
161.本实施例提供一种计算机设备,如图3所示,包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机程序311,处理器320执行计算机程序311时实现以下步骤:
162.针对直播平台中的任一业务场景,提取所有用户的风险特征;所述风险特征包括:
所述用户在所述业务场景中的行为总数量、所述用户在所述业务场景中使用的ip数量、所述用户在所述业务场景中使用的设备数量及所述用户在所述业务场景使用的客户端数量;
163.基于所述风险特征构建分类器,基于所述分类器及所述用户的风险特征,确定各用户在所述业务场景中的个体风险分;每个所述用户对应一个所述个体风险分;
164.针对每一个所述用户,获取所述用户在所述直播平台所有业务场景中的风险特征,将所述风险特征进行拼接,获得风险特征向量;
165.基于各所述用户的所述风险特征向量确定至少一个用户团体;
166.针对每一个所述用户团体,确定所述用户团体中的每个用户在所述用户团体中的重要度;基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分;
167.确定所述用户团体在所述业务场景中的团体分歧度;所述团体分歧度为所述用户团体的群组风险分与各所述用户的加权风险分之间的偏差,所述加权风险分根据所述用户的个体风险分及所述用户在所述用户团体中的重要度确定;
168.根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧度确定所述用户团体在所述业务场景中的共识得分;
169.判断所述共识得分是否超出预设的共识得分阈值,若超出,则确定所述用户团体在所述业务场景中为高风险用户团体;
170.在所述业务场景中,基于预设的行为限制策略对所述高风险用户团体的行为进行限制。
171.在具体实施过程中,处理器320执行计算机程序311时,可以实现实施例一中任一实施方式。
172.由于本实施例所介绍的计算机设备为实施本技术实施例一中一种用于限制用户团体行为的方法所采用的设备,故而基于本技术实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的计算机设备的具体实施方式以及其各种变化形式,所以在此对于该服务器如何实现本技术实施例中的方法不再详细介绍。只要本领域所属技术人员实施本技术实施例中的方法所采用的设备,都属于本技术所欲保护的范围。
173.基于同一发明构思,本技术提供了实施例一对应的存储介质,详见实施例四。
174.实施例四
175.本实施例提供一种计算机可读存储介质400,如图4所示,其上存储有计算机程序411,该计算机程序411被处理器执行时实现以下步骤:
176.针对直播平台中的任一业务场景,提取所有用户的风险特征;所述风险特征包括:所述用户在所述业务场景中的行为总数量、所述用户在所述业务场景中使用的ip数量、所述用户在所述业务场景中使用的设备数量及所述用户在所述业务场景使用的客户端数量;
177.基于所述风险特征构建分类器,基于所述分类器及所述用户的风险特征,确定各用户在所述业务场景中的个体风险分;每个所述用户对应一个所述个体风险分;
178.针对每一个所述用户,获取所述用户在所述直播平台所有业务场景中的风险特征,将所述风险特征进行拼接,获得风险特征向量;
179.基于各所述用户的所述风险特征向量确定至少一个用户团体;
180.针对每一个所述用户团体,确定所述用户团体中的每个用户在所述用户团体中的
重要度;基于所述用户团体中每个用户在所述用户团体中的重要度及所述每个用户在所述业务场景中的个体风险分确定所述用户团体在所述业务场景中的群组风险分;
181.确定所述用户团体在所述业务场景中的团体分歧度;所述团体分歧度为所述用户团体的群组风险分与各所述用户的加权风险分之间的偏差,所述加权风险分根据所述用户的个体风险分及所述用户在所述用户团体中的重要度确定;
182.根据所述用户团体的群组风险分及所述用户团体在所述业务场景中的团体分歧度确定所述用户团体在所述业务场景中的共识得分;
183.判断所述共识得分是否超出预设的共识得分阈值,若超出,则确定所述用户团体在所述业务场景中为高风险用户团体;
184.在所述业务场景中,基于预设的行为限制策略对所述高风险用户团体的行为进行限制。
185.在具体实施过程中,该计算机程序411被处理器执行时,可以实现实施例一中任一实施方式。
186.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
187.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
188.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
189.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
190.尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
191.以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1