可信性判别的方法及系统与流程

文档序号：32054739发布日期：2022-11-04 20:42阅读：44来源：国知局

1.本说明书一个或多个实施例涉及人工智能技术领域，尤其涉及一种可信性判别的方法及系统。

背景技术：

2.在互联网技术日益发展的今天，用户在使用互联网的各种行为中出现各种风险。例如可能存在诸如网络交易诈骗、虚假兼职诈骗、网络交友诈骗等各种各样的欺诈形式。还可能存在诸如洗钱、作弊、赌博、盗用等风险形式。通常在风险识别系统的前端，对流量会首先进行可信性判别，将认为是可信用户行为的流量进行快速放行，而对于非可信用户行为的流量则送入风险识别系统进行更精细化的风险识别。一般而言，可信性判别可以放行9成以上的流量，仅1成左右的流量转至风险识别系统进行更精细化的识别。
3.为了减轻线上计算的压力，可信性判别大多采用了离线模型的设计思路，即采用离线的形式预先归纳出可信要素，然后线上进行可信性判别时，直接放行与可信要素匹配的流量。其中可信要素主要包括单主体和双主体。单主体是一个主体，例如针对一个用户进行的可信性判别。双主体是两个主体构成的关系对，例如消费者与商户之间、账户与收益卡之间、账户与设备之间，等等。鉴于在全域可信性判定中，行为关系的被动方发挥了重要的作用，双主体要素可以有效地覆盖不同的风险域，因此亟需一种能够基于双主体进行准确地可信性判别的方式。

技术实现要素：

4.有鉴于此，本说明书一个或多个实施例公开了一种可信性判别的方法及系统，以便于实现基于双主体的准确可信性判别。
5.根据第一方面，本公开提供了一种可信性判别的方法，该方法包括：
6.获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量；
7.针对所述第一主体，确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体，并将确定出的各第二主体分别与该第一主体构成候选关系对；
8.对各候选关系对进行风险评分，选择风险评分满足预设第二条件的候选关系对作为可信关系对，所述可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别；
9.其中，所述表征模型是预先利用训练数据进行对比学习得到的，所述训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征，所述正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体，所述负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体，所述t1为所述t2之前的历史时间，所述m为预设的正整数。
10.根据本技术实施例中一可实现的方式，所述表征模型采用如下方式预先训练得到：
11.获取所述训练数据；
12.利用所述训练数据训练动量对比度moco模型，训练目标包括：最大化负样本对中第一主体和第二主体之间的表征向量相似度且最小化正样本对中第一主体和第二主体之间的表征向量相似度；
13.利用训练得到的moco模型中的编码器得到所述表征模型。
14.根据本技术实施例中一可实现的方式，所述moco模型中的编码器包括第一编码器和第二编码器；
15.在所述训练中，所述第一编码器用以利用第一主体在时间t1之前预设时长内的行为特征，得到第一主体的向量表示；所述第二编码器用以利用第二主体在时间t1之前预设时长内的行为特征，得到第二主体的向量表示；在所述训练的每一轮迭代中利用训练损失的取值反向更新所述第一编码器的参数，所述第二编码器的参数根据所述第一编码器的参数进行动量更新；
16.所述利用训练得到的moco模型中的编码器得到所述表征模型包括：将训练得到的所述第一编码器作为所述表征模型。
17.根据本技术实施例中一可实现的方式，预先得到的所述表征模型被下发至所述第一主体的终端设备和所述第二主体的终端设备；
18.所述获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量包括：
19.从第一主体的终端设备获取表征模型利用该第一主体在时间t2之前预设时长内的行为特征得到的第一主体的表征向量；以及从从第二主体的终端设备获取表征模型利用该第二主体在时间t2之前预设时长内的行为特征得到的第二主体的表征向量。
20.根据本技术实施例中一可实现的方式，针对所述第一主体，确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体包括：
21.利用分层可导航小世界图hnsw方法，搜索表征向量与第一主体的表征向量之间最近的n个第二主体，所述n为预设的正整数。
22.根据本技术实施例中一可实现的方式，对各候选关系对进行风险评分，选择风险评分满足预设第二条件的候选关系对作为可信关系对包括：
23.对各候选关系对进行风险评分，得到候选关系对在m个风险类别上的评分，所述m为正整数；
24.选择在所述m个风险类别上的评分满足所述第二条件的候选关系对作为可信关系对。
25.根据本技术实施例中一可实现的方式，所述对各候选关系对进行风险评分包括：
26.利用风险评分模型对各候选关系对进行风险评分，其中所述风险评分模型是基于多任务专家模型预先训练得到的。
27.根据本技术实施例中一可实现的方式，所述风险评分模型包括：表征处理模块和k个专家模块；
28.所述表征处理模块对输入的候选关系对中第一主体和第二主体的特征向量进行拼接处理后，将得到的特征向量进行n阶表征交叉，所述n为正整数；
29.所述专家模块利用所述n阶表征交叉后得到的表征向量，映射得到该候选关系对
在各风险类别上的评分。
30.根据本技术实施例中一可实现的方式，该方法还包括：
31.若在所述时间t2+m接收到包含网络行为的流量，则将所述网络行为与所述可信关系对进行匹配，若依据匹配结果确定所述网络行为为可信行为，正常转发所述流量。
32.根据本技术实施例中一可实现的方式，所述第一主体为消费者，所述第二主体为商户，所述预设类型的行为关系包括交易行为、支付行为、收款行为和评价行为中的至少一种；或者，
33.所述第一主体和第二主体均为用户，所述预设类型的行为关系包括支付行为、存取款行为、签约绑定行为和收发红包行为中的至少一种。
34.第二方面，提供了一种可信性判别的系统，该系统包括：
35.表征获取单元，被配置为获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量；
36.候选召回单元，被配置为针对所述第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体，并将确定出的各第二主体分别与第一主体构成候选关系对；
37.风险评分单元，被配置为对各候选关系对进行风险评分；
38.关系对确定单元，被配置为选择风险评分满足预设第二条件的候选关系对作为可信关系对，所述可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别；
39.其中，所述表征模型是预先利用训练数据进行对比学习得到的，所述训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征，所述正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体，所述负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体，所述t1为所述t2之前的历史时间，所述m为预设的正整数。
40.根据本技术提供的具体实施例，本技术可以具备以下技术效果：
41.1)本技术提供的表征模型利用时间t1之前第一主体和第二主体的历史行为特征预测第一主体和第二主体的表征向量，该表征向量体现了对应主体在时间t1+m发生行为的可能性，因此利用该表征向量能够召回在时间t1+m可能发生行为关系的候选关系对，并基于该候选关系对进行风险评分得到可信关系对用以在时间t1+m对包含网络行为的流量进行可信性判别。这种方式能够提高在未来发生行为关系的关系对的召回率，从而提高可行性判别的准确性。
42.2)本技术基于表征向量之间的距离先筛选候选关系对，然后基于候选关系对进行风险评分确定可信关系对的方式，无需对主体进行两两遍历来进行风险评分，降低了对计算资源的消耗。
43.3)在表征模型训练完成后，可以将表征模型发送至各终端设备。由各终端设备的表征模型利用自身对应主体在时间t2之前预设时长内的行为特征得到该主体的表征向量，并将该表征向量上传至服务端的可信性判别系统。这种实现方式下，终端设备无需提交各主体的行为数据，只需要将表征向量发送至服务端。服务端并不能够具体感知各主体的行为数据，从而达到保护用户隐私的效果。
44.当然，实施本技术的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
45.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
46.图1示出了可以应用本公开实施例的示例性系统架构图；
47.图2为本技术实施例提供的可信性判别的方法流程图；
48.图3为本技术实施例提供的训练表征模型的方法流程图；
49.图4为本技术实施例提供的训练moco模型的原理示意图；
50.图5为本技术实施例提供的多任务专家模型的原理示意图；
51.图6为本技术实施例提供的可信性判别系统的结构图。
具体实施方式
52.下面结合附图，对本说明书提供的方案进行描述。
53.在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。
54.应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
55.取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
56.目前传统的可信性判别方法主要是：统计过去诸如30天内出现过行为关系的所有关系对，基于人工策略预测在未来n天可能发生行为关系的关系对，将这些关系对作为可信关系对用以未来几天天线上的可信性判别。但未来发生行为关系的关系对可能在过去30内并未发生过行为关系，这就造成了召回缺陷，从而使得可信性判别不准确。但若将所有主体两两构成关系对后基于人工策略进行预测，则会造成计算资源消耗大，无法在海量用户中完全遍历。并且，这些方式需要服务端获取用户的相关数据进行预测，无法保证用户的隐私。
57.有鉴于此，本技术提供了一种新的可信性判别方法。为了方便对本技术实施例的理解，首先对本技术实施例所应用的系统架构进行详细描述。图1示出了可以应用本公开实施例的示例性系统架构。该系统主要包括可信性判别系统和风险识别系统。其中，可信性判别系统进一步包括离线的挖掘装置和在线的判别装置。
58.其中，离线的挖掘装置用以从数据仓库中获取t2之前预设时长内各主体的行为特征；利用时间t2之前预设时长内各主体的行为特征，预先挖掘出包含两个主体的可信关系对，用以进行时间t2+m的可信性判别，m为正整数。
59.在线的判别装置用以在线进行流量的可信性判别，例如，在时间t2+m利用上述预
先挖掘出的可信关系对对包含网络行为的流量进行可信性判别。如果判别结果为可信行为，则正常转发该流量。如果判别结果为非可信行为，则将该流量转发至风险识别系统进行进一步的精细化的风险识别。例如进行关于洗钱、作弊、赌博、盗用等类别的风险识别。
60.上述系统中的可信性判别系统和风险识别系统可以在服务器端实现。该服务器端可以是单一服务器，也可以是多个服务器构成的服务器群组，还可以是云服务器。云服务器又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物理主机与虚拟专用服务器(vps，virtual private server)服务中存在的管理难度大，业务扩展性弱的缺陷。除了在服务器端实现之外，也可以在具有强大计算能力的计算机终端实现。
61.其中，可信性判别系统可以为位于服务器端的应用，或者还可以为位于服务器端的应用中的插件或软件开发工具包(software development kit，sdk)等功能单元。
62.应该理解，图1中的可信性判别系统、风险识别系统和数据仓库的数目仅仅是示意性的。根据实现需要，可以具有任意数目的可信性判别系统、风险识别系统和数据仓库。
63.图2为本技术实施例提供的可信性判别的方法流程图。可以理解，该方法可以通过图1所示系统中的可信性判别系统来执行。参见图2，该方法可以包括：
64.步骤202：获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量。其中，表征模型是预先利用训练数据进行对比学习得到的，训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征，正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体，负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体，t1早于t2。
65.步骤204：针对第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体，并将确定出的各第二主体分别与第一主体构成候选关系对。
66.步骤206：对各候选关系对进行风险评分，选择风险评分满足预设第二条件的候选关系对作为可信关系对，该可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别，m为预设的正整数。
67.由以上技术方案可以看出，本技术提供的表征模型利用时间t1之前第一主体和第二主体的历史行为特征预测第一主体和第二主体的表征向量，该表征向量体现了对应主体在时间t1+m发生行为的可能性，因此利用该表征向量能够召回在时间t1+m可能发生行为关系的候选关系对，并基于该候选关系对进行风险评分得到可信关系对用以在时间t1+m对包含网络行为的流量进行可信性判别。这种方式能够提高在未来发生行为关系的关系对的召回率，从而提高可行性判别的准确性。
68.另外，基于表征向量之间的距离先筛选候选关系对，然后基于候选关系对进行风险评分确定可信关系对的方式，无需对主体进行两两遍历来进行风险评分，降低了对计算资源的消耗。
69.下面分别对图2所示的各步骤进行详细说明。
70.首先结合实施例对上述步骤202即“获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量”进行详细描述。
71.首先需要说明的是，本技术中涉及的“第一”、“第二”等限定并不具备大小、顺序和
数量等方面的限制，仅仅用以在名称上加以区分，例如“第一主体”和“第二主体”用以区分两个主体。
72.本步骤中，可以将各第一主体和第二主体在时间t2之前预设时长内的行为特征输入预先训练得到的表征模型，由表征模型输出第一主体和第二主体的表征向量。
73.上述时间t2可以取当前时间，也可以是已经发生的某个历史时间。例如，t2为今天，利用今天之前预设时长内的行为特征输入表征模型，由表征模型输出第一主体和第二主体的表征向量，用以通过后续步骤生成可信关系对，该可信关系对用以在时间t2+m对线上流量进行可信性判别，若m取1天，就是对明天的线上流量进行可信性判别。
74.为了方便理解，首先对该表征模型的训练过程进行描述。作为其中一种可实现的方式，该表征模型的训练过程可以如图3中所示，包括以下步骤：
75.步骤302：获取训练数据。
76.本技术实施例中采用的表征模型是利用训练数据进行对比学习得到的。其中训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征，正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体，负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体。t1早于t2，是t2之前的历史时间。m为正整数。
77.这种训练数据能够使得表征模型将历史行为特征与未来行为之间的联系映射到向量空间，以使得到的表征向量能够体现对应主体的未来行为。
78.举个例子，假设上述m取1天，第一主体为消费者，第二主体为商户。首先从数据仓库中获取消费者构成的集合作为query set。然后选择在时间t1+1天与消费者发生交易的商户作为gallery set中的正样本，与对应的消费者构成正样本对。然后选择在时间t1+1天与消费者未发生交易的商户作为gallery set中的负样本，与对应的消费者构成负样本对。也就是说，正样本对中包含的是在时间t1+1天发生交易消费者-商户对，负样本对中包含的是在时间t1+1天未发生交易消费者-商户对。
79.其中，在针对一个第一主体选择正样本和负样本时，可以进一步结合一些限制条件。例如，在选择正样本时，可以控制一个第一主体对应的正样本数量在预设数量阈值内，例如控制在10个正样本之内。在选择负样本时可以限制第一主体和第二主体之间的地理位置范围在10公里之内，等等。
80.各主体(包括第一主体和第二主体)的特征可以采用一些事件来进行体现。例如，对于消费者而言，可以是t1之前预设时长(例如7天)内发生的最近100笔交易事件、付款事件、关注事件等等。对于商户而言，可以是t1之前预设时长(例如7天)内发生的最近100笔交易事件、收款事件等等。
81.例如，query set中第一主体的特征序列q可以表示为：
[0082][0083]
其中，e表示预设类型的事件，下标表示t1之前预设时长内发生的最近的第几笔，上标表示主体标识。例如，表示第一主体q在t1之前预设时长内发生的最近第1笔预设类型的事件。事件的属性维度为l维的向量，l为预设的正整数。
[0084]
gallery set中第一主体对应的正样本的特征序列gp可以表示为：
[0085][0086][0087][0088]
…
[0089][0090]
gallery set中第一主体对应的负样本的特征序列gn可以表示为：
[0091][0092][0093][0094]
…
[0095][0096]
步骤304：利用训练数据训练moco模型，训练目标包括：最大化负样本对中第一主体和第二主体之间的表征向量相似度且最小化正样本对中第一主体和第二主体之间的表征向量相似度。
[0097]
作为一种较为优选的实施方式，本技术中可以选用moco(动量对比度)模型，除此之外，也可以选用其他对比学习模型。在此以moco模型为例。
[0098]
如图4中所示，moco模型中包括第一编码器和第二编码器。第一编码器用以利用第一主体在时间t1之前预设时长内的行为特征，得到第一主体的向量表示。输入第一编码器的第一主体的行为特征来自q。
[0099]
第二编码器用以利用第二主体在时间t1之前预设时长内的行为特征，得到第二主体的向量表示。输入第二编码器的第二主体的行为特征来自gp和gn。
[0100]
本技术实施例中可以利用上述的训练目标构造损失函数，利用损失函数的取值反向更新模型参数。构造的损失函数可以采用infonce损失函数lq，如下公式所示：
[0101][0102]
其中，x表示第一主体的特征，来源于q。x
+
是第一主体对应的正样本的特征，来源于gn。xi是gallery set中的第二主体的特征，包括第一主体对应的正样本和负样本的特征，来源于gn和gp。k为针对第一主体采样的正样本和负样本的总数量。f()是第一编码器采用的函数，f
′
()是第二编码器采用的函数。score()是度量两个向量之间相似度的函数，可以采用诸如欧氏距离、余弦相似度等。
[0103]
moco模型的其中一个优势是负样本不是在每个batch(批)中进行选取，而是在所有负样本特征中随机采样，一定程度上可以认为针对一个query采样的负样本能够代表所有样本。但为了避免每次迭代更新都需要重新编码一次所有样本所带来的内存需求过大，moco模型针对第二编码器采用的是momentum encoder(动量编码器)。momentum encoder采用一个动态进出的queue(队列)，用该queue维护最近几个batch的第二编码器的输出结果。
另外，训练的每一轮迭代中利用训练损失的取值反向更新第一编码器的参数，而第二编码器的参数是根据第一编码器的参数进行动量更新的，即采用逐步向第一编码器逼近的方式，从而保证第二编码器输出结果的平稳性。
[0104]
例如，第二编码器的参数θk可以采用以下公式表示：
[0105]
θk←
αθk+(1-α)θqꢀꢀꢀ
(2)
[0106]
就是说，利用第一编码器的参数θq以及第二编码器的参数θk进行加权求和后得到的值，更新第二编码器的参数θk。其中，α为加权系数，可以采用经验值或试验值。
[0107]
经过moco模型的训练后，生成的第一主体的表征向量与第二主体的表征向量的效果是：若第一主体和第二主体在时间t1+m发生行为关系，则该第一主体和第二主体的表征向量在向量空间的距离近；反之，若第一主体和第二主体在时间t1+m不发生行为关系，则该第一主体和第二主体的表征向量在向量空间的距离远。
[0108]
步骤306：利用训练得到的moco模型中的编码器得到表征模型。
[0109]
作为其中一种可实现的方式，可以利用训练得到的moco模型中的第一编码器作为表征模型。
[0110]
利用表征模型就能够在输入任意主体的行为特征后，得到该主体的表征向量。
[0111]
另外，由于模型训练阶段并不需要感知用户的具体数据。在训练阶段完成后，可以将表征模型发送至各终端设备。由各终端设备的表征模型利用自身对应主体在时间t2之前预设时长内的行为特征得到该主体的表征向量，并将该表征向量上传至服务端的可信性判别系统。这种实现方式下，终端设备无需提交用户的行为数据，只需要将表征向量发送至服务端。服务端并不能够具体感知用户的行为数据，从而达到保护用户隐私的效果。
[0112]
更进一步地，在模型训练阶段，moco结构下第一编码器分支需要回传梯度来进行参数更新，而第二编码器分支不需要回传梯度，而是在第一编码器的参数基础上进行动量更新。对于第一编码器部分的训练，可以将涉及到训练数据的部分进行分割，将涉及到训练数据的部分放置于合规部门进行，使得对于训练人员无法感知和获取训练数据，从而进一步达到保护用户隐私的效果。
[0113]
下面结合实施例对上述步骤204即“针对第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体，并将确定出的各第二主体分别与第一主体构成候选关系对”进行详细描述。
[0114]
本步骤实际上是利用表征向量对在未来时间t2+m可能发生行为关系的关系对进行初步筛选，得到候选关系对。在进行初步筛选时，是通过计算第一主体和第二主体的表征向量之间的距离来确定的。上述预设第一条件可以是诸如小于或等于预设距离阈值，或者距离从小到大排在前预设数量，等等。其中距离可以采用欧式距离、余弦相似度等来进行衡量。
[0115]
例如，针对消费者a，可以利用消费者a的表征向量与各商户的表征向量进行距离计算和判断，找到表征向量与消费者a的表征向量之间的距离满足预设第一条件的商户，将这些商户与消费者a分别构成候选关系对。对各消费者都可以执行该处理得到候选关系对。
[0116]
为了提高候选关系对的召回效率，作为一种优选的实施方式，可以利用hnsw(hierarchical navigable small world，分层可导航小世界图)方法，搜索表征向量与第一主体的表征向量之间最近的n个第二主体，所述n为预设的正整数。
[0117]
hnsw用于近似最近邻搜索，是在nsw(navigable small world，可导航小世界图)算法基础上改进而来的，是一种基于图的向量检索算法。其思路是将向量空间中所有的向量构建成一张相互联通的图，并基于该图搜索某个顶点的n个最近邻。采用hnsw方式可以针对上述实例中的消费者a快速检索出距离该消费者a的表征向量最近的n个商户。鉴于hnsw为目前已有的算法，在此不做详述。
[0118]
下面结合实施例对上述步骤206即“对各候选关系对进行风险评分，选择风险评分满足预设第二条件的候选关系对作为可信关系对，该可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别”进行详细描述。
[0119]
本步骤中可以根据实际的需求确定m个风险类别，对各候选关系对进行风险评分，分别得到候选关系对在m个风险类别上的评分，m为正整数。然后选择在m个风险类别上的评分满足第二条件的候选关系对作为可信关系对。
[0120]
由于后续可信性判别是为了放行流量使用的，需要保证是完全没有风险的，因此作为其中一种可实现的方式，可以选择在m个风险类别上的评分均低于或等于预设评分阈值的候选关系对作为可信关系对。
[0121]
例如，针对消费者和商户构成的各候选关系对，分别在盗用风险、欺诈风险和赌博风险三个类别上对各候选关系对进行评分，从候选关系对中选择三个类别上的评分均低于或等于预设评分阈值的候选关系对。其中评分越高说明风险越高，反之评分越低说明风险越低。
[0122]
作为一种可实现的方式，可以基于一些预设的规则对各候选关系对进行评分，例如可以将一些明确是无风险的行为特征、中风险的行为特征、高风险的行为特征等形成预设的规则，将各候选关系对对应的行为特征与该预设的规则进行匹配，依据匹配结果来确定候选关系对的评分。其中，上述预设的规则可以人为设置，也可以采用其他方式设置。
[0123]
作为另一种可实现的方式，可以利用风险评分模型对各候选关系对进行风险评分，上述风险评分模型可以基于多任务专家模型预先训练得到。
[0124]
上述的多任务专家模型可以包括表征处理模块和k个专家模块。表征处理模块对输入的候选关系对中第一主体和第二主体的特征向量进行拼接处理后，将得到的特征向量进行n阶表征交叉，n为正整数。专家模块利用n阶表征交叉后得到的表征向量，映射得到该候选关系对在该专家模块所对应风险类别上的评分。
[0125]
作为一种优选的实施方式，上述多任务专家模型可以采用moeho(multi-task learning with mixture of experts and high-order feature interaction，多任务专家模型和高维表征交叉)模型。如图5中所示，该模型可以包括表征交叉层、拼接层和mmoe(multi-gate mixture-of-experts，多门控混合专家)模块。
[0126]
其中，表征交叉层用以对候选关系对中第一主体和第二主体的表征向量进行n阶表征交叉。以3阶表征交叉为例，可以采用mlp(multilayer perceptron，多层感知机)层、fm(factorization machines，因子分解机)层和lnn(legendre neural network,勒让德神经网络)层分别做1阶、2阶和3阶表征交叉。然后由拼接层(concatenation layer)将表征交叉层输出的表征向量进行拼接。该过程可以表示为如下公式：
[0127]
[0128]
其中，为拼接层的输出。σ()代表激活函数，例如relu、sigmoid等。代表mlp层进行的表征交叉，即一阶表征交叉，w
(1)
为mlp层的参数，代表将第一主体和第二主体的表征向量拼接在一起。
[0129]
代表fm层的表征交叉，即二阶表征交叉。de代表风险域的个数。代表fm层的参数。代表将第一主体和第二主体的表征向量在第i个风险域上的特征向量。其中，可以每个特征对应一个风险域，也可以多个特征对应一个风险域，可以根据实际情况进行设置。
[0130]
代表lnn层的表征交叉，即三阶即以上的高阶表征交叉。o代表表征交叉的阶数，若为3阶则为3。u0、we和w
e0
为lnn层的参数。
[0131]
mmoe模块采用k个专家模块模拟k个专家打分，通过门限机制控制每个专家模块对每个风险类别打分的权重，可以表示为如下公式：
[0132]
ym＝hm(fm(x))
ꢀꢀꢀ
(4)
[0133][0134]
其中，x为拼接层的输出。gm(x)i表示第m个风险类别在第i个专家模块上门限的权重，是gate(门)的输出，可以采用多层感知机实现，例如采用线性变换加softmax层。fi(x)为第i个专家模块的打分。ym为候选关系对在第m个风险类别的评分。hm()可以是线性变换加softmax层的处理。
[0135]
上述风险评分模型可以预先训练得到，其训练时采用的训练数据包括：由第一主体和第二主体构成的关系对中第一主体和第二主体的表征向量，以及针对关系对标注的在m个风险类别上的评分。
[0136]
将第一主体和第二主体的表征向量输入上述多任务专家模型，由多任务专家模型输出该关系对在m个风险类别上的评分，相当于存在m个任务。训练目标为最小化多任务专家模型的输出与训练数据中标注内容的差异。可以依据上述训练目标构造损失函数，在每一轮迭代中利用损失函数的取值，采用诸如梯度下降等方式更新多任务专家模型的参数，直至满足预设的训练结束条件。其中训练结束条件可以包括诸如损失函数的取值小于或等于预设的损失函数阈值，迭代次数达到预设的次数阈值等。
[0137]
上述过程由可信性判别系统中离线的挖掘装置实现。在得到可信关系对后，将可信关系对提供给在线的判别装置。由在线的判别装置用以在时间t2+m对包含网络行为的流量进行可信性判别。具体可以包括：若在时间t2+m接收到包含网络行为的流量，则将该网络行为与可信关系对进行匹配，若依据匹配结果确定网络行为为可信行为，正常转发流量；否则将该流量转发至风险识别系统进行进一步的精细化的风险识别。
[0138]
例如，若接收到的流量中包含消费者a和商户b之间的支付行为，则可以判断消费者a和商户b之间的支付行为是否能够匹配到对应的可信关系对，如果匹配到，说明该消费
者a和商户b之间的支付行为在各风险类别上的风险评分均是较低的，可以放行该流量。
[0139]
需要说明的是，针对每个第一主体，离线部分的处理每个单位时间都会进行更新。例如上述t2所采用的单位时间为天，那么终端设备每天上报各主体的表征向量，然后召回候选关系对，并进一步对各候选关系对进行风险评分得到可信关系对。然后回流至线上用于时间t2+m流量的可信性判别。
[0140]
下面以消费者-商户关系对为例，对本技术实施例提供的上述方法进行举例描述。
[0141]
服务端预先获取用户(包括消费者和商户)在t1之前7天内的行为特征，t1可以是历史上能够获取用户行为数据的任意天。确定在t1+1天发生交易行为、支付行为、收款行为或评价行为等的消费者和商户构成正样本对，在t1+1天未发生交易行为、支付行为、收款行为或评价行为等的消费者和商户构成负样本对。利用上述正样本对和负样本对中各消费者和商户在t1之前7天内的行为特征输入moco模型进行对比学习，训练得到的moco模型中的第一编码器作为表征模型。
[0142]
服务端将表征模型下发至各终端设备。各终端设备每天更新当天之前7天内的行为特征，利用当前之前7天内的行为特征输入表征模型，得到该用户(消费者或商户)的表征向量并上传至服务端。
[0143]
服务端获取到各消费者和各商户的表征向量后采用hnsw针对每一个消费者进行搜索，搜索表征向量距离该消费者最近的n个商户。将这些商户和该消费者构成候选关系对。
[0144]
针对各候选关系对利用预先训练得到的风险评分模型分别进行打分，得到候选关系对在盗用风险、欺诈风险和赌博风险三个类别上对各候选关系对进行评分，从候选关系对中选择三个类别上的评分均低于或等于预设评分阈值的候选关系对作为可信关系对。
[0145]
将得到的所有可信关系对提供给在线的可信性判别装置。可信性判别装置利用该可信关系对在时间t1+1天对包含消费者和商户之间的网络行为的流量进行可信性判别。如果判别结果为可信，则快速放行该流量；否则将该流量转发至风险识别系统进行进一步的精细化的风险识别。
[0146]
以上是对本公开所提供方法进行的详细描述，上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0147]
下面对本公开所提供的装置进行详细描述。图6示出根据本公开一个实施例的可信性判别系统的结构图，如图6所示，该系统600可以包括：表征获取单元601、候选召回单元602、风险评分单元603和关系对确定单元604，还可以进一步包括第一训练单元605、第二训练单元606和可信判别单元607。
[0148]
其中各组成单元的主要功能如下：
[0149]
表征获取单元601，被配置为获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量。
[0150]
候选召回单元602，被配置为针对第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体，并将确定出的各第二主体分别与第一主体构成候选关
系对。
[0151]
风险评分单元603，被配置为对各候选关系对进行风险评分。
[0152]
关系对确定单元604，被配置为选择风险评分满足预设第二条件的候选关系对作为可信关系对，可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别。
[0153]
其中，表征模型是预先利用训练数据进行对比学习得到的，训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征，正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体，负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体，t1早于t2，是t2之前的历史时间，m为预设的正整数。
[0154]
作为其中一种可实现的方式，上述表征模型可以由第一训练单元605采用如下方式预先训练得到：
[0155]
获取上述训练数据；
[0156]
利用训练数据训练动量对比度moco模型，训练目标包括：最大化负样本对中第一主体和第二主体之间的表征向量相似度且最小化正样本对中第一主体和第二主体之间的表征向量相似度；
[0157]
利用训练得到的moco模型中的编码器得到表征模型。
[0158]
作为一种优选的实施方式，moco模型中的编码器包括第一编码器和第二编码器。在训练中，第一编码器用以利用第一主体在时间t1之前预设时长内的行为特征，得到第一主体的向量表示；第二编码器用以利用第二主体在时间t1之前预设时长内的行为特征，得到第二主体的向量表示；在训练的每一轮迭代中利用训练损失的取值反向更新第一编码器的参数，第二编码器的参数根据第一编码器的参数进行动量更新。第一训练单元605将训练得到的第一编码器作为表征模型。
[0159]
作为其中一种可实现的方式，第一训练单元605可以将训练得到的表征模型下发至第一主体的终端设备和第二主体的终端设备。表征获取单元601从第一主体的终端设备获取表征模型利用该第一主体在时间t2之前预设时长内的行为特征得到的第一主体的表征向量；以及从从第二主体的终端设备获取表征模型利用该第二主体在时间t2之前预设时长内的行为特征得到的第二主体的表征向量。
[0160]
作为其中一种可实现的方式，候选召回单元602可以利用分层可导航小世界图hnsw方法，搜索表征向量与第一主体的表征向量之间最近的n个第二主体，n为预设的正整数。
[0161]
作为其中一种可实现的方式，风险评分单元603可以对各候选关系对进行风险评分，得到候选关系对在m个风险类别上的评分，m为正整数。相应地，关系对确定单元604选择在m个风险类别上的评分满足上述第二条件的候选关系对作为可信关系对。
[0162]
作为其中一种可实现的方式，上述第二条件可以为在m个风险类别上的评分均低于预设评分阈值。
[0163]
作为其中一种可实现的方式，风险评分单元603可以利用风险评分模型对各候选关系对进行风险评分，其中风险评分模型是基于多任务专家模型预先训练得到的。
[0164]
其中，风险评分模型可以包括：表征处理模块和k个专家模块；
[0165]
表征处理模块对输入的候选关系对中第一主体和第二主体的特征向量进行拼接处理后，将得到的特征向量进行n阶表征交叉，n为正整数；
[0166]
专家模块利用n阶表征交叉后得到的表征向量，映射得到该候选关系对在各风险类别上的评分。
[0167]
作为其中一种可实现的方式，第二训练单元606，被配置为预先训练风险评分模型。其训练时采用的训练数据包括：由第一主体和第二主体构成的关系对中第一主体和第二主体的表征向量，以及针对关系对标注的在m个风险类别上的评分。将第一主体和第二主体的表征向量输入上述多任务专家模型，由多任务专家模型输出该关系对在m个风险类别上的评分，相当于存在m个任务。训练目标为最小化多任务专家模型的输出与训练数据中标注内容的差异。可以依据上述训练目标构造损失函数，在每一轮迭代中利用损失函数的取值，采用诸如梯度下降等方式更新多任务专家模型的参数，直至满足预设的训练结束条件。其中训练结束条件可以包括诸如损失函数的取值小于或等于预设的损失函数阈值，迭代次数达到预设的次数阈值等。
[0168]
作为其中一种可实现的方式，可信判别单元607，被配置为若在时间t2+m接收到包含网络行为的流量，则将网络行为与可信关系对进行匹配，若依据匹配结果确定网络行为为可信行为，正常转发流量；否则将该流量转发至风险识别系统进行更进一步精细的风险识别。
[0169]
上述表征获取单元601、候选召回单元602、风险评分单元603、关系对确定单元604、第一训练单元605和第二训练单元606可以设置于图1所示系统中的离线的挖掘装置。可信判别单元607可以设置于图1所示系统中的在线的判别装置。
[0170]
作为其中一种典型的应用场景，第一主体为消费者，第二主体为商户，预设类型的行为关系包括交易行为、支付行为、收款行为和评价行为中的至少一种。
[0171]
作为另一种典型的应用场景，第一主体和第二主体均为用户，预设类型的行为关系包括支付行为、存取款行为、签约绑定行为和收发红包行为中的至少一种。
[0172]
本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0173]
以上所描述的系统及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
[0174]
本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0175]
上述的计算机存储介质可以采用一个或多个计算机可读的介质的任意组合，包括但不限于：便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0176]
以上的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细
说明，所应理解的是，以上仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周璟蒋晨之王宁涛吕乐傅幸刘芳卿杨阳杨信王维强
技术所有人：支付宝（杭州）信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。