基于动态图的群体识别方法和系统与流程

文档序号:30581834发布日期:2022-06-29 12:41阅读:来源:国知局

技术特征:
1.一种基于动态图的群体识别方法,包括:获取预定时间段内的事务数据集;基于所述时间段和所述事务数据集来构建动态图,其中所述动态图中的每个节点映射成低维向量;基于所述动态图中每个节点的低维向量来确定与事务数据在所述动态图中的流向和流速相关的流转信息;基于所述事务数据的流转信息来捕捉所述动态图中具有异常流转模式的事务数据流;基于所捕捉的事务数据流来识别目标对象;以及基于所述目标对象与其他对象的事务相关关系来识别目标群体。2.如权利要求1所述的方法,基于所述时间段和所述事务数据集来构建动态图进一步包括:基于所述时间段和所述事务数据集获得与每个对象相关联的对象特征和事务特征,其中所述对象特征包括对象的历史标签、一阶特征、二阶特征,所述事务特征包括对象执行的每一事务的事务发生时间和事务相关数额;基于所述对象特征和所述事务特征来构建所述动态图。3.如权利要求1所述的方法,具有异常流转模式的事务数据流包括满足以下一项或多项的事务数据流:同一对象执行的全部事务的事务相关数额的均值大于第一阈值;同一对象执行的相邻事务的事务发生时间的间隔小于第二阈值;以及同一对象执行的事务的流转链路大于预设跳数。4.如权利要求1所述的方法,基于所述动态图中每个节点的低维向量来确定与事务数据在所述动态图中的流向和流速相关的流转信息以及基于所述事务数据的流转信息来捕捉所述动态图中具有异常流转模式的事务数据流是通过对所述动态图执行动态图表征算法来实现的。5.如权利要求4所述的方法,所述动态图表征算法包括tgat算法、gat算法、或graphsage算法。6.如权利要求1所述的方法,基于所述目标对象与其他对象的事务相关关系来识别目标群体进一步包括:基于所述目标对象与其他对象的事务相关关系来构建数据流向图,其中所述数据流向图中的根节点表示所述目标对象,非根节点表示与所述目标对象有事务相关关系的其他对象;基于所述数据流向图中节点的数据流入占比来识别所述目标群体。7.如权利要求6所述的方法,基于所述数据流向图中节点的数据流入占比来识别所述目标群体进一步包括:对所述数据流向图中的根节点的流出数据以及非根节点的流入数据和流出数据进行标记;计算所述数据流向图中所有非根节点的数据流入占比,其中每一非根节点的数据流入占比表示所述非根节点的流入数据与所述根节点的流出数据的比率;确定数据流入占比超过预设阈值的非根节点;
将所述目标对象以及所确定的非根节点所表示的对象识别为所述目标群体。8.一种基于动态图的群体识别系统,包括:数据获取模块,获取预定时间段内的事务数据集;动态图构建模块,基于所述时间段和所述事务数据集来构建动态图,其中所述动态图中的每个节点映射成低维向量;对象识别模块,其被配置成:基于所述动态图中每个节点的低维向量来确定与事务数据在所述动态图中的流向和流速相关的流转信息;基于所述事务数据的流转信息来捕捉所述动态图中具有异常流转模式的事务数据流;基于所捕捉的事务数据流来识别目标对象;以及群体识别模块,基于所述目标对象与其他对象的事务相关关系来识别目标群体。9.如权利要求8所述的系统,动态图构建模块进一步:基于所述时间段和所述事务数据集获得与每个对象相关联的对象特征和事务特征,其中所述对象特征包括对象的历史标签、一阶特征、二阶特征,所述事务特征包括对象执行的每一事务的事务发生时间和事务相关数额;基于所述对象特征和所述事务特征来构建所述动态图。10.如权利要求8所述的系统,具有异常流转模式的事务数据流包括满足以下一项或多项的事务数据流:同一对象执行的全部事务的事务相关数额的均值大于第一阈值;同一对象执行的相邻事务的事务发生时间的间隔小于第二阈值;以及同一对象执行的事务的流转链路大于预设跳数。11.如权利要求8所述的系统,所述对象识别模块进一步:通过对所述动态图执行动态图表征算法来实现基于所述动态图中每个节点的低维向量来确定与事务数据在所述动态图中的流向和流速相关的流转信息以及基于所述事务数据的流转信息来捕捉所述动态图中具有异常流转模式的事务数据流。12.如权利要求11所述的系统,所述动态图表征算法包括tgat算法、gat算法、或graphsage算法。13.如权利要求8所述的系统,所述群体识别模块进一步:基于所述目标对象与其他对象的事务相关关系来构建数据流向图,其中所述数据流向图中的根节点表示所述目标对象,非根节点表示与所述目标对象有事务相关关系的其他对象;基于所述数据流向图中节点的数据流入占比来识别所述目标群体。14.如权利要求13所述的系统,所述群体识别模块进一步:对所述数据流向图中的根节点的流出数据以及非根节点的流入数据和流出数据进行标记;计算所述数据流向图中所有非根节点的数据流入占比,其中每一非根节点的数据流入占比表示所述非根节点的流入数据与所述根节点的流出数据的比率;确定数据流入占比超过预设阈值的非根节点;将所述目标对象以及所确定的非根节点所表示的对象识别为所述目标群体。
15.一种计算机可读存储介质,其存储计算机程序,所述计算机程序能被处理器执行以执行如权利要求1-7中任一项所述的方法。

技术总结
本公开提出了一种基于动态图的群体识别方法和系统。该方法包括:获取预定时间段内的事务数据集;基于该时间段和该事务数据集来构建动态图,其中该动态图中的每个节点映射成低维向量;基于该动态图中每个节点的低维向量来确定与事务数据在该动态图中的流向和流速相关的流转信息;基于该事务数据的流转信息来捕捉该动态图中具有异常流转模式的事务数据流;基于所捕捉的事务数据流来识别目标对象;以及基于该目标对象与其他对象的事务相关关系来识别目标群体。识别目标群体。识别目标群体。


技术研发人员:黄耀波 刘智欣 黄涛 张天翼 王睿祺
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2022.03.23
技术公布日:2022/6/28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1