识别社交网络中的风险账户的方法及装置与流程

文档序号:31499719发布日期:2022-09-14 08:30阅读:44来源:国知局
识别社交网络中的风险账户的方法及装置与流程

1.本技术涉及数据处理技术领域,具体涉及一种识别社交网络中的风险账户的方法及装置、电子设备、计算机可读存储介质。


背景技术:

2.目前,为了识别社交网络中存在的风险账户,主要是通过构建相应的标签训练数据集来训练分类算法模型,并通过训练好的分类算法模型根据账户的特征信息来预测该账户的风险概率,风险概率越大,表示该账户为风险账户的可能性越大。但这种识别方式在实际风险场景中的适应度不高,例如在识别社交网络中参与赌博的账户的应用场景,采用如上的风险账户识别方式难以识别出参与赌博的账户。


技术实现要素:

3.为解决上述技术问题,本技术的实施例提供了一种识别社交网络中的风险账户的方法及装置、电子设备、计算机可读存储介质。
4.根据本技术实施例的一个方面,提供了一种识别社交网络中的风险账户的方法,包括:将社交网络中的账户作为节点,并融合账户之间具有的多种关联关系以构建节点之间的边,生成所述社交网络对应的账户关系网络图结构;根据账户在所述账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息,提取各个账户的深度特征表示;结合账户的深度特征表示和账户特征信息,预测各个账户的风险概率;根据预测得到的风险概率识别所述社交网络中的风险账户。
5.根据本技术实施例的一个方面,提供了一种识别社交网络中的风险账户的装置,包括:网络图结构生成模块,配置为将社交网络中的账户作为节点,并融合账户之间具有的多种关联关系以构建节点之间的边,生成所述社交网络对应的账户关系网络图结构;深度特征提取模块,配置为根据账户在所述账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息,提取各个账户的深度特征表示;风险概率预测模块,配置为结合账户的深度特征表示和账户特征信息,预测各个账户的风险概率;账户风险识别模块,配置为根据预测得到的风险概率识别所述社交网络中的风险账户。
6.根据本技术实施例的一个方面,提供了一种电子设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的识别社交网络中的风险账户的方法。
7.根据本技术实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的识别社交网络中的风险账户的方法。
8.根据本技术实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机
指令,使得该计算机设备执行上述各种可选实施例中提供的识别社交网络中的风险账户的方法。
9.在本技术的实施例所提供的技术方案中,通过融合账户之间具有的多种关联关系来构建账户关系网络图结构,并根据账户在账户关系网络图结构中的邻居节点特征信息和账户的账户特征信息来提取各个账户的深度特征表示,最后结合账户的深度特征表示和账户特征信息来预测账户的风险概率,极大地提升了在账户风险概率预测过程中所使用的特征信息的数量以及深度,从而提升了风险识别方法的适应程度,也能够提升风险账户的识别效果。
10.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
11.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
12.图1是本技术涉及的一种实施环境的示意图;
13.图2是本技术的一实施例示出的识别社交网络中的风险账户的方法的流程图;
14.图3是本技术的一实施例示出的邻居节点分布示意图;
15.图4是图2所示实施例中的步骤s110在一个示例性实施例中的流程图;
16.图5是图4所示实施例中的步骤s113在一个示例性的实施例中的描述;
17.图6是本技术的一实施例示出的第一关联权重所表征的异构信息融合过程示意图;
18.图7是本技术的一实施例示出的第二关联权重所表征的异构信息融合过程示意图;
19.图8是图2所示实施例中的步骤s130在一个示例性实施例中的流程图;
20.图9是本技术的一示例性实施例示出的风险账户识别方案的流程概述图;
21.图10是本技术的一示例性实施例示出的识别社交网络中的风险账户的装置的框图;
22.图11示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
23.这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
24.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
25.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
26.还需要说明的是:在本技术中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
27.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
28.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
29.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
30.以下将基于人工智能技术和机器学习技术,对本技术实施例提供的识别社交网络中的风险账户的方法及装置、电子设备、计算机可读存储介质进行说明。
31.请参阅图1,图1是本技术涉及的一种实施环境的示意图。该实施环境包括社交服务器20和多个用户终端10,用户终端10和社交服务器20之间通过有线或者无线网络进行通信。
32.用户终端10中运行由社交客户端,社交服务器20为社交客户端的运行提供数据支持,例如不同的社交客户端之间基于社交服务器20能够进行即时通讯,由此形成社交网络。不同的用户在社交网络中以不同的账户形式存在,账户也即是用户在社交网络中所使用的用户标识。
33.为了识别社交网络中的风险账户,例如识别出参与赌博的账户,社交服务器20中加载有识别社交网络中的风险账户的程序,依据社交网络中的账户和账户之间具有的多种关联关系构建账户关系网络图结构,并根据账户在账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息,提取各个账户的深度特征表示,且结合账户的深度特征表示和账户特征信息预测各个账户的风险概率,以根据预测得到的风险概率识别所述社交网络中的风险账户,由此识别出社交网络中的风险账户。
34.对于识别出的风险账户,则可以采取一定的措施对该风险账户进行打击,例如注销该风险账户、将风险账户的每笔交易资金限制在较小数值以下、限制风险账户每日的交易次数等。针对风险账户所采取的打击措施可根据实际的应用场景进行确定,本处不对此
进行限制,由此能够营造一种健康安全的网络社交环境。
35.需要说明的是,在图1所示实施环境中,用户终端10可以是智能手机、平板、笔记本电脑、计算机等电子设备;社交服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,其中多个服务器可组成一区块链,而服务器为区块链上的节点;社交服务器20还可以是提供云服务、云数据库、云计算、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处不对此进行限制。
36.图2是本技术的一实施例示出的识别社交网络中的风险账户的方法的流程图。该方法可以应用于图1所示的实施环境,例如由图1所示实施例环境中的社交服务器20或者用户终端10具体执行。在其它的实施环境中,该方法可以由其它电子设备具体执行,本实施例不对此进行限制。
37.如图2所示,在一示例性实施例中,该方法可以包括步骤s110至步骤s170,详细介绍如下:
38.步骤s110,将社交网络中的账户作为节点,并融合账户之间具有的多种关联关系以构建节点之间的边,生成社交网络对应的账户关系网络图结构。
39.首先需要说明的是,社交网络是指社交网络服务,广义上的社交网络包含硬件、软件、服务及应用,通常理解为是由许多节点构成的一种社交关系网络结构,节点通常是指个人或组织,通过节点之间的社交关系,以将节点之间串连起来。
40.本实施例构建社交网络对应的账户关系网络图结构,目的在于通过网状图谱的形式来表示社交网络中不同账户之间的联系,进而通过网状图谱所表示的账户之间的联系,来提取社交网络中账户的深度特征信息。深度特征信息相比于账户特征信息含有更加丰富的账户特征信息。其中,账户特征信息包括账户的行为信息和属性标签信息等,账户的行为信息可以包括与账户交易行为、操作行为等相关信息,属性标签信息可以包括账户的年龄、性别等属性信息。后续结合提取得到的深度特征信息和账户特征信息来预测账户的风险情况,使得风险账户的识别过程所依据的特征信息相比于现有技术更加丰富,从而获得相比于现有技术具有的更高适应度的风险账户识别方案,并且能够提升风险账户的识别效果。
41.本实施例中,是将社交网络中的账户作为账户关系网络图结构中的节点,并融合账户之间具有的多种关联关系来构建节点之间的边。其中,社交网络中的账户也即是用户在社交网络中所使用的用户标识,社交网络中的用户可以是个人或者组织。
42.通过收集和分析账户在多个维度的账户数据,能够获得账户之间的关联关系。示例性的,账户之间进行的社交操作可使得账户之间产生关联关系,例如账户a向账户b转入了一笔资金,则可确定账户a和账户b之间具有关联关系;账户的注册过程也可能产生账户之间的关联关系,例如账户a和账户b是基于同一手机号码注册的,账户a和账户b之间则具有关联关系;账户的交易过程也可能产生账户之间的关联关系,例如账户a和账户b在同一设备上进行过资金交易,账户a和账户b之间也具有关联关系;账户所关联的信息也可能产生账户之间的关联关系,例如账户a和账户b关联有同一证件号码,账户a和账户b之间则具有关联关系,在此不一一列举。
43.本实施例融合账户之间具有的多种关联关系来构建节点之间的边的方式可以有多种,例如任意的两个节点之间具有多种关联关系中的至少一种关联关系,则可以在这两
个节点之间形成边;也可以针对任意的两个节点之间都形成边,并根据相应两个节点之间具有的多种关联关系生成一个关联权重,将生成的关联权重赋予至对应边,由此通过每条边对应的关联权重来表征边所连接的两个节点账户之间的关联程度。在实际的应用场景中可以根据具体需求来选取构建节点之间边的方式,本实施例也不对此进行限制。
44.基于所构建的账户关系网络图结构,十分便于获得社交网络中各个账户之间的关联信息,也便于后续基于这些关联信息来获取各个账户的深度特征表示。
45.步骤s130,根据账户在账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息,提取各个账户的深度特征表示。
46.在本实施例中,账户在账户关系网络图结构中的邻居节点可以包括与账户具有直接的关联关系的节点,也即邻居节点与表征当前账户的节点之间具有边,还可以包括与账户具有间接的关联关系的节点,该具有间接关联关系的节点与前述具有直接关关系的节点之间具有边。例如在图3所示的账户e对应的邻居节点分布示意图中,账户e对应的节点存在多个邻居节点,这些邻居节点与账户e对应的节点具有直接或者间接的关联关系。
47.邻居节点特征信息不仅包括各个邻居节点的账户特征信息,还包括邻居节点与作为中心的节点之间的关联关系,以及包括邻居节点之间的关联关系。仍如图3所示,账户e对应的邻居节点之间也存在边,因此邻居节点特征信息包含有这些邻居节点之间的关联关系。
48.本实施例根据账户在账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息来提取各个账户的深度特征表示,使得在所得到的深度特征表示中不仅含有账户自身的账户特征信息,还融合了邻居节点的账户特征信息以及邻居节点与自身账户之间的关联关系,极大地提升了每个节点账户的特征深度。
49.步骤s150,结合账户的深度特征表示和账户特征信息,预测各个账户的风险概率。
50.本实施例结合账户的深度特征表示和账户特征信息,来预测各个账户的风险概率,例如是将账户的深度特征和账户特征信息作为待处理特征,通过对该待处理特征进行特征分类处理,以得到相应账户的风险概率。预测得到的风险概率用于表征对应账户为风险账户的可能性,例如在社交网络中的账户可能参与赌博的风险场景下,所得到的风险概率越高,相应账户参与赌博的可能性也越大。
51.本实施例针对待处理特征进行特征分类处理可通过分类算法模型实现,分类算法模型可以包括lightgbm|、lr(logistic regression,逻辑回归)、softmax等模型,可以根据具体需求进行选择。
52.步骤s170,根据预测得到的风险概率识别社交网络中的风险账户。
53.账户的风险情况用户描述账户是否为风险账户。如前所述,预测得到的风险概率用于表征对应账户为风险账户的可能性,若所得风险概率大于风险阈值,则可将相应账户识别为风险账户,风险概率小于风险阈值的账户相应为非风险账户。风险阈值用于表征相应的风险边界,可预先进行设置。
54.或者,为了进一步提升风险账户的识别精确度,还可以结合社交网络中的风险场景来判断风险账户,社交网络中的风险场景也即是本实施例的方法所对应的应用场景,例如可以包括社交网络中的账户可能参与赌博、洗钱等违法行为的风险场景,采用本实施例的方法用以识别出这些风险账户,即可以针对这些风险账户进行精确打击,以实现良好的
互联网社交环境。
55.具体来说,针对社交网络中的每个账户,若确定账户的风险概率大于风险阈值,则获取用于描述社交网络中的风险场景所对应的关键特征,例如在识别参与赌博的风险场景中,关键特征可以包括资金交易时间为夜间、每笔交易资金的金额大于指定金额的占比应大于预设的阈值比例等。这些关键特征可以结合具体的风险场景进行确定,重要思想在于采取进一步的风险约束条件来判断账户是否为风险账户。若确定风险概率大于风险阈值的账户符合关键特征,则将这些账户识别为风险账户。
56.可以看出,本实施例通过提取社交网络中账户的深度特征信息、结合提取得到的深度特征信息和账户特征信息来预测账户的风险概率、结合预测的风险概率和风险场景对应的关键特征等方式来识别社交网络中的风险账户,相比于现有技术仅针对账户特征信息预测账户的风险概率的方案,本实施例提出的风险账户识别方案在风险账户的识别过程所依据的特征信息更加丰富,从而获得相比于现有技术具有的更高适应度的风险账户识别方案,并且能够提升风险账户的识别效果。
57.图4是图2所示实施例中的步骤s110在一个示例性实施例中的流程图。在图4所示的实施例中,账户之间的多种关联关系包括资金关系以及非资金关系,资金关系是指账户之间的资金往来情况,非资金关系是指账户之间基于非资金信息所存在的关联情况,例如两个账户是否使用同一手机号注册,两个账户是否在同一设备上进行资金交易等。
58.由此,本实施例提出的风险账户识别方案在涉及账户资金交易安全的风险场景中,对于涉及资金交易风险的账户具有较好的识别效果,例如在识别账户的是否参与赌博、洗钱等违法行为的场景中,采取本实施例提出的能够有效识别出风险账户。
59.如图4所示,在一示例性实施例中,将社交网络中的账户作为节点,并融合账户之间具有的多种关联关系以构建节点之间的边,生成社交网络对应的账户关系网络图结构,可以包括步骤s111至步骤s115,详细介绍如下:
60.步骤s111,将社交网络中的账户作为节点,生成任意两个节点之间的边。
61.考虑到在实际的资金交易场景中,存在很多衡量账户关联关系的方式,即使不同的账户之间并不存在任何资金交易行为,但一些非法分子可能利用多个证件或者设备下的账户,同时去多个风险场景下作恶,单纯依赖于资金关系容易导致有些关联程度较弱的两个账户之间很难被发现,导致最终构建的账户关系网络图结构并不能非常准确地描述社交网络中的账户关联状态,进而影响后续的账户深度特征提取以及账户风险概率的预测。
62.为避免出现此问题,本实施例将社交网络中的账户作为节点之后,生成任意两个节点之间的边,然后依赖于任意两个节点对应的账户之间的资金关系和非资金关系,向生成的对应边赋予关联权重,以通过关联权重来表征该条边所连接的两个节点账户之间的关系亲密度,由此使得最终得到的账户关系网络图结构与社交网络中的账户关联状态相符合。
63.步骤s113,根据任意两个节点对应的账户之间的资金关系和非资金关系,确定任意两个节点之间的关联权重。
64.两个账户之间的资金关系和非资金关系也称为异构信息,若针对每种异构信息分别构建账户关系网络图结构,并针对不同的账户关系网络图结构来提取各个账户的深度特征表示,往往显得有些冗余,为此,本实施例根据任意两个节点对应的账户之间的资金关系
和非资金关系来确定任意两个节点之间的关联权重,根据多种异构信息融合为一张信息网。
65.两个账户之间的资金关系包括一种或多种资金关系类型,当只含有一种资金关系类型时,任意两个节点之间的关联权重也为一个,该关联权重通过此种资金关系类型和非资金关系确定得到;当含有多种资金关系类型时,任意两个节点之间的关联权重相应有多个,多个关联权重是根据任意两个节点之间具有的不同资金关系类型获得的。
66.步骤s115,将关联权重作为标注信息添加至所生成的边上,以形成账户关系网络图结构。
67.本实施例将关联权重作为标注信息添加至所生成的边上,使得所形成的账户关系网络图结构中含有每条边所连接的两个账户之间的关系亲密度,在后续提取深度特征信息的过程中,基于这些关联权重来得到账户的深度特征,使得账户深度特征中含有更为全面的账户信息。
68.当任意两个节点之间具有多个关联权重时,可以根据任意两个节点之间依据同一资金关系类型所获得的关联权重,生成相应的账户关系网络图结构,以得到社交网络对应的多个账户关系网络图结构。也即,在所得到的每个账户关系网络图结构中,每条边上标注的关联权重应是基于同一资金关系类型所获得的。
69.或者,还可以计算多个关联权重之和,将计算结果作为标注信息添加至所生成的边上,以基于任意两个节点之间具有多个关联权重融合生成所述社交网络对应的账户关系网络图结构。也即是说,即使任意两个账户之间存在多种资金关系类型,最终也只会得到一个账户关系网络图结构,该账户关系网络图结构中每条边上标注的关联权重是根据相应两个节点之间具有的不同资金关系类型获得的关联权重之和,相当于实现了不同账户关系网络图结构的融合。
70.还需要说明的是,若确定某两个节点之间的关联权重为零,可以删除这两个节点之间的边,以使最终生成的账户关系网络图结构更为简洁和精确。
71.由此,本实施例提供的方法实现了异构关联信息的同构化,通过在账户关系网络图结构中的每条边上标注相应的关联权重,能够建立更为精确的账户关系网络图结构,为后续提取得到各个账户的深度特征信息的准确性提供的基础条件。
72.图5是图4所示实施例中的步骤s113在一个示例性的实施例中的描述。如图5所示,根据任意两个节点对应的账户之间的资金关系和非资金关系,确定任意两个节点之间的关联权重,可以包括步骤s1131至步骤s1133,详细介绍如下:
73.步骤s1131,根据任意两个节点对应的账户之间的资金关系,获取任意两个节点关联的交易对手信息和交易资金信息。
74.本实施例描述了任意两个节点对应的账户之间的资金关系包括交易对手信息和交易资金信息两种资金关系类型,其中交易对手信息是与某个账户具有资金往来关系的账户信息,例如账户a与账户b和账户c都具有资金往来关系,账户b和账户c则均作为账户a的交易对手;交易资金信息是指具体的资金往来金额。
75.步骤s1133,根据任意两个节点关联的交易对手信息和任意两个节点之间的非资金关系,确定任意两个节点之间的第一关联权重,以及根据任意两个节点关联的交易资金信息和任意两个节点之间的非资金关系,确定任意两个节点之间的第二关联权重。
76.对于任意两个节点之间的第一关联权重,可根据这两个节点关联的交易对手信息,确定这两个节点之间的共同交易对手数量,以及这两个节点中的所有节点的交易对手数量之和,并计算共同交易对手数量与所得和值的比值,然后确定这两个节点之间的非资金关系对应的赋值,针对所得比值和赋值进行加权和运算,得到这两个节点之间的第一关联权重。
77.以上获取任意两个节点之间的第一关联权重的过程可通过如下公式表示:
[0078][0079]
其中,任意的两个节点为账户a和账户b对应的节点,w(a,b)表示这两个节点之间的第一关联权重,n(a)∩n(b)表示账户a和账户b之间的共同交易对手数量,n(a)+n(b)表示账户a和账户b的交易对手数量之和,d(a,b)表示非资金关系包括账户资金交易设备关系时对应的赋值,p(a,b)表示非资金关系包括账户所关联的证件号码时对应的赋值,i(a,b)表示非资金关系包括账户注册时所使用的手机号码时对应的赋值。以上各种类型的非资金关系对应的赋值条件如下:
[0080][0081][0082][0083]
其中,device(a)表示账户a进行资金交易的设备,device(b)表示账户b进行资金交易的设备,phone(a)表示账户a在注册时所使用的手机号码,phone(b)表示账户b在注册是所使用的手机号码,idcard(a)表示账户a所关联的证件号码,idcard(b)表示账户b所关联的证件号码。
[0084]
以上计算过程可抽象为图6所示的过程,所计算得到的第一关联权重融合了两个账户之间的交易对手信息、进行资金交易的设备、关联的证件和手机号等异构信息,实现了主要基于两个账户之间的共同交易对手信息的关系网络融合。
[0085]
对于任意两个节点之间的第二关联权重,可根据这两个节点关联的资金交易信息,确定任意两个节点之间的资金往来总量以及所有节点的资金交易总量之和,并计算资金往来总量与所有节点的资金交易总量之和的比值,然后确定这两个节点之间的非资金关系对应的赋值,针对所得比值和赋值进行加权和运算,得到这两个节点之间的第一关联权重。
[0086]
以上获取任意两个节点之间的第二关联权重的过程可通过如下公式表示:
[0087][0088]
其中,w(a,b)表示账户a和账户b所对应节点之间的第二关联权重,m(a)∩m(b)表
示账户a和账户b之间的资金往来总量,m(a)+m(b)表示账户a和账户b的资金交易总量之和,d(a,b)、p(a,b)和i(a,b)与第一关联权重的计算过程相同。
[0089]
以上计算过程可抽象为图7所示的过程,所计算得到的第一关联权重融合了两个账户之间的交易资金信息、进行资金交易的设备、关联的证件和手机号等异构信息,实现了主要基于两个账户之间的往来资金信息的关系网络融合。
[0090]
本实施例基于任意两个节点对应的账户之间的资金关系包括交易对手信息和交易资金信息两种资金关系类型,来描述了任意两个节点之间的关联权重的计算过程,这种计算过程可以推广至任意两个节点对应的账户之间的资金关系包括其它资金关系类型的情况,由此获得任意两个节点之间的多个关联权重。
[0091]
如前所述的,在获得任意两个节点之间的多个关联权重之后,可以分别生成不同的账户关系网络图结构,也可以基于多个关联权重融合生成一个账户关系网络图结构,可以根据实际需求进行选择。
[0092]
图8是图2所示实施例中的步骤s130在一个示例性实施例中的流程图。如图8所示,根据账户在账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息,提取各个账户的深度特征表示,可以包括步骤s131至步骤s135,详细介绍如下:
[0093]
步骤s131,根据账户关系网络图结构中的各个节点对应的账户特征信息,生成账户关系网络图结构对应的账户特征图。
[0094]
在本实施例中,所生成账户关系网络图结构对应的账户特征图,也即是将所有账户的账户特征信息按照账户之间的关联关系进行排列,所形成的账户特征图结构。
[0095]
步骤s133,针对账户特征图进行特征聚合处理,得到账户关系网络图结构对应的聚合特征图,聚合特征图中含有对应于各个节点的聚合特征表示,聚合特征表示聚合了相应节点的邻居节点特征信息。
[0096]
本实施例针对账户关系网络图结构对应的账户特征图进行特征聚合处理,目的是在于将每个节点的邻居节点特征信息与每个节点的账户特征信息进行聚合,以得到每个节点的聚合特征表示,由此形成包含有所有节点的聚合特征表示的聚合特征图。
[0097]
在一些实施例中,可通过生成账户特征图对应的邻接矩阵,并针对该邻接矩阵进行图卷积处理,得到账户关系网络图结构对应的聚合特征图。其中,所生成的邻接矩阵中包含有所有节点的特征向量以及节点之间的图连接关系,节点之间的图连接关系包括节点之间的边上所标注的关联权重,针对邻接矩阵进行图卷积处理可通过gcn(graph convolutional network,图神经网络)模型实现。本实施例进行的图卷积处理是针对账户特征图所进行的全图卷积处理,在卷积过程中能够充分利用节点信息,也充分利用了邻居节点的特征信息,因此具有较好的特征聚合效果。
[0098]
在另一些实施例中,考虑到在类似于“微信”等具有大规模账户节点、且账户节点更新速度较快的社交网络中,采用上述实施例中的图卷积处理过程难以实现,本实施例则采用另一种方式针对账户特征图进行特征聚合处理,具体包括以下过程:
[0099]
针对账户特征图中的各个节点采样指定数量的邻居节点,得到各个节点对应的邻居节点集合;将邻居节点集合对应的邻居节点特征信息聚合至对应节点中,形成账户关系网络图结构中各个节点所对应的聚合特征,以得到聚合特征图。
[0100]
仍如图3所示,针对账户e所对应的节点采样得到的邻居节点包括具有黑色填充的
所有节点,针对账户e所对应的节点所提取得到的深度特征表示,即聚合了这些邻居节点的相关特征信息和关联权重的信息。
[0101]
可以看出,本实施例并不是直接对账户特征图全图进行卷积,而通过对每一节点的邻居节点进行随机采样得到的邻居节点集合作为子图,再对子图进行特征聚合,大大降低了计算压力,也减轻了执行本实施例的方法的电子设备的内存压力。
[0102]
本实施例可以获取训练得到的聚合函数,根据聚合函数对邻居节点集合对应的邻居节点特征信息以及对应节点的账户特征信息进行聚合运算,将运算结果作为对应节点的聚合特征。其中,聚合函数的训练包括针对账户关系网络图结构中的各个节点提取特征表示的过程。
[0103]
因此,本实施例并不是直接学习网络节点的深度特征表示,而是学习一个聚合函数,这个聚合函数能够将邻居节点的特征聚合到相应作为中心的节点上。当学习得到聚合函数之后,就可以泛化至社交网络中的新增节点或者新的社交网络上,从而适用于类似于“微信”等具有大规模账户节点、且账户节点更新速度较快的社交网络。
[0104]
无论采取哪种特征聚合方式,所得到的聚合特征图中含有的各个账户的聚合特征表示都聚合了相应节点的邻居节点的特征信息,使得所得到的各个节点的聚合特征中含有更为深度的特征信息。
[0105]
步骤s135,将各个节点的聚合特征表示作为相应的各个账户的深度特征表示。
[0106]
本实施例所得到的聚合特征表示即含有与相应节点的邻居节点相关的特征信息,将所得到的聚合特征表示作为相应节点的深度特征表示,即可使得每个节点的深度特征表示中能够含有更加丰富的特征信息,为后续预测各个账户的风险情况奠定了更为准确的数据条件。
[0107]
由上可以看出,本技术提出的风险账户识别方案融合社交网络中用户账户的在不同维度的特征信息来构建账户关系网络图结构,并通过图卷积方式或者图学习方式来提取账户关系网络图结构中各个节点的深度特征信息,并结合各个特征的深度特征信息和原有的账户特征信息来预测账户的风险概率,能够有效提升风险账户的识别效果。
[0108]
本技术所提出的风险账户识别方案可以通过图9所示的流程进行表示:
[0109]
首先根据社交网络中的多种关联关系,例如共同交易对手、交易资金、进行资金交易的设备、关联的证件和手机号等,来构建账户关系网络图结构,并提取账户关系网络图结构中各个节点的深度特征表示。将各个节点对应的账户作为目标账户,通过将各个目标账户和深度特征表示以及账户特征信息相结合,即可预测各个目标账户的风险概率,后续结合当前社交网络中的风险场景所对应的关联特征,来进一步识别社交网络中的风险账户,进而对这些风险账户进行打击处理,由此营造一种健康安全的互联网社交环境。
[0110]
本技术所提出的风险账户识别方案利用深度特征信息来丰富风险账户的识别过程中的节点特征信息,使得风险账户的识别过程更加有效。详细的风险账户识别过程已在前述的各个实施例中进行描述,本处不再进行赘述。
[0111]
图10是本技术的一示例性实施例示出的识别社交网络中的风险账户的装置的框图。如图10所示,该装置包括:
[0112]
网络图结构生成模块210,配置为将社交网络中的账户作为节点,并融合账户之间具有的多种关联关系以构建节点之间的边,生成社交网络对应的账户关系网络图结构;深
度特征提取模块230,配置为根据账户在账户关系网络图结构中的邻居节点特征信息以及账户的账户特征信息,提取各个账户的深度特征表示;风险概率预测模块250,配置为结合账户的深度特征表示和账户特征信息,预测各个账户的风险概率;账户风险识别模块270,配置为根据预测得到的风险概率识别社交网络中的风险账户。
[0113]
在本实施例提供的装置中,通过提取社交网络中账户的深度特征信息、结合提取得到的深度特征信息和账户特征信息来预测账户的风险概率、结合预测的风险概率和风险场景对应的关键特征等方式来识别社交网络中的风险账户,相比于现有技术仅针对账户特征信息预测账户的风险概率的方案,本实施例提出的风险账户识别方案在风险账户的识别过程所依据的特征信息更加丰富,从而获得相比于现有技术具有的更高适应度的风险账户识别方案,并且能够提升风险账户的识别效果。
[0114]
在另一示例性的实施例中,多种关联关系包括资金关系和非资金关系;网络图结构生成模块210包括:
[0115]
节点及边生成单元,配置为将社交网络中的账户作为节点,生成任意两个节点之间的边;关联权重确定单元,配置为根据任意两个节点对应的账户之间的资金关系和非资金关系,确定任意两个节点之间的关联权重;图结构形成单元,配置为将关联权重作为标注信息添加至所生成的边上,以形成账户关系网络图结构。
[0116]
在另一示例性的实施例中,任意两个节点之间具有多个关联权重,多个关联权重是根据任意两个节点之间具有的不同资金关系类型获得的;图结构形成单元包括:
[0117]
图结构融合形成子单元,配置为计算多个关联权重之和,将计算结果作为标注信息添加至所生成的边上,以基于任意两个节点之间具有多个关联权重融合生成社交网络对应的账户关系网络图结构;或者,多图结构形成子单元,配置为根据任意两个节点之间依据同一资金关系类型所获得的关联权重,生成相应的账户关系网络图结构,以得到社交网络对应的多个账户关系网络图结构。
[0118]
在另一示例性的实施例中,关联权重确定单元包括:
[0119]
资金关系类型获取子单元,配置为根据任意两个节点对应的账户之间的资金关系,获取任意两个节点关联的交易对手信息和交易资金信息;多关联权重获取子单元,配置为根据任意两个节点关联的交易对手信息和任意两个节点之间的非资金关系,确定任意两个节点之间的第一关联权重,以及根据任意两个节点关联的交易资金信息和任意两个节点之间的非资金关系,确定任意两个节点之间的第二关联权重。
[0120]
在另一示例性的实施例中,多关联权重获取子单元包括:
[0121]
第一关联权重获取子单元,配置为根据任意两个节点关联的交易对手信息,确定任意两个节点之间的共同交易对手数量,以及任意两个节点中所有节点的交易对手数量之和,并计算共同交易对手数量与所有节点的交易对手数量之和的比值;确定任意两个节点之间的非资金关系对应的赋值;针对比值和赋值进行加权和运算,得到任意两个节点之间的第一关联权重;
[0122]
第二关联权重获取子单元,配置为根据任意两个节点关联的资金交易信息,确定任意两个节点之间的资金往来总量以及所有节点的资金交易总量之和,并计算资金往来总量与所有节点的资金交易总量之和的比值;确定任意两个节点之间的非资金关系对应的赋值;针对比值和赋值进行加权和运算,得到任意两个节点之间的第二关联权重。
[0123]
在另一示例性的实施例中,深度特征提取模块230包括:
[0124]
账户特征图生成单元,配置为根据账户关系网络图结构中的各个节点对应的账户特征信息,生成账户关系网络图结构对应的账户特征图;特征聚合处理单元,配置为针对账户特征图进行特征聚合处理,得到账户关系网络图结构对应的聚合特征图,聚合特征图中含有对应于各个节点的聚合特征表示,聚合特征表示聚合了相应节点的邻居节点特征信息;深度特征表示获取单元,配置为将各个节点的聚合特征表示作为相应的各个账户的深度特征表示。
[0125]
在另一示例性的实施例中,特征聚合处理单元包括:
[0126]
邻居节点采样子单元,配置为针对账户特征图中的各个节点采样指定数量的邻居节点,得到各个节点对应的邻居节点集合;特征信息聚合子单元,配置为将邻居节点集合对应的邻居节点特征信息聚合至对应节点中,形成账户关系网络图结构中各个节点所对应的聚合特征,以得到聚合特征图。
[0127]
在另一示例性的实施例中,特征信息聚合子单元包括:
[0128]
聚合函数获取子单元,配置为获取训练得到的聚合函数,训练包括针对账户关系网络图结构中的各个节点提取深度特征表示的过程;聚合运算子单元,配置为根据聚合函数对邻居节点集合对应的邻居节点特征信息以及对应节点的账户特征信息进行聚合运算,将运算结果作为对应节点的聚合特征。
[0129]
在另一示例性的实施例中,特征聚合处理单元包括:
[0130]
邻接矩阵生成子单元,配置为生成账户特征图对应的邻接矩阵,矩阵中含有所有节点的特征向量以及节点之间的图连接关系;图卷积处理子单元,配置为针对邻接矩阵进行图卷积处理,以得到账户关系网络图结构对应的聚合特征图。
[0131]
在另一示例性的实施例中,风险概率预测模块250包括:
[0132]
特征分类处理单元,配置为将账户的多个深度特征表示以及账户特征信息作为待处理特征,对待处理特征进行特征分类处理,以得到相应账户的风险概率。
[0133]
在另一示例性的实施例中,账户风险识别模块270包括:
[0134]
关键特征获取单元,配置为若确定账户的风险概率大于风险阈值,则获取用于描述社交网络中的风险场景所对应的关键特征;关键特征对比单元,配置为若风险概率大于风险阈值的账户符合关键特征,则将风险概率大于风险阈值的账户识别为风险账户。
[0135]
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
[0136]
本技术的实施例还提供了一种电子设备,包括处理器和存储器,其中,存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如前所述的识别社交网络中的风险账户的方法。
[0137]
图11示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。需要说明的是,图11示出的电子设备的计算机系统1600仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0138]
如图11所示,计算机系统1600包括中央处理单元(central processing unit,cpu)1601,其可以根据存储在只读存储器(read-only memory,rom)1602中的程序或者从储
存部分1608加载到随机访问存储器(random access memory,ram)1603中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在ram 1603中,还存储有系统操作所需的各种程序和数据。cpu 1601、rom 1602以及ram 1603通过总线1604彼此相连。输入/输出(input/output,i/o)接口1605也连接至总线1604。
[0139]
以下部件连接至i/o接口1605:包括键盘、鼠标等的输入部分1606;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1607;包括硬盘等的储存部分1608;以及包括诸如lan(local area network,局域网)卡、调制解调器等的网络接口卡的通信部分1609。通信部分1609经由诸如因特网的网络执行通信处理。驱动器1610也根据需要连接至i/o接口1605。可拆卸介质1611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1610上,以便于从其上读出的计算机程序根据需要被安装入储存部分1608。
[0140]
特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1609从网络上被下载和安装,和/或从可拆卸介质1611被安装。在该计算机程序被中央处理单元(cpu)1601执行时,执行本技术的系统中限定的各种功能。
[0141]
需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0142]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的
功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0143]
描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0144]
本技术的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前所述的识别社交网络中的风险账户的方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
[0145]
本技术的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的识别社交网络中的风险账户的方法。
[0146]
上述内容,仅为本技术的较佳示例性实施例,并非用于限制本技术的实施方案,本领域普通技术人员根据本技术的主要构思和精神,可以十分方便地进行相应的变通或修改,故本技术的保护范围应以权利要求书所要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1