识别可疑关系的方法以及装置与流程

文档序号:21888477发布日期:2020-08-18 17:35阅读:325来源:国知局
识别可疑关系的方法以及装置与流程

本说明书实施例涉及计算机技术领域,特别涉及一种识别可疑关系的方法。本说明书一个或者多个实施例同时涉及一种识别可疑关系的装置,一种计算设备,以及一种计算机可读存储介质。



背景技术:

随着互联网技术的发展,通过网络平台进行交易已经成为广大互联网用户普遍的行为。然而,网络平台交易在给用户带来便利的同时,也存在一些安全隐患。为了避免安全隐患,需要在网络平台发现产生这些安全隐患的黑灰产。

然而,随着网络平台的业务不断增长,黑灰产的行为方式不断升级,如何发现这些黑灰产,成为了人们关注的问题。



技术实现要素:

有鉴于此,本说明书施例提供了一种识别可疑关系的方法。本说明书一个或者多个实施例同时涉及一种识别可疑关系的装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面,提供了一种识别可疑关系的方法,包括:对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的;通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签;抽取出所述多个社区子图各自的关系特征;通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重;依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

可选地,还包括:依据识别出的可疑关系,对所述网络平台上各方之间的关系数据进行筛选,得到更新的关系数据,所述更新的关系数据用于构建更新的关系网络。

可选地,还包括:将设置了关系分类标签的所述多个社区子图作为已知可疑关系网络,加入所述可疑关系知识库。

可选地,还包括:对所述关系分类标签下的社区子图的关系特征,按照权重大小排序,得到所述关系分类标签下的可疑关系的重要性排名。

可选地,还包括:获取所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据;依据所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据,进行关系网络构建,得到小程序的关系网络。

可选地,在对关系网络进行社区检测之前,还包括:对所述关系网络中的节点进行异常交易检测,筛选出所述网络平台上不存在异常交易的节点;将所述不存在异常交易的节点从所述关系网络中剔除。

可选地,还包括:获取与所述社区子图具有相同关系分类标签的历史异常社区子图;通过将所述社区子图与所述历史异常社区子图进行相似度分析,得到对应关系分类标签下的共性可疑关系、共性可疑链接和/或可疑关系变化信息。

可选地,还包括:根据所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络的关联度,将关联度不满足预设关联度要求的社区子图从所述多个社区子图中剔除。

根据本说明书实施例的第二方面,提供了一种识别可疑关系的装置,包括:社区检测模块,被配置为对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的。关联计算模块,被配置为通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签。特征抽取模块,被配置为抽取出所述多个社区子图各自的关系特征。学习模块,被配置为通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重。关系确定模块,被配置为依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

可选地,还包括:数据筛选模块,被配置为依据识别出的可疑关系,对所述网络平台上各方之间的关系数据进行筛选,得到更新的关系数据,所述更新的关系数据用于构建更新的关系网络。

可选地,还包括:知识累积模块,被配置为将设置了关系分类标签的所述多个社区子图作为已知可疑关系网络,加入所述可疑关系知识库。

可选地,还包括:排名模块,被配置为对所述关系分类标签下的社区子图的关系特征,按照权重大小排序,得到所述关系分类标签下的可疑关系的重要性排名。

可选地,还包括:数据获取模块,被配置为获取所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据。网络构建模块,被配置为依据所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据,进行关系网络构建,得到小程序的关系网络。

可选地,还包括:异常筛选模块,被配置为对所述关系网络中的节点进行异常交易检测,筛选出所述网络平台上不存在异常交易的节点。网络更新模块,被配置为将所述不存在异常交易的节点从所述关系网络中剔除。

可选地,还包括:历史异常获取模块,被配置为获取与所述社区子图具有相同关系分类标签的历史异常社区子图。异常分析模块,被配置为通过将所述社区子图与所述历史异常社区子图进行相似度分析,得到对应关系分类标签下的共性可疑关系、共性可疑链接和/或可疑关系变化信息。

可选地,还包括:子图筛选模块,被配置为根据所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络的关联度,将关联度不满足预设关联度要求的社区子图从所述多个社区子图中剔除。

根据本说明书实施例的第三方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的;通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签;抽取出所述多个社区子图各自的关系特征;通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重;依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述识别可疑关系的方法的步骤。

本说明书一个实施例提供了识别可疑关系的方法,该方法对关系网络进行社区检测,得到多个社区子图,实现了对可能存在黑灰产的社区发现,该方法通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签,也即结合历史知识的关联度实现了对黑灰产的行为的识别,而且该方法又抽取出所述多个社区子图各自的关系特征,通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重,依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系,也即利用监督学习的方法,实现了智能地遵循黑灰产的行为模式,识别出黑灰产的核心可疑关系的目的。

附图说明

图1是本说明书一个实施例提供的一种识别可疑关系的方法的流程图;

图2是本说明书一个实施例提供的社区子图示意图;

图3是本说明书一个实施例提供的一种识别可疑关系的方法的处理过程流程图;

图4是本说明书一个实施例提供的一种识别可疑关系的装置的结构示意图;

图5是本说明书另一个实施例提供的一种识别可疑关系的装置的结构示意图;

图6是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在本说明书中,提供了一种识别可疑关系的方法,本说明书同时涉及一种识别可疑关系的装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。

图1示出了根据本说明书一个实施例提供的一种识别可疑关系的方法的流程图,包括步骤102至步骤110。

步骤102:对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的。

其中,所述网络平台上的各方例如可以包括用户、小程序、商户、设备等任意可能存在关系的平台角色。所述关系数据例如可以包括交易数据、注册数据、社交数据等任意可能存在关系的数据。所述关系网络例如可以包括节点以及用于连接节点的边。所述节点例如可以是所述网络平台上的任意角色,如用户、小程序、设备等。用户例如可以包括在小程序端消费的会员账户、小程序绑定的收款会员账户等。所述边也即关系例如可以表示为[src,dst,dge_property],其中src与dst表示一条边两端的节点,dge_property可以表示边的属性,边的属性例如可以是用户与商户的交易属性、用户与小程序的注册属性、用户与小程序的交易属性、用户与设备如wifi设备的使用属性、小程序与小程序之间的相似属性等任意用于表示两个节点之间关系的属性。

步骤104:通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签。

例如,所述可疑关系知识库可以包括:黑灰产名单关系网络、外部舆情与情报网络、案件投诉关系网络等已知可疑关系网络。这些已知可疑关系网络各自具有用于定义黑灰产行为所属类别的关系分类标签。

例如,在进行关联度计算时,可以计算已知可疑关系网络与待定的社区子图之间的核心顶点以及边的关联度。核心顶点可以是社区子图中入度最高的节点。

步骤106:抽取出所述多个社区子图各自的关系特征。

例如,抽取社区子图的关系特征,具体可以从社区子图的节点属性以及边的属性抽取。例如,如图2所示的社区子图,该社区子图的关系特征可以包括:收款账户a与小程序b之间边的交易属性如交易额、交易频次等特征;小程序c与开发者d之间的归属属性等。

步骤108:通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重。

例如,所述监督学习可以采用决策树、随机森林等算法。具体地,例如可以采用xgboots算法。例如,对于带有标签“y”的社区子图“x”,可以建立算法模型f和目标函数l,在f满足argmin(l(x,y))时,得到社区子图“x”的关系特征的权重。如图2所示的社区子图,该社区子图各边的关系特征的权重从初始的“1”,通过监督学习的迭代计算,重要关系的权重得以提升。例如在某些场景,黑灰产团伙会集中在某个开发者开发小程序,小程序和开发者的关系特征的权重提升到“10”。

步骤110:依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

例如,针对于某种关系分类标签,可以从该种关系分类标签下的社区子图的关系特征中,筛选出权重满足预设重要度要求的关系特征,将筛选出的关系特征所代表的关系作为对应的关系分类标签下的核心可疑关系。具体地,例如,所述预设重要度要求可以为权重排序在前预设位数,从而可以按权重从大到小的顺序排序,将权重排序在前预设位数的关系特征所代表的关系作为对应的关系分类标签下的核心可疑关系。再例如,所述预设重要度要求可以为权重大于预设权重阈值,从而可以将权重大于或等于预设权重阈值的关系特征所代表的关系作为对应的关系分类标签下的核心可疑关系。

例如,如图2所示的社区子图的关系分类标签为“xx”,经过监督学习的迭代,小程序和开发者的关系特征的权重提升到“10”,依据上述预设重要度要求的实施方式,可以确定“xx”这一关系分类标签下的核心可疑关系为小程序和开发者之间的关系。

可见,该方法对关系网络进行社区检测,得到多个社区子图,实现了对可能存在黑灰产的社区发现,该方法通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签,也即结合历史知识的关联度实现了对黑灰产的行为的识别。在确定了标签之后,为了能够识别社区子图中重要的可疑关系,且该方法又抽取出所述多个社区子图各自的关系特征,通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重,依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系,也即利用监督学习的方法,实现了智能地遵循黑灰产的行为模式,识别出黑灰产的核心可疑关系的目的。

本说明书一个或多个实施例中,还可以进一步依据识别出的可疑关系,对所述网络平台上各方之间的关系数据进行筛选,得到更新的关系数据,所述更新的关系数据用于构建更新的关系网络。

例如,可以预置用于筛选的权重阈值或权重排名阈值,依据识别出的可疑关系的权重确定权重较高的可疑关系,由于权重较高的可疑关系类型的关系比较重要。因此,从平台上各方之间的关系数据中,保留同样或相似类型的关系数据,剔除权重较低的关系类型的关系数据。从而在关系网络中,能够极大地保留体现当前黑灰产行为模式的重要关系数据,有助于后续对黑灰产的跟踪。

可见,通过将识别出的可疑关系反馈作用到关系数据的筛选上,能够极大地保留体现当前黑灰产行为模式的重要关系数据,动态地跟踪黑灰产的行为模式,提高后续识别的准确度,减少需要参与计算的数据量,减少对计算资源的占用,降低系统负载。

本说明书一个或多个实施例中,还可以进一步将设置了关系分类标签的所述多个社区子图作为已知可疑关系网络,加入所述可疑关系知识库。通过该实施例,将识别出关系分类标签的社区子图加入可疑关系知识库,实现了对历史知识的累积,有助于提高后续识别的准确度。

本说明书一个或多个实施例中,还可以进一步对所述关系分类标签下的社区子图的关系特征,按照权重大小排序,得到所述关系分类标签下的可疑关系的重要性排名。在该实施例中,通过可疑关系的重要性排名,使识别出的可疑关系在黑灰产中的作用更加明确,使识别出的可疑关系提供的信息更加详细。

本说明书一个或多个实施例中,考虑到小程序在网络平台提供入口,网络平台对小程序应用的权威性有隐含的认证作用,用户因为信赖网络平台而相信小程序应用的可靠,使小程序业务得以快速增长,为了保护网络安全以及用户的利益,本说明书实施例所述识别可疑关系的方法可以应用于小程序业务场景。在该场景中,该方法还可以包括:获取所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据;依据所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据,进行关系网络构建,得到小程序的关系网络。其中,所述各个小程序的用户的可信关系数据例如可以包括用户与用户之间的可信关系数据、用户与设备如wifi设备之间的可信关系数据等。

例如,在进行关系网络构建时,可以依据小程序页面的文本数据、小程序的注册数据、小程序上消费的用户的交易数据及介质数据、小程序上收款的用户的交易数据及介质数据、小程序的用户之间的可信关系数据进行节点嵌入向量表达计算,得到各个节点的向量表达。例如,对于各个小程序页面的文本数据、各个小程序的注册数据,可以先进行文本分词,再建立文档模型并降维得到小程序的主题向量表达,按照主题向量表达对各个小程序进行聚类,得到小程序与小程序之间的关系。在对所述小程序的关系网络进行社区检测时,可以利用半监督标签扩散、聚类、子图相似度计算、关系度量等方法实现社区检测。另外,根据实施场景需要,各方之间的关系数据还可以包括用户的通讯录等社交数据。

在该实施例中,由于关系数据中包含了平台上各个小程序页面的文本数据、各个小程序的注册数据、所述平台上会员个人数据、所述平台上会员之间的关系数据、以及所述会员的社交数据,从而得到了小程序的关系网络,实现了对小程序关系网络中黑灰产的社区发现,实现了在小程序应用场景中智能地遵循黑灰产行为模式,识别出黑灰产核心可疑关系的目的。

本说明书一个或多个实施例中,为了进一步减少参与计算的数据量,减少对计算资源的占用,降低系统负载,该方法还包括:对所述关系网络中的节点进行异常交易检测,筛选出所述网络平台上不存在异常交易的节点;将所述不存在异常交易的节点从所述关系网络中剔除。该实施例中,通过对节点的交易数据进行异常交易检测,筛选出存在异常交易的节点,构建关系网络,实现了对节点的动态热点采样,有效减少了参与计算的数据量。另一个实施例中,该方法还包括:根据所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络的关联度,将关联度不满足预设关联度要求的社区子图从所述多个社区子图中剔除。通过该实施例,减少了参与监督学习的数据量,有效减少了对计算资源的占用。

本说明书一个或多个实施例中,为了能够更加有效地跟踪黑灰产行为模式,识别黑灰产行为链路,该方法进一步获取与所述社区子图具有相同关系分类标签的历史异常社区子图;通过将所述社区子图与所述历史异常社区子图进行相似度分析,得到对应关系分类标签下的共性可疑关系、共性可疑链接和/或可疑关系变化信息。通过该实施例可以分析得到对应关系分类标签下的核心可疑关系的共性以及变化,以便于布防。

下面,对结合上述多个实施例的实施方式进行示例性说明。图3示出了本说明书一个实施例提供的一种识别可疑关系的方法的处理过程流程图,具体步骤包括步骤302至步骤324。

步骤302:获取网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据。

步骤304:依据所获取的数据,进行关系网络构建,得到小程序的关系网络。

步骤306:对所述关系网络中的节点进行异常交易检测,筛选出所述网络平台上不存在异常交易的节点。

步骤308:将所述不存在异常交易的节点从所述关系网络中剔除。

步骤310:对小程序的关系网络进行社区检测,得到多个社区子图。

步骤312:通过将多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签。

步骤314:根据所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络的关联度,将关联度不满足预设关联度要求的社区子图从所述多个社区子图中剔除。

步骤316:抽取出所述多个社区子图各自的关系特征。

步骤318:通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重。

步骤320:对所述关系分类标签下的社区子图的关系特征,按照权重大小排序,得到所述关系分类标签下的可疑关系的重要性排名。

步骤322:筛选出权重满足预设重要度要求的关系特征代表的关系,作为对应的关系分类标签下的核心可疑关系。

将识别出的核心可疑关系反馈到步骤302,以便依据识别出的可疑关系,对网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据进行筛选,得到更新的关系数据,从而重新进入步骤304,依据更新的关系数据,进行关系网络构建,得到小程序的关系网络。

步骤324:将设置了关系分类标签的所述多个社区子图作为已知可疑关系网络,加入所述可疑关系知识库。

可见,根据该实施例,将识别出关系分类标签的社区子图加入可疑关系知识库,使得历史知识能得以及时更新,根据识别出的可疑关系筛选下次识别的关系数据,使得关系网络中能够极大地保留体现当前黑灰产行为模式的重要关系数据,因此,这两套反馈机制能够及时跟踪黑灰产行为模式,利用监督学习的方法,智能地遵循黑灰产行为模式,识别出黑灰产核心可疑关系。

与上述方法实施例相对应,本说明书还提供了识别可疑关系的装置实施例,图4示出了本说明书一个实施例提供的一种识别可疑关系的装置的结构示意图。如图4所示,该装置包括:社区检测模块402、关联计算模块404、特征抽取模块406、学习模块408及关系确定模块410。

该社区检测模块402,可以被配置为对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的。

该关联计算模块404,可以被配置为通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签。

该特征抽取模块406,可以被配置为抽取出所述多个社区子图各自的关系特征。

该学习模块408,可以被配置为通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重。

该关系确定模块410,可以被配置为依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

可见,该装置对关系网络进行社区检测,得到多个社区子图,实现了对可能存在黑灰产的社区发现,通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签,也即结合历史知识的关联度实现了对黑灰产的行为的识别。在确定了标签之后,为了能够识别社区子图中重要的可疑关系,且又抽取出所述多个社区子图各自的关系特征,通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重,依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系,也即利用监督学习的方式,实现了智能地遵循黑灰产的行为模式,识别出黑灰产的核心可疑关系的目的。

图5示出了本说明书另一个实施例提供的一种识别可疑关系的装置的结构示意图。如图5所示,该装置还包括:数据筛选模块412,可以被配置为依据识别出的可疑关系,对所述网络平台上各方之间的关系数据进行筛选,得到更新的关系数据,所述更新的关系数据用于构建更新的关系网络。该实施例通过将识别出的可疑关系反馈作用到关系数据的筛选上,能够极大地保留体现当前黑灰产行为模式的重要关系数据,动态地跟踪黑灰产的行为模式,提高后续识别的准确度,减少需要参与计算的数据量,减少对计算资源的占用,降低系统负载。

本说明书一个或多个实例中,如图5所示,该装置还包括:知识累积模块414,可以被配置为将设置了关系分类标签的所述多个社区子图作为已知可疑关系网络,加入所述可疑关系知识库。通过该实施例,将识别出关系分类标签的社区子图加入可疑关系知识库,实现了对历史知识的累积,有助于提高后续识别的准确度。

本说明书一个或多个实例中,如图5所示,该装置还包括:排名模块416,可以被配置为对所述关系分类标签下的社区子图的关系特征,按照权重大小排序,得到所述关系分类标签下的可疑关系的重要性排名。在该实施例中,通过可疑关系的重要性排名,使识别出的可疑关系在黑灰产的作用更加明确,使识别出的可疑关系提供的信息更加详细。

本说明书一个或多个实例中,如图5所示,该装置还包括:数据获取模块418,可以被配置为获取所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据。网络构建模块420,可以被配置为依据所述网络平台上各个小程序页面的文本数据、所述各个小程序的注册数据、所述各个小程序上消费的用户的交易数据及介质数据、所述各个小程序上收款的用户的交易数据及介质数据、所述各个小程序的用户的可信关系数据,进行关系网络构建,得到小程序的关系网络。在该实施例中,由于关系数据中包含了平台上各个小程序页面的文本数据、各个小程序的注册数据、所述平台上会员个人数据、所述平台上会员之间的关系数据、以及所述会员的社交数据,从而得到了小程序的关系网络,实现了对小程序关系网络中黑灰产的社区发现,实现了在小程序应用场景中智能地遵循黑灰产的行为模式,识别出黑灰产的核心可疑关系的目的。

本说明书一个或多个实例中,如图5所示,该装置还包括:异常筛选模块422,可以被配置为对所述关系网络中的节点进行异常交易检测,筛选出所述网络平台上不存在异常交易的节点。网络更新模块424,可以被配置为将所述不存在异常交易的节点从所述关系网络中剔除。该实施例中,通过对节点的交易数据进行异常交易检测,筛选出存在异常交易的节点,构建关系网络,实现了对节点的动态热点采样,有效减少了参与计算的数据量。

本说明书一个或多个实例中,如图5所示,该装置还包括:历史异常获取模块424,可以被配置为获取与所述社区子图具有相同关系分类标签的历史异常社区子图。异常分析模块426,可以被配置为通过将所述社区子图与所述历史异常社区子图进行相似度分析,得到对应关系分类标签下的共性可疑关系、共性可疑链接和/或可疑关系变化信息。通过该实施例可以分析得到对应关系分类标签下的核心可疑关系的共性以及变化,以便于布防。

本说明书一个或多个实例中,该装置还包括:子图筛选模块428,可以被配置为根据所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络的关联度,将关联度不满足预设关联度要求的社区子图从所述多个社区子图中剔除。通过该实施例,减少了参与监督学习的数据量,有效减少了对计算资源的占用。

上述为本实施例的一种识别可疑关系的装置的示意性方案。需要说明的是,该识别可疑关系的装置的技术方案与上述的识别可疑关系的方法的技术方案属于同一构思,识别可疑关系的装置的技术方案未详细描述的细节内容,均可以参见上述识别可疑关系的方法的技术方案的描述。

图6示出了根据本说明书一个实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。

计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。

在本说明书的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。

计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备600还可以是移动式或静止式的服务器。

其中,处理器620用于执行如下计算机可执行指令:

对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的;

通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签;

抽取出所述多个社区子图各自的关系特征;

通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重;

依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的识别可疑关系的方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述识别可疑关系的方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:

对关系网络进行社区检测,得到多个社区子图,其中,所述关系网络是根据网络平台上各方之间的关系数据构建的;

通过将所述多个社区子图与可疑关系知识库中的各个已知可疑关系网络进行关联度计算,为所述多个社区子图分别设置关联的已知可疑关系网络的关系分类标签;

抽取出所述多个社区子图各自的关系特征;

通过将所述多个社区子图各自的关系特征以及各自的关系分类标签作为输入进行监督学习,得到所述多个社区子图各自的关系特征的权重;

依据所述多个社区子图各自的关系特征的权重,确定对应关系分类标签下的可疑关系。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的识别可疑关系的方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述识别可疑关系的方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1