一种基于链路预测的用电客户虚假绑定识别方法及装置与流程

文档序号:30267283发布日期:2022-06-02 04:57阅读:83来源:国知局
一种基于链路预测的用电客户虚假绑定识别方法及装置与流程

1.本发明涉及知识图谱技术领域,特别是涉及一种基于链路预测的用电客户虚假绑定识别方法、装置、系统及计算机可读存储介质。


背景技术:

2.随着图计算、自然语言处理等技术地快速发展,知识图谱技术更加成熟,被广泛应用于国家电网各信息化项目当中。在使用知识图谱技术,对营销系统用电客户关系进行建模过程中发现,部分用户信息存在更新不及时、户号绑定较为随意、户号无关账号绑定等现象。目前,缺少用电客户与户号关联度的研究,对于无效的联系方式以及用电客户与户号之间绑定关系,无法进行有效的识别,从而影响推广信息的精准送达。
3.鉴于此,如何识别用电客户中的虚假绑定成为本领域技术人员需要解决的问题。


技术实现要素:

4.本发明实施例的目的是提供一种基于链路预测的用电客户虚假绑定识别方法、装置、系统及计算机可读存储介质,在使用过程中能够实现对虚假绑定的识别,有利于使推广信息准确送达。
5.为解决上述技术问题,本发明实施例提供了一种基于链路预测的用电客户虚假绑定识别方法,包括:
6.获取用电客户图谱;
7.计算出所述用电客户图谱中每个节点的度值;
8.针对每个节点,确定出与所述节点对应的各邻居节点;
9.针对每个所述邻居节点,根据所述节点的度值及与所述节点对应的邻居节点的度值,计算出所述节点与所述邻居节点之间的亲密度;
10.根据与每个所述邻居节点分别对应的亲密度,识别出与所述节点存在虚假绑定的邻居节点。
11.可选的,所述根据所述节点的度值及与所述节点对应的邻居节点的度值,计算出所述节点与所述邻居节点之间的亲密度的过程包括:
12.从各个节点中确定出与所述邻居节点对应的各个次邻居节点;
13.根据所述节点的度值以及各个所述次邻居节点的度值,计算出所述节点与所述邻居节点之间的优先连接指标;
14.计算出所述节点与所述邻居节点之间的一阶路径指标;
15.根据所述优先连接指标和所述一阶路径指标,计算出所述节点与所述邻居节点之间的亲密度。
16.可选的,所述根据所述节点的度值以及各个所述次邻居节点的度值,计算出所述节点与所述邻居节点之间的优先连接指标的过程包括:
17.根据所述节点的度值以及各个所述次邻居节点的度值以及第一计算关系式,计算
出所述节点与所述邻居节点之间的优先连接指标,其中:
18.所述第一计算关系式为:
19.其中,mpa(i,x)表示节点i与邻居节点x之间的优先连接指标,n(x)为邻居节点x的所有次邻居节点集合,ki表示节点i的度值,kn表示第n个次邻居节点的度值。
20.可选的,所述计算出所述节点与所述邻居节点之间的一阶路径指标的过程包括:
21.根据所述节点与所述邻居节点之间的业务数据,计算出每类关系的权重;
22.根据第二计算关系式计算出所述节点与所述邻居节点之间的一阶路径指标,其中,第二计算关系式为:
23.其中,l(i,x)为节点i与邻居节点x之间的一阶路径指标,e(i,x)表示节点i与邻居节点x之间的关系集合,e表示当前关系,αe表示当前关系的权重,le表示当前关系是否存在。
24.可选的,所述关系的类别包括电器联系人、缴费、工单、户主和发票。
25.可选的,所述根据与每个所述邻居节点分别对应的亲密度,识别出与所述节点存在虚假绑定的邻居节点的过程包括:
26.将与每个所述邻居节点分别对应的亲密度按照大小排序;
27.将亲密度最大的预设数量的邻居节点作为真实关系节点,将其他的邻居节点作为虚假关系节点。
28.本发明实施例还提供了一种基于链路预测的用电客户虚假绑定识别装置,包括:
29.获取模块,用于获取用电客户图谱;
30.第一计算模块,用于计算出所述用电客户图谱中每个节点的度值;
31.确定模块,用于针对每个节点,确定出与所述节点对应的各邻居节点;
32.第二计算模块,用于针对每个所述邻居节点,根据所述节点的度值及与所述节点对应的邻居节点的度值,计算出所述节点与所述邻居节点之间的亲密度;
33.识别模块,用于根据与每个所述邻居节点分别对应的亲密度,识别出与所述节点存在虚假绑定的邻居节点。
34.可选的,所述第二计算模块包括:
35.确定单元,用于从各个节点中确定出与所述邻居节点对应的各个次邻居节点;
36.第一计算单元,用于根据所述节点的度值以及各个所述次邻居节点的度值,计算出所述节点与所述邻居节点之间的优先连接指标;
37.第二计算单元,用于计算出所述节点与所述邻居节点之间的一阶路径指标;
38.第三计算单元,用于根据所述优先连接指标和所述一阶路径指标,计算出所述节点与所述邻居节点之间的亲密度。
39.本发明实施例还提供了一种基于链路预测的用电客户虚假绑定识别系统,包括:
40.存储器,用于存储计算机程序;
41.处理器,用于执行所述计算机程序时实现如上述所述基于链路预测的用电客户虚假绑定识别方法的步骤。
42.本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述基于链路预测的用电客户虚假绑定识别方法的步骤。
43.本发明实施例提供了一种基于链路预测的用电客户虚假绑定识别方法、装置、系统及计算机可读存储介质,该方法包括:获取用电客户图谱;计算出用电客户图谱中每个节点的度值;针对每个节点,确定出与节点对应的各邻居节点;针对每个邻居节点,根据节点的度值及与节点对应的邻居节点的度值,计算出节点与邻居节点之间的亲密度;根据与每个邻居节点分别对应的亲密度,识别出与节点存在虚假绑定的邻居节点。
44.可见,本发明实施例通过获取用电客户图谱,并计算出用电客户图谱中每个节点的度值,确定出每个节点各自的邻居节点,并针对每个节点的每个邻居节点,根据该节点的度值及邻居节点的度值,计算出节点与邻居节点之间的亲密度,从而可以得到该节点与每个邻居节点各自对应的亲密度,并根据各个亲密度识别出与节点存在虚假绑定的邻居节点;本发明实施例在使用过程中能够实现对虚假绑定的识别,有利于使推广信息准确送达。
附图说明
45.为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
46.图1为本发明实施例提供的一种基于链路预测的用电客户虚假绑定识别方法的流程示意图;
47.图2为发明实施例提供的一种用电客户图谱的示意图;
48.图3为发明实施例提供的另一种用电客户图谱的示意图;
49.图4为本发明实施例提供的一种基于链路预测的用电客户虚假绑定识别装置的结构示意图。
具体实施方式
50.本发明实施例提供了一种基于链路预测的用电客户虚假绑定识别方法、装置、系统及计算机可读存储介质,在使用过程中能够实现对虚假绑定的识别,有利于使推广信息准确送达。
51.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
52.请参照图1,图1为本发明实施例提供的一种基于链路预测的用电客户虚假绑定识别方法的流程示意图。该方法包括:
53.s110:获取用电客户图谱;
54.需要说明的是,本发明实施例中可以通过获取用户基础账户信息以及用户行为信息,然后基于该用户基础账户信息和用户行为信息,构建用电客户图谱。
55.具体的,可以获取缴费数据、发票数据、工单、工单数、户主认证及电气联系人数据以及用电客户的户号与手机联系人之间的关联数据,其中可以利用缴费数据分析用户与户号之间的缴费关联关系,利用发票数据分析用户是否给户号办理过发票数据,利用工单数分析用户是否给户号办理过工单数据,利用户主认证及电气联系人数据分析用户是否是户主认证或电气联系人。
56.具体在搭建用电客户图谱时,图谱数据库可以存储实体、实体关系、实体属性等信息,其中,图谱主要包括两类实体和5类关系,其中两类实体分别为户号以及联系人手机号,5类关系分别为户主、工单、电气联系人、发票和缴费,图谱中手机号与户号之间发生关系,即可能存在边,手机号与手机号之间、户号与户号之间不发生关系。例如图2所示的一个拓扑关系,其中,w、x、y、z为不同联系人手机号,i、j为不同的用电户号。具体的,户号i关联了4个联系人手机号w、x、y、z,户号j关联了1个联系人手机号z,户号i与联系人手机号x之间存在3条关系边,分别为户主、工单和发票关系。
57.s120:计算出用电客户图谱中每个节点的度值;
58.具体的,本发明实施例中在构建好用电客户图谱后,确定出各个节点,并计算出每个节点的度值,例如,针对图2中的节点w的度值为1,节点x的度值为3,节点y的度值为1,节点z的度值为3,节点i的度值为6,节点j的度值为2。
59.s130:针对每个节点,确定出与节点对应的各邻居节点;
60.需要说明的是,本发明实施例中针对每个节点,确定出与该节点对应的邻居节点,例如图2中的节点i的邻居节点为节点x、节点w、节点y和节点z,节点x的邻居节点为节点i,节点w的邻居节点为节点i,节点z的邻居节点为节点i和节点j,节点y的邻居节点为节点i,节点j的邻居节点为节点z。
61.s140:针对每个邻居节点,根据节点的度值及与节点对应的邻居节点的度值,计算出节点与邻居节点之间的亲密度;
62.具体的,在确定出与每个节点各自对应的邻居节点后,针对任意一个节点,都可以根据该节点的度值以及与其中邻居节点的度值进一步计算出该节点与该邻居节点之间的亲密度,从而可以得到与该节点对应的多个亲密度,每个亲密度对应一个邻居节点。
63.s150:根据与每个邻居节点分别对应的亲密度,识别出与节点存在虚假绑定的邻居节点。
64.需要说明的是,针对每一个节点,根据与该节点对应的各亲密度,能够进一步识别出与该节点对应的各个邻居节点中哪些节点是虚假绑定,哪些节点是真实绑定。具体可以将与该节点对应的各亲密度进行按照大小排序,然后将亲密度最大的预设数量的邻居节点作为真实关系节点,将其他的邻居节点作为虚假关系节点。也即,可以将亲密度最大的两个邻居节点与该节点之间的绑定认为是真实绑定,将其他亲密度的邻居节点与该节点之间的绑定认为是虚假绑定。
65.进一步的,上述s140中根据节点的度值及与节点对应的邻居节点的度值,计算出节点与邻居节点之间的亲密度的过程,具体可以包括:
66.从各个节点中确定出与邻居节点对应的各个次邻居节点;
67.根据节点的度值以及各个次邻居节点的度值,计算出节点与邻居节点之间的优先连接指标;
68.计算出节点与邻居节点之间的一阶路径指标;
69.根据优先连接指标和一阶路径指标,计算出节点与邻居节点之间的亲密度。
70.需要说明的是,针对任意个节点均可以采用本发明实施例中提供的方法计算该节点与其中任意一个邻居节点的亲密度,具体的针对一个节点及与其对应的一个邻居节点,可以从用电客户图谱中确定出与该邻居节点对应的各次邻居节点,也即,找出该邻居节点的邻居节点,本发明实施例中将该邻居节点的邻居节点作为次邻居节点。在确定出与邻居节点对应的各次邻居节点后,可以进一步根据该节点的度值以及各个次邻居节点的度值,计算出节点与邻居节点之间的优先连接指标,又由于节点之间的亲密度还与节点之间的链接路径有关,不同类别的边传递的亲密度也不同,因此本发明实施例中还计算出节点与邻居节点之间的一阶路径指标,再根据节点与该邻居节点之间的优先连接指标和一阶路径指标,进一步计算出节点与该邻居节点之间的亲密度。
71.具体的,上述根据节点的度值以及各个次邻居节点的度值,计算出节点与邻居节点之间的优先连接指标的过程,具体可以包括:
72.根据节点的度值以及各个次邻居节点的度值以及第一计算关系式,计算出节点与邻居节点之间的优先连接指标,其中:
73.第一计算关系式为:
74.其中,mpa(i,x)表示节点i与邻居节点x之间的优先连接指标,n(x)为邻居节点x的所有次邻居节点集合,ki表示节点i的度值,kn表示第n个次邻居节点的度值。
75.也即,计算节点i与邻居节点x之间的优先连接指标,可以先确定出邻居节点x的各个次邻居节点,这些次邻居节点的集合为n(x),然后根据上述计算关系式即可计算出节点与该邻居节点之间的优先连接指标,采用本发明实施例中所提的方法计算出的优先连接指标更加准确,有利于提高亲密度的精确度。
76.具体的,上述计算出节点与邻居节点之间的一阶路径指标的过程包括:
77.根据节点与邻居节点之间的业务数据,计算出每类关系的权重;
78.根据第二计算关系式计算出节点与邻居节点之间的一阶路径指标,其中,第二计算关系式为:
79.其中,l(i,x)为节点i与邻居节点x之间的一阶路径指标,e(i,x)表示节点i与邻居节点x之间的关系集合,例如包括e
电气联系人
、e
缴费
、e
工单
、e
户主
、e
发票
,e表示当前关系,αe表示当前关系的权重,le表示当前关系是否存在,le的取值为0或1。
80.需要说明的是,本发明实施例中具体可以采用加权的方式计算出一阶路径指标,具体可以获取节点与该邻居节点之间的业务数据,并根据该业务数据计算出每类关系的权重,其中,关系的类别包括电器联系人、缴费、工单、户主和发票,当某类关系的数据不存在时,则该关系的权重为0。在计算出每类关系的权重后,可以根据上述第二计算关系式进一步计算出节点与该邻居节点之间的一阶路径指标。
81.例如图3所示的用电客户图谱,假设节点i与节点x的边为电气联系人、缴费、发票,节点j与节点x两条边的关系分别为电气联系人、发票,节点k与节点x的边为电气联系人关
系,假设业务数据得到的权重分别为α
电气联系人
=0.1,α
缴费
=0.25,α
工单
=0.2,α
户主
=0.2,α
发票
=0.25。可以得出节点x与其三个邻居的亲密度:
[0082][0083][0084][0085]
从而可以得出节点i与节点x的亲密度值最大,这也与直观的观察结果相符,可以认为节点i和节点j与节点x之间为真实绑定,节点k与节点x之前为虚假绑定,后续进行推广信息的发送时,可以发送至节点i和节点j以便推广信息准确送达。
[0086]
可见,本发明实施例通过获取用电客户图谱,并计算出用电客户图谱中每个节点的度值,确定出每个节点各自的邻居节点,并针对每个节点的每个邻居节点,根据该节点的度值及邻居节点的度值,计算出节点与邻居节点之间的亲密度,从而可以得到该节点与每个邻居节点各自对应的亲密度,并根据各个亲密度识别出与节点存在虚假绑定的邻居节点;本发明实施例在使用过程中能够实现对虚假绑定的识别,有利于使推广信息准确送达。
[0087]
在上述实施例的基础上,本发明实施例还提供了一种基于链路预测的用电客户虚假绑定识别装置,具体请参照图4,该装置包括:
[0088]
获取模块21,用于获取用电客户图谱;
[0089]
第一计算模块22,用于计算出用电客户图谱中每个节点的度值;
[0090]
确定模块23,用于针对每个节点,确定出与节点对应的各邻居节点;
[0091]
第二计算模块24,用于针对每个邻居节点,根据节点的度值及与节点对应的邻居节点的度值,计算出节点与邻居节点之间的亲密度;
[0092]
识别模块25,用于根据与每个邻居节点分别对应的亲密度,识别出与节点存在虚假绑定的邻居节点。
[0093]
可选的,第二计算模块24包括:
[0094]
确定单元,用于从各个节点中确定出与邻居节点对应的各个次邻居节点;
[0095]
第一计算单元,用于根据节点的度值以及各个次邻居节点的度值,计算出节点与邻居节点之间的优先连接指标;
[0096]
第二计算单元,用于计算出节点与邻居节点之间的一阶路径指标;
[0097]
第三计算单元,用于根据优先连接指标和一阶路径指标,计算出节点与邻居节点之间的亲密度。
[0098]
需要说明的是,本发明实施例中提供的基于链路预测的用电客户虚假绑定识别装置具有与上述实施例提供的用电客户虚假绑定方法相同的有益效果,并且对于本发明实施例中所设计到的用电客户虚假绑定方法的具体介绍请参照上述实施例,本发明在此不再赘述。
[0099]
在上述实施例的基础上,本发明实施例还提供了一种基于链路预测的用电客户虚假绑定识别系统,该系统包括:
[0100]
存储器,用于存储计算机程序;
[0101]
处理器,用于执行计算机程序时实现如上述基于链路预测的用电客户虚假绑定识别方法的步骤。
[0102]
例如,本发明实施例中的处理器具体可以用于实现获取用电客户图谱;计算出用电客户图谱中每个节点的度值;针对每个节点,确定出与节点对应的各邻居节点;针对每个邻居节点,根据节点的度值及与节点对应的邻居节点的度值,计算出节点与邻居节点之间的亲密度;根据与每个邻居节点分别对应的亲密度,识别出与节点存在虚假绑定的邻居节点。
[0103]
在上述实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述基于链路预测的用电客户虚假绑定识别方法的步骤。
[0104]
该计算机可读存储介质可以包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0105]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0106]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0107]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0108]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其他形式的存储介质中。
[0109]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1