本发明涉及电力技术领域,更具体地说,涉及一种关联度计算方法及装置。
背景技术:
近年来,随着电力业务的不断发展,国家电网公司积累了大量的电力客户。传统的电力客户管理模式主要是对客户进行单点服务,较少关注客户之间的相关性,这就会导致公司对于客户信息把握不全面并且工作效率低下。
目前,对电力客户之间关联性主要是专家利用自身经验人为度量,但是,随着业务规模扩大,电力数据也在不断增加,这种人为识别的方式所需的工作量和工作难度会大大增加。
技术实现要素:
有鉴于此,本发明提供关联度计算方法及装置,以解决现有人为识别电力客户之间关联性所需的工作量和工作难度会大大增加的问题。技术方案如下:
一种关联度计算方法,包括:
从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;
针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;
针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。
优选的,所述根据对比客户信息和目标客户信息计算单因子匹配相似度,包括:
分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;
分别解析所述对比客户指标集合和所述目标客户指标集合中包含的各个指标,得到对应的指标类型,所述指标类型为纯文本型、具有层次性结构的文本型或数值型;
根据所述指标类型对所述对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据所述指标类型对所述目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;
计算所述对比客户纯文本型指标集合和所述目标客户纯文本型指标集合的文本相似度,并判断所述文本相似度是否为0;
当所述文本相似度为0时,确定单因子匹配相似度为0;
当所述文本相似度不为0时,计算所述对比客户具有层次性结构的文本型指标集合和所述目标客户具有层次性结构的文本型指标集合的层级相似度,并判断所述层级相似度是为0;
当所述层级相似度为0时,将所述文本相似度确定为单因子匹配相似度;
当所述层级相似度不为0时,计算所述对比客户数值型指标集合和所述目标客户数值型指标集合的数值相似度;
根据所述文本相似度、所述层级相似度和所述数值相似度及其各自对应的权重值,计算单因子匹配相似度。
优选的,所述根据对比客户用电信息和目标客户用电信息计算多因子复合相似度,包括:
根据对比客户用电信息和目标客户用电信息判断所述对比客户和所述目标客户是否属于同一用电类别客户;
当所述对比客户和所述目标客户不属于同一用电类别客户时,确定多因子复合相似度为0;
当所述对比客户和所述目标客户属于同一用电类别客户时,从所述对比客户用电信息中获取所述对比客户的对比用电量信息以及对比信用信息,同时,从所述目标客户用电信息中获取所述目标客户的目标用电量信息以及目标信用信息;
根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,同时,根据所述对比信用信息和所述目标信用信息确定信用维度相似度;
根据所述用电维度相似度和所述信用维度相似度及其各自对应的权重值,计算多因子复合相似度。
优选的,所述根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,包括:
分别从所述对比用电量信息和所述目标用电量信息中获取对比用电量指标值集合和目标用电量指标值集合,并生成相应的对比用电曲线和目标用电曲线;
针对所述对比用电曲线和所述目标用电曲线,选取曲线端点和至少一个曲线采样点,并根据所述曲线端点的位置值确定各个所述曲线采样点的位置值;
根据所述对比用电曲线上的各个所述曲线采样点的用电量指标值和所述目标用电曲线上的各个所述曲线采样点的用电量指标值,计算曲线数值相似度;
依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度;
根据所述曲线数值相似度和所述曲线形状相似度及其各自对应的权重值,计算用电维度相似度。
优选的,所述依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度,包括:
根据所述对比用电曲线上的各个所述曲线采样点的位置值计算所述对比用电曲线的质心位置值,同时,根据所述目标用电曲线上的各个所述曲线采样点的位置值计算所述目标用电曲线的质心位置值,所述质心用于表征曲线中心点;
针对所述对比用电曲线和所述目标用电曲线,根据对应的各个所述质心向量计算各个所述曲线采样点的质心距离增量;
针对所述对比用电曲线和所述目标用电曲线,依据对应的各个所述质心距离增量构建曲线质心增量矩阵;
根据所述对比用电曲线的曲线质心增量矩阵和所述目标用电曲线的曲线质心增量矩阵,计算曲线形状相似度。
一种关联度计算装置,包括:客户确定模块、相似度计算模块和关联度计算模块;
所述客户确定模块,用于从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;
所述相似度计算模块,用于针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;
所述关联度计算模块,用于针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。
优选的,所述相似度计算模块包括:单因子匹配相似度计算模块;所述单因子匹配相似度计算模块包括指标集合获取单元、解析单元、指标集合划分单元、文本相似度计算判断单元、第一确定单元、层级相似度计算判断单元、第二确定单元、数值相似度计算单元和单因子匹配相似度计算单元;
所述指标集合获取单元,用于分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;
所述解析单元,用于分别解析所述对比客户指标集合和所述目标客户指标集合中包含的各个指标,得到对应的指标类型,所述指标类型为纯文本型、具有层次性结构的文本型或数值型;
所述指标集合划分单元,用于根据所述指标类型对所述对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据所述指标类型对所述目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;
所述文本相似度计算判断单元,用于计算所述对比客户纯文本型指标集合和所述目标客户纯文本型指标集合的文本相似度,并判断所述文本相似度是否为0;
所述第一确定单元,用于当所述文本相似度为0时,确定单因子匹配相似度为0;
所述层级相似度计算判断单元,用于当所述文本相似度不为0时,计算所述对比客户具有层次性结构的文本型指标集合和所述目标客户具有层次性结构的文本型指标集合的层级相似度,并判断所述层级相似度是为0;
所述第二确定单元,用于当所述层级相似度为0时,将所述文本相似度确定为单因子匹配相似度;
所述数值相似度计算单元,用于当所述层级相似度不为0时,计算所述对比客户数值型指标集合和所述目标客户数值型指标集合的数值相似度;
所述单因子匹配相似度计算单元,用于根据所述文本相似度、所述层级相似度和所述数值相似度及其各自对应的权重值,计算单因子匹配相似度。
优选的,所述相似度计算模块还包括:多因子复合相似度计算模块;所述多因子复合相似度计算模块包括判断单元、第三确定单元、信息获取单元、相似度计算单元和多因子复合相似度计算单元;
所述判断单元,用于根据对比客户用电信息和目标客户用电信息判断所述对比客户和所述目标客户是否属于同一用电类别客户;
所述第三确定单元,用于当所述对比客户和所述目标客户不属于同一用电类别客户时,确定多因子复合相似度为0;
所述信息获取单元,用于当所述对比客户和所述目标客户属于同一用电类别客户时,从所述对比客户用电信息中获取所述对比客户的对比用电量信息以及对比信用信息,同时,从所述目标客户用电信息中获取所述目标客户的目标用电量信息以及目标信用信息;
所述相似度计算单元,用于根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,同时,根据所述对比信用信息和所述目标信用信息确定信用维度相似度;
所述多因子复合相似度计算单元,用于根据所述用电维度相似度和所述信用维度相似度及其各自对应的权重值,计算多因子复合相似度。
优选的,所述相似度计算单元包括:用电维度相似度计算单元;所述用电维度相似度计算单元包括用电曲线生成子单元、选取确定子单元、曲线数值相似度计算子单元、曲线形状相似度计算子单元和用电维度相似度计算子单元;
所述用电曲线生成子单元,用于分别从所述对比用电量信息和所述目标用电量信息中获取对比用电量指标值集合和目标用电量指标值集合,并生成相应的对比用电曲线和目标用电曲线;
所述选取确定子单元,用于针对所述对比用电曲线和所述目标用电曲线,选取曲线端点和至少一个曲线采样点,并根据所述曲线端点的位置值确定各个所述曲线采样点的位置值;
所述曲线数值相似度计算子单元,用于根据所述对比用电曲线上的各个所述曲线采样点的用电量指标值和所述目标用电曲线上的各个所述曲线采样点的用电量指标值,计算曲线数值相似度;
所述曲线形状相似度计算子单元,用于依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度;
所述用电维度相似度计算子单元,用于根据所述曲线数值相似度和所述曲线形状相似度及其各自对应的权重值,计算用电维度相似度。
优选的,所述曲线形状相似度计算子单元包括:质心位置值计算子单元、质心距离增量计算子单元、曲线质心增量矩阵构建子单元和计算子单元;
所述质心位置值计算子单元,用于根据所述对比用电曲线上的各个所述曲线采样点的位置值计算所述对比用电曲线的质心位置值,同时,根据所述目标用电曲线上的各个所述曲线采样点的位置值计算所述目标用电曲线的质心位置值,所述质心用于表征曲线中心点;
所述质心距离增量计算子单元,用于针对所述对比用电曲线和所述目标用电曲线,根据对应的各个所述质心向量计算各个所述曲线采样点的质心距离增量;
所述曲线质心增量矩阵构建子单元,用于针对所述对比用电曲线和所述目标用电曲线,依据对应的各个所述质心距离增量构建曲线质心增量矩阵;
所述计算子单元,用于根据所述对比用电曲线的曲线质心增量矩阵和所述目标用电曲线的曲线质心增量矩阵,计算曲线形状相似度。
相较于现有技术,本发明实现的有益效果为:
以上本发明提供的一种关联度计算方法及装置,该方法通过同时计算两个用电客户在客户信息和客户用电信息两个方面的相似度,来计算两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例一公开的一种关联度计算方法流程图;
图2为本发明实施例二公开的一种关联度计算方法部分流程图;
图3为本发明实施例二公开的另一种关联度计算方法部分流程图;
图4为本发明实施例二公开的另一种关联度计算方法部分流程图;
图5为本发明实施例二公开的另一种关联度计算方法部分流程图;
图6为本发明实施例三公开的一种关联度计算装置结构示意图;
图7为本发明实施例四公开的一种关联度计算装置部分结构示意图;
图8为本发明实施例四公开的另一种关联度计算装置部分结构示意图;
图9为本发明实施例四公开的另一种关联度计算装置部分结构示意图;
图10为本发明实施例四公开的另一种关联度计算装置部分结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例一公开了一种关联度计算方法,应用于关联度计算装置,方法流程图如图1所示,包括如下步骤:
S101,从后台数据库中调取至少两个用电客户的电力数据,并从各个用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;
在执行步骤S101的过程中,在国家电网公司的后台数据库中可调取至少两个用电客户的电力数据,可根据实际需要确定相应的目标客户,相应的,剩余的其他用电客户为对比客户,电力数据包括但不局限于客户信息以及客户用电信息,其中,客户信息可包括但不局限于客户的身份证号码、地址、手机号码、开户时间、欠费金额和缴费金额,可根据实际需要进行选择,客户用电信息包括但不局限于客户的用电量信息和信用信息,可根据实际需要进行选择。
S102,针对每一个对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;
在执行步骤S102的过程中,针对每一个对比客户,可根据对比客户信息中包含的指标,例如,当指标为身份证号码和地址时,分别与目标客户信息中相应指标进行对比,计算对比客户和目标客户在客户信息方面的相似度;可根据对比客户用电信息中的包含的指标,例如,用电量、电费、预付费和欠费以及目标客户用电信息中相应的指标计算对比客户和目标客户在用电信息方面的相似度。
S103,针对每一个对比客户,根据单因子匹配相似度和多因子复合相似度及其各自对应的权重值,计算与目标客户之间的关联度。
在执行步骤S103的过程中,可根据实际需要具体设置单因子匹配相似度与多因子复合相似度各自对应的权重值,并且,两权重值之和为1,举例说明,第一客户相似度对应的权重值为0.7,第二客户相似度对应的权重值为0.3,当第一客户相似度为0.5以及第二客户相似度为0.6时,计算得到的目标客户之间的关联度为0.5*0.7+0.6*0.3=0.53。
本发明实施例公开的关联度计算方法,通过同时计算两个用电客户在客户信息和客户用电信息两个方面的相似度,来计算两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
实施例二
基于上述本发明实施例一公开的关联度计算方法,如图1所示出的步骤S102中,根据对比客户信息和目标客户信息计算单因子匹配相似度的具体执行过程,如图2所示,包括如下步骤:
S201,分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;
S202,分别解析对比客户指标集合和目标客户指标集合中包含的各个指标,得到对应的指标类型,指标类型为纯文本型、具有层次性结构的文本型或数值型;
S203,根据指标类型对对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据指标类型对所述目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;
S204,计算对比客户纯文本型指标集合和目标客户纯文本型指标集合的文本相似度,并判断文本相似度是否为0;
在执行步骤S204的过程中,纯文本型的指标集合中包含有各个纯文本型指标,例如,指标集合中包含有电话号码和身份证号这两个指标,按照完全匹配法将对比客户电话号码和目标客户电话号码进行对比,同时,将对比客户身份证号和目标客户身份证号进行对比,如果对比客户电话号码和目标客户电话号码不是完全一致,对比客户身份证号和目标客户身份证号完全一致,那么,对比客户与目标客户在电话号码这个指标上的相似度为0,在身份证号这个指标上的相似度为1,并且,根据指标集合中各个指标所占的权重,计算两个指标集合的文本相似度,例如,电话号码这个指标的权重为0.5,并且,身份证号这个指标的权重为0.5,则文本相似度可为0*0.5+1*0.5=0.5。
S205,当文本相似度为0时,确定单因子匹配相似度为0;
S206,当文本相似度不为0时,计算对比客户具有层次性结构的文本型指标集合和目标客户具有层次性结构的文本型指标集合的层级相似度,并判断层级相似度是为0;
在执行步骤S206的过程中,具有层次性结构的文本型指标集合中包含有各个具有层次性结构的指标,例如,指标集合中包含有客户住址和客户行业这两个指标,按照层次法将对比客户住址与目标客户住址进行对比,同时,将对比客户行业与目标客户行业进行对比,具体的,例如,对比客户住址为河北省保定市、目标客户住址为河北省保定市蠡县,则对比客户住址与目标客户住址在市这个层级是一致的,并且,由于每个层级对应的相似度是预设的(例如,省层级的相似度为0.3,市层级的相似度为0.6,县层级的相似度为0.9),则对比客户与目标客户在客户住址这个指标上的相似度为0.6,同理,客户行业的对比过程也是如此,在此不再赘述,并且,根据指标集合中各个指标所占的权重,计算两个指标集合的文本相似度,例如,对比客户与目标客户在客户行业这个指标上的相似度为0.6,客户住址这个指标的权重为0.3,并且,客户行业这个指标的权重为0.7,则层级相似度可为0.9*0.3+0.6*0.7=0.69。
S207,当层级相似度为0时,将文本相似度确定为单因子匹配相似度;
S208,当层级相似度不为0时,计算对比客户数值型指标集合和目标客户数值型指标集合的数值相似度;
在执行步骤S208的过程中,数值型指标集合中包含有各个数值型指标,例如指标集合中包含有欠费金额和缴费金额这两个指标,按照差比法将对比客户欠费金额与目标客户欠费金额进行对比,同时,将对比客户缴费金额与目标客户缴费金额进行对比,具体的,对比客户缴费金额为7万,目标客户缴费金额为9万,根据差比法计算公式可知,对比客户与目标客户在缴费金额这个指标上的相似度为相应的,欠费金额的对比过程也是如此,并且,根据指标集合中各个指标所占的权重,计算两个指标集合的数值相似度,例如,对比客户与目标客户在缴费金额这个指标上的相似度为0.8,对比客户与目标客户在欠费金额这个指标上的相似度为0.7,缴费金额这个的指标的权重是0.6,并且,欠费金额这个指标的权重为0.4,则数值相似度可为0.8*0.6+0.6*0.4=0.72。
S209,根据文本相似度、层级相似度和数值相似度及其各自对应的权重值,计算单因子匹配相似度;
在执行步骤S209的过程中,例如,文本相似度为0.5、层级相似度为0.69、数值相似度为0.72,并且,文本相似度、层级相似度和数值相似度分别占的权重为0.3、0.3和0.4,则第一客户相似度可为0.5*0.3+0.69*0.3+0.72*0.4=0.645。
本发明实施例公开的关联度计算方法,通过对两个用电客户的客户信息进行指标分类,再根据各个类型的指标之间的相似度计算在客户信息方面的相似度,再结合同时计算的客户用电信息的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
基于上述本发明实施例一公开的关联度计算方法,如图1所示出的步骤S102中,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度的具体执行过程,如图3所示,包括如下步骤:
S301,根据对比客户用电信息和目标客户用电信息判断对比客户和目标客户是否属于同一用电类别客户;
在执行步骤S301的过程中,可根据对比客户用电信息确定对比客户所属的用电类别客户,同时,根据目标客户用电信息确定目标客户所属的用电类型客户,进而判断对比客户与目标客户是否属于同一用电类别客户,具体的,用电类型客户包括但不局限于高压用电客户、低压居民用电客户和低压非居民用电客户。
S302,当对比客户和目标客户不属于同一用电类别客户时,确定多因子复合相似度为0;
S303,当对比客户和目标客户属于同一用电类别客户时,从对比客户用电信息中获取对比客户的对比用电量信息以及对比信用信息,同时,从目标客户用电信息中获取目标客户的目标用电量信息以及目标信用信息;
S304,根据对比用电量信息和目标用电量信息计算用电维度相似度,同时,根据对比信用信息和所述目标信用信息确定信用维度相似度;
在执行步骤S304的过程中,根据对比信用信息和目标信用信息确定信用维度相似度,其中,信用信息中可包含客户的信用等级,以信用等级举例,若对比用户的信用等级为优,目标用户的信用等级为良,由于信用等级对应关系的相似度为预设的(例如,优与优、良与良、差与差的相似度均为1,优与良的相似度为0.5、优与差的相似度为0),则该对比用户与目标用户在信用维度的相似度为0.5。
305,根据用电维度相似度和信用维度相似度及其各自对应的权重值,计算多因子复合相似度。
本发明实施例公开的关联度计算方法,通过根据两个用电客户的用电信息获取用电量信息和信用信息,并根据各自的用电量信息和信用信息计算在客户用电信息发面的相似度,同时,结合在客户信息方面的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
基于上述本发明实施例二公开的关联度计算方法,如图3所示出的步骤S304中,根据对比用电量信息和目标用电量信息计算用电维度相似度的具体执行过程,如图4所示,包括如下步骤:
S401,分别从对比用电量信息和目标用电量信息中获取对比用电量指标值集合和目标用电量指标值集合,并生成相应的对比用电曲线和目标用电曲线;
S402,针对对比用电曲线和目标用电曲线,选取曲线端点和至少一个曲线采样点,并根据曲线端点的位置值确定各个曲线采样点的位置值;
在执行步骤S402的过程中,由于根据用电量指标值集合中的各个用电量指标值生成的用电曲线是开口曲线,则会有两个端点,例如,端点A和端点B,确定距离线段AB最远的极值点,以及该极值点在线段AB上的投影点,并选取距离该投影点最近的端点作为曲线端点,并且,如果两个端点与投影点的距离一致,则任选一个端点作为曲线端点。
需要说明的是,对比用电曲线和目标用电曲线上的曲线采样点数量是一致的,并且数量可根据数据需要进行设置。
S403,根据对比用电曲线上的各个曲线采样点的用电量指标值和目标用电曲线上的各个曲线采样点的用电量指标值,计算曲线数值相似度;
在执行步骤S403的过程中,举例说明,对比用电曲线上的各个曲线采样点的位置值的集合为A=[a1,a2,a3,…,an],目标用电曲线上的各个曲线采样点的位置值的集合为B=[b1,b2,b3,…,bn],可选取两向量的余弦值作为曲线形状相似度,余弦值的计算公式如下:则相应也计算出曲线形状相似度。
S404,依据对比用电曲线上的各个曲线采样点的位置值和目标用电曲线上的各个曲线采样点的位置值,计算曲线形状相似度;
S405,根据曲线数值相似度和曲线形状相似度及其各自对应的权重值,计算用电维度相似度。
本发明实施例公开的关联度计算方法,通过根据两个用电客户的用电信息获取用电量信息和信用信息,并根据各自的用电量信息和信用信息计算在客户用电信息发面的相似度,同时,结合在客户信息方面的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
基于上述本发明实施例二公开的关联度计算方法,如图4所示出的步骤S404中,依据对比用电曲线上的各个曲线采样点的位置值和目标用电曲线上的各个曲线采样点的位置值,计算曲线形状相似度的具体执行过程,如图5所示,包括如下步骤:
S501,根据对比用电曲线上的各个曲线采样点的位置值计算对比用电曲线的质心位置值,同时,根据目标用电曲线上的各个曲线采样点的位置值计算目标用电曲线的质心位置值,质心用于表征曲线中心点;
在执行步骤S501的过程中,举例说明,Pi表示对比用电曲线上的曲线采样点的位置值,则对比用电曲线的质心位置值可表示为
S502,针对对比用电曲线和目标用电曲线,根据对应的各个质心向量计算各个曲线采样点的质心距离增量;
在执行步骤S502的过程中,举例说明,Pm和Pk为对比用电曲线上的两个曲线采样点,则可通过计算曲线采样点Pm位置值与质心位置值W的差值得到曲线采样点Pm的质心向量同时,通过计算曲线采样点Pk位置值与质心位置值W的差值得到曲线采样点Pk的质心向量再根据质心向量和计算曲线采样点Pm相对于曲线采样点Pk的质心距离增量其中,θ为质心向量和质心向量的夹角。
S503,针对对比用电曲线和目标用电曲线,依据对应的各个质心距离增量构建曲线质心增量矩阵;
在执行步骤S503的过程中,以对比用电曲线举例说明,根据对比用电曲线上各个曲线采样点相于对对比用电曲线上所有曲线采样点的质心距离增量,可得到对比用电曲线质心增量矩阵
S504,根据对比用电曲线的曲线质心增量矩阵和目标用电曲线的曲线质心增量矩阵,计算曲线形状相似度。
在执行步骤S504的过程中,举例说明,对比用电曲线L0和目标用电曲线用L1各自对应的曲线质心增量矩阵分别为FiL0和FiL1,则曲线形状相似度可通过如下公式计算:其中,
本发明实施例公开的关联度计算方法,通过根据两个用电客户的用电信息获取用电量信息和信用信息,并根据各自的用电量信息和信用信息计算在客户用电信息发面的相似度,同时,结合在客户信息方面的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
实施例三
基于上述本发明各实施例公开的关联度计算方法,本发明实施例则对应公开执行上述关联度计算方法的装置,其结构示意图如图6所示,关联度计算装置100包括:客户确定模块101、相似度计算模块102和关联度计算模块103;
客户确定模块,用于从后台数据库中调取至少两个用电客户的电力数据,并从各个用电客户中确定一个目标客户和至少一个对比客户,电力数据包括客户信息以及客户用电信息;
相似度计算模块,用于针对每一个对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;
关联度计算模块,用于针对每一个对比客户,根据单因子匹配相似度和多因子复合相似度及其各自对应的权重值,计算与目标客户之间的关联度。
本发明实施例公开的关联度计算装置,通过同时计算两个用电客户在客户信息和客户用电信息两个方面的相似度,来计算两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
实施例四
结合上述本发明实施例三公开的关联度计算装置,如图6所示出的相似度计算模块102包括:单因子匹配相似度计算模块1021;单因子匹配相似度计算模块1021结构示意图如图7所示,包括指标集合获取单元201、解析单元202、指标集合划分单元203、文本相似度计算判断单元204、第一确定单元205、层级相似度计算判断单元206、第二确定单元207、数值相似度计算单元208和单因子匹配相似度计算单元209;
指标集合获取单元201,用于分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;
解析单元202,用于分别解析对比客户指标集合和目标客户指标集合中包含的各个指标,得到对应的指标类型,指标类型为纯文本型、具有层次性结构的文本型或数值型;
指标集合划分单元203,用于根据指标类型对对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据指标类型对目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;
文本相似度计算判断单元204,用于计算对比客户纯文本型指标集合和目标客户纯文本型指标集合的文本相似度,并判断文本相似度是否为0;
第一确定单元205,用于当文本相似度为0时,确定单因子匹配相似度为0;
层级相似度计算判断单元206,用于当文本相似度不为0时,计算对比客户具有层次性结构的文本型指标集合和目标客户具有层次性结构的文本型指标集合的层级相似度,并判断层级相似度是为0;
第二确定单元207,用于当层级相似度为0时,将文本相似度确定为单因子匹配相似度;
数值相似度计算单元208,用于当层级相似度不为0时,计算对比客户数值型指标集合和目标客户数值型指标集合的数值相似度;
单因子匹配相似度计算单元209,用于根据文本相似度、层级相似度和数值相似度及其各自对应的权重值,计算单因子匹配相似度。
本发明实施例公开的关联度计算装置,通过对两个用电客户的客户信息进行指标分类,再根据各个类型的指标之间的相似度计算在客户信息方面的相似度,再结合同时计算的客户用电信息的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
结合上述本发明实施例三公开的关联度计算装置,如图6所示出的相似度计算模块102还包括:多因子复合相似度计算模块1022;多因子复合相似度计算模块1022结构示意图如图8所示,包括判断单元301、第三确定单元302、信息获取单元303、相似度计算单元304和多因子复合相似度计算单元305;
判断单元301,用于根据对比客户用电信息和目标客户用电信息判断对比客户和目标客户是否属于同一用电类别客户;
第三确定单元302,用于当对比客户和目标客户不属于同一用电类别客户时,确定多因子复合相似度为0;
信息获取单元303,用于当对比客户和目标客户属于同一用电类别客户时,从对比客户用电信息中获取对比客户的对比用电量信息以及对比信用信息,同时,从目标客户用电信息中获取目标客户的目标用电量信息以及目标信用信息;
相似度计算单元304,用于根据对比用电量信息和目标用电量信息计算用电维度相似度,同时,根据对比信用信息和目标信用信息确定信用维度相似度;
多因子复合相似度计算单元305,用于根据用电维度相似度和信用维度相似度及其各自对应的权重值,计算多因子复合相似度。
本发明实施例公开的关联度计算装置,通过根据两个用电客户的用电信息获取用电量信息和信用信息,并根据各自的用电量信息和信用信息计算在客户用电信息发面的相似度,同时,结合在客户信息方面的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
结合上述本发明实施例三公开的关联度计算装置,如图8所示出的相似度计算单元304包括:用电维度相似度计算单元3041;用电维度相似度计算单元3041结构示意图如图9所示,包括用电曲线生成子单元401、选取确定子单元402、曲线数值相似度计算子单元403、曲线形状相似度计算子单元404和用电维度相似度计算子单元405;
用电曲线生成子单元401,用于分别从对比用电量信息和目标用电量信息中获取对比用电量指标值集合和目标用电量指标值集合,并生成相应的对比用电曲线和目标用电曲线;
选取确定子单元402,用于针对对比用电曲线和目标用电曲线,选取曲线端点和至少一个曲线采样点,并根据曲线端点的位置值确定各个曲线采样点的位置值;
曲线数值相似度计算子单元403,用于根据对比用电曲线上的各个曲线采样点的用电量指标值和目标用电曲线上的各个曲线采样点的用电量指标值,计算曲线数值相似度;
曲线形状相似度计算子单元404,用于依据对比用电曲线上的各个曲线采样点的位置值和目标用电曲线上的各个曲线采样点的位置值,计算曲线形状相似度;
用电维度相似度计算子单元405,用于根据曲线数值相似度和曲线形状相似度及其各自对应的权重值,计算用电维度相似度。
本发明实施例公开的关联度计算装置,通过根据两个用电客户的用电信息获取用电量信息和信用信息,并根据各自的用电量信息和信用信息计算在客户用电信息发面的相似度,同时,结合在客户信息方面的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
结合上述本发明实施例三公开的关联度计算装置,如图9所示出的曲线形状相似度计算子单元404的结构示意图如图10所示,包括:质心位置值计算子单元501、质心距离增量计算子单元502、曲线质心增量矩阵构建子单元503和计算子单元504;
质心位置值计算子单元501,用于根据对比用电曲线上的各个曲线采样点的位置值计算对比用电曲线的质心位置值,同时,根据目标用电曲线上的各个曲线采样点的位置值计算目标用电曲线的质心位置值,质心用于表征曲线中心点;
质心距离增量计算子单元502,用于针对对比用电曲线和目标用电曲线,根据对应的各个质心向量计算各个曲线采样点的质心距离增量;
曲线质心增量矩阵构建子单元503,用于针对对比用电曲线和目标用电曲线,依据对应的各个质心距离增量构建曲线质心增量矩阵;
计算子单元504,用于根据对比用电曲线的曲线质心增量矩阵和目标用电曲线的曲线质心增量矩阵,计算曲线形状相似度。
本发明实施例公开的关联度计算装置,通过根据两个用电客户的用电信息获取用电量信息和信用信息,并根据各自的用电量信息和信用信息计算在客户用电信息发面的相似度,同时,结合在客户信息方面的相似度,进一步计算得到两个用电客户之间的关联度,这就实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。
以上对本发明所提供的一种关联度计算方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。