基于电力数据和多元数据建立低压居民特征画像的方法和系统与流程

文档序号:26612139发布日期:2021-09-11 00:10阅读:89来源:国知局
基于电力数据和多元数据建立低压居民特征画像的方法和系统与流程

1.本发明属于电力数据特征分析技术领域,涉及基于电力数据和多元数据建立低压居民特征画像的方法和系统。


背景技术:

2.目前,用户画像在推荐、用户增长等互联网业务领域应用非常广泛,其核心技术就是通过建立画像体系和分析用户相关的大规模数据,从原始数据中抽取出能够表达用户特质的表征数据,然后保存下来在需要的业务中进行使用。
3.目前的在互联网大数据领域,用户画像的体系和技术已经比较成熟了,各大互联网利用精准的用户画像,不仅能更好的服务好目标客户,还可以在增加收益方面有很好的效果。
4.电力公司作为掌握了社会用户电力大数据的公司,可以合理的运用大数据技术来建立用户用电画像,为更好的服务客户做好坚实的基础。但是目前用户用电画像面临如下问题:其一为数据来源单一,只使用了用电数据,没有合理的使用到天气等外部数据;另一问题是画像类型和时效性单一,因为设备的局限,之前国网公司没有使用到接近实时级的数据来生成准实时的画像特征,而随着最新行业发展

分钟级用电数据的推出,为准实时用户画像打造了基础。


技术实现要素:

5.为解决现有技术中的不足,本技术提供基于电力数据和多元数据建立低压居民特征画像的方法和系统,通过对多元数据与准实时分钟级数据的分析,可以有效生成用户在不同外部情况下的离线画像和准实时画像特征,解决了用户画像维度不清晰以及画像实时性不够的问题。
6.为了实现上述目标,本发明采用如下技术方案:
7.基于电力数据和多元数据建立低压居民特征画像的方法,包括以下步骤:
8.步骤1:获取低压居民的电力相关数据;
9.步骤2:对步骤1的电力相关数据进行数据清洗;
10.步骤3:对步骤2得到的数据进行补全;
11.步骤4:建立用户用电长期、短期、准实时特征画像模型;
12.步骤5:利用步骤3得到的数据,根据特征画像模型,计算低压居民的长期、短期、准实时特征画像;
13.步骤6:对步骤5的模型计算结果进行验证;
14.步骤7:根据步骤6的验证结果进行特征画像模型优化,返回步骤5,直到模型计算结果表征情况和实际情况相比满足要求;
15.步骤8:使用步骤7的优化后的特征画像模型对低压居民进行特征画像计算。
16.本发明进一步包括以下优选方案:
17.优选地,步骤1中,按区域选取低压居民的电力相关数据,包括用电数据、用户档案数据、节假日、温度、天气状况数据;
18.所述用电数据包括准实时用电数据和离线用电数据;
19.所述准实时用电数据指的是分钟级别更新的用电数据,所述离线用电数据指的是天级用电数据。
20.优选地,步骤2中,对步骤1的准实时用电数据使用条件判断检测负值和空值;
21.对步骤1的离线用电数据使用四分位检测和条件判断检测异常值、负值和空值。
22.优选地,步骤3中,准实时用电数据使用相邻数据求平均算法进行补全;
23.离线用电数据使用同时满足同用户、同天气状况、同温度、同节假日情况的历史数值和相邻用电量加权平均的算法进行补全。
24.优选地,步骤4中,长期画像模型包括稳定画像特征:用户的年龄、性别、住址、四季用电习惯特征;
25.短期画像模型包括天级画像特征:近期早上开始用电时间、晚上结束用电时间特征;
26.准实时特征画像模型包括分钟级更新的画像特征:分钟级用电情况、瞬时最大电流特征、判断是否有人在家特征。
27.优选地,步骤5中,从天气状况维度、温度维度、节假日维度分别计算低压居民的长期、短期、准实时特征画像。
28.优选地,步骤5中,将计算出来的结果存储于用户数据库中并将长期、短期、准实时各类特征按照不同的时间维度进行定时更新。
29.优选地,步骤6和步骤7中,采用实地验证、样本间互相验证方式验证对模型计算特征准确性。
30.优选地,步骤6和步骤7中,具体为:
31.对特征数据进行平滑计算,对特征值偏离大于阈值的特征使用威尔逊平滑方法对齐进行平滑计算;或,
32.进行特征分布统计,对分布不足以区分个用户的特征进行重新评判和计算;或,
33.设定误差函数,与实际情况进行对比计算,若实际情况与画像计算结果表征情况有所不符,则根据误差调整模型计算方法;
34.返回步骤5,直到模型计算结果表征情况和实际情况相比满足要求。
35.本发明还公开了基于电力数据和多元数据建立低压居民特征画像的系统,包括:
36.初始数据获取模块,用于获取低压居民的电力相关数据并进行数据预处理,包括数据清洗和补全;
37.特征画像模型构建模块,用于建立用户用电长期、短期、准实时特征画像模型;
38.长期、短期、准实时特征计算模块,用于利用初始数据获取模块得到的数据,根据特征画像模型,计算低压居民的长期、短期、准实时特征画像;
39.验证模块,用于对模型计算结果进行验证并进行特征画像模型优化,返回长期、短期、准实时特征计算模块,直到模型计算结果表征情况和实际情况相比满足要求;
40.特征画像计算模块,用于使用优化后的特征画像模型对低压居民进行特征画像计
算。
41.本技术所达到的有益效果:
42.1、本发明借助电力行业最新推出的分钟级用电数据,提高了用户准实时特征的实时性,大大增加了用户画像的可用性。
43.2、本发明通过多元数据加入计算,提高了用户画像的计算维度和精确性,使表征数据更为准确。
44.3、本发明通过对实地验证和样本间互相验证,可以有效的提高算法的精确度,提高画像特征数据的表征能力,让用户画像更加的精确。
附图说明
45.图1是本发明基于电力数据和多元数据建立低压居民特征画像的方法流程示意图。
具体实施方式
46.下面结合附图对本技术作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本技术的保护范围。
47.如图1所示,本发明的基于电力数据和多元数据建立低压居民特征画像的方法,包括以下步骤:
48.步骤1:获取低压居民的电力相关数据;
49.具体实施时,按区域选取5000户低压居民的电力相关数据,包括用电数据、用户档案数据、节假日、温度、天气状况等外部数据;
50.数据来源包括用采系统和互联网公共渠道。
51.所述用电数据包括准实时用电数据和离线用电数据;
52.所述准实时用电数据指的是分钟级别更新的用电数据,该类数据没有异常值,但是有空值和负值需要条件检测出来并去除;
53.所述离线用电数据指的是天级用电数据,该类数据有不符合逻辑的用电异常值,需要使用统计学中分位数异常检测来判断出异常值,再用条件检测出空值和负值进行去除。
54.步骤2:对步骤1的电力相关数据进行数据清洗,包括:
55.对步骤1的准实时用电数据(无异常值)使用条件判断出小于0以及无值的情况,检测负值和空值;
56.对步骤1的离线用电数据使用四分位检测(超出均值加上四分位与四分之三分位差值绝对值的10倍的数值即为异常值)和条件判断检测异常值、负值和空值。
57.步骤3:对步骤2得到的数据进行补全,具体的:
58.准实时用电数据使用相邻数据求平均算法进行补全;
59.离线用电数据使用同时满足同用户、同天气状况、同温度、同节假日情况的历史数值和相邻用电量加权平均的算法进行补全。
60.步骤4:建立用户用电长期、短期、准实时特征画像模型;
61.长期画像指的是用户年龄、性别等不经常需要更新的画像特征;
62.短期画像指的是天级电情况这类需要天级更新的画像特征;
63.准实时画像指的是分钟级更新的画像特征。
64.具体实施时,长期画像模型包括稳定画像特征:用户的年龄、性别、住址、长期用电习惯特征,例如四季用电习惯、不同温度用电习惯等特征;
65.其中年龄、性别可以从证件号信息解析获取,住址从登记档案数据中截取储存等等。
66.短期画像模型包括天级画像特征:近期早上开始用电时间、晚上结束用电时间、近期用电习惯等特征;
67.准实时特征画像模型包括分钟级更新的画像特征:精确到小时甚至分钟级用电情况、瞬时最大电流特征、判断是否有人在家等特征。
68.计算方式主要是直接取准实时数据或者是推准实时数据进行统计计算。例如瞬时最大电流特征就可以直接取推送数据里的值进行赋值。
69.步骤5:利用步骤3得到的数据,根据特征画像模型,计算低压居民的长期、短期、准实时特征画像;
70.具体实施时,从天气状况维度、温度维度、节假日维度分别计算低压居民的长期、短期、准实时特征画像。
71.分维度统计特征可以使特征更加精细化,在使用的时候可以根据当天的情况来选择对应维度的特征使用,使特征的使用更加准确。
72.将计算出来的结果存储于用户数据库中并将长期、短期、准实时各类特征按照不同的时间维度进行定时更新。
73.步骤6:对步骤5的模型计算结果进行验证,具体的:
74.步骤7:根据步骤6的验证结果进行特征画像模型优化,返回步骤5,直到模型计算结果表征情况和实际情况相比满足要求;
75.采用实地验证、样本间互相验证等方式验证对模型计算特征准确性,具体为:
76.对特征数据进行平滑计算,对特征值偏离大于阈值的特征使用威尔逊平滑方法对齐进行平滑计算;或,
77.进行特征分布统计,对分布不足以区分个用户的特征进行重新评判和计算;或,
78.设定误差函数,与实际情况进行对比计算,若实际情况与画像计算结果表征情况有所不符,则根据误差调整模型计算方法;
79.返回步骤5,直到模型计算结果表征情况和实际情况相比满足要求。
80.步骤8:使用步骤7的优化后的特征画像模型对低压居民进行特征画像计算。
81.本发明的基于电力数据和多元数据建立低压居民特征画像的系统,包括:
82.初始数据获取模块,用于获取低压居民的电力相关数据并进行数据预处理,包括数据清洗和补全;
83.特征画像模型构建模块,用于建立用户用电长期、短期、准实时特征画像模型;
84.长期、短期、准实时特征计算模块,用于利用初始数据获取模块得到的数据,根据特征画像模型,计算低压居民的长期、短期、准实时特征画像;
85.验证模块,用于对模型计算结果进行验证并进行特征画像模型优化,返回长期、短期、准实时特征计算模块,直到模型计算结果表征情况和实际情况相比满足要求;
86.特征画像计算模块,用于使用优化后的特征画像模型对低压居民进行特征画像计算。
87.综上所述,本发明借助电力行业最新推出的分钟级用电数据,提高了用户准实时特征的实时性,大大增加了用户画像的可用性;通过多元数据加入计算,提高了用户画像的计算维度和精确性,使表征数据更为准确;通过对实地验证和样本间互相验证,可以有效的提高算法的精确度,提高画像特征数据的表征能力,让用户画像更加的精确。
88.本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1