一种基于多源信息的窃电行为检测方法与流程

文档序号:35989571发布日期:2023-11-15 21:20阅读:30来源:国知局
一种基于多源信息的窃电行为检测方法

本发明涉及电网运维领域,尤其涉及一种基于多源信息的窃电行为检测方法。


背景技术:

1、电力资源在人类社会中非常重要,它是人类生活的重要基础设施,它为社会的经济发展和人们的日常生活提供了便利和方便。电力资源的可靠供应对社会的发展十分关键,因此,保障电力资源的正常运转是电力公司一直以来的职责和目标。然而,窃电行为时有发生,会对社会造成十分不良的影响,尤其是在电力供应紧张,电力价格高和缺乏电力管理的地区。

2、近些年来,由于深度学习方法的强大效果,研究者们提出了许多基于神经网络的方法来检测和预防窃电行为。zheng[zheng 2018]提出了一种基于cnn模型的新型窃电检测方法,该方法可以识别窃电行为的非周期性和正常电力使用的周期性,同时能够捕捉电力消耗数据的全局特征。hasan[hasan 2018]结合了cnn和lstm用于智能电网数据分类。hu[hu2020]提出了一个分层窃电检测的框架,该框架通过融合用电情况,台区线损和气候因素三个层次的数据分析用户行为。

3、然而,在实际场景中,很多地区缺乏有标注的窃电数据且获取该数据耗时耗财,无法为模型的训练提供足够的支持。对于缺乏标注数据的目标地区,可能仍然可以用其他地区的数据来训练模型,但由于训练的数据分布与实际的数据分布不同,数据采集方式的差异以及其他因素的影响,在这种条件下训练的模型在目标地区上往往会出现性能下降,甚至失效的情况。比如将工业城市上训练的窃电检测模型直接用于旅游城市的窃电检测,模型大概率难以发挥作用。在工业城市中,大量的用电需求来自于制造业和工业生产,这些活动主要在白天进行,因此工业城市的用电高峰往往在白天,且工业城市的用电在一年之间比较稳定。在旅游城市中,游客们在通常在白天进行游玩,用电高峰就出现在晚上,旅游旺季和淡季则造成了旅游城市的用电在一年之间波动较大。因此,目前工作者在利用深度学习方法对不同城市进行窃电行为检测时,往往都需要重新获取该城市的相关数据并重新训练一个模型,这给工作者们带来了极大的困扰。


技术实现思路

1、本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于多源信息的窃电行为检测方法,以达到缺乏标注数据的目标地区的窃电行为的有效检测目的。为此,本发明采取以下技术方案。

2、一种基于多源信息的窃电行为检测方法,包括以下步骤:

3、1)获取数据,所述数据包括温度记录、用户用电记录和非技术性台区线损记录;

4、2)将数据输入训练好的窃电行为检测模型中,进行窃电行为检测;

5、窃电行为检测模型训练时先在具有较多标注数据的地区训练一个窃电行为检测模型;接着,在目标地区,对已经训练好的模型进行域适应,使其适用于该地区,形成适用于目标地区的窃电行为检测模型;

6、3)窃电行为检测模型输出每个用户可能进行窃电的概率,从而实现窃电行为的精准预测。

7、本发明首先在具有较多标注数据的地区训练一个窃电行为检测模型;接着,在目标地区,对已经训练好的模型进行域适应,使其适用于该地区;最后,模型处理输入数据,并给出窃电行为的检测结果。通过电力数据性质,结合基于深度学习的时间序列建模与域适应技术,实现在缺乏标注数据的目标地区的窃电行为检测。

8、本方法综合利用了温度记录、用户用电记录和非技术性台区线损记录等多种数据源,从不同角度获取信息,并将其进行融合。这样可以提高窃电行为检测的准确性和可靠性。通过训练好的窃电行为检测模型,该方法可以输出每个用户可能进行窃电的概率,实现对窃电行为的精准预测。这有助于及时发现和应对潜在的窃电行为,保障电力系统的安全和稳定运行。在目标地区通过域适应模块对已训练好的模型进行调整,使其适应目标地区的特征和环境。这可以有效解决不同地区之间的数据分布差异问题,提高模型在目标地区的适应性和泛化能力。基于深度学习的时间序列建模,利用神经网络等技术,能够更好地捕捉数据中的隐含规律和模式。相比传统的基于规则或经验的方法,深度学习技术能够实现更高效、更精确地窃电行为检测。通过数据融合、精准预测、域适应和深度学习等方面的优势,提高窃电行为检测的效果和性能。

9、作为优选技术手段:窃电行为检测模型包括:

10、特征提取模块,用于从多源信息中分层提取特征;

11、标签预测模块,用于根据提取的特征预测用户是否存在窃电行为;

12、域适应模块,用于对齐源域特征和目标域特征。

13、特征提取模块:由于窃电行为可能涉及多个信息源(如能源使用数据、用户行为数据等),特征提取模块可以从这些多源信息中分层提取相关特征。这样的设计可以帮助模型捕捉到不同信息源之间的相互关系和潜在模式,提高特征的表达能力。

14、标签预测模块:标签预测模块使用提取的特征作为输入,根据模型学习到的特征与窃电行为的关联性进行预测,即判断用户是否存在窃电行为。通过这个模块,模型可以将特征与窃电行为之间建立起联系,并进行行为分类。

15、域适应模块:窃电行为检测通常涉及多个地区或环境,不同地区的数据分布可能会存在差异,导致模型在跨地区应用时性能下降。域适应模块的作用是将源域特征和目标域特征进行对齐,使得模型能够充分利用源域的知识来适应目标域的数据特性。通过域适应模块的引入,模型能够在不同地区之间进行迁移学习,提高窃电行为检测的泛化性能和准确性。

16、本技术方案将特征提取、标签预测和域适应模块相结合,使得模型能够从多源信息中提取相关特征、预测窃电行为,并通过域适应来适应不同地区的数据分布。这样做的优势在于充分挖掘多源数据的潜力,提高模型的准确性和泛化能力,更好地适应实际窃电行为检测应用场景的需求。

17、作为优选技术手段:特征提取模块采用1d-cnn对数据进行处理,使用不同大小的卷积核,帮助模型捕捉不同粒度的时间信息,分层进行特征提取和融合。本技术方案使用1d-cnn对数据进行处理,也就是在一维的时间维度做卷积操作。因为窃电用户通常间隔着进行窃电,而不是连续地进行窃电,cnn可以更好地提取局部特征且处理速度更快。窃电用户为了掩盖自己的窃电行为,通常会以不正常的频率进行窃电,因此也使用不同大小的卷积核,帮助模型捕捉不同粒度的时间信息,使用较大的卷积核可以捕捉较长时间内的趋势,而使用较小的卷积核可以捕捉较短时间内的细节,这可以帮助模型更好地理解数据。而且1d-cnn可以有效地对时间序列数据进行处理。通过在不同时间尺度上应用不同大小的卷积核,可以捕捉到不同粒度的时间信息,这样可以帮助模型更好地理解和分析数据中的时间模式和时间相关性。由于不同大小的卷积核具有不同的感受野(receptive field),可以根据卷积核的大小逐层提取不同抽象程度的特征,较小的卷积核可以捕捉到局部细节信息,而较大的卷积核可以捕捉到更宽范围的全局特征,通过分层特征提取,模型可以获取更丰富、更全面的特征表示,从而提高窃电行为检测的准确性。不同大小的卷积核在特征提取过程中产生的特征图可以进行融合,利用池化或连接等操作将它们合并到一起,这种特征融合可以综合利用不同层次的特征信息,增强整体特征表达的鲁棒性和区分能力。1d-cnn中卷积核的参数是共享的,这意味着无论时间序列数据的长度如何,模型的参数数量都是固定的,这样可以有效减少模型的参数量,避免过拟合,并加快模型的训练和推理速度。

18、作为优选技术手段:在第一层中,将中观层次的台区线损信息、宏观层次的温度信息与微观层次的用户用电量信息相融合,以捕获其他因素对用户用电行为的影响;在第二层中,对初步融合得到的二元信息进行特征提取和融合,以统一其他因素对用户用电行为的影响;在第三层中使用cnn进行最终的特征提取,以捕获用户总体的行为特征,将该特征用于后续的标签预测和域适应。通过逐层的特征提取和融合,将不同层次的信息(中观、宏观和微观)相结合,这样可以更全面地捕捉到其他因素对用户用电行为的影响,增加了模型的表达能力和准确性。在每一层中,采用不同大小的卷积核进行处理,有助于模型捕捉各种粒度的时间信息,这样可以提取出丰富而具体的特征,在窃电行为检测中起到更好的作用。通过对初步融合得到的二元信息进行特征提取和融合,可以将其他因素对用户用电行为的影响统一起来,这有助于消除噪声和冗余信息,提高模型对窃电行为的区分度和鲁棒性。使用cnn进行最终的特征提取,可以利用其在图像和序列数据处理中的优势,能够自动学习复杂的特征表示,并能够更好地捕捉到用户的整体行为特征。从而可以充分利用不同层次的信息、精细提取特征、统一其他因素影响,并发挥深度学习的优势,提高窃电行为检测的准确性和可靠性。

19、作为优选技术手段:在融合时,首先通过一个无偏置的线性层将表示两个数据源的向量源转换为相同维度,然后对一个数据源t时间点,t-1时间点的信息与另一个数据源t时间点的信息分别进行池化后相连接。本技术方案可以捕获不同数据源信息之间的相关性,在不同的时间点对信息进行融合;充分考虑两个不同的时间序列之间可能不仅同天之间存在影响,不同天之间也可能存在关联。通过无偏置的线性层,将两个不同数据源表示的向量转换为相同维度,这样可以使它们在后续处理中具有相同的特征维度,方便进行特征的融合和处理。对于一个数据源,在时间点t上,将时间点t-1的信息与另一个数据源在时间点t上的信息进行池化之后相连接,这样可以将过去的历史信息纳入考虑,有助于捕捉数据源之间的时序关系和依赖关系。池化操作有助于提取数据源中的重要特征,并减少数据的冗余信息,通过对池化后的特征进行相连接,能够增强特征的表达能力,更好地捕捉到数据源之间的关联信息。通过融合不同数据源的信息,在特征维度的统一和历史信息的汇集上,可以提高模型对复杂输入的鲁棒性,使模型更加适应不同类型的数据样本。通过将不同数据源的信息进行线性转换、维度统一和池化操作后的连接,可以实现特征的融合和历史信息的纳入,从而提高模型对数据源之间关系的建模能力,并增强模型的表达能力和鲁棒性。

20、作为优选技术手段:仅对时间序列前后两天的数据进行融合。从而兼顾模型的能力和时间复杂度。有效控制时间复杂度,相较于更长的时间窗口或更多的历史数据,仅使用相邻两天的数据进行融合可以降低计算复杂度,减少模型处理的数据量,这有助于提高模型的运行效率和响应速度。并充分考虑短期趋势,在某些场景下,短期内的变化对结果影响较大,选取仅两天的数据进行融合,能够更敏感地捕捉到短期趋势变化,使模型对最新的信息作出适时的反映。尽管只考虑两天的数据,但仍能够保留一定的历史信息,前一天的数据可以提供过去一天的情况,为当前时间点的预测提供一定的背景和参考。尽管仅考虑相邻两天的数据融合可能降低对长期信息的建模能力,但能有效控制计算资源和时间复杂度。

21、作为优选技术手段:标签预测模块由全连接网络构成,该网络包含两个全连接层,最终输出一个长度为2的输出,分别代表该用户不存在窃电行为的概率和存在窃电行为的概率。本技术方案可以对用户的行为进行分类,将其分为两类:存在窃电行为和不存在窃电行为;输出向量中的第一个元素表示用户不存在窃电行为的概率,第二个元素表示用户存在窃电行为的概率,通过比较两个概率值,可以确定用户是否从事窃电行为。全连接网络通过学习训练数据集中的特征和模式,可以对用户的窃电行为进行准确判断,网络的参数会被训练以最大化准确性,并在测试阶段对未见过的数据进行预测,因此,如果训练数据集足够且代表性良好,该模型能够较好地判定用户的窃电行为。由于该模型仅包含两个全连接层,其计算效率较高,适用于实时场景的应用,它能够快速处理输入数据并给出相应的预测结果,有助于及时响应并采取相应的措施。从而使得本技术方案具有较高的判定准确性,并能够在实时场景中高效运行,提供快速准确的窃电行为预测结果。

22、作为优选技术手段:域适应模块与特征提取模块的第一层、第二层、第三层相连实现多源域适应,即采用多个不同的特征向量进行域适应。通过将多个不同的特征向量进行域适应,可以增强模型对不同领域或源数据集的适应能力,每个源数据集可能具有独特的数据分布和特征表示,通过整合多个源的特征向量进行域适应,可以更好地捕捉到各个源数据集之间的共同特征,从而提高模型的泛化性能。在实际应用中,数据的分布可能因为不同源的差异而存在一定的偏移,通过使用多个不同的特征向量进行域适应,可以减小源域间的分布偏移,增强模型对于数据变化或扰动的鲁棒性,这意味着模型在面对新的未见过的数据时能够更好地适应并保持较好的性能。采用多个不同的特征向量进行域适应,能够将各个源数据集的信息进行融合,并充分利用多源数据的信息优势,不同特征向量往往表达了不同方面的特征,通过综合利用这些特征,可以提供更全面、多样化的信息,有助于提升模型的性能和表现。使用多个不同的特征向量进行域适应可以增加模型的多样性,减少过拟合的风险。多源域适应能够融合多样特征、增强模型鲁棒性、提升迁移学习效果,并结合对抗性训练方法,以更好地解决域适应问题,这种方法可以有效地利用不同特征源的信息,提供更全面准确的特征表示,从而提高模型的性能和泛化能力。

23、作为优选技术手段:域适应模块在窃电行为检测中,同时对用户隐藏层向量、温度隐藏层向量、ntl隐藏层向量、用户温度融合隐藏层向量,用户ntl融合隐藏层向量、用户温度ntl融合隐藏层向量进行域适应。域适应模块可以帮助模型在不同的领域中更好地适应和推广,从而提高模型的泛化能力,这意味着即使在训练模型时使用了一个特定的数据集,模型也可以在其他领域中产生较好的性能。通过对多个隐藏层向量进行域适应,可以增强模型对于不同区域的数据变化、噪声和干扰的鲁棒性,这使得模型更加稳健,在面对各种复杂情况时能够保持较好的性能表现。域适应模块可以在隐藏层向量的域适应过程中捕捉到区域之间的共享特征,并将其纳入模型的学习过程中,这有助于降低区域间的差异,提高模型在目标领域中的准确性和性能。从而使得模型更好地应用于不同区域的问题。

24、作为优选技术手段:在进行窃电行为检测模型训练时,采用梯度反转层进行对抗性训练;当更新权重时,梯度反转层在反向传播期间翻转梯度,反向传播域适应模块的判别结果,以便特征提取模块根据域适应模块的反馈信息更新自身的参数,使提取的特征在源域和目标域之间更加一致。域适应模块的损失函数由源域数据和目标域数据两部分数据得到;当为用户隐藏层向量时,其损失函数定义为:

25、

26、其中,u表示源域,t表示目标域;

27、域适应模块的总体损失函数如下:

28、

29、特征提取模块有两个优化目标,一是标签预测模块的标签预测准确度,该部分仅使用源域的数据;域适应模块则使用源域和目标域的数据进行对抗性训练,优化的目标为令窃电行为检测模型难以区分数据来自于哪个域;整个窃电行为检测模型采用联合损失函数优化,用公式表示为:

30、

31、其中,λ为平衡损失函数和权重的参数;在窃电行为检测模型训练中,朝着令最小的方向优化,在优化过程中域适应模块将梯度反转后再进行传播,标签预测模块则正常地进行梯度的传播。通过使用域适应模块和梯度反转层,在源域和目标域之间使特征表示更加一致,这样可以降低由于域间分布差异引起的性能下降,提高模型在目标域的泛化能力。梯度反转层的翻转梯度机制使得特征提取模块学习不区分域别的特征表示,使窃电行为检测模型难以区分数据来源于哪个域,这种对抗性训练策略有助于减轻域间的偏移影响,提升模型在不同域上的鲁棒性。域适应模块利用源域和目标域的数据进行训练,通过优化目标为令模型难以区分数据来源域别的特征表示,这能够促进特征提取模块学习到具有较高一致性的特征表示,进而增强模型在目标域中的性能。整个模型采用联合损失函数进行优化,平衡了标签预测模块和域适应模块两个优化目标,这样可以使得模型在窃电行为检测任务中既关注标签预测的准确性,又注意到域间的一致性,从而提高模型的综合性能。通过梯度反转层和对抗性训练,域适应模块可以帮助特征提取模块学习到源域和目标域之间的共享特征,从而减少域差异,提升模型在目标域中的适应能力。域适应模块的损失函数考虑了源域数据和目标域数据的一致性,使得特征提取模块能够根据域适应模块的反馈信息更新参数,使得提取的特征在源域和目标域之间更加一致,提高窃电行为检测模型的性能。对抗性训练使得窃电行为检测模型难以区分源域和目标域的数据,增强了模型对于不同领域数据的鲁棒性,这意味着即使在未知的目标域中,模型也能表现出较好的窃电行为检测能力。通过采用联合损失函数,可以平衡标签预测模块的准确度和域适应模块的效果,参数λ用于调整两部分损失函数的权重,使得窃电行为检测模型在训练过程中更好地平衡这两个目标。

32、有益效果:

33、1.通过多源域适应,模型能够更好地适应不同地区的数据特点和分布,使模型能在不同地区间进行迁移,从而提高窃电行为检测的准确性,减少误判和漏判的情况。

34、2.利用域适应技术,使得本方法具备了更强的泛化能力,无论面对新的地区、新的环境还是新的数据集,都能够快速适应并取得良好的检测效果。

35、3.本技术方案改善数据分布偏移问题,避免在窃电行为检测中,不同地区的数据分布可能存在差异,导致模型在跨地区应用时性能下降的问题。通过多源域适应,模型能够自动学习和调整特征表示,减小数据分布之间的差异,有效解决数据分布偏移问题,提升模型的鲁棒性。

36、4.本技术方案节约时间和资源:避免传统的方法需要在每个新的地区重新训练模型,消耗大量时间和资源的问题。通过利用已有的数据和知识,无需从头开始训练模型。只需进行少量的领域自适应训练,就能够快速实现模型在新地区的有效部署,节约了训练时间和计算资源成本。

37、5.当除了对模型最终输出的隐藏层向量进行域适应外,还对多个中间层向量进行域适应,可以进一步提升了模型的适应性和准确性。

38、将多源域适应技术引入窃电行为检测领域,提高了模型的准确性、泛化能力,解决了数据分布偏移问题,并节约了时间和资源,这对于窃电行为的有效监测和管理具有重要意义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1