一种考虑用户满意度的需求响应激励价格确定方法及装置

文档序号：32403701发布日期：2022-12-02 19:52阅读：来源：国知局

技术特征：
1.一种考虑用户满意度的需求响应激励价格确定方法，其特征是，包括步骤：s1、建立基于分层电力市场和碳排放交易市场的激励型需求响应模型，包括电网运营商模型和用户侧模型，以及目标函数模型；s2、通过聚类算法确定用户的需求响应潜力等级；通过历史响应数据确定用户的响应率和不同时段的激励弹性系数；s3、将用户的需求响应潜力等级、响应率和激励弹性系数作为模型参数输入激励型需求响应模型，基于强化学习中的q学习算法对激励型需求响应模型进行求解，得到最优激励补贴价格。2.根据权利要求1所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，所述电网运营商模型包括碳排放收益模型，减少的购电成本模型，激励成本模型；所述电网运营商模型为：所述碳排放收益模型为：所述减少的购电成本模型为：所述激励成本模型为：其中式中，f
gr
表示电网收益，c
gr
表示碳排放收益，c
rc
表示减少的购电成本，c
ic
表示激励成本，i代表用户，t代表时间，n是用户的集合，t是一天中所有时间段的集合；表示用户i在t时间段参与活动的响应负荷，；表示用户i在t时段的原始用电需求；表示用户i的激励弹性系数，其含义为补贴发生1%的偏差而引起该时段负荷需求调整的百分数；表示用户i在t时段参与需求响应获得的激励补贴价格，由电网运营商制定，表示最低激励补贴价格；表示在t时刻标准煤的交易价格单价；表示在t时刻当地碳交易市场的二氧化碳的交易单价；表示t时刻电力市场批发电价的实时价格。3.根据权利要求2所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，所述用户侧模型包括节约电费收益模型、补贴收益模型、用户不满意度模型；所述用户侧模型为：所述节约电费收益模型为：
所述补贴收益模型为：所述用户不满意度模型所述用户不满意度模型其中，f
ur
表示用户收益，c
sr
表示节约电费收益，c
si
表示补贴收益，c
ud
表示用户不满意度，代表用户i在t时刻的用电价格；是用户i的响应率，通过历史响应效果来计算，代表用户i的历史响应负荷，代表用户i的历史用电需求；代表用户i的需求响应潜力等级；∈[0，1]，∈[0，1]。4.根据权利要求3所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，所述目标函数模型为：式中，ρ是收益权重因子，表示为电网运营商收益和用户收益的重要性比例，ρ∈[0，1]。5.根据权利要求1所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，步骤s2中，获取活动实施地区的用户的前一周的用电负荷曲线，通过负荷曲线聚类识别不同用户的用能特性，根据其用能特性划分其需求响应潜力等级。6.根据权利要求1所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，步骤s2中，获取用户参与需求响应活动的历史响应数据，通过神经网络辨识用户i的响应率和不同时段的激励弹性系数。7.根据权利要求1所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，步骤s3具体包括：将基于分层电力市场和碳排放交易市场的激励型需求响应模型决策优化问题建模成一个智能体进行学习的有限mdp，电网运营商首先为用户设置一个激励补贴价格，接着用户响应并削减自己的用电负荷，同时把用户和电网的收益反馈给电网运营商，然后电网运营商根据用户的负荷削减量以及当前的总收益重新设置激励补贴价格，当用户和电网的总收益取得最大值，或达到收敛条件时停止迭代过程，此时的激励补贴价格就是所求最优的基于激励的需求响应策略。8.根据权利要求4所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，步骤s3过程如下：步骤s31:初始化参数，包括：用户i的需求响应潜力等级，激励弹性系数，用户i的响应率，收益权重因子ρ，用户i的响应率，折扣系数α，学习率θ，贪婪系数ε，，，，，，t，设置的区间；
步骤s32:初始化q表格，q表格中各元素为零，设置时间段t=0，用户i=0;步骤s33:观察用户i在t=0时间段参与活动的响应负荷;步骤s34:用贪婪策略选择用户i在t时段参与需求响应获得的激励补贴价格；步骤s35:计算奖励，观察用户i在t+1时间段参与活动的响应负荷，并且更新q值；步骤s36:判断是否达到最大时间段t，是则转到下一步骤，否则，t=t+1,返回步骤s34；步骤s37:判断q表格是否收敛到最大值，是则转到下一步骤，否则，i=i+1,返回步骤s33；步骤s38:输出一天中t个时间段的最优激励补贴价格。9.根据权利要求8所述的考虑用户满意度的需求响应激励价格确定方法，其特征是，步骤s35中，所述q值可用下面的式子计算：式中，为用户i在t时刻的q值，为用户i在t时刻的响应负荷，为用户i在t时刻得到的激励补贴价格，α是折扣系数，为用户i在t+1时刻的q值，会在每次迭代过程中进行更新，直到取得最大的累计折扣回报或者达到最大迭代次数，q值更新方式如下式：式中，为用户i在t时刻下一次迭代的q值，为用户i在t时刻下一次迭代的响应负荷，为用户i在t时刻下一次迭代的激励补贴价格，为用户i在t+1时刻下一次迭代的q值，θ是学习率，取值范围是[0,1]。10.一种考虑用户满意度的需求响应激励价格确定装置，包括非易失性计算机存储介质，计算机存储介质存储有计算机可执行指令，其特征是，所述计算机可执行指令可执行权利要求1-9任意一项所述考虑用户满意度的需求响应激励价格确定方法。

技术总结
本发明属于智能用电技术领域，涉及一种考虑用户满意度的需求响应激励价格确定方法及装置，该方法立基于分层电力市场和碳排放交易市场的激励型需求响应模型，包括电网运营商模型和用户侧模型，以及目标函数模型；通过聚类算法确定用户的需求响应潜力等级；通过历史响应数据确定用户的响应率和不同时段的激励弹性系数；基于强化学习中的Q学习算法对激励型需求响应模型进行求解，得到最优激励补贴价格。本发明综合考虑碳排放交易市场和用户不满意度等影响因素，根据用户的相关用能特性和碳交易市场的实时交易价格改变模型的参数，输出补贴价格，帮助供电公司制定科学的需求响应调控策略，实现电力资源合理配置。实现电力资源合理配置。实现电力资源合理配置。

技术研发人员：丁贵立韩威许志浩王宗耀康兵朱卓航高永民蒋善旗
受保护的技术使用者：南昌工程学院
技术研发日：2022.11.03
技术公布日：2022/12/1

完整全部详细技术资料下载

当前第2页1 2