一种基于主从博弈的综合能源系统互动模拟方法及装置与流程

文档序号:15830626发布日期:2018-11-07 07:15阅读:339来源:国知局
一种基于主从博弈的综合能源系统互动模拟方法及装置与流程

本发明涉及电力规划技术领域,尤其涉及一种基于主从博弈的综合能源系统互动模拟方法及装置。

背景技术

随着我国综合能源技术的发展以及相关政策的推动,在工业园区建立以cchp为核心单元的综合能源系统并辅以合理的互动机制,从而在满足工业园区内部多类型用能需求和资源合理调配的基础上实现与园区外部电网的友好互动。

这些互动机制的建立需要结合市场的环境,当前随着我国电力体制改革进程的推进,售电市场化环境逐渐形成,工业园区综合能源系统中的用户与运营商之间存在竞争博弈关系。

这些互动机制的制定需要通过仿真手段对互动机制的流程进行模拟,一方面分析互动机制的实际效果,另一方面论证互动机制与其他机制的兼容能力。但是当前关于互动机制的仿真研究主要聚焦于多能源的优化调度和需求响应,这种研究多以系统自身调度经济性为目标,很少涉及用户侧对多类型能源的响应行为,在规划过程中并未考虑用户侧的主观能动性,难以适应当前的电力市场。

因此,导致了当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。



技术实现要素:

本发明提供了一种基于主从博弈的综合能源系统互动模拟方法及装置,解决当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。

本发明提供了一种基于主从博弈的综合能源系统互动模拟方法,包括:

s1:获取用户的各个时段的初始负荷量和可调负荷量,初始化运营商各个负荷越限时段的削峰补偿电价,构建运营商的收益模型和各个用户的收益模型;

s2:根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量;

s3:将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高,若是,则以本次计算的运营商收益作为新的最大运营商收益,执行步骤s4,若否,则执行步骤s4,其中,初始的最大运营商收益为0;

s4:迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则通过优化算法对最大运营商收益对应的各个负荷越限时段的削峰补偿电价进行优化,并返回步骤s2。

优选地,步骤s1具体包括:

s11:获取用户的各个时段的初始负荷量和可调负荷量,其中,初始负荷量包括:初始用电负荷量和初始热负荷量,可调负荷量包括:可调电负荷量和可调热负荷量;

s12:初始化运营商各个负荷越限时段的削峰补偿电价;

s13:以产能成本与削峰补偿成本相加得到运营商成本,以运营商售能收益减去运营商成本构建运营商的收益模型,以用户的削峰补偿收益与用能成本的差值加上用能效用函数构建各个用户的收益模型。

优选地,步骤s4具体包括:

s41:迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则执行步骤s42;

s42:以各个负荷越限时段的削峰补偿电价作为种群内个体的优化变量,通过微分进化算法种群进行交叉和变异,得到新的各个负荷越限时段的削峰补偿电价,并返回步骤s2。

优选地,步骤s2具体包括:根据各个负荷越限时段的削峰补偿电价通过matlab内的yalmip工具箱计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

优选地,步骤s2具体包括:根据各个负荷越限时段的削峰补偿电价通过有效集算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

本发明提供了一种基于主从博弈的综合能源系统互动模拟装置,包括:

收益建模单元,用于获取用户的各个时段的初始负荷量和可调负荷量,初始化运营商各个负荷越限时段的削峰补偿电价,构建运营商的收益模型和各个用户的收益模型;

用户规划单元,用于根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量;

运营判断单元,用于将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高,若是,则以本次计算的运营商收益作为新的最大运营商收益,触发电价优化单元,若否,则触发电价优化单元,其中,初始的最大运营商收益为0;

电价优化单元,用于迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则通过优化算法对最大运营商收益对应的各个负荷越限时段的削峰补偿电价进行优化,并触发用户规划单元。

优选地,收益建模单元具体包括:

初始子单元,用于获取用户的各个时段的初始负荷量和可调负荷量,其中,初始负荷量包括:初始用电负荷量和初始热负荷量,可调负荷量包括:可调电负荷量和可调热负荷量;

削峰子单元,用于初始化运营商各个负荷越限时段的削峰补偿电价;

建模子单元,用于以产能成本与削峰补偿成本相加得到运营商成本,以运营商售能收益减去运营商成本构建运营商的收益模型,以用户的削峰补偿收益与用能成本的差值加上用能效用函数构建各个用户的收益模型。

优选地,电价优化单元具体包括:

判断子单元,用于迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则触发优化子单元;

优化子单元,用于以各个负荷越限时段的削峰补偿电价作为种群内个体的优化变量,通过微分进化算法种群进行交叉和变异,得到新的各个负荷越限时段的削峰补偿电价,并触发用户规划单元。

优选地,用户规划单元,具体用于根据各个负荷越限时段的削峰补偿电价通过matlab内的yalmip工具箱计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

优选地,用户规划单元,具体用于根据各个负荷越限时段的削峰补偿电价通过有效集算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

从以上技术方案可以看出,本发明具有以下优点:

本发明提供了一种基于主从博弈的综合能源系统互动模拟方法,包括:s1:获取用户的各个时段的初始负荷量和可调负荷量,初始化运营商各个负荷越限时段的削峰补偿电价,构建运营商的收益模型和各个用户的收益模型;s2:根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量;s3:将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高,若是,则以本次计算的运营商收益作为新的最大运营商收益,执行步骤s4,若否,则执行步骤s4,其中,初始的最大运营商收益为0;s4:迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则通过优化算法对最大运营商收益对应的各个负荷越限时段的削峰补偿电价进行优化,并返回步骤s2。

本发明提供的基于主从博弈的综合能源系统互动模拟方法中充分模拟用户和运营商追求自身收益最大化的趋向,采用主从博弈模型来描述两者的互动关系,以运营商为主导者,制定削峰补偿电价,用户为跟从者,针对削峰补偿电价规划自身用电,两者循环博弈直至达到均衡解,真实模拟了运营商和用户的互动行为,解决了当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的一个实施例的流程示意图;

图2为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的另一个实施例的流程示意图;

图3为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟装置的一个实施例的结构示意图;

图4为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的应用例的工业公共电价和削峰补偿电价示意图;

图5为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的应用例的互动前和互动后的能源系统的系统电负荷曲线图。

具体实施方式

本发明实施例提供了一种基于主从博弈的综合能源系统互动模拟方法及装置,解决当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1,本发明实施例提供了一种基于主从博弈的综合能源系统互动模拟方法的一个实施例,包括:

步骤101:获取用户的各个时段的初始负荷量和可调负荷量,初始化运营商各个负荷越限时段的削峰补偿电价,构建运营商的收益模型和各个用户的收益模型;

需要说明的是,在进行能源系统互动模拟前,需要获取用户在各个时段的初始负荷量和可调负荷量,并且设置初始的削峰补偿电价,削峰补偿电价的设置方式可以是随机设置。

并且还需要构建运营商的收益模型和各个用户的收益模型,以进行后续互动博弈。

步骤102:根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量;

需要说明的是,当运营商制定了削峰补偿电价之后,由于运营商和用户之间存在博弈关系,所以用户会追求自身收益最大化,可根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量,此时用户拥有最大收益,符合用户的行为趋势。

步骤103:将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高,若是,则以本次计算的运营商收益作为新的最大运营商收益,执行步骤104,若否,则执行步骤104,其中,初始的最大运营商收益为0;

需要说明的是,用户做出了负荷响应之后,运营商需要判断自身是否拥有更高的收益,将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高。

如果是,则说明本次的削峰补偿电价与之前的最佳削峰补偿电价更优,将本次的削峰补偿电价作为新的最佳削峰有偿电价,将本次计算的运营商收益作为新的最大运营商收益,之后执行步骤104继续寻找最佳削峰补偿电价。

如果否,则说明本次削峰补偿电价不如最佳补偿电价,则不采用本次削峰补偿电价,直接执行步骤104继续寻找最佳削峰补偿电价。

步骤104:迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则执行步骤105,若否,则通过优化算法对最大运营商收益对应的各个负荷越限时段的削峰补偿电价进行优化,并返回步骤102。

需要说明的是,迭代次数加1,判断迭代次数是否等于预置迭代次数,如果是,则达到迭代终止条件,停止迭代,执行步骤105,预置迭代次数根据实际需要进行设置。

如果否,则继续下一次迭代,通过优化算法对各个负荷越限时段的削峰补偿电价进行优化,得到新的各个负荷越限时段的削峰补偿电价,并返回步骤102进行用户和运营商的博弈过程。

步骤105:输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量。

本发明提供的基于主从博弈的综合能源系统互动模拟方法中充分模拟用户和运营商追求自身收益最大化的趋向,采用主从博弈模型来描述两者的互动关系,以运营商为主导者,制定削峰补偿电价,用户为跟从者,针对削峰补偿电价规划自身用电,两者循环博弈直至达到均衡解,真实模拟了运营商和用户的互动行为,解决了当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。以上为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的一个实施例,以下为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的另一个实施例。

请参阅图2,本发明实施例提供了一种基于主从博弈的综合能源系统互动模拟方法的另一个实施例,包括:

步骤201:获取用户的各个时段的初始负荷量和可调负荷量,其中,初始负荷量包括:初始用电负荷量和初始热负荷量,可调负荷量包括:可调电负荷量和可调热负荷量;

需要说明的是,工业园区综合能源系统互动机制为运营商和用户提供了一种信息交互的手段,用于实现园区内负荷削减、负荷平移和热电负荷转换,进而满足电力调度机构对园区下达的削峰指标。

运营商和用户通过感知周围的环境,彼此之间进行交互,实现互动过程。运营商需要协调用户之间的信息交互,确保所有参与主体信息的互联互通,同时负责园区负荷互动计划的具体制定,协调用户之间能量流和信息流的互动;用户接收运营商的指令,根据自身设备情况等对其作出响应,并等待运营商下一步指令。

当前的互动机制主要包括5个阶段:

1、前期准备阶段:在园区互动机制正式实施之前,电网公司、园区运营商与底层用户等做的一系列准备工作,主要包括确定互动资源及补偿形式、运营商与用户签订供能合同以及年度预测等。

2、日前决策阶段:园区运营商提前一天,通过负荷预测,对次日是否启动互动机制和次日具体互动计划等进行最优决策。该阶段任务主要包括互动机制启动条件判定等环节。

3、日内交互阶段:在当日的互动过程中,运营商对日前互动计划中存在的偏差或紧急情况进行修正和再调度,底部执行层的各主体按照计划进行主体间的互动,完成削峰指标。

4、有效性判定阶段:运营商根据最终确定的调度计划(包括用户竞价、中断权交易、热电互动),对用户的响应有效性进行判定。

5、月度结算阶段:每月初,运营商或售电公司对上个月用户响应削峰需求情况进行统计和结算,对用户或cchp支付补贴或收取罚款。

这些互动机制的制定需要通过仿真手段对互动机制的流程进行模拟,一方面分析互动机制的实际效果,另一方面论证互动机制与其他机制的兼容能力。

在对此互动机制进行仿真时,需要构建运营商和用户的互动模型,如在日前决策阶段和日内交互阶段的修正中运营商制定削峰补偿电价和用户对自身负荷寻优。

但是当前关于互动机制的仿真研究主要聚焦于多能源的优化调度和需求响应,这种研究多以系统自身调度经济性为目标,很少涉及用户侧对多类型能源的响应行为,在规划仿真过程中并未考虑用户侧的主观能动性,难以适应当前的电力市场。

本实施例中的基于主从博弈的综合能源系统互动模拟方法提供了一种基于主从博弈的各参与主体互动模型的建立方法,建立的参与主体互动模型一方面反映互动机制中前期准备阶段用户负荷情况以及运营商的削峰定价方法,另一方面为后续互动过程中达到的博弈均衡提供目标函数。

在建模的初始需要获取用户的各个时段的初始负荷量和可调负荷量,其中,初始负荷量包括:初始用电负荷量和初始热负荷量,可调负荷量包括:可调电负荷量和可调热负荷量。

可调电负荷量具体包括:可平移电负荷量和可削减电负荷量。

步骤202:初始化运营商各个负荷越限时段的削峰补偿电价;

需要说明的是,为了起到削峰作用,运营商需要在负荷越限时段提供削峰补偿电价吸引用户削减可削减负荷或者将可平移负荷平移至非越限时段。

步骤203:以产能成本与削峰补偿成本相加得到运营商成本,以运营商售能收益减去运营商成本构建运营商的收益模型,以用户的削峰补偿收益与用能成本的差值加上用能效用函数构建各个用户的收益模型;

需要说明的是,在工业园区综合能源系统中,用户及运营商通过感知周围的环境、各主体间的交互共享自身信息,具备自主响应互动机制的决策能力。

基于此,针对工业园区综合能源的实际削峰需求、用户的用能行为特征、以及各参与主体的效益诉求,建立用户模型和运营商模型。

用户的电负荷模型:

将用户群作为一个整体,且运营商在各户安装了光伏发电装置,那么在h时段系统的净负荷为所有用户的净负荷之和,表达式为:

i∈(1,2,…n)(3)

其中,lhi为第i个用户(用户i)在时段h的电负荷量,n为用户总数,nhli为用户i在时段h的净电负荷,nhl为所有用户在时段h的净电负荷,phi为第i个用户在时段h的光伏预测量,nli为用户i在所有时段的净负荷的集合。

根据是否处于削峰时段,用户i在时段h的电负荷模型的定义如下:

h∈(1,2,…,t)(6)

其中,hex为负荷越限时段的集合,liinit_h为用户i在负荷越限时段的初始用电负荷量,△rih为用户i在负荷越限时段根据自身情况申报的实际调节电负荷量,包含实际平移电负荷量和实际削减电负荷量,△lhih为用户i在负荷越限时段增加实际增加热负荷量而耦合调节的电负荷量,lhfi为用户i的固定用电负荷,lhsi为用户i在非负荷越限时段因为在负荷越限时段负荷平移而增加的可平移负荷增加量,t为时段总数,如日前决策阶段则t可取为24,如果是日内交互阶段,则可以选择4小时预测调节一次,则t可取为4。

通过式(4)以分段函数的形式表现了对用户电负荷量根据削峰要求进行的负荷调整。

在负荷非越限时段的初始用电负荷可全部视为固定用电负荷,在负荷越限时段的初始用电负荷则是固定用电负荷和实际调节电负荷量之和,所以式(5)表示初始用电负荷减去实际调节电负荷量不能小于固定用电负荷,固定用电负荷不可被调节。

固定用电负荷对可靠性要求很高,要求实时保证供电量,第i个用户固定用电负荷表达式如下:

其中,为用户i的全时段的固定用电负荷的集合。

实际调节负荷量包括:实际平移电负荷量、实际削减电负荷量和实际增加热负荷量。

实际平移电负荷量无需实时保证供电,可以根据需要调整用电时间,只需保证一定时间内的连续供电即可,用户i的实际平移电负荷量表达式为:

其中,lsi为用户i在全时间段的实际平移电负荷量的集合,lhsi为用户i在时段h的实际平移电负荷量,lsimin为用户i的实际平移电负荷量下限值,lsimax为用户i的实际平移电负荷量上限值,qi为用户i的非越限时间段的实际平移电负荷量的总量的上限值。

实际削减电负荷量可根据具体情况由调度指令进行全部削减或部分削减,用户i的实际削减电负荷量表达式为:

其中,lci为用户i在全时间段的实际削减电负荷量的集合,lhci为用户i在时段h的实际削减电负荷量,lcimin为用户i的实际平移电负荷量下限值,lcimax为用户i的实际平移电负荷量上限值,ci为用户i的实际平移电负荷量的总量的上限值。

用户i在h时段的总体热负荷表达式如下:

其中,hi为用户i各个时段的热负荷的集合,hhfi为用户i的固定热负荷。

固定热负荷指不可变热负荷,不能接受调度指令的调节。表达式如下:

实际增加热负荷量指用户因生产需要即时增加的热负荷量,具体表达式如下:

其中,△hi为用户i在全时间段的实际增加热负荷量的集合,△hih为用户i在时段h的实际增加热负荷量,△himin为用户i的热负荷增长下限值,△himax为用户i的热负荷增长上限值,△hi为用户i的实际增加热负荷量的总量的上限值。

用户因为增加热负荷量导致的电负荷变换的物理量是热电耦合电负荷,该值可能增加,可能减少,也可能保持不变。定义如下:

a∈[-∞,+∞](21)

其中,△lhih为用户i在负荷越限时段增加实际增加热负荷量而耦合调节的电负荷量;a为热电耦合系数,表征着热电负荷的耦合强度,正值为热电正耦合,表示电、热负荷同向变化,即热负荷增加,电负荷也增加,负值为热电负耦合,表示电、热负荷反向变化,即热负荷增加,电负荷减少,零为热电无耦合,其绝对值越大,表明耦合强度越大,反之,则越小;ζ为热电单位的换算系数,是一个常数,取值为0.7,即1t/h=0.7mwh。

运营商可在各个用户处安装光伏发电装置,光伏出力具有间歇性和波动性,采取“自发自用,余电上网”的模式,保证新能源的就地消纳。根据光伏的出力特性,光伏逆变器会采取最大功率点跟踪的控制策略,第i个用户光伏出力预测值表达式如下:

pi=[pi1,…,pit](22)

用户的收益模型是指用户的净收益模型,即用户的收益与用能成本之间的差值,用户的收益包括:削峰补偿收益和用能效用,可表示为:

其中,eih为用户i在时段h的用能效用函数,fhi,cost为用户i在时段h的用能成本,fhi,comp为用户i在时段h的削峰补偿收益,ki为偏好系数,是通过文件和用户体验总结出用户体验收益随负荷自变量和偏好系数的变化关系。对于某一固定负荷自变量,偏好系数取值越大则收益也越大,由于时,趋于无穷,因此用替代

fhi,cost为用户i在时段h的用能成本,表达式为:

其中,phms为运营商的单位售电电价,γ为运营商的单位热力价格。

fhi,comp为用户i在时段h的削峰补偿收益,表达式为:

其中,λhg为h时段的削峰补偿电价,discount为热负荷折扣。

在系统日负荷中,一旦检测有超过年负荷峰值的的时段,就立刻触发互动机制,用户响应运营商的互动请求,采取可平移负荷及直接削减负荷的策略,运营商对于用户削减负荷造成的生产损失给予适当的经济补偿;非越限时段,运营商不对用户行为提供补偿。

运营商的收益模型如下:

prom=em-cm(27)

其中,em为运营商售能收益,cm为运营商成本。

运营商通过向用户出售电能和热能以及向电网售电来获取收益,其收益可以表示为下式:

其中,ehm为运营商h时段的售能收益,pgs为运营商的单位售电电价,pgb为运营商的单位购电电价,β为光伏补贴价格,h时段的总发电负荷为ephchp。

运营商成本来自cchp燃气成本及向用户提供削峰补偿,则运营商成本可以表达如下:

其中,chm为运营商h时段的运营商成本,pgas为天然气的单位价格,l为天然气低热值,hphchp为时段h的总热负荷,lsihex为负荷越限时段的实际平移电负荷量总量,lsihex为负荷越限时段的实际削减电负荷量总量,为负荷越限时段的实际增加热负荷量总量,ηchp为发电效率,θ为热电比。

hphchp为时段h的总热负荷,可以表示为下式:

时段h的总电负荷可以表示下式:

其中,ηloss为热损失系数,δheat为热系数。

步骤204:根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量;

需要说明的是,在互动模拟中,运营商作为主导者,制定削峰补偿电价,用户作为跟从者。

运营商的策略为其对于用户削减电负荷行为的电补偿价格,用户的策略为其可平移电负荷量、变化的热负荷量以及可削减电负荷量,二者策略的制定原则均为实现自身效益最大化。

在互动模型中,euseri表示用户i在各个时段的总收益,则针对目前建立的模型,采用分布式优化方法对各用户及运营商的收益模型进行优化求解,求解表达式如式(33)和(34),约束条件为式(35):

直至博弈的参加者都不能通过单独改变自身策略来增加自身收益,则达到“斯塔克伯格均衡点”,互动过程结束。主从博弈可以描述为下式:

gch={(n∪m);s1,…,sn;proui,…,proun;λe;prom}(36)

通常一个博弈包括博弈方、博弈方策略及博弈方收益几个主要因素,主从博弈gch的主要因素如下所述:

1、博弈方包括用户集合n(跟从者),运营商m(主导者);

2、{s1,…sn}表示用户n中的每一个用户的策略集合,包括实际平移电负荷量、实际增加热负荷量和实际削减电负荷量;

3、{proui,...,proun}表示用户的收益;

4、λe表示运营商对于用户削负荷给予的电补偿价格,为运营商的策略

5、prom表示运营商的收益。

式中,hmax为热负荷上限值,lmax为电负荷上限值。

主从博弈的最优策略集为达到斯塔克伯格博弈均衡时的均衡解,在该均衡解处,博弈的参加者都不能通过单独改变自己的策略来增加自身收益。

斯塔克伯格均衡解可以定义为一个策略集合对于用户i,如果它的策略相对于该博弈中的其他博弈者的策略集而言是最优策略,即:

式中:

在求均衡解的过程中,供应商提供削峰补偿电价,用户根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

步骤205:将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高,若是,则以本次计算的运营商收益作为新的最大运营商收益,执行步骤206,若否,则执行步骤206,其中,初始的最大运营商收益为0;

需要说明的是,当用户计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量之后,负荷运营商得倒用户申报的实际调节负荷量,将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益。

如果本次计算的运营商收益比最大运营商收益大,则说明本次采用的削峰补偿电价比历史中的最大运营商收益的削峰补偿电价更接近均衡解,采用本次计算的运营商收益作为新的最大运营商收益,以本次削峰补偿电价作为新的最佳削峰补偿电价,并执行步骤206继续下一步。

如果本次计算的运营商收益比最大运营商收益小,则说明本次采用的削峰补偿电价并非是均衡解,无法使运营商达到最大收益,则依然采用历史数据中的最大运营商收益和其对应的削峰补偿电价作为当前最优解,并执行步骤206继续下一步。

步骤206:迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则执行步骤207,若否,则执行步骤208;

需要说明的是,迭代次数家1,如果迭代次数达到预置迭代次数,则执行步骤207输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量作为均衡解。

如果未达到预置迭代次数,则继续执行步骤208进行下一次博弈以尝试寻找新的最优解。

步骤207:输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量;

步骤208:以各个负荷越限时段的削峰补偿电价作为种群内个体的优化变量,通过微分进化算法种群进行交叉和变异,得到新的各个负荷越限时段的削峰补偿电价,并返回步骤204。

需要说明的是,寻找新的最优解则需要运营商制定新的削峰补偿电价,可通过优化算法对各个负荷越限时段的削峰补偿电价进行优化,优化算法包括但不限于:梯度下降法、牛顿法、拟牛顿法、共轭梯度法、启发式优化算法和拉格朗日乘数法等。

微分进化算法是启发式优化算法的其中一种,本实施例中以微分进化算法作为较优选的进化算法。

使用微分进化算法需要构建种群,种群个体数量根据实际需要而定,各个种群个体内的优化变量则是各个负荷越限时段的削峰补偿电价,然后进行交叉和变异,得到新的各个负荷越限时段的削峰补偿电价,然后返回步骤204继续用户寻优和运营商收益比较,进行下一轮博弈,直至达到预置迭代次数,则认为最后的输出量为均衡解。

进一步地,步骤204具体包括:根据各个负荷越限时段的削峰补偿电价通过matlab内的yalmip工具箱计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

需要说明的是,用户的收益模型是一个规划问题模型,可通过数学规划算法对其进行寻优,数学规划算法可以是具体的算法或者一些已经封装好的数学工具,当选择数学工具时,可以根据各个负荷越限时段的削峰补偿电价通过matlab内的yalmip工具箱结合cplex工具箱计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

或,进一步地,步骤204具体包括:根据各个负荷越限时段的削峰补偿电价通过有效集算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

需要说明的是,当选择具体的算法进行计算时,可以选择有效集算法进行计算。

上述就是供应商和用户之间的基于主从博弈的互动模拟模型,通过此模型可以完成整个供应商和用户之间互动机制的模拟。

前期准备阶段模拟:在园区互动机制正式实施之前,或新的互动周期开始之后,电网公司、园区运营商与第三层用户等为高效顺利的开展互动机制而做的一系列准备工作。该阶段的任务主要包括确定互动资源及补偿形式、运营商与用户签订供能合同以及年度预测等几部分内容。

日前阶段模拟:首先,配电网调度中心先完成24小时的日前负荷预测,在检测到有潮流越限的时段时,就向越限的园区运营商发出削峰指令,园区运营商在接收到削峰指令后,采用上述基于主从博弈的互动模拟模型进行互动模拟:

1、先随机初始化预计要下发给用户的补偿电价,初始补偿电价不得超过事前阶段签订的合同的上限;

2、运营商就向下一级用户侧的各个用户发送互动请求,各用户结合自身的生产计划和收益函数,向运营商申报可平移负荷(实际平移电负荷量)、可削减负荷(实际削减电负荷量)和可增加热负荷(实际增加热负荷量)来与运营商进行互动;

3、运营商汇总各户的申报情况之后,根据自身的收益函数重新制定补偿电价,并将其公布给各户;

4、用户继续对自己的收益函数寻优,并向运营商申报重新计算得到的可平移负荷,可削减负荷,可增加热负荷,再次与运营商互动;

5、2至4互动过程可以是一次甚至有限的若干次,每一次用户和运营商都对自身的效益函数寻优,直至达到博弈均衡,运营商和用户都不能通过单独改变自身策略来增加收益,本轮互动结束。

园区运营商上报更新之后的园区电力负荷给配网调度中心。配电网在校验有功潮流是否发生越限后制定日前发电计划。此后,各主体结束日前阶段,进入日内阶段。

日内阶段模拟:日内交互阶段是指在当日的互动过程中,运营商对日前互动计划中存在的偏差或紧急情况进行修正和再调度,底部执行层的各主体按照计划进行主体间的互动,完成削峰指标。

该阶段的主要任务包括运营商对日前的削峰计划进行修正、用户之间的中断权交易,以及电动汽车的有序充放电等。

日内,运营商实时监测园区系统负荷状态,用户分布自治系统每三个小时进行一次超短期负荷预测,预测其后四个小时内的电、热负荷,以及分布式光伏发电量,并预留一个小时用于计划下发、用户报价和再撮合。

日内互动的启动判据与日前相同。若园区出现新的负荷尖峰,则在日前计划的基础上进行日内计划的修正。若园区调度优化需求,也可申请启动互动,但需提前将互动计划告知运营商。

具体操作应按照如下优先级进行;

1、若因负荷预测失准或因其他原因导致日前互动计划的改变,则运营商优先调用用户报价中能在任意时段可削减的负荷,对计划进行修正。

2、若仅靠日前计划的修正无法满足新的削峰指标或调度需求,则运营商发布新的互动计划(与日前相同,采用基于主从博弈的互动模型),组织用户报价。

3、用户接受到日内的削峰需求,重新评估其在拟削峰时段的负荷可调能力(不包含其已经在日前计划申报的削峰能力),在规定时间内(如半小时内)递交响应报价。

4、运营商按照日前决策相同的方法,将热电互动和可中断投标进行联合优化,形成新的调度计划,并至少于拟削峰时段半小时内通知用户。

5、用户分布自治控制系统(用户和cchp)根据确定的日前和日内削峰计划曲线控制用电/产能计划,在规定的时段削减规定量的负荷或增加规定量的产热量。

有效性判定阶段模拟:日内执行结束后,运营商根据最终确定的调度计划(包括用户竞价、中断权交易、热电互动),对用户的响应有效性进行判定。用户在负荷削减过程中如同时满足:1、响应时段最大负荷不高于基线最大负荷;2、响应时段平均负荷低于基线平均负荷,并且其差值大于等于规定的负荷削减量;则视为有效响应,否则视为无效响应。

热电互动有效性以cchp产热量为指标进行判定。cchp在互动过程中若满足:1、响应时段每小时产热量大于等于对应基线值;2、产热量与基线的差值大于等于规定的增发量,则视为有效响应,否则视为无效响应。

结算阶段模拟:每月初,运营商或售电公司对上个月用户响应削峰需求情况进行统计和结算:1、如果用户或cchp按照日前和日内约定响应了削峰需求,则按约定的补偿价格对其进行结算。运营商向用户支付可中断负荷补贴;2、如果用户没有按照日前或日内约定响应削峰需求,并且没有提前通知运营商,则对其按照补偿价格的5-10倍进行惩罚,同时也能一定程度上抑制用户报高价。惩罚费用计入平衡账户,在上个月的削峰收益中扣减该部分惩罚费用;3、由于调度优化启动的互动,优化后节约的运行成本,由受益方(例如cchp)向互动参与方(例如用户)支付费用,不由运营商按照补贴价格结算;4、对于用户之间的中断权交易,运营商或售电公司只统计不结算;5、电动汽车的充电费用按充电次数结算,用户充电完成后当场交付费用。

上述互动机制只是本实施例中的基于主从博弈的综合能源系统互动模拟方法可以应用的其中一种互动机制方案,但并不是对本实施例中的互动模拟方法的限制,对于其他的互动机制,只要能提供本实施例中的互动模拟方法所需的基本数据,同样可应用本实施例中的基于主从博弈的综合能源系统互动模拟方法。

本实施例提供了基于主从博弈的综合能源系统互动模拟方法,上述互动机制可以通过此互动模拟方法仿真程序上进行仿真,以主从博弈关系来模拟供应商和用户的行为进行模拟,与当前以系统自身调度经济性为目标的仿真方法相比,本实施例提供的互动模拟方法真实还原了运营商和用户追求自身最大收益的博弈过程,以运营商为主导者,制定削峰补偿电价,用户为跟从者,针对削峰补偿电价规划自身用电,两者循环博弈直至达到均衡解,真实模拟了运营商和用户的互动行为,更贴合实际市场情况,准确性高。

对主从博弈互动模型寻求均衡解的过程中,通过合适的数学工具、规划算法和优化算法对用户的收益模型和削峰补偿电价进行寻优和优化,可以提高计算速度和准确性。

并且本实施例中描述了工业园区内多能源互补综合能源系统中热电耦合环节的互动特性,与实际情况贴合,使得仿真更为合理,同时构建了合理的运营商和用户的收益模型,可以真实且全面地反映互动过程对工业园区各参与者的激励效果。

综上所述,本实施例的基于主从博弈的综合能源系统互动模拟方法解决了当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。

以上为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的另一个实施例,以下为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟装置的一个实施例。

请参阅图3,本发明实施例提供了一种基于主从博弈的综合能源系统互动模拟装置的一个实施例,包括:

收益建模单元301,用于获取用户的各个时段的初始负荷量和可调负荷量,初始化运营商各个负荷越限时段的削峰补偿电价,构建运营商的收益模型和各个用户的收益模型;

用户规划单元302,用于根据各个负荷越限时段的削峰补偿电价通过数学规划算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量;

运营判断单元303,用于将各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量输入运营商收益模型,计算运营商收益,判断本次计算的运营商收益是否比最大运营商收益高,若是,则以本次计算的运营商收益作为新的最大运营商收益,触发电价优化单元304,若否,则触发电价优化单元304,其中,初始的最大运营商收益为0;

电价优化单元304,用于迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则通过优化算法对最大运营商收益对应的各个负荷越限时段的削峰补偿电价进行优化,并触发用户规划单元302。

进一步地,收益建模单元301具体包括:

初始子单元3011,用于获取用户的各个时段的初始负荷量和可调负荷量,其中,初始负荷量包括:初始用电负荷量和初始热负荷量,可调负荷量包括:可调电负荷量和可调热负荷量;

削峰子单元3012,用于初始化运营商各个负荷越限时段的削峰补偿电价;

建模子单元3013,用于以产能成本与削峰补偿成本相加得到运营商成本,以运营商售能收益减去运营商成本构建运营商的收益模型,以用户的削峰补偿收益与用能成本的差值加上用能效用函数构建各个用户的收益模型。

进一步地,电价优化单元304具体包括:

判断子单元3041,用于迭代次数加1,判断迭代次数是否等于预置迭代次数,若是,则输出最大运营商收益对应的各个负荷越限时段的削峰补偿电价和各个用户在各个时段的实际调节负荷量,若否,则触发优化子单元3042;

优化子单元3042,用于以各个负荷越限时段的削峰补偿电价作为种群内个体的优化变量,通过微分进化算法种群进行交叉和变异,得到新的各个负荷越限时段的削峰补偿电价,并触发用户规划单元302。

进一步地,用户规划单元302,具体用于根据各个负荷越限时段的削峰补偿电价通过matlab内的yalmip工具箱计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

进一步地,用户规划单元302,具体用于根据各个负荷越限时段的削峰补偿电价通过有效集算法计算当各个用户的收益模型拥有最高收益时各个用户在各个时段的实际调节负荷量。

以上为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的另一个实施例,以下为本发明实施例提供的一种基于主从博弈的综合能源系统互动模拟方法的一个应用例。

请参阅图4和图5,本发明实施例提供了一种基于主从博弈的综合能源系统互动模拟方法的一个应用例:

利用我国某工业园区基础数据,搭建了六个用户的主从博弈模型,仿真结果分析如下:

如图4中的实线所示,用户执行大工业峰谷电价:高峰时段为14:00-17:00和19:00-22:00,平段为08:00-14:00、17:00-19:00和22:00-24:00,低谷时段为0:00-8:00。

工业公共电价按高峰电价1.0911分/kwh、平段电价0.6805分/kwh以及低谷电价0.3647分/kwh计费。

根据图5中的虚线所示,原电负荷的越限时段为2,7,19,21,23和24时,在这些时段需要进行削峰。

通过上述实施例中的基于主从博弈的综合能源系统互动模拟方法进行运营商和用户的决策进行模拟,寻求均衡解,均衡解的各个负荷越限时段的削峰补偿电价如图4的柱状所示,运营商只对于负荷越限时段部分实行价格补偿,且当处于用电高峰时段时,削峰补偿电价要比处于用电低谷时段时高,这是由于用户的生产等活动行为在用电高峰时段可能会由于负荷削减受到较大损失,因而需要更高的补偿价格才能激励用户与运营商之间进行削峰互动。

互动后的系统电力负荷曲线如图5中的实线所示,原负荷越限时段均实现削峰,且非负荷越限时段也不会发生越限,同时又保证了这些时段用户的用电计划不会有较大改变,保证用户的正常生产生活不受较大影响。

综合图4和图5可知,采用本发明提供的基于主从博弈的综合能源系统互动模拟方法可以实现对运营商和用户的市场行为进行模拟,运营商在不同的负荷越限时段需要设置不同的削峰补偿电价使得用户响应削峰,真实反应了运营商和用户追求最大收益的行为趋势,符合实际市场情况,且整个互动过程以削峰补偿电价作为激励,可以达到良好的削峰效果,有利于电力系统的平稳运行,解决了当前的互动机制的仿真未考虑的用户侧主观能动性,无法合理模拟用户的响应行为,难以真实起到越限削峰作用的技术问题。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1