一种植物工厂的智能控制方法及系统、智能监控系统与流程

文档序号:13297042阅读:829来源:国知局
本发明涉及智能控制领域,尤其涉及一种植物工厂的智能控制方法及系统、智能监控系统。
背景技术
::植物工厂是现代设施农业发展的高级阶段,是一种高投入、高技术、精装备的生产体系,集生物技术、工程技术和系统管理于一体,使农业生产从自然生态束缚中脱离出来。按计划周年性进行植物产品生产的工厂化农业系统,是农业产业化进程中吸收应用高新技术成果最具活力和潜力的领域之一,代表着未来农业的发展方向。其中,对于植物工厂中植物生育的温度、湿度、光照、co2浓度以及营养液等环境条件都需要通过计算机进行自动控制,以便能够实时的对植物的生长进行监控及调整,从而保证植物处于最适的生长环境中。技术实现要素:本发明的实施例提供一种植物工厂的智能控制方法及系统、智能监控系统,能够通过q学习算法自适应的调整pid控制器的增益以使得植物生产环境达到最佳状态。为达到上述目的,本发明的实施例采用如下技术方案:本发明实施例一方面提供一种植物工厂的智能控制方法,包括:获取植物生长环境的监测参数与设定参数之间的误差值;采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益;基于所述误差值和调整后的比例增益、积分增益以及微分增益输出对植物生长环境的控制系统的控制命令。进一步优选的,所述采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益包括:根据关系式对当前时刻状态下的q值表进行更新,并将当前时刻的最优行为策略对应的动作作为pid控制器的优化增益其中,xt,kt分别为当前时刻的监测参数和增益参数;xt+1,kt+1为下一时刻的监测参数和增益参数;rt+1为从当前时刻的监测参数xt转变到下一时刻的监测参数xt+1时的奖励函数;γ为折扣因子;α为学习率,α∈(0,1];增益参数k={kp,ki,kd},kp比例增益、ki积分增益、kd微分增益。进一步优选的,所述奖励函数rt+1满足关系式:其中,xref为设定参数;σ为标准方差。进一步优选的,所述智能控制方法还包括:从植物参数数据库中选取所述植物生长环境的设定参数。进一步优选的,所述植物生长环境的监测参数包括温度测定值、湿度监测值、co2浓度监测值、营养液ec值、营养液ph值、光照强度值中的一种或多种。本发明实施例另一方面还提供一种植物工厂的智能控制系统,包括:获取模块,用于获取植物生长环境的监测参数与设定参数之间的误差值;智能体,用于采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益;所述pid控制器,用于基于所述误差值和调整后的比例增益、积分增益以及微分增益输出对植物生长环境的控制系统的控制命令。进一步优选的,所述智能体,用于采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益包括:根据关系式对当前时刻状态下的q值表进行更新,并将当前时刻的最优行为策略对应的动作作为pid控制器的优化增益其中,xt,kt分别为当前时刻的监测参数和增益参数;xt+1,kt+1为下一时刻的监测参数和增益参数;rt+1为从当前时刻的监测参数xt转变到下一时刻的监测参数xt+1时的奖励函数;γ为折扣因子;α为学习率,α∈(0,1];增益参数k={kp,ki,kd},kp比例增益、ki积分增益、kd微分增益。进一步优选的,所述奖励函数rt+1满足关系式:其中,xref为设定参数;σ为标准方差。进一步优选的,所述获取模块还用于从植物参数数据库中选取所述植物生长环境的设定参数。本发明实施例再一方面还提供一种植物工厂的智能监控系统,包括前述的智能控制系统。进一步优选的,所述智能监控系统还包括:语音提示模块、红外感应模块以及检测模块;所述语音提示模块用于根据所述红外感应模块和检测模块检测植物工厂中的环境信息进行语音提示。进一步优选的,所述智能监控系统还包括无线网络模块,用于在植物工厂和用户之间进行通讯。本发明实施例又一方面还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如前述的植物工厂的智能控制方法。本发明实施例又一方面还提供一种包含指令的计算机程序产品,当所述计算机程序产品在终端设备上运行时,使得所述终端设备执行如前述的植物工厂的智能控制方法。本发明实施例提供一种植物工厂的智能控制方法及系统、智能监控系统,该植物工厂的智能控制方法包括:获取植物生长环境的监测参数与设定参数之间的误差值;采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益;基于误差值和调整后的比例增益、积分增益以及微分增益输出对植物生长环境的控制系统的控制命令;本发明中通过q学习算法自适应的调整pid控制器的比例增益、积分增益以及微分增益,从而能够保证pid控制器以最优的增益输出控制命令,以使得植物生产环境达到最佳状态。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种智能控制方法的流程图;图2为本发明实施例提供的一种智能控制系统的示意图;图3为本发明实施例提供的一种包括智能控制系统的智能监控系统的示意图;图4为本发明实施例提供的一种智能监控系统中的监控方法过程示意图;图5为本发明实施例提供的一种智能监控系统中的数据传输过程示意图。附图标记:01-智能监控系统;100-智能控制系统;101-语音提示模块;102-键盘模块;103-红外感应模块;104-检测模块;105-调节模块;106-无线网络模块;107-植物参数数据库。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供一种植物工厂的智能控制方法,如图1所示,该智能控制方法包括:步骤s101、获取植物生长环境的监测参数与设定参数之间的误差值。其中,植物生长环境的监测参数可以是温度监测值、湿度监测值、co2浓度监测值、营养液ec监测值、营养液ph监测值、光照强度监测值中的一种或多种,本发明对此不作具体限定,可以根据实际的植物类型以及植物生长条件需求选择设置。植物生长环境的设定参数与监测参数的类型对应,可以是温度设定参数、湿度设定参数、co2浓度设定参数、营养液ec设定参数、营养液ph设定参数、光照强度设定参数中的一种或多种,本发明对此不作限定,实际中只要保证设定参数与监测参数的类型一一对应即可。需要说明的是,设定参数一般为包括设定上限参数和设定下限参数,上限参数和下限参数之间的范围一般为最佳的植物生产环境条件。另外,对于设定参数而言,可以是用户根据实际需求人为设定的;也可以是从植物参数数据库中选取植物生长环境的设定参数,其中,植物参数数据库可以是基于植物学知识和专家经验,并依据一定准则进行分析整理得到的,从而使得用户无需掌握专业的种植知识也能够进行种植,为用户提供了便利的种植条件。步骤s102、采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益。具体的,q学习算法(q-learning)从环境中感知信息(也即监测参数),对信息进行处理,选择最优的动作,即调整pid控制器比例增益、积分增益以及微分增益达到最优化,进而影响环境,也即q学习算法能够通过系统自身和环境的交互实现参数的自动调整,是一个不断地“试探-评价”的过程。步骤s103、基于误差值和调整后的比例增益、积分增益以及微分增益输出对植物生长环境的控制系统的控制命令。具体的,pid控制器输出的控制命令u(t)与植物生长环境的监测参数与设定参数之间的误差值e(t)以及比例增益kp、积分增益ki以及微分增益kd满足以下关系式:实际中pid控制器基于植物生长环境的监测参数与设定参数之间的误差值e(t),结合增益参数(kp、ki、kd)通过控制命令u(t)控制被控对象,以尽可能的减小该误差值e(t)。综上所述,本发明中通过q学习算法自适应的调整pid控制器的比例增益、积分增益以及微分增益,从而能够保证pid控制器以最优的增益输出控制命令,以使得植物生产环境达到最佳状态。以下对上述步骤s102中通过采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益做进一步的说明。具体的,q学习算法中的q函数代表在状态时采取动作得到的未来价值回报,本发明中将监测参数作为状态变量,将增益作为执行动作,在各状态(监测参数)下学习最优的增益参数,其具体学习过程包括:q学习算法开始运行,并维护一张q值表(q-table)来记录每个状态下的每一种执行动作下的q值。根据关系式对当前时刻状态下的q值表进行更新,并将当前时刻的最优行为策略对应的动作作为pid控制器的优化增益其中,xt,kt分别为当前时刻的监测参数和增益参数;xt+1,kt+1为下一时刻的监测参数和增益参数;rt+1为从当前时刻的监测参数xt转变到下一时刻的监测参数xt+1时的奖励函数;γ为折扣因子;α为学习率,α∈(0,1];增益参数k={kp,ki,kd},kp为比例增益、ki为积分增益、kd为微分增益。需要说明的是,上述学习率α决定了新得到的信息覆盖旧信息的程度,即当前时刻的信息对前一时刻的信息的覆盖程度,一般的学习率α控制着学习的速度,α越大则收敛(监测参数向设定参数收敛)越快,然而过大的α有可能引起不成熟的收敛,因此在实际中可以根据经验结合设备的规格选择设定。另外,折扣因子γ决定了对未来回报的重视程度,同样可以根据经验选择设定。另外,以下提供一种奖励函数rt+1的计算方式,但本发明并不限制于。具体的,奖励函数rt+1满足关系式:其中,xref为设定参数;σ为标准方差,由数据(检测参数)分布的离散程度决定。本发明实施例还提供一种植物工厂的智能控制系统,如图2所示,该智能控制系统包括:获取模块,智能体(agent),pid控制器。获取模块用于获取植物生长环境的监测参数与设定参数之间的误差值e(t)。其中,对于监测参数一般采用传感器监测,例如,温度传感器、湿度传感器(包括空气湿度传感器和土壤湿度传感器)、co2浓度检测传感器、光照强度传感器等;其中co2浓度检测传感器可以采用t6713co2传感器,光照强度传感器可以采用光敏电阻传感器,空气湿度传感器可以dht11传感器等等,实际中根据需要选择设置相应类型的传感器即可,此处不再一一赘述。另外,该获取模块还用于从植物参数数据库中选取植物生长环境的设定参数,使得用户无需掌握专业的种植知识也能够进行种植,为用户提供了便利的种植条件。智能体用于采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益。pid控制器用于基于误差值和调整后的比例增益、积分增益以及微分增益输出对植物生长环境的控制系统的控制命令。实际中pid控制器基于植物生长环境的监测参数xt与设定参数xref之间的误差值e(t),结合增益参数(kp、ki、kd)通过控制命令u(t)控制被控对象(例如,对于湿度控制而言,该被控对象可以是一个电子可控阀门),以尽可能的减小该误差值e(t)。采用本发明中植物工厂的智能控制系统通过q学习算法自适应的调整pid控制器的比例增益、积分增益以及微分增益,从而能够保证pid控制器以最优的增益输出控制命令,以使得植物生产环境达到最佳状态。需要说明的是的,在实际的pid控制器进行控制的过程中,对于pid控制器的初始比例增益、积分增益以及微分增益可以进行认为设定,后续的比例增益、积分增益以及微分增益依据q学习算法自适应的进行调整。具体的,如图2所示,智能体采用q学习算法调整pid控制器的比例增益、积分增益以及微分增益包括:q学习算法开始运行,并维护一张q值表(q-table)来记录每个状态下的每一种执行动作下的q值。根据关系式对当前时刻状态下的q值表进行更新,并将当前时刻的最优行为策略对应的动作作为pid控制器的优化增益其中,xt,kt分别为当前时刻的监测参数和增益参数;xt+1,kt+1为下一时刻的监测参数和增益参数;rt+1为从当前时刻的监测参数xt转变到下一时刻的监测参数xt+1时的奖励函数;γ为折扣因子;α为学习率,α∈(0,1];增益参数k={kp,ki,kd},kp为比例增益、ki为积分增益、kd为微分增益。进一步的,上述奖励函数rt+1满足关系式:其中,xref为设定参数;σ为标准方差。对于该植物工厂的智能控制系统的其他相关信息,可以结合前述与该智能控制系统对应的方法实施例的相关说明,此处不再赘述。以下对智能控制系统的实际控制过程做进一步的说明。第一步,智能体获取当前状态(当前监测参数xt),系统选择执行一个动作(增益kt)通过pid控制器结合当前监测参数xt与设定参数xref作用于当前状态以使得当前状态发生变化(监测参数会朝向设定参数收敛);当然,在初始状态下该动作(增益)可以是人为根据经验选择设定的。第二步,发生变化后的状态作为新的当前状态,也即下一时刻的当前监测参数xt+1作为新的当前监测参数xt,此时,系统反馈奖励函数rt+1。第三步,按照整体运行q学习算法,对q值表进行更新,调整控制策略,并将最优行为策略对应的动作通过pid控制器作用于当前状态以使得当前状态再次发生变化。然后,系统通过循环执行上述第二步和第三步的过程以达到目标状态(也即当前监测参数与设定参数相同),则该循环停止。本发明实施例还提供一种植物工厂的智能监控系统,如图3所示,该智能监控系统01包括前述的智能控制系统100,具有与前述实施例提供的智能控制系统100相同的结构和有益效果。由于前述实施例已经对智能控制系统的结构和有益效果进行了详细的描述,此处不再赘述。具体的,本发明中智能监控系统01可以是基于arduino平台的植物工厂智能监控系统,例如该植物工厂智能监控系统可以选用arduinomega2560开发板作为微控制器,具有多达54路数字输入输出,适合需要大量i/o接口的项目;arduino微控制器将各个感应模块的检测数值输出至智能控制系统100,以通过调节模块105调整植物的生长环境至最佳状态;其中,智能控制系统100可以通过arduino微控制器从植物参数数据库107中获取相关的设定参数。示意的,调节模块105中包括温度调节模块(例如,加热棒)、湿度调节模块(例如,喷雾加湿器)、co2浓度调节模块(例如,通风扇)等;实际中的调节过程可以是:调节温、湿度使达到设定的范围;在实现温湿度调控的基础上,调节到最适宜的co2浓度;研究光照对植物生长的影响,找到最适宜的光照配比;在得出所有控制因素之后,通过综合调控相关参数,观察植物的生长状态。在此基础上,如图3所示,该智能监控系统01还包括:语音提示模块101、红外感应模块103以及检测模块104;语音提示模块101用于根据红外感应模块103和检测模块104检测植物工厂中的环境信息进行语音提示;其中,感应模块102中可以包括温度检测模块、湿度检测模块、co2浓度检测模块等等。具体的,语音提示模块101(例如syn7318语音提示装置)用于根据环境信息进行语音提示;例如,如果检测模块104中的温度检测模块检测的温度值超出了植物的对温度需求的设定参数范围,此时语音提示模块101可以发出警示语音提示;又例如,在用户输入相关设定参数时进行相应的语音指导,比如“欢迎使用本系统,请输入适合植物生长的温度上下限参数”;再例如,如果红外感应模块103检测到有人靠近植物时,可以向人发出语音提示(例如,打招呼,或者,按照设定播报相关的植物生长情况)等等;这样一来,通过语音提示模块101不仅提供人机交互功能,进一步增强系统的实用性和趣味性;另外,还可以设置4*4键盘模块102用于设定适宜植物生长的温、湿度和光强范围等。更进一步的,如图3所示,该智能监控系统还可以包括无线网络模块106,该无线网络模块106能够使得植物工厂和用户之间进行通讯;同时结合新兴的物联网理念,通过无线网络模块106,例如wi-fi模块(ethernetshieldw5100),arduino微控制器将各个感应模块的检测数值上传到物联网平台上,用户可以通过软件(例如手机app,但不限制于此)远程访问该平台,随时了解植物的生长情况及环境参数,以及修改相关参数,实现对植物生长的远程控制;当然还可以设置单独的显示装置对当前植物的生长情况及环境参数进行显示,以便用户能够直观的了解植物的生长情况。以下提供一种智能监控系统01的实际工作过程。如图4所示,在开机时,语音提示模块发出语音提示“欢迎使用本系统,请输入适合植物生长的环境(温度/湿度)上下限参数”,用户通过输入模块设定该参数(即设定参数),当然,此处也可以是从植物参数数据库中根据植物的品种以及当前的季节进行选取;感应模块获取环境的检测参数,此时,判断该环境参数是否适宜,若否,则通过智能控制系统控制调节模块对环境进行调整;直到环境参数适宜时,通过无线网络模块将该参数传输至物联网平台;当然,即使在环境参数不适宜的情况下,也可以将实时的环境参数传输至物联网平台,此处仅是一种举例。以下还提供一种通过无线网络模块106进行数据传输的实际过程。如图5所示,在开机后,连接无线网络模块,从arduino平台接收数据,然后将数据打包后进行发送;在发送一个数据包后,判断数据是否发送完毕,若否,继续发送数据包;若是,关闭网络连接;数据传输结束。需要说明的是,本发明中,各模块、智能体(agent),pid控制器和类似的术语意味着以下各项中的任何适合的一个或者多个的各种组合:特定应用集成电路,电子电路;执行一个或多个软件或固定程序的中央处理单元(例如,微处理器)以及相关内存和存储器;组合逻辑电路、输入/输出电路等等。本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在终端设备上运行时,使得终端设备执行前述的植物工厂的智能控制方法。本发明实施例还提供一种包含指令的计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行前述的植物工厂的智能控制方法;具体的,例如,手机app产品等。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1