一种智能窗帘控制方法、装置、设备及可读存储介质与流程

文档序号:36159587发布日期:2023-11-23 05:22阅读:73来源:国知局
一种智能窗帘控制方法与流程

本技术涉及智能家居,具体而言,涉及一种智能窗帘控制方法、装置、设备及可读存储介质。


背景技术:

1、目前,智能家居技术的发展使得人们能够通过智能设备控制家庭设备和系统,提供更智能化、便利化的生活体验。

2、然而,现有的智能窗帘系统,主要通过远程遥控、手动控制、声音控制、定时启动或光敏启动的方式实现窗帘的控制,均无法实现窗帘的自适应、智能控制。

3、远程遥控、手动控制、声音控制仍然需要用户手动操作,便捷程度和自动化程度低;定时启动虽然能够根据预设的时间表自动开合窗帘,但缺乏对用户行为模式和环境信息的感知和调整能力,无法根据实时的需求和变化的环境条件进行智能化的控制;光敏启动控制范围有限,仅基于光线变化进行反应,无法满足用户对智能控制的需求。


技术实现思路

1、本技术实施例的目的在于提供一种智能窗帘控制方法、装置、设备及可读存储介质,用以解决现有技术存在的操作繁琐、反应速度慢、无法满足个性化与智能化的要求的问题,可以更加智能、更加个性化、更加便捷、更快速的控制窗帘,提高用户体验度。

2、第一方面,提供了一种智能窗帘控制方法,该方法可以包括:

3、每隔第一预设时长,采集当前时刻的智能窗帘接收的控制参数;

4、将所述控制参数输入预先训练的智能窗帘控制模型中,得到所述当前时刻的智能窗帘预测状态;

5、判断所述智能窗帘预测状态与当前时刻的智能窗帘状态是否一致;

6、若不一致,则将所述智能窗帘预测状态发送给用户,获取所述用户针对所述智能窗帘预测状态的反馈信息;

7、若所述反馈信息为根据智能窗帘预测状态调整智能窗帘状态,则调整当前时刻的智能窗帘状态为所述智能窗帘预测状态。

8、在一个可选的实现中,所述智能窗帘控制模型包括:价值网络和策略网络;

9、所述策略网络包括:输入层、两个lstm层、全连接层、激活函数和输出层;

10、所述价值网络包括:输入层、ann隐藏层和输出层。

11、在一个可选的实现中,调整当前时刻的智能窗帘状态为所述智能窗帘预测状态之后,所述方法还包括:

12、利用奖励函数给予所述策略网络和所述价值网络奖励反馈,生成奖励值;

13、基于所述奖励值,对所述智能窗帘控制模型的参数进行优化,得到优化后的智能窗帘控制模型。

14、在一个可选的实现中,所述控制参数包括:环境参数和时间参数;

15、其中,所述环境参数包括:室内温度、室外温度、室内湿度、光照强度以及天气状况;

16、所述时间参数包括:日期信息和当前时间。

17、在一个可选的实现中,所述智能窗帘控制模型的训练步骤,包括:

18、在过去第一时间段内,每隔第二预设时长,采集智能窗帘接收的历史控制参数和所述控制参数对应的历史智能窗帘状态,得到多条样本数据;

19、将所述多条样本数据进行归一化处理,得到多条样本数据;

20、基于所述多条样本数据,构建样本数据集;

21、将所述样本数据集随机划分为训练数据集和测试数据集;

22、利用所述训练数据集,对所述智能窗帘控制模型进行训练,得到训练后的智能窗帘控制模型;

23、利用所述测试数据集,对所述训练后的智能窗帘控制模型进行测试,得到测试后的智能窗帘控制模型。

24、在一个可选的实现中,利用所述训练数据集,对所述智能窗帘控制模型进行训练,得到训练后的智能窗帘控制模型,包括:

25、随机初始化智能窗帘控制模型的价值网络与策略网络的参数;

26、针对所述训练数据集中的任意一条训练数据,将所述训练数据中的历史控制参数,输入到所述智能窗帘控制模型的策略网络中,得到历史控制参数对应的所有智能窗帘状态以及每种智能窗帘状态对应的概率;

27、将所述历史控制参数与所述历史控制参数对应的所有智能窗帘状态以及每种智能窗帘状态对应的概率,输入所述智能窗帘控制模型的价值网络中,得到第一评分结果;

28、随机从所述所有智能窗帘状态中挑选一个智能窗帘状态,作为待执行智能窗帘状态;

29、判断所述待执行智能窗帘状态与所述训练数据中的历史智能窗帘状态是否一致;

30、若不一致,则直接返回步骤:将所述训练数据中的历史控制参数,输入到所述智能窗帘控制模型的策略网络中,得到第二评分结果;

31、若一致,则奖励函数给予所述策略网络和所述价值网络奖励反馈,生成奖励值;并获取一条新的训练数据,将新的训练数据,返回执行步骤:将所述训练数据中的历史控制参数,输入到所述智能窗帘控制模型的策略网络中,得到第二评分结果;

32、计算所述第一评分结果与所述第二评分结果的误差;

33、根据所述误差,联合更新所述价值网络与所述策略网络的参数;

34、遍历训练数据集中的所有训练数据,得到训练后的智能窗帘控制模型。

35、在一个可选的实现中,若所述反馈信息为不调整智能窗帘状态,则保持智能窗帘状态不变之后,所述方法还包括:

36、将所述控制参数和所述控制参数对应的智能窗帘状态,作为一条更新数据;

37、基于所述更新数据,构建更新数据集;

38、利用所述更新数据集,对所述智能窗帘控制模型的价值网络进行训练,得到更新后的价值网络;

39、每隔第三预设时长,利用所述更新后的价值网络对策略网络进行更新。

40、第二方面,提供了一种智能窗帘控制装置,该装置可以包括:

41、数据获取单元,用于每隔第一预设时长,采集当前时刻的智能窗帘接收的控制参数;

42、预测单元,用于将所述控制参数输入预先训练的智能窗帘控制模型中,得到所述当前时刻的智能窗帘预测状态;

43、控制单元,用于判断所述智能窗帘预测状态与当前时刻的智能窗帘状态是否一致;若不一致,则将所述智能窗帘预测状态发送给用户,获取所述用户针对所述智能窗帘预测状态的反馈信息;若所述反馈信息为根据智能窗帘预测状态调整智能窗帘状态,则调整当前时刻的智能窗帘状态为所述智能窗帘预测状态。

44、第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

45、存储器,用于存放计算机程序;

46、处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤。

47、第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。

48、本技术的智能窗帘控制方法基于人工智能算法和自适应学习技术,能够自主学习用户的习惯、获取相应数据,再结合人工智能技术,实现窗帘的自然唤醒与关闭,为用户提供更舒适、智能化的窗帘体验。且随着使用时间的增长,本技术的智能窗帘控制模型会越来越适应于用户的个人习惯,给用户增加新的体验。

49、本技术利用强化学习的思想,对策略网络和价值网络进行联合训练,可以通过与环境的交互来学习并优化策略,而不仅仅依赖于输入-输出对之间的直接映射,本技术的策略优化可以帮助模型更好地利用环境的反馈信息,逐步改进决策策略,并最大化长期回报;本技术的联合训练方法比一般的lstm监督训练来的更有效。

50、本技术的智能窗帘控制方法能够实现自动化、智能化的智能窗帘控制,无需人工操作,且反应速度快,能够针对性满足用户的个性化需求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1