一种工作模式切换方法及装置与流程

文档序号：31053120发布日期：2022-08-06 08:47阅读：131来源：国知局

1.本发明涉及人工智能技术领域，尤其涉及一种工作模式切换方法。

背景技术：

2.空调已经在人们的生活中成为不可或缺的必备产品，大大提高了人们的生活质量。
3.然而，每个用户对空调温度，风速等的习惯、需求、偏好都是不一样的。
4.现有的空调无法满足用户的个性化需求。

技术实现要素：

5.本发明提供一种工作模式切换方法及装置，用以解决现有技术中无法满足用户的个性化需求的缺陷，实现针对特定家庭成员给予定制化的运行方案。
6.本发明提供一种工作模式切换方法，包括：接收目标用户的目标语音信息；
7.对所述目标语音信息进行声纹分析，确定目标用户类别；
8.根据所述目标用户类别，切换至所述目标用户对应的工作模式。
9.根据本发明提供的一种工作模式切换方法，所述对所述目标语音信息进行声纹分析，确定目标用户类别，包括：
10.对所述目标语音信息进行声纹分析，获取目标声纹特征；
11.比对所述目标声纹特征与所有注册用户的录入声纹特征；
12.在确定所述目标用户属于注册用户的情况下，根据所述目标用户的用户类别标签，确定所述目标用户类别。
13.根据本发明提供的一种工作模式切换方法，在所述比对所述目标声纹特征与所有注册用户的录入声纹特征之后，还包括：
14.在确定所述目标用户属于非注册用户的情况下，获取开机间隔时长；
15.在所述开机间隔时长大于预设时长阈值的情况下，切换默认工作模式；
16.在所述开机间隔时长不大于预设时长阈值的情况下，生成开机提示。
17.根据本发明提供的一种工作模式切换方法，所述对所述目标语音信息进行声纹分析，获取目标声纹特征，包括：
18.对所述目标语音信息进行预加重，确定预加重语音信息；
19.对所述预加重语音信息进行分帧，确定分帧语音信息；
20.对所述分帧语音信息进行加窗，获取加窗语音信息；
21.对所述加窗语音信息进行声纹提取，获取所述目标语音信息的目标声纹特征。
22.根据本发明提供的一种工作模式切换方法，在所述比对所述目标声纹特征与所有注册用户的录入声纹特征之前，还包括：
23.接收录入声纹指令；
24.根据所述录入声纹指令，生成录入声纹提示；
25.在接收到任一用户发送的声纹测试语音的情况下，提取所述任一用户的录入声纹特征；
26.根据所述任一用户的录入声纹特征，生成录入类别提示；
27.接收所述任一用户录入类别，以确定所述任一用户的用户类别标签；
28.所述录入类别是所述任一用户响应所述录入类别提示后输入的。
29.根据本发明提供的一种工作模式切换方法，所述根据所述目标用户类别，切换至所述目标用户对应的工作模式，包括：
30.在确定所述目标用户类别为第一用户类别的情况下，切换为第一工作模式；
31.在确定所述目标用户类别为第二用户类别的情况下，根据所述目标用户的使用习惯，切换为所述目标用户对应的目标工作模式。
32.本发明还提供一种工作模式切换装置，包括：
33.接收模块，用于接收目标用户的目标语音信息；
34.分析模块，用于对所述目标语音信息进行声纹分析，确定目标用户类别；
35.切换模块，用于根据所述目标用户类别，切换至所述目标用户对应的工作模式。
36.本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述工作模式切换方法。
37.本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述工作模式切换方法。
38.本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述工作模式切换方法。
39.本发明提供的工作模式切换方法及装置，
附图说明
40.为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
41.图1是本发明提供的工作模式切换方法的流程示意图；
42.图2是本发明提供的工作模式切换装置的结构示意图；
43.图3是本发明提供的电子设备的结构示意图。
具体实施方式
44.为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
45.当前空调的控制是通过遥控器、手机应用程序(application，app)语音实现，无法主动的一步到位实现用户的最佳使用习惯。注册制声纹技术可实现：
46.由于大多儿童不知道如何调空调，可能会因儿童乱调空调而导致感冒等身体不适的情况，当家里的儿童使用语音开启空调时，空调会自动进入儿童模式；
47.青年及成人有着不同的调空调偏好，当不同的家庭成员打开空调时，则自动进入不同用户喜好的模式；
48.老人对温度和空气质量较为敏感，且80岁以上老人需要在儿女帮助调到合适的健康的温度和模式，声纹识别技术帮助老人语音开启空调时自动进入老人模式，给与定制化呵护。
49.下面结合图1至图3描述本发明的实施例所提供的工作模式切换方法及装置。
50.本发明实施例提供的工作模式切换方法，执行主体可以为电子设备或者电子设备中能够实现该工作模式切换方法的软件或功能模块或功能实体，本发明实施例中电子包括但不限于智能空调设备。需要说明的是，上述执行主体并不构成对本发明的限制。
51.图1是本发明提供的工作模式切换方法的流程示意图，如图1所示，包括但不限于以下步骤：
52.首先，在步骤s1中，接收目标用户的目标语音信息。
53.发送目标语音信息的目标用户可以是已录入声纹的注册用户。
54.目标语音信息可以为开机指令。
55.用户可以使用语音空调、app语音助手或智能音箱三种方式对空调进行语音操控，使用语音说出“空调开机”指令后，空调为用户智慧开机。
56.进一步地，在步骤s2中，对所述目标语音信息进行声纹分析，确定目标用户类别。
57.在获取到目标语音信息之后，将该目标语音信息进行预加重、分帧和加窗等预处理，将预处理后的目标语音信息转换为声纹特征图。其中声纹特征图可以为梅尔能量谱图。梅尔能量谱图能表征人能听到的声音的频率分布，是人通过声音辨别事物的深层特征，利用这种在梅尔频域的分布特性，更适合构建说话人识别系统，语音信号经过这样的转换，语音信号就变为了携带声纹信息的图像，对于单个信号，其梅尔能量谱图是黑白的，可以理解为单通道的特征图。
58.将声纹特征图与空调中已注册用户的录入声纹特征进行比对，在已注册用户中确定目标用户之后，可以得到相应的用户类别标签，作为目标用户类别。
59.用户类别标签可以包括：儿童标签、成人标签和老人标签；每个成人标签均是唯一的。
60.进一步地，在步骤s3中，根据所述目标用户类别，切换至所述目标用户对应的工作模式。
61.在目标用户类别为儿童群体的情况下，将空调的工作模式切换为儿童模式；在目标用户类别为老人群体的情况下，将空调的工作模式切换为老人模式；在目标用户类别为成人群体的情况下，根据外界环境，以及目标用户的个体使用习惯，将空调的工作模式切换为目标用户在当前时间和环境下对应的工作模式。
62.本发明提供的工作模式切换方法，通过对用户的语音信息进行声纹识别，得到用户的类别，从而针对特定家庭成员给予定制化的运行方案。
63.可选地，在所述比对所述目标声纹特征与所有注册用户的录入声纹特征之前，还包括：
64.接收录入声纹指令；
65.根据所述录入声纹指令，生成录入声纹提示；
66.在接收到任一用户发送的声纹测试语音的情况下，提取所述任一用户的录入声纹特征；
67.根据所述任一用户的录入声纹特征，生成录入类别提示；
68.接收所述任一用户录入类别，以确定所述任一用户的用户类别标签；
69.所述录入类别是所述任一用户响应所述录入类别提示后输入的。
70.智能空调在接收到录入声纹的指令之后，切换至声纹录入模式，并发出语音提示提醒用户录入声纹测试语音。
71.用户重复发音两次以上的声纹测试语音，每次发音后，提取该段纹测试语音的滤波器组的特征(filter bank，fbank)特征信息，声纹识别模型将fbank特征信息转化为该段语音的声纹特征；最后将各次发音得到的声纹特征求平均值作为用户发出的录入声纹特征；智能空调生成录入年龄提示，在接收到用户发送的录入年龄之后，将录入声纹和录入年龄作为用户的注册信息，并语音播报模块提示该次录入成功。
72.声纹识别模型是一个深度神经网络模型，由多个中文语料训练而得，具有很强的抗噪性和鲁棒性。
73.根据本发明提供的工作模式切换方法，以录入声纹的方式，结合基于年龄的群体识别，以及个体化声纹识别于一体，并针对儿童，老人年龄段的声纹识别及定制化呵护，提供最合适的空气方案。
74.可选地，所述对所述目标语音信息进行声纹分析，确定目标用户类别，包括：
75.对所述目标语音信息进行声纹分析，获取目标声纹特征；
76.比对所述目标声纹特征与所有注册用户的录入声纹特征；
77.在确定所述目标用户属于注册用户的情况下，根据所述目标用户的用户类别标签，确定所述目标用户类别。
78.可选地，所述对所述目标语音信息进行声纹分析，获取目标声纹特征，包括：
79.对所述目标语音信息进行预加重，确定预加重语音信息；
80.对所述预加重语音信息进行分帧，确定分帧语音信息；
81.对所述分帧语音信息进行加窗，获取加窗语音信息；
82.对所述加窗语音信息进行声纹提取，获取所述目标语音信息的目标声纹特征。
83.由于语音信号的平均功率谱受声门激励和口鼻辐射的影响，高频端大约在800赫兹(hz)以上按6分贝/倍频程(db/oct)衰减，频率越高相应的成分越小，为此要在对语音信号进行分析之前对其高频部分加以提升。可以利用数字滤波器实现对目标语音信息的预加重。
84.以10至20毫秒(ms)为间隔将声纹信号分为若干帧，一帧为一个基本单位，实现对预加重语音信息的分帧。
85.采用汉明窗函数对分帧语音信息来进行窗化。
86.根据本发明提供的工作模式设置方法，经过对目标语音信息的预加重、分帧和加窗，能够消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等等因素，对语音信号质量的影响。尽可能保证后续语音处理得到的信号更均
匀、平滑，为信号参数提取提供优质的参数，提高语音处理质量。
87.对目标语音信息进行声纹分析，提取目标语音信息的fbank特征信息，并输入至声纹识别模型，输出为目标语音信息的目标声纹特征。将目标声纹特征与所有注册用户已储存的录入声纹特征进行相似度计算；若得到的最高相似度高于设置的声纹阈值，则判定该最高相似度对应的录入声纹特征用户为目标语音信息的发出用户，可以根据该用户的注册信息确定用户类别标签，并根据用户类别标签，确定目标用户类别；若最高相似度低于设置的声纹阈值，则确定发送所述目标语音信息的对象不为注册用户。
88.根据本发明提供的工作模式设置方法，通过声纹识别，确定用户类别，为每个群体提供定制化的运行方案提供基础。
89.可选地，所述根据所述目标用户类别，切换至所述目标用户对应的工作模式，包括：
90.在确定所述目标用户类别为第一用户类别的情况下，切换为第一工作模式；
91.在确定所述目标用户类别为第二用户类别的情况下，根据所述目标用户的使用习惯，切换为所述目标用户对应的目标工作模式。
92.其中，第一用户类别可以包括：老人、儿童，在第一用户类别为老人的情况下，第一工作模式为老人模式；在第一用户类别为儿童的情况下，第一工作模式为儿童模式。
93.第二用户类别可以为成人，使用习惯包括声纹识别的学习结果和网器行为的学习结果。
94.当目标用户通过语音空调、app语音助手或智能音箱任一种方式说出“空调开机”类指令，空调对指令进行声纹分析，判断目标用户是否属于已注册用户。
95.在确定目标用户为注册用户的情况下，确定目标用户的用户类别标签，作为目标用户类别。
96.由于热空气轻容易上浮，冷空气重容易下沉，故夏季的上下导板处于上吹位置，冬季的上下导板处于下吹位置。
97.在目标用户类别为老人标签的情况下，智能空调将工作模式切换至老人模式，且在每次识别到该目标用户声纹的打开空调指令时，自动进入老人模式。
98.老人模式的具体参数与季节相关：在6月至9月的夏季，打开pmv，温度设置为27℃的制冷模式，风速设为低风，上下导板设置在最大上吹位置1，空气洁净度为打开健康模式；在12月到至2月的冬季，打开pmv，温度设为26℃的制热模式；风速设为低风，上下导板设置在最大下吹位置5；空气洁净度为打开健康模式；在其他月份，打开pmv，温度设置为26℃，在室内温度高于26℃的情况下制冷，在室内温度不高于26℃的情况下制热；风速设为低风，空气洁净度为打开健康。
99.在打开老人模式之后，智能空调播报：“长辈好，长辈关怀模式已开启，可以健康舒适地吹空调啦”。
100.在目标用户类别为儿童标签的情况下，智能空调将工作模式切换至儿童模式，且在每次识别到该目标用户声纹的打开空调指令时，自动进入儿童模式。
101.儿童模式的具体参数与季节相关：在6月至9月的夏季，打开pmv，温度设置为26℃的制冷模式，风速设为低风，上下导板设为最大上吹位置1，空气洁净度为打开健康模式；在12月至2月的冬季，打开pmv，温度设置为23℃的制热模式，风速设为低风，上下导板设为最
大下吹位置5，空气洁净度为打开健康模式；在其他月份，打开pmv，温度设置为26℃，在室内温度高于26℃的情况下制冷，在室内温度不高于26℃的情况下制热，风速设为低风，空气洁净度设置为打开健康模式。
102.空调播报：“你好小朋友，儿童模式已开启，可以开心地吹空调了哦”。
103.在目标用户类别为成人标签的情况下，则在每次识别到该用户声纹的打开空调指令时，后台调取对该声纹识别的学习结果，并下发将学习结果以设置工作模式；如果没有声纹识别的学习结果，则调取网器行为的学习结果，并下发将学习结果以设置工作模式。
104.其中，基于声纹识别的智慧学习，可以得到每个声纹识别的学习结果。
105.每个成人的录入声纹特征均有自己唯一的成人标签，云端对每个成年男性以及成年女性的用户开机数据进行学习，开机数据与录入声纹的用户类别标签保持一致。用户开机数据包括用户每次开机对空调温度、风速、模式等参数的设置。
106.例如，在某一台智能空调中，包括老人、成年男性1、成年女性1、儿童，共计四个用户类别标签。若识别出来的目标用户类别为老人或儿童，则不学习。
107.若识别出来的目标用户类别为“成年男性1”，则学习本次及历史上的“成年男性1”开机数据，记为“成年男性1”的声纹识别的学习结果，该声纹识别的学习结果作为下次“成年男性1”对应的工作模式设置。
108.若识别出来的目标用户类别为“成年女性1”，则学习本次及历史上的“成年女性1”开机数据，记为“成年女性1”的声纹识别的学习结果，该声纹识别的学习结果作为下次“成年女性1”对应的工作模式设置。
109.基于网器行为的智慧学习，利用历史数据库，学习该智能空调的样本外界参数，以及样本外界参数对应的用户开机数据标签为训练样本，对基于神经网络模型构建的网器进行训练，考虑到用户的空调使用会随着当天气温、睡眠等因素变化，三段式学习，学习用户各时间段的开机设定操作。外界参数包括温度、时段等参数。
110.时间设置为24小时制，晚上的时段为17：00至21：00，白天的时段为7：00至17：00，睡眠的时段为21：00至7：00。
111.以空调开机30分钟内使用概率最高的设定温度、模式、风速等用户开机数据作为学习对象，并判断网器行为的学习结果是否准确。网器行为的学习结果准确的标准包括：预测设定温度与开机数据标签中的实际设定温度的误差不超过1度，预测模式与开机数据标签中的实际模式相同，预测风速与开机数据标签中的实际风速相同。
112.若既没有声纹识别的学习结果，也没有网器行为的学习结果，则获取智能空调距离上次开机的时长，在时长大于30天的情况下，下发打开pmv模式，温度为26度，风速为自动风，并播报：“你好先生/女士，小优还帮您调整了您喜欢的模式，当前温度为26℃、自动风速”，播报内容还可以包括智能空调的运行模式；若本次距离上次开机的时长不大于30天，则只下发开机指令，并播报：“你好先生/女士，空调已开机”。
113.儿童模式和老人模式均是经人体舒适研究院实验得出的最优的空气解决方案。
114.根据本发明提供的工作模式设置方法，通过确定用户的类别，利用注册制声纹识别的方式，可针对不同的家庭成员去学习其使用习惯，做到智慧识人与用户的偏好学习，对每个群体进行定制化呵护，提供最合适的空气方案。
115.可选地，在所述比对所述目标声纹特征与所有注册用户的录入声纹特征之后，还
包括：
116.在确定所述目标用户属于非注册用户的情况下，获取开机间隔时长；
117.在所述开机间隔时长大于预设时长阈值的情况下，切换默认工作模式；
118.在所述开机间隔时长不大于预设时长阈值的情况下，生成开机提示。
119.预设时长阈值可以设置为30天；默认工作模式为打开pmv，温度为26度，风速为自动风。
120.当确定目标声纹特征为非注册用户声纹时，调取网器行为的学习结果，并将学习结果下发；如果没有网器行为的学习结果，则获取智能空调距离上次开机的时长，在时长大于30天的情况下，下发打开pmv，温度为26度，风速为自动风，并播报：“你好先生/女士，小优还帮您调整了您喜欢的模式，当前温度为26℃、自动风速”，播报内容还可以包括智能空调的运行模式；若本次距离上次开机的时长不大于30天，则只下发开机指令，并播报：“你好先生/女士，空调已开机”。
121.根据本发明提供的工作模式切换方法，利用大数据进行用户习惯人工智能(artificial intelligence，ai)深度学习，从而使空调更加的符合各个用户群体的使用习惯。
122.下面对本发明提供的工作模式切换装置进行描述，下文描述的工作模式切换装置与上文描述的工作模式切换方法可相互对应参照。
123.图2是本发明提供的工作模式切换装置的结构示意图，如图2所示，包括：
124.接收模块201，用于接收目标用户的目标语音信息；
125.分析模块202，用于对所述目标语音信息进行声纹分析，确定目标用户类别；
126.切换模块203，用于根据所述目标用户类别，切换至所述目标用户对应的工作模式。
127.首先，接收模块201接收目标用户的目标语音信息。
128.发送目标语音信息的目标用户可以是已录入声纹的注册用户。
129.目标语音信息可以为开机指令。
130.用户可以使用语音空调、app语音助手或智能音箱三种方式对空调进行语音操控，使用语音说出“空调开机”指令后，空调为用户智慧开机。
131.进一步地，分析模块202对所述目标语音信息进行声纹分析，确定目标用户类别。
132.在获取到目标语音信息之后，将该目标语音信息进行预加重、分帧和加窗等预处理，将预处理后的目标语音信息转换为声纹特征图。其中声纹特征图可以为梅尔能量谱图。梅尔能量谱图能表征人能听到的声音的频率分布，是人通过声音辨别事物的深层特征，利用这种在梅尔频域的分布特性，更适合构建说话人识别系统，语音信号经过这样的转换，语音信号就变为了携带声纹信息的图像，对于单个信号，其梅尔能量谱图是黑白的，可以理解为单通道的特征图。
133.将声纹特征图与空调中已注册用户的录入声纹特征进行比对，在已注册用户中确定目标用户之后，可以得到相应的用户类别标签，作为目标用户类别。
134.用户类别标签可以包括：儿童标签、成人标签和老人标签；每个成人标签均是唯一的。
135.进一步地，切换模块203根据所述目标用户类别，切换至所述目标用户对应的工作
模式。
136.在目标用户类别为儿童群体的情况下，将空调的工作模式切换为儿童模式；在目标用户类别为老人群体的情况下，将空调的工作模式切换为老人模式；在目标用户类别为成人群体的情况下，根据外界环境，以及目标用户的个体使用习惯，将空调的工作模式切换为目标用户在当前时间和环境下对应的工作模式。
137.本发明提供的工作模式切换装置，通过对用户的语音信息进行声纹识别，得到用户的类别，从而针对特定家庭成员给予定制化的运行方案。
138.图3是本发明提供的电子设备的结构示意图，如图3所示，该电子设备可以包括：处理器(processor)310、通信接口(communications interface)320、存储器(memory)330和通信总线340，其中，处理器310，通信接口320，存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令，以执行工作模式切换方法，该方法包括：接收目标用户的目标语音信息；对所述目标语音信息进行声纹分析，确定目标用户类别；根据所述目标用户类别，切换至所述目标用户对应的工作模式。
139.此外，上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
140.另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的工作模式切换方法，该方法包括：接收目标用户的目标语音信息；对所述目标语音信息进行声纹分析，确定目标用户类别；根据所述目标用户类别，切换至所述目标用户对应的工作模式。
141.又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的工作模式切换方法，该方法包括：接收目标用户的目标语音信息；对所述目标语音信息进行声纹分析，确定目标用户类别；根据所述目标用户类别，切换至所述目标用户对应的工作模式。
142.以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
143.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指
令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
144.最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴岩葛温清张凯月张桂芳
技术所有人：青岛海尔空调电子有限公司海尔智家股份有限公司
我是此专利的发明人

上一篇：外科器械和方法与流程
上一篇：一种高速磁浮低真空管道的焊接设备及焊接方法与流程