一种方言语音识别方法、装置、终端及其存储介质与流程

文档序号：16813556发布日期：2019-02-10 14:01阅读：263来源：国知局

本发明涉及家电语音控制领域，具体涉及一种方言语音识别方法。

背景技术：

智能电动晾衣机是一种阳台家居用品，主要由主机机身、动力系统、控制系统、升降系统、衣杆系统以及一系列功能外设组成，目前市面上大部分的控制方式都为射频遥控器，按下不同的按键可以控制不同的功能，但是按键的数量一般为6-8个，可控制的功能非常有限。按键遥控器也有寿命，用户体验效果不好。一些晾衣机加入了智能app，但是又依赖网络，app的操作整个过程又非常繁琐复杂，不适合大众使用。

现在有的晾衣机已经加入了语音识别技术，但是必须是普通话才能识别，对于广大用户来说，并不实用；近场语音识别技术体验效果差；中国有八大方言区，每个方言区下面又有很多很多地方方言，很多人并不会讲普通话。

技术实现要素：

本发明解决的技术问题为方言语音识别问题，提供一种方言语音识别方法。

为了解决上述技术问题，本发明提供的技术方案为：

一种方言语音识别方法，包括：接收环境中语音信息；识别接收到的语音信息，判断语音信息中是否含有已存储的操作指令对应的语音指令；若语音信息中含有语音指令，发出该语音指令对应的操作指令。

用户通过发出语音的方式来控制电动晾衣架，晾衣架的控制系统内存储有根据用户的语音录制的语音指令，以及语音指令对应的操作指令，如果接收到的语音信心同语音指令相匹配，向升降或者移动装置发出操作指令，以实现语音控制。

语音指令是由用户录入的，识别也是同用户录入的语音指令进行对比，因此，即使用户使用方言录入指令，也可以有效的控制电动晾衣架。

优选地，所述的已存储的操作指令包括n种操作指令，所述的n≥1；以及包括如下步骤：发出操作指令i录入的请求，所述的1≤i≤n；接收语音信息i，将所述的语音信息i同操作指令i共同存储，语音信息i存储为语音指令i；重复上述步骤，至将n种操作指令对应的n种语音指令全部存储。操作指令的数量取决于电动晾衣架的功能的数量，每个操作指令对应一个语音指令，方便用户控制。

优选地，所述的已存储的操作指令中包括唤醒指令；所述的唤醒指令为可将设备由待机状态转变为激活状态；所述唤醒指令的录入方式为：发出录入唤醒词的请求；接收语音信息并将该语音信息存储为唤醒词。唤醒指令用于将设备由待机状态转变为激活状态，激活状态为可以随时接收各种语音信息，而待机状态接收的信息中必须含有唤醒词。

优选地，提取语音指令中的语音特征，任一语音指令中的语言特征不少于1；对n种语音指令共有m种特征（m≥n），每种语音指令对应至少一个特征。从方言的语音信息中的特征被提取后可以用于不同语音的模糊匹配。

优选地，将每种语音指令对应的特征进行对比，判断是否存在特征完全相同的两个或两个以上的语音指令；若存在，提示用户重新录入语音信息；若不存在，为每条语音指令分配一个该语音指令自有的语言特征。语音特征完全相同的两个语音指令是无法有效的被识别的，必须更换其中一个才能提高语音识别的效率。

优选地，对比每条语音指令对应的语言特征，判断是否存在分配的特征完全相同的两个或两个以上的语音指令；若存在，判断所述的分配的特征完全相同的语音指令是否存在未分配特征，若存在未分配特征，对比语音指令之间的未分配特征，为存在未分配特征的语音信息再分配一个该语音指令自有的特征，返回至对比每条与语音指令对应的语言特征步骤；若不存在，存储操作指令及其语言特征。语音指令的语言特征一般不少于一个，进入激活状态后，为了达到便捷控制的效果，识别过程只匹配语音信息中是否含有特定语言特征，可以有效提高识别效率。

优选地，若语音信息中含有唤醒词，发出进入激活状态的指令，将该语音信息存储，提取语音信息中的语言特征，并将该语音信息同已经录入的n种语音指令进行对比；若该语音信息为已经录入的n种语音指令中的一种，发出该语音信息对应的操作指令；若该语音信息不是已经录入的n种语音指令中的一种，维持激活状态，等待接收下一条语音信息；所述的对比方法为精确匹配或模糊匹配，所述的精确匹配为判断接收到的语音信息同存储的语音信息指令整体是否相同；所述的模糊匹配为为判断接收到的语音信息同存储的语音指令的特征是否相同。有些语音指令可能并不是仅包含唤醒词，还包括语音指令，二者混合后，通过模糊匹配的方式是可以更为有效提高识别效率。

一种方言语音识别装置，包括接收模块、识别模块与执行模块，所述的接收模块同识别模块连接，所述的识别模块同执行模块连接，所述的接收模块的功能为接收环境中的语音信息；所述的识别模块的功能为识别接收到的语音信息，判断语音信息中是否含有已存储的操作指令对应的语音指令；所述的执行模块的功能为发出该语音指令对应的操作指令。

一种方言语音识别终端，包括一个或多个处理器；以及存储装置，用于存储一个或多个程序；当所述一个或多个程序被所述的一个或多个处理器执行，使得所述的一个或多个处理器实现如权利要求1~7中任一项所述的方法。

一种方言语音识别存储介质，存储有一个或多个程序，所述的一个或多个程度可被一个或多个处理器执行，以实现权利要求1~7任一项所述的方法。

与现有技术相比，本发明具有的有益效果为：语音指令是由用户录入的，识别也是同用户录入的语音指令进行对比，因此，即使用户使用方言录入指令，也可以有效的控制电动晾衣架；通过模糊匹配的方式是可以更为有效提高识别效率。

附图说明

图1为一种方言语音识别方法的结构示意图。

图2为图1中结构示意图。

图3为一种方言语音识别方法的另一种实施方式的流程示意图。

图4为一种方言语音识别方法的另一种实施方式的流程示意图。

图5为一种方言语音识别方法的另一种实施方式的流程示意图。

图6为一种方言语音识别方法的另一种实施方式的流程示意图。

图7为一种方言语音识别装置的示意图。

图8为一种方言语音识别装置的另一种实施方式的示意图。

具体实施方式

以下实施列是对本发明的进一步说明，不是对本发明的限制。

在本申请的一些实施例中，一种方言语音识别方法，如图1所示，包括：接收环境中语音信息；识别接收到的语音信息，判断语音信息中是否含有已存储的操作指令对应的语音指令；若语音信息中含有语音指令，发出该语音指令对应的操作指令。

语音指令是由用户录入的，识别也是同用户录入的语音指令进行对比，因此，即使用户使用方言录入指令，也可以有效的控制电动晾衣架。

在本申请的另一些实施例中，所述的已存储的操作指令包括n种操作指令，所述的n≥1；以及包括如下步骤：发出操作指令i录入的请求，所述的1≤i≤n；接收语音信息i，将所述的语音信息i同操作指令i共同存储，语音信息i存储为语音指令i；重复上述步骤，至将n种操作指令对应的n种语音指令全部存储。

操作指令的数量取决于电动晾衣架的功能的数量，每个操作指令对应一个语音指令，方便用户控制。

如图2所示，在接收环境中的语音信息前，先进行操作指令对应的语音指令的录入，共录入n种语音指令，对应n中操作指令。

在本申请的另一些实施例中，所述的已存储的操作指令中包括唤醒指令；所述的唤醒指令为可将设备由待机状态转变为激活状态；所述唤醒指令的录入方式为：发出录入唤醒词的请求；接收语音信息并将该语音信息存储为唤醒词。

唤醒指令用于将设备由待机状态转变为激活状态，激活状态为可以随时接收各种语音信息，而待机状态接收的信息中必须含有唤醒词。

如图3所示，录入操作指令前，先录入唤醒词，应当理解，录入唤醒词可以在操作指令录入前也可在操作指令录入的过程中，及录入完成后。

在本申请的另一些实施例中，提取语音指令中的语音特征，任一语音指令中的语言特征不少于1；对n种语音指令共有m种特征（m≥n），每种语音指令对应至少一个特征。

从方言的语音信息中的特征被提取后可以用于不同语音的模糊匹配。

进一步地，在本申请的另一些实施例中，将每种语音指令对应的特征进行对比，判断是否存在特征完全相同的两个或两个以上的语音指令；若存在特征完全相同的语音指令，判断特征完全相同的语音指令的数量k以及指令的特征数量l，k≥l；若≥k，从种组合中选出k中特征的组合分配给语音指令；若＜k，提示用户重新录入语音指令，至≥k；若不存在，为每条语音指令分配一个该语音指令自有的语言特征。

在本申请的另一些实施例中，将每种语音指令对应的特征进行对比，判断是否存在特征完全相同的两个或两个以上的语音指令；若存在，提示用户重新录入语音信息；若不存在，为每条语音指令分配一个该语音指令自有的语言特征。

语音特征完全相同的两个语音指令是无法有效的被识别的，必须更换其中一个才能提高语音识别的效率。

如图4所示，录入语音指令后，提取语音指令中的语言特征，每个语音指令至少提取一个语言特征，当存在两个以上的语音指令时，判断二者的语言特征是否完全相同，如果完全相同，重新录入语音指令，至每个语音指令的语音特征不完全相同，为每条指令分配一个该语音指令自有的语言特征。

在本申请的另一些实施例中，对比每条语音指令对应的语言特征，判断是否存在分配的特征完全相同的两个或两个以上的语音指令；若存在，判断所述的分配的特征完全相同的语音指令是否存在未分配特征，若存在未分配特征，对比语音指令之间的未分配特征，为存在未分配特征的语音信息再分配一个该语音指令自有的特征，返回至对比每条与语音指令对应的语言特征步骤；若不存在，存储操作指令及其语言特征。

语音指令的语言特征一般不少于一个，进入激活状态后，为了达到便捷控制的效果，识别过程只匹配语音信息中是否含有特定语言特征，可以有效提高识别效率。

在本申请的另一些实施例中，若语音信息中含有唤醒词，发出进入激活状态的指令，将该语音信息存储，提取语音信息中的语言特征，并将该语音信息同已经录入的n种语音指令进行对比；若该语音信息为已经录入的n种语音指令中的一种，发出该语音信息对应的操作指令；若该语音信息不是已经录入的n种语音指令中的一种，维持激活状态，等待接收下一条语音信息；所述的对比方法为精确匹配或模糊匹配，所述的精确匹配为判断接收到的语音信息同存储的语音信息指令整体是否相同；所述的模糊匹配为为判断接收到的语音信息同存储的语音指令的特征是否相同。

有些语音指令可能并不是仅包含唤醒词，还包括语音指令，二者混合后，通过模糊匹配的方式是可以更为有效提高识别效率。

如图5所示，为语音指令分配一个自有的语言特征后，例如有的语音指令的特征为“a”，一个指令的特征为“a，b”，一个指令的特征为“a，b，c”，那么可能存在三个指令的特征全为a的可能，为了避免这种情况的发生，判断是否存在特征完全相同的语音的指令，如果存在，再判断是否语音指令中是否存在未分配的特征，为该语音指令在分配一个特征，重新分配后三个语音指令的特征为“a”，“a+b”，“a+b或a+c”，返回至判断是否存在特征完全相同的语音指令步骤，如果为均为a+b，则再次分配后，两个指令的特征分别为“a+b”和“a+b+c”。存储了操作指令及其语言特征后，进入待机状态，等待接收语音信息。当接收到环境中的语音信息后，若信息中存在唤醒词，即进入激活状态，同时对该语音信息进行语言特征提取，将提取到的特征同已存储的语音指令的特征进行匹配，如果匹配成功，发出相应的操作指令。

如图6所示，同已存储的信息匹配是也可是精确匹配，将接收到的语音信息同已存储的信息整体进行匹配，可以实现更为精确的控制。

一种方言语音识别装置，如图7所示，包括接收模块、识别模块与执行模块，所述的接收模块同识别模块连接，所述的识别模块同执行模块连接，所述的接收模块的功能为接收环境中的语音信息；所述的识别模块的功能为识别接收到的语音信息，判断语音信息中是否含有已存储的操作指令对应的语音指令；所述的执行模块的功能为发出该语音指令对应的操作指令。

语音指令是由用户录入的，识别也是同用户录入的语音指令进行对比，因此，即使用户使用方言录入指令，也可以有效的控制电动晾衣架。

在本申请的另一些实施例中，所述的方言语音识别装置还包括指令录入模块，所述的指令录入模块的功能为：所述的已存储的操作指令包括n种操作指令，所述的n≥1；以及包括如下步骤：发出操作指令i录入的请求，所述的1≤i≤n；接收语音信息i，将所述的语音信息i同操作指令i共同存储，语音信息i存储为语音指令i；重复上述步骤，至将n种操作指令对应的n种语音指令全部存储。

操作指令的数量取决于电动晾衣架的功能的数量，每个操作指令对应一个语音指令，方便用户控制。

在本申请的另一些实施例中，所述的方言语音识别装置还包括唤醒模块，所述的唤醒模块的功能为发出唤醒指令，所述的已存储的操作指令中包括唤醒指令；所述的唤醒指令为可将设备由待机状态转变为激活状态；所述唤醒指令的录入方式为：发出录入唤醒词的请求；接收语音信息并将该语音信息存储为唤醒词。

唤醒指令用于将设备由待机状态转变为激活状态，激活状态为可以随时接收各种语音信息，而待机状态接收的信息中必须含有唤醒词。

在本申请的另一些实施例中，所述的方言语音识别装置还包括特征提取模块，所述的特征提取模块的功能为，提取语音指令中的语音特征，任一语音指令中的语言特征不少于1；对n种语音指令共有m种特征（m≥n），每种语音指令对应至少一个特征。

从方言的语音信息中的特征被提取后可以用于不同语音的模糊匹配。

在本申请的另一些实施例中，所述的方言语音识别装置还包括特征分配模块，所述的特征分配模块的功能为：将每种语音指令对应的特征进行对比，判断是否存在特征完全相同的两个或两个以上的语音指令；若存在，提示用户重新录入语音信息；若不存在，为每条语音指令分配一个该语音指令自有的语言特征。

语音特征完全相同的两个语音指令是无法有效的被识别的，必须更换其中一个才能提高语音识别的效率。

在本申请的另一些实施例中，所述的方言语音识别装置还包括特征分析模块，所述的特征分析模块的功能为：对比每条语音指令对应的语言特征，判断是否存在分配的特征完全相同的两个或两个以上的语音指令；若存在，判断所述的分配的特征完全相同的语音指令是否存在未分配特征，若存在未分配特征，对比语音指令之间的未分配特征，为存在未分配特征的语音信息再分配一个该语音指令自有的特征，返回至对比每条与语音指令对应的语言特征步骤；若不存在，存储操作指令及其语言特征。

在本申请的另一些实施例中，所述的方言语音识别装置还包括匹配模块，若语音信息中含有唤醒词，发出进入激活状态的指令，将该语音信息存储，提取语音信息中的语言特征，并将该语音信息同已经录入的n种语音指令进行对比；若该语音信息为已经录入的n种语音指令中的一种，发出该语音信息对应的操作指令；若该语音信息不是已经录入的n种语音指令中的一种，维持激活状态，等待接收下一条语音信息；所述的对比方法为精确匹配或模糊匹配，所述的精确匹配为判断接收到的语音信息同存储的语音信息指令整体是否相同；所述的匹配模块的功能为：所述的模糊匹配为为判断接收到的语音信息同存储的语音指令的特征是否相同。

有些语音指令可能并不是仅包含唤醒词，还包括语音指令，二者混合后，通过模糊匹配的方式是可以更为有效提高识别效率。

如图8所示，所述的指令录入模块同特征提取模块连接，所述的特征提取模块同特征分配模块连接，所述的特征分配模块同特征分析模块连接，所述的特征分析模块他同唤醒模块连接，所述的唤醒模块同接收模块连接，所述的接收模块识别模块连接，所述的识别模块同匹配模块连接，所述的匹配模块他同执行模块连接

一种方言语音识别终端，包括一个或多个处理器；以及存储装置，用于存储一个或多个程序；当所述一个或多个程序被所述的一个或多个处理器执行，使得所述的一个或多个处理器实现如上述的方法。

一种方言语音识别存储介质，存储有一个或多个程序，所述的一个或多个程度可被一个或多个处理器执行，以实现上述的方法。

上列详细说明是针对本发明可行实施例的具体说明，以上实施例并非用以限制本发明的专利范围，凡未脱离本发明所为的等效实施或变更，均应包含于本案的专利范围中。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘海辉;曹俊煌;贺令华;李爱群;刘志锋;杨艇;区夏湄;张晓宇
技术所有人：广东晾霸智能科技有限公司
我是此专利的发明人

上一篇：机动车辅助动力单元真空泵的制作方法
上一篇：磁吸式胶带固定器的制作方法