照明灯具的语音控制方法与流程

文档序号:11846791阅读:2730来源:国知局

本发明涉及语音控制技术领域,尤其涉及一种照明灯具的语音控制方法。



背景技术:

随着语音识别技术的发展,现有技术中考虑在照明灯具中引入语音控制功能,实现用户可通过说出语音控制命令的方法来控制照明灯具的开、关、调光等操作。

考虑到照明灯具并不期望限定对其进行语音控制的使用者的身份,而倾向于实现任一口音、年龄段、性别和发声特性的使用者都可以对其进行语音控制,因此在照明灯具中实现语音控制的方法通常是使用非特定人语音识别芯片来识别语音控制命令。在实际应用中,往往要求此类非特定人语音识别芯片保持较高的语音识别率,同时要求拒绝识别率和误识别率保持在较低的水平。由于该非特定人语音识别芯片仅需要识别数量有限的特定词语即可,出于成本考虑,在构建其语音识别的逻辑时可以使用包含少量的声音样本(例如200个声音样本)的集合进行算法处理得到上述特定词语的特征数据,并以此作为语音识别的特征比对基础数据,而无需使用复杂的隐藏马尔可夫模型来进行语音识别。此类非特定人语音识别芯片在提升语音识别率同时可以使拒绝识别率降低,但会提升误识别率,也即非特定人语音识别芯片容易将照明灯具工作场景内正常对话中的其他语音或不相关噪音错误地识别为语音命令,从而导致照明灯具出现错误的开启、关闭、调光等,从而影响用户体验和降低了语音控制照明灯具的效率。



技术实现要素:

为了克服现有技术中的上述缺陷,本发明提供了一种照明灯具的语音控制方法,该方法包括:

在照明灯具内设置语音识别芯片;

所述语音识别芯片采集用户的自定义语音流,根据所述自定义语音流生成语音特征值,并存储所述语音特征值;

所述语音识别芯片采集外界输入的第一语音流,并判断所述第一语音流中是否存在与所述语音特征值相匹配的第一特征语句;

若存在所述第一特征语句,则所述语音识别芯片在预定时间内采集外界输入的第二语音流,并判断所述第二语音流中是否存在第二特征语句;

若存在所述第二特征语句,根据所述第二特征语句生成用于变更所述照明灯具的工作状态的控制命令。

根据本发明的一个方面,若存在所述第一特征语句,该方法还包括:触发所述照明灯具呈现预设的提示信号。

根据本发明的另一个方面,该方法中触发所述照明灯具呈现预设的提示信号包括:触发所述照明灯具内设置的扬声器播放预定义声音信号;和/或触发所述照明灯具的光源发出预定义的灯光信号。

根据本发明的又一个方面,该方法中所述预定时间的取值范围是0秒至2秒。

根据本发明的又一个方面,该方法中判断所述第二语音流中是否存在第二特征语句包括:判断所述第二语音流中是否存在与所述语音特征值相匹配的第二特征语句;或判断所述第二语音流中是否存在与所述语音识别芯片内存储的语音模型相匹配的第二特征语句。

根据本发明的又一个方面,该方法中所述第二特征语句包括:用于描述针对所述照明灯具的开灯操作、关灯操作、调整光源亮度操作或更改光源颜色操作的自然语言字符序列。

根据本发明的又一个方面,该方法中所述照明灯具的光源是LED光源。

本发明所提供的照明灯具的语音控制方法具有如下优点:

一方面,通过在整个语音识别过程中首先识别出第一特征语句触发进入后续的语音识别,再识别出用于生成控制命令的第二特征语句,在保持较高语音识别率的前提下降低了拒绝识别率和误识别率,因此提升了照明灯具的语音控制的准确度和用户体验,另一方面,从第一语音流中识别所述第一特征语句是使用用户自定义语音流中提取的语音特征值来进行识别,在提升语音识别率的同时还满足了用户个性化语音识别的需求。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1是根据本发明的照明灯具的语音控制方法的一个具体实施方式的流程图。

具体实施方式

为了更好地理解和阐释本发明,下面将结合附图对本发明作进一步的详细描述。

本发明提供了一种照明灯具的语音控制方法,请参考图1,图1是根据本发明的照明灯具的语音控制方法的一个具体实施方式的流程图,该方法包括以下步骤:

步骤S100,在照明灯具内设置语音识别芯片;

步骤S200,所述语音识别芯片采集用户的自定义语音流,根据所述自定义语音流生成语音特征值,并存储所述语音特征值;

步骤S300,所述语音识别芯片采集外界输入的第一语音流,并判断所述第一语音流中是否存在与所述语音特征值相匹配的第一特征语句,若是则执行步骤S400;

步骤S400,所述语音识别芯片在预定时间内采集外界输入的第二语音流,并判断所述第二语音流中是否存在第二特征语句,若是则执行步骤S500;

步骤S500,根据所述第二特征语句生成用于变更所述照明灯具的工作状态的控制命令。

具体地,步骤S100中在所述照明灯具内设置的语音识别芯片典型地选用例如本文背景技术部分所述的非特定人语音识别芯片,该语音识别芯片可以设置在所述照明灯具光源的控制电路上,用于向所述控制电路中的主机传输控制命令以达到控制所述照明灯具的光源的目的。所述语音识别芯片可以集成在所述控制电路上,也可以与所述控制电路分离地设置并电连接。本领域技术人员可以理解,所述语音识别芯片还应与麦克风电连接,所述麦克风用于采集外界的语音信号,相应地所述语音识别芯片内还包括模数装换模块,用于将麦克风采集到的语音信号对应的模拟信号转变为数字信号。典型地,所述照明灯具的光源选用LED光源,所述照明灯具中的LED光源数据可以根据所述照明灯具的使用场景来确定,本发明并不做限定。

执行步骤S200的目的是为了对所述语音识别芯片进行预设值,便于语音控制所述照明灯具的用户预先对所述照明灯具进行语音配置,也即所述用户可以预先使用自定义语音训练所述语音识别芯片,使该语音识别芯片在后续的语音识别中能够快速地识别出所述自定义语音。典型的处理方法是所述语音识别芯片采集所述用户的自定义语音流,并从该自定义语音流中提取并存储语音特征值,提取所述语音特征值的方法例如可以使用计算机算法计算所述自定义语音流的数字信号的方法来实现。具体地,所述自定义语音流包含了所述用户自定义的自然语言词语,例如词语“阿拉丁”。所述语音特征值可记录所述用户在说出至少部分所述自然语言词语时的数字波形的关键数据。执行步骤S200之后,所述语音识别芯片通过存储所述语音特征值从而完成了预设值,所述照明灯具可进入语音控制的等待状态。

在步骤S300中,所述语音识别芯片采集外界输入的第一语音流,并判断所述第一语音流中是否存在与所述语音特征值相匹配的第一特征语句,执行步骤S300的目的是通过识别出所述第一特征语句来判断出所述第一语音流中存在与步骤S200中的所述自定义语音流的至少部分相同或相似的语音信号,进一步触发所述语音识别芯片进入后续的识别语音控制命令的状态。也即所述第一特征语句是所述语音识别芯片进入后续语音识别步骤的唤醒触发语句。典型地,所述第一特征语句中包含的词语和所述自定义语音流中包含的词语至少部分重合或完全相同,例如所述自定义语音流包含用户自定义的词语“阿拉丁”,则相应地所述第一特征语句可设置为词语“阿拉丁”。执行步骤S300过程时若判断所述第一语音流中是否存在与所述语音特征值相匹配的第一特征语句的判断结果为是,则触发步骤S400执行。

在步骤S400中,所述语音识别芯片在预定时间内采集外界输入的第二语音流,并判断所述第二语音流中是否存在第二特征语句。执行步骤S400的目的是在步骤S300中所述语音识别芯片以识别出所述第一特征语句为唤醒条件后,在后续的所述预定时间内判断是否有用户说出针对所述照明灯具的语音命令,典型地,所述第二特征语句包括:用于描述针对所述照明灯具的开灯操作、关灯操作、调整光源亮度操作或更改光源颜色操作的自然语言字符序列。例如所述第二特征语句包括如下词语:“开灯”、“关灯”、“调亮度”、“调颜色”。

本领域技术人员可以理解,所述语音识别芯片在识别接收到的语音流中的语音命令时,若按照现有技术的方法是仅识别单个的语音命令词语,这样无关的对话语音流或噪音都有可能造成误识别。而本发明采用的先识别出所述第一特征语句再触发识别所述第二特征语句的方法,可以有效地降低误识别率。所述第一特征语句和所述第二特征语句在一段时间内的语音流中先后出现的情况,通常是用户对所述照明灯具具有真实的语音控制意愿才容易出现,而在无关的对话语音流中或噪音中仅有较小概率会出现所述第一特征语句和所述第二特征语句先后连续出现的情况,尤其是所述第一特征语句与用户的所述自定义语音流中包含的自定义词语相匹配的前提下,若所述第一特征语句选用较为冷僻的词语(例如前文中的词语“阿拉丁”),降低所述语音识别芯片的误识别率的效果更佳明显。

在用户对所述照明灯具进行语音控制时,用于唤醒所述语音识别芯片的第一特征语句和用于进行语音控制的第二特征语句可能是连续地说出,也可能是相隔一个较短的时间间隔的情况下时间离散地先后说出。因此步骤S400中所述预定时间的取值范围应考虑正常人类普遍的语言习惯,根据实验结果发现,优选地所述预定时间的取值范围是0秒至2秒能保持较低的误识别率。

典型地在一个实施例中,判断所述第二语音流中是否存在所述第二特征语句的具体方法是:判断所述第二语音流中是否存在与所述语音特征值相匹配的第二特征语句。该方法是以步骤S200中采集到的所述自定义语音流作为识别所述第二特征语句的识别数据,相应地所述第二特征语句中包含的词语和所述自定义语音流中包含的词语至少部分重合或完全相同。这样的安排便于用户自定义第二特征语句包含的具体词语,可以进一步降低误识别率。在另一实施例中,断所述第二语音流中是否存在第二特征语句的具体方法是:判断所述第二语音流中是否存在与所述语音识别芯片内存储的语音模型相匹配的第二特征语句。该方法是以所述语音识别芯片内存储的语音模型作为识别所述第二特征语句的识别数据,所述语音模型可以使用现有的常规技术来创建(例如使用包含200个声音样本的集合进行算法处理得到),这样便于降低所述语音识别芯片的开发难度。根据所述照明灯具的实际使用场景,本发明的实施人员在选用判断所述第二语音流中是否存在所述第二特征语句的具体方法时可以使用上述两个实施例中任一方法或其组合。

在优选的实施例中,所述第一语音流和所述第二语音流是所述语音识别芯片在不同时间分别采集的,步骤S200和步骤S300的执行具有时间上的先后执行顺序。在可选的实施例中,所述第一语音流和所述第二语音流是从所述语音识别芯片接收到的连续语音流中分离出来的,在这种情况中步骤S200中所述语音识别芯片采集外界输入的第一语音流的具体步骤和步骤S300中所述语音识别芯片在预定时间内采集外界输入的第二语音流可能是并行执行的情况。

本领域技术人员可以理解,基于语音识别芯片的性能和成本考虑,本发明识别所述第一特征语句和所述第二特征语句时优先使用的是简单的语音特征对比方法,而不需要使用更为复杂的语音识别概率算法(例如隐藏的马尔可夫模型)来进行识别。

若步骤S400中判断所述第二语音流中是否存在第二特征语句的判断结果为是,则进一步执行步骤S500,也即根据所述第二特征语句生成用于变更所述照明灯具的工作状态的控制命令。其中变更所述照明灯具的工作状态例如是开启、关闭所述照明灯具的光源,或调整所述照明灯具的光源的亮度或颜色。根据所述第二特征语句生成用于变更所述照明灯具的工作状态的控制命令的步骤可以是所述语音识别芯片所实现的,也可以是所述语音识别芯片触发与其电连接的主机芯片来实现。本领域技术人员可以理解,实际上控制所述照明灯具的控制命令是根据所述第二特征语句生成的,并不会根据所述第一特征语句生成上述控制命令。

需要说明的是,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

本发明提供的照明灯具的语音控制方法可以使用可编程逻辑器件来实现,也可以实施为计算机程序软件,例如根据本发明的实施例可以是一种计算机程序产品,运行该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现上述方法的各个步骤。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如热拔插技术存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如盒带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。

本领域技术人员应当理解,任何具有适当编程装置的计算机系统都将能够执行包含在程序产品中的本发明的方法的诸步骤。尽管本说明书中描述的多数具体实施方式都侧重于软件程序,但是作为固件和硬件实现本发明提供的方法的替代实施例同样在本发明要求保护的范围之内。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他部件、单元或步骤,单数不排除复数。

本发明所提供的照明灯具的语音控制方法具有如下优点:一方面,通过在整个语音识别过程中首先识别出第一特征语句触发进入后续的语音识别,再识别出用于生成控制命令的第二特征语句,在保持较高语音识别率的前提下降低了拒绝识别率和误识别率,因此提升了照明灯具的语音控制的准确度和用户体验,另一方面,从第一语音流中识别所述第一特征语句是使用用户自定义语音流中提取的语音特征值来进行识别,在提升语音识别率的同时还满足了用户个性化语音识别的需求。

以上所揭露的仅为本发明的一些较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1