本发明属于人工智能技术领域,涉及语音识别技术,具体涉及一种降低相似语音命令词误识别率的方法。
背景技术:
目前语音识别作为一种常用的人机交互技术,已广泛应用于各类电子产品中,以其自然方便的交互方式收到了消费者的喜爱,逐渐成为了智能产品时代的主流交互控制方式。
语音识别目前有两类方式,一类是在线的自由对讲方式,用户使用时可以随意讲话,由产品设备采集到用户讲话内容,通过网络上传到云端服务器进行语义分析理解,解析出用户的用意,再通过网络传到产品设备中进行相应的操作控制,这种方式优点在于用户可自由讲话,比较接近人们的日常生活习惯,但缺点在于需要网络才能使用,且因涉及到需要上传语音数据,安全性较差,另外网络具有延时,网络识别的产品需要等待网络识别的结果需要花费的时间就较多。
考虑到上述方式的缺点,目前很多功能性的产品设备如空调、抽油烟机等设备都采用了另一类语音识别的方式,即通过离线的语音控制命令词的识别,进行产品设备的功能控制,该类方式无需使用网络,具有响应速度快,控制简单等优点,但需要事先设定好语音控制命令词,产品设备需识别到完整的语音控制命令词后才会响应,而在实际的产品设备应用环境中经常有语音相似的命令词或用户个别字发音不准等情况,比方生活中经常用到的四和十发音相似,可能会造成语音控制命令词识别错误,造成语音误识别率下降。影响用户体验。现有的语音模型和声学模型难以解决这种误识别问题。
技术实现要素:
为克服现有技术存在的技术缺陷,本发明公开了一种降低相似语音命令词误识别率的方法。
本发明所述降低相似语音命令词误识别率的方法,包括如下步骤:
s1.在设备的命令词中筛选出彼此容易误识别的命令词并分组;
s2.统计客户使用设备时,对单个命令词的使用频率及误识别频率;
s3.设置置信度分数调整触发条件;当使用频率及误识别频率达到触发条件时,对置信度分数进行调整;
s4.反复进行步骤s2至s3,直至使用频率及误识别频率不能满足触发条件。
优选的,所述步骤s3中,设置使用频率阈值,误识别频率上调阈值;所述触发条件具体为:在使用频率高于使用频率阈值的条件下,误识别频率高于误识别频率上调阈值;
所述调整为:误识别频率高于误识别频率上调阈值的命令词,置信度分数调高。
优选的,所述步骤s3中,设置使用频率上调阈值和下调阈值,设置误识别频率阈值;所述触发条件具体为:使用频率高于使用频率上调阈值或低于使用频率下调阈值;且同组中存在至少一个命令词的误识别频率高于误识别频率阈值;
所述调整为:调高使用频率高于使用频率阈值的命令词置信度分数,或降低低于使用频率下调阈值的命令词置信度分数。
优选的,所述误识别的判断标准:命令词发出后时间t内被取消;该时间t为自定义的时间长度。
采用本发明所述的降低相似语音命令词误识别率的方法,可以针对用户使用习惯和发音习惯调整命令词置信度分数,使设备对用户识别更具有针对性,可以显著降低误识别率;这种个性化调整措施还可以提高个体用户使用依赖性,增强用户使用语音控制的体验度。
附图说明
图1为本发明所述降低相似语音命令词误识别率的方法的一种具体实施方式流程示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述本发明所述降低相似语音命令词误识别率的方法,包括如下步骤:
s1.在设备的命令词中筛选出彼此容易误识别的命令词并分组;
s2.统计客户使用设备时,对单个命令词的使用频率及误识别频率;
s3.设置置信度分数调整触发条件;当使用频率及误识别频率达到触发条件时,对置信度分数进行调整;
s4.反复进行步骤s2至s3,直至使用频率及误识别频率不能满足触发条件。
优选的,所述步骤s3中,设置使用频率阈值,误识别频率上调阈值;所述触发条件具体为:在使用频率高于使用频率阈值的条件下,误识别频率高于误识别频率上调阈值;
所述调整为:误识别频率高于误识别频率上调阈值的命令词,置信度分数调高。
例如:对于语音控制的微波炉,存在容易混淆的命令词a1:加热四分钟和命令词a2:加热十分钟,及命令词a3:加热十四分钟。
用户使用时,统计发现对于命令词a1和a2,经常使用,而命令词a3加热十四分钟几乎不使用。
则可能命令词a1和a2的使用频率高于使用频率阈值,而命令词a3的调整不再考虑。
统计进一步发现命令词a1加热四分钟经常被误识别为命令词a2加热十分钟,而命令词a2几乎不发生误识别。
则命令词a1的误识别频率高于误识别频率上调阈值,系统自动上调命令词a1的置信识别度分数,使命令词a1更容易被识别,降低命令词a1的误识别率,直至命令词a1的误识别率低于误识别频率上调阈值。
上述方式可以降低用户经常容易发错音的命令词的误识别率。
对于经常被使用或几乎不被使用的命令词,也可以对置信度分数进行调整以进行区别,降低误识别率。
仍然以命令词a1:加热四分钟和命令词a2:加热十分钟为例,现实中发现命令词a1经常使用,命令词a2几乎没人使用,则可能出现命令词a1的使用频率高于使用频率上调阈值,命令词a2的使用频率低于使用频率下调阈值;
此时调高命令词a1置信度分数,使a1降低误识别率,直至误识别率低于误识别率阈值;提高命令词a2置信度分数,实际也可以降低a1被误识别为a2的几率。
该优选实施方式中,误识别率阈值通常相对第一种方式更低,例如可以是连续100次都无误识别;这种方式可以提高对用户常用词的识别准确度。
所述误识别现象一般是用户发出指令后,发现设备的反馈语音或反馈动作与用户预想不同,此时用户会迅速发出命令取消之前指令的执行,可以设定误识别的判断标准为,命令词发出后时间t内被取消;该时间t为自定义的时间长度,例如3秒或其它时间。
采用本发明所述的降低相似语音命令词误识别率的方法,可以针对用户使用习惯和发音习惯调整命令词置信度分数,使设备对用户识别更具有针对性,可以显著降低误识别率;这种个性化调整措施还可以提高个体用户使用依赖性,增强用户使用语音控制的体验度。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。