一种语音识别执法记录仪及其识别方法_2

文档序号：9330922阅读：来源：国知局

]第一语音输入装置和第二语音输入装置同时拾取声音信号分别得到第一电压信号和第二电压信号。由于声音信号到达第一语音输入装置和第二语音输入装置的距离不一定相同，因此，声音信号到达第一语音输入装置和第二语音输入装置处产生的音压也不一定相同，从而经过第一语音输入装置和第二语音输入装置处理后输出的第一电压信号和第二电压信号表现出来的电压也不一定相同。
[0036]第一采样模块和第二采样模块以预设的采样频率分别对第一电压信号和第二电压信号进行采样，得到第一数字信号和第二数字信号。一个实施例中，第一采样模块和第二采样模块采用ADC接口 (模拟转数字接口)，采样频率的取值不小于人体发声频率的2倍，如人体发声频率范围为85HZ-1.1KHZ，采样频率可设为2.2KHZ，以便更好地将语音信号进行还原。一个实施例中，在第一语音输入装置与第一采样模块之间还包括第一放大模块，在第二语音输入装置与第二采样模块之间还包括第二放大模块，第一放大模块和第二放大模块分别对第一电压信号和第二电压信号进行放大处理，第一放大模块和第二放大模块对信号放大的倍数相同。由于执法记录仪上第一语音输入装置与第二语音输入装置的间距比较小，不经放大处理的第一电压信号和第二电压信号间的电压差异可能比较微小，不利于后续处理。
[0037]音源判断模块获取第一数字信号与第二数字信号的电压差，若该电压差大于预设的电压阈值，认为声音信号是来自于执法记录仪使用者，将第一数字信号或第二数字信号作为用户语音信号传输给语音识别模块进行处理。更优地，音源判断模块还包括通过第一数字信号和第二数字信号获取声音信号到达第一声音输入装置和第二声音输入装置的时延差，若电压差大于预设的电压阈值且时延差小于预设的时延阈值，认为该声音信号来自于执法记录仪使用者，将第一数字信号或第二数字信号作为用户语音信号传输给语音识别模块进行处理。本发明的实施例中，采用时延估计算法(TDE)来获取声音信号到达第一语音输入装置和第二语音输入装置的时延差。
[0038]语音识别模块将用户语音信号与指令语音库中预存的指令语音进行比较并确认指令类别，若确认成功，输出对执法记录仪相应的操作指令。一个实施例中，语音识别模块包括频谱分析单元、特征提取单元、语音比较器和指令语音库，参见图2是本发明【具体实施方式】一的语音识别模块结构框图。其中，频谱分析单元利用快速傅里叶算法(FFT)获取用户语音信号的长度、频率、振幅等信号特征，特征提取单元根据上述信号特征获取到相应的音节长度、音调大小以及声音响度等语音特征，语音比较器将上述语音特征与指令语音库中的关键词语列表进行识别，若识别成功，输出对执法记录仪相应的操作指令，如行使对执法记录仪的摄像、录音、拍照等操作。但由于每个人的发音特点不一样，采用标准的指令语音库影响语音识别准确度，不利于指令信息的高效识别，当执法场景处于异常状况时还可能错失对重要信息的记录。更优地，语音识别模块还包括语音录入单元，用于录入使用者的语音，从而为每个使用者建立一个专属指令语音库。使用者在正式使用前可通过第一声音输入装置或第二声音输入装置拾取自己的指令语音信号，语音录入单元将该指令语音信号处理后存入专属指令语音库中进行保存；或者在语音识别过程中，语音识别模块未在使用者的专属指令语音库中识别到对应的指令语音，则提醒使用者是否将该指令语音信号加入专属指令语音库，若使用者回答是，则语音录入单元存储该指令语音信号，从而不断完善和强大每个使用者的专属指令语音库。
[0039]更优地，在音源判断模块和语音识别模块之间还包括降噪模块，降噪模块用于对用户语音信号进行降噪处理，对该用户语音信号进行滤波以滤除人声频率以外的声音信号，如环境噪声等，从而提高语音识别结果的准确性。
[0040]实施例二:
[0041]本发明还提出一种语音识别执法记录仪，参见图3是本发明【具体实施方式】二的语音识别执法记录仪系统框图，本语音识别执法记录仪包括第一语音输入装置、第二语音输入装置、第一放大模块、第二放大模块、第一采样模块、第二采样模块、音源判断模块和语音识别模块，其中，第一语音输入装置至目标音源的距离比第二语音输入装置至目标音源的距离小，这里的目标音源指的是执法记录仪使用者的发音部位。在本发明的实施例中，第一语音输入装置为位于执法记录仪机顶的麦克风，第二语音输入装置为位于执法记录仪前壳的麦克风，按照一般佩戴习惯，第一语音输入装置至目标音源的距离小于第二语音输入装置至目标音源的距离。
[0042]第一语音输入装置和第二语音输入装置同时拾取声音信号分别得到第一电压信号和第二电压信号。
[0043]第一放大模块和第二放大模块分别对第一电压信号和第二电压信号进行相同倍数的放大处理。
[0044]第一采样模块和第二采样模块以预设的采样频率分别对第一电压信号和第二电压信号进行采样，得到第一数字信号和第二数字信号。
[0045]音源判断模块获取第一数字信号与第二数字信号的电压差，以及通过第一数字信号与第二数字信号获取声音信号到达第一声音输入装置和第二声音输入装置的时延差，若电压差大于预设的电压阈值且时延差小于预设的时延阈值，认为该声音信号是来自于执法记录仪使用者，将第一数字信号或第二数字信号作为用户语音信号传输给语音识别模块进行处理；若电压差小于预设的电压阈值且时延差大于预设的时延阈值，认为该声音信号是来自于执法记录仪使用者以外的路人，将第一数字信号或第二数字信号作为路人语音信号传输给语音识别模块进行处理。
[0046]若传输来的语音信号是用户语音信号，语音识别模块将用户语音信号与指令语音库中预存的指令语音进行比较并确认指令类别，若确认成功，输出对执法记录仪相应的操作指令；若传输来的语音信号是路人语音信号，语音识别模块将路人语音信号与异常语音库中预存的异常语音进行比较并确认是否为异常语音，若是，输出对执法记录仪开始录音或录像的操作指令，这里的异常语音可以是尖叫声或呼救声等。语音识别模块可采用语音识别芯片实现，将语音识别芯片的输出端与数字信号处理单元DSP相连，若传输来的语音信号是用户语音信号，如“录像”，语音识别模块将用户语音信号与指令语音库中预存的指令语音进行比较并确认指令类别，若确认成功，通过数字信号处理单元DSP发送信号，将与“录像”命令相对应的LUXIANG_KEY拉高，等同于按键功能，执法记录仪开始录像。
[0047]更优地，在音源判断模块和语音识别模块之间还包括降噪模块，降噪模块用于对用户语音信号和路人语音信号进行降噪处理，对该用户语音信号或路人语音信号进行滤波以滤除人声频率以外的声音信号，如环境噪声等，从而提高语音识别结果的准确性。
[0048]参见图4是本发明【具体实施方式】二的语音识别执法记录仪工作流程图，具体如下:
[0049]S1、机顶麦克风和前壳麦克风同时拾取声音信号，分别得到第一电压信号和第二电压信号；
[0050]S2、第一放大模块和第二放大模块分别对第一电压信号和第二电压信号进行相同倍数的放大处理，得到放大后的第一电压信号和第二电压信号；
[0051]S3、第一采样模块和第二采样模块以预设的采样频率分别对步骤S2放大后的第一电压信号和第二电压信号进行采样，得到第一数字信号和第二数字信号；
[0052]S4、音源判断模块通过第一数字信号与第二数字信号获取电压差以及时延差，若电压差大于电压阈值且时延差小于时延阈值，认为该声音信号是来自于执法记录仪使用者，将第一数字信号作为用户语音信号传输给语音识别模块；若电压差小于电压阈值且时延差大于时延阈值，认为该声音信号是来自于执法记录仪使用者以外的路人，将第二数字信号作为路人语音信号传输给语音识别模块；否则，认为对该声音信号的判断无效，返回步骤SI由机顶麦克风和前壳麦克风重新拾取；
[0053]S5、降噪模块对用户语音信号或路人语音信号进行降噪处理，对该用户语音信号或路人语音信号进行滤波以滤除人声频率以外的声音信号；
[0054]S6、若传输来的语音信号是用户语音信号，语音识别模块将用户语音信号与指令语音库中预存的指令语音进行比较并确认指令类别，若确认成功，输出对执法记录仪相应的操作指令，若确认失败，返回步骤SI由机顶麦克风和前壳麦克风重新拾取；若传输来的语音信号是路人语音信号，

完整全部详细技术资料下载

当前第2页1 2 3