本发明属于制造信息化技术领域,具体说是一种基于离线语音识别的测量系统输入方法。
背景技术:
检测数据记录系统旨在替代人工,提高测试人员的工作效率,此外,在某些情况下确保信息录入的保密性,不允许连接internet广域网,实现不淘汰现有仪器设备为前提的产品检测,并且原系统软件要做尽量少的改动。
本发明对检测数据语音输入系统的使用简化了测试流程,提高了测试准确性和劳动效率。该系统使测试数据电子化,有利于后续的处理和保存。本发明测试数据可转化为二维码,随产品交付,形成电子数据包;本发明测试数据可直接导出至数据处理软件,完成结果评估。
技术实现要素:
本发明采用串口键盘协议转换将语音识别与键盘输入无缝连接,在充分利用现有条件的基础上,发明了一种语音输入法。
本发明为实现上述目的所采用的技术方案是:
一种基于离线语音识别的测量系统,包括:
语音输入端,用于将待测语音数据输出给语音识别系统;
语音识别系统,用于识别语音输入端输入的语音数据并转化成字符串,输出给协议转换线;
协议转换线,用于将语音识别系统输入的字符串转换成键盘码并通过串口输出给信息录入计算机;
信息录入计算机,用于读取串口输入的键盘码并将键盘码对应的字符录入到文档中。
所述语音识别系统包括语音识别app。
所述语音识别app通过调用离线语音包中的api函数进行语音识别。
所述语音识别app执行以下操作:
1)语音识别app获得待测语音数据后,调用离线语音包提供的api函数开始转换,并将待测语音数据转换成字符串;
2)语音识别app调用离线语音包提供的api函数获得步骤1)转换后的字符串,并进行分检处理:如果是数字,直接输出给协议转换线处理;如果是“完毕”,则输出“\n”给协议转换线;如果是“修改”,则输出“del”给协议转换线。
一种基于离线语音识别的测量系统输入方法,包括以下步骤:
1)语音输入端输入待测语音数据;
2)语音识别系统获得待测语音数据后,调用离线语音包提供的api函数开始转换,并将待测语音数据转换成字符串;
3)语音识别系统调用离线语音包提供的api函数获得步骤2)转换后的字符串,并进行分检处理:如果是数字,直接输出给协议转换线处理;如果是“完毕”,则输出“\n”给协议转换线;如果是“修改”,则输出“del”给协议转换线;
4)协议转换线将步骤3)所输出的字符串进行自动处理,转换成键盘码,并输出到信息录入计算机的串口;
5)信息录入计算机从串口获得键盘码,并根据键盘码进行操作。
所述键盘码包含各按键的键盘位置信息。
信息录入计算机根据键盘码进行的操作包括:输入、修改、换行。
输入的待测语音数据包含两类:数值指令及控制指令,数值指令经语音识别后输出到计算机的串口,控制指令完成输入数据的确认及修改,分别输出“\n”及“del”键盘码到串口。
本发明具有以下有益效果及优点:
1.降低了系统的开发成本;
2.减小了录入pc端的软件开发工作,既提高了开发效率又有助于原系统的保密性。
附图说明
图1a为本发明系统结构及硬件连接图一;
图1b为本发明系统结构及硬件连接图二;
图2为语音识别app界面图;
图3为语音识别app工作流程图;
图4为数据格式转换示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
该输入法的具体执行过程如下:
步骤1操作人员打开语言识别app,点击开始按钮;
步骤2测量工件尺寸,并对准耳麦语音播报测量结果;
步骤3语言识别app获得语音信息后,调用离线语音包提供的api函数:start_recognition()开始转换,并将语音信号转换成字符串;
步骤4语言识别app调用离线语音包提供的api函数:receive_result()获得步骤3转换称的字符串,并进行分检处理,如果是数字,直接输出给协议转换线处理;如果是“完毕”,则输出“\n”给协议转换线;如果是“修改”,则输出“del”给协议转换线;
步骤5协议转换线将步骤4所输出的字符进行自动处理,转换称键盘码,其中包含各按键的键盘位置信息,并输出到pc机的串口;
步骤6pc机从串口获得键盘码,进行表格中尺寸的输入、修改、换行等;
步骤7判断测量完毕是否关闭语音输入法,如果关闭,则按界面的结束按钮关闭,否则转步骤2继续测量。
1系统构成
硬件:
支持android的pc机
用于语音输入的耳麦、话筒
软件:
android操作系统
开源离线语音包
语音识别软件包(手写替代)
语音输入法的开发(协议转换):
2.系统结构及硬件连接,如图1a~图1b所示
话筒:话筒是语音输入的关键设备,具备一定降噪功能。
语音识别系统:语音输入软件作用为在离线环境下识别检测人员报读的数据,并将读取的语音数据通过语音识别转化成字符串。由于语音输入软件具备对离线语音包的良好的兼容性,因此采用android操作系统。
协议转换线:为保证录入系统的保密性,要不改变原有的数据输出方式,本发明采用串口键盘映射的交互方式,该功能语音识别的结果由协议转换线转换成键盘码,使用串口方式输出到要录入的计算机。
信息录入计算机:读取串口信息,并作为键盘码将对应的字符录入到文档或数据库中。
3.语音识别软件的开发
语音识别软件包括人机界面及语音处理两个模块构成。各模块详细介绍如下。
3.1界面开发,如图2所示
尺寸显示:实时显示语音识别的结果;
开始按钮:开启语音识别输入法;
结束按钮:关闭语音识别输入法。
3.2语音处理软件
该软件设计为基于离线语音库的二次开发。根据测量需要,输入的语言指令包含两类:数值指令及控制指令。数值指令经语音识别后直接输出到计算机的串口,控制指令主要完成输入数据的确认及修改,分别输出“\n”及“del”键盘码到串口。此外,输入时各指令间需要有适当的暂停时间以区分指令的条数,大约在1-2秒左右。软件运行流程图如图3所示。
3.3数据格式的转换
操作人员得到工件的测量尺寸后,通过话筒进行语音输入,语音识别app获取语音信号后,调用离线语音包的api,得到识别出的字符串,然后经协议转换线自动处理后,得到字符串的键盘码串,输出到录入计算机的串口;然后,录入计算机读取串口的键盘码串后自动转换成字符串并输出到工件尺寸的记录表格,数据格式转换示意图如图4所示。
4.测试的工艺流程
由于采用语音输入方式,操作人员的操作流程发生改变,具体操作步骤如下:
第1步:系统准备:打开电脑;测试耳麦;打开软件;打开输入文本;
第2步:产品准备:将产品置于测试台,准备好量具;
第3步:测量:测试产品数据;
第4步:报读:报读测试结果;
第5步:检查:检查录入数据是否与实测相符;
第6步:检查是否完成测试,未完成转第二步继续下一项测量;
第7步:结束:保存文件,关闭电脑。
5可靠性分析
由于该输入方式受外界因素的影响较大,识别的准确率及外界因素的控制是很关键的,该系统的可靠性分析如下:
1)系统测试指标:准确度不低于90%,识别转换平均速率不低于1个数据/秒。
2)降噪防干扰:操作人员尽量采用普通话报告测试结果;保证测试环境不要过分吵杂;设置修改指令,在发现错误识别时要及时纠错;设置完毕指令,实现数据录入时的确认;采用耳麦等装置避免外界的干扰。