语音识别方法、装置、电子设备及可读存储介质与流程

文档序号:33178731发布日期:2023-02-04 04:22阅读:44来源:国知局
语音识别方法、装置、电子设备及可读存储介质与流程

1.本发明实施例涉及医疗语音识别技术领域,尤其涉及一种语音识别方法、装置、电子设备及可读存储介质。


背景技术:

2.当前,语音识别需要用户提前发出唤醒指令(例如:汽车语音按钮、手机助手等),使得语音采集设备开始采集语音信息;再对采集到的语音信息进行识别,进而执行与识别到的语音信息对应的目标操作。
3.在医疗领域,医疗设备对患者做出的操作需要具备高及时性,即对医疗领域的语音识别提出了需要具备高及时性和高识别效率的要求。现有的语音识别方法及时性差、识别效率低。


技术实现要素:

4.本发明实施例提供一种语音识别方法、装置、电子设备及可读存储介质,以解决现有的语音识别方法及时性差、识别效率低的问题。
5.为了解决上述技术问题,本发明是这样实现的:
6.第一方面,本发明实施例提供了一种语音识别方法,包括:
7.每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息;
8.获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;
9.对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;
10.确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备。
11.可选地,
12.根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据,包括:
13.根据所述存储信息以及本次获取的所述语音信息,核验所述预分配的存储空间中的未被占用空间是否足够用于存储本次获取的所述语音信息,得到核验结果;
14.若所述核验结果为所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息,将本次获取的所述语音信息存储至所述预分配的存储空间;
15.若所述核验结果为所述预分配的存储空间中的未被占用空间不足够用于存储本次获取的所述语音信息,删除所述预分配的存储空间中存储时刻最早的目标数据,使得所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息;将本次获取的所述语音信息存储至所述预分配的存储空间;
16.根据所述存储信息,对所述预分配的存储空间是否存储有前一次获取的所述语音信息进行检验,得到检验结果;
17.若所述检验结果为存储有前一次获取的所述语音信息,根据所述待识别语音包合成策略,将本次获取的所述语音信息与前一次获取的所述语音信息进行合成,得到待识别语音数据包;
18.若所述检验结果为未存储有前一次获取的所述语音信息,根据所述待识别语音包合成策略,将本次获取的所述语音信息合成为所述待识别语音数据包。
19.可选地,
20.根据所述待识别语音包合成策略,将本次获取的所述语音信息与前一次获取的所述语音信息进行合成,包括:
21.将本次获取的所述语音信息的语音数据段与前一次获取的所述语音信息的语音数据段进行拼接,得到拼接后的语音数据段;
22.将预设的文件头添加至所述拼接后的语音数据段,得到所述待识别语音数据包。
23.可选地,
24.对所述待识别语音数据包进行语音识别,得到本次的语音识别结果,包括:
25.获取预设的用户自定义关键词库;
26.识别所述待识别语音数据包中是否具有所述用户自定义关键词库中的用户自定义关键词,得到本次的所述语音识别结果。
27.可选地,
28.所述用户自定义关键词库中的用户自定义关键词与所述目标操作指令一一映射,所述目标操作指令用于指示所述医疗设备执行目标操作;
29.识别所述待识别语音数据包中是否具有所述用户自定义关键词库中的用户自定义关键词,得到本次的所述语音识别结果,之后包括:
30.若本次的所述语音识别结果为所述待识别语音数据包中具有所述用户自定义关键词,根据识别到的所述用户自定义关键词,确定对应的所述目标操作指令。
31.可选地,
32.应用于超声波内窥镜;
33.所述用户自定义关键词库包括以下至少一项所述用户自定义关键词:
34.扫描、抓图、批注、测量、开启照明以及关闭照明。
35.可选地,
36.确定与所述语音识别结果对应的目标操作指令,之前包括:
37.计算得到本次的所述语音识别结果的可信度值;
38.校验所述可信度值是否超出预设的可信度阈值,得到校验结果;
39.若所述校验结果为所述可信度值超出所述预设的可信度阈值,终止确定与所述语音识别结果对应的目标操作指令。
40.第二方面,本发明实施例提供了一种语音识别装置,包括:
41.获取模块,用于每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息;
42.执行模块,用于获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;
43.识别模块,用于对所述待识别语音数据包进行语音识别,得到本次的语音识别结
果;
44.所述执行模块,还用于确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备。
45.第三方面,本发明实施例提供了一种超声波内窥镜,包括:
46.用于采集语音信息的语音采集器;
47.如第二方面所述的语音识别装置。
48.第四方面,本发明实施例提供了一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面中任一项所述的语音识别方法中的步骤。
49.第五方面,本发明实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面中任一项所述的语音识别方法中的步骤。
50.在本发明实施例中,通过每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息,不需要用户提前发出唤醒指令,即能够实时地采集所述语音信息;并且,通过获取一次语音采集器采集的语音信息之后,获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备,本发明实施例还将每次获取到的语音信息不间断识别,本发明实施例的语音识别具有高及时性和高识别效率。
附图说明
51.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
52.图1为本发明实施例语音识别方法的流程示意图之一;
53.图2为应用本发明实施例语音识别方法的时序示意图;
54.图3为应用本发明实施例语音识别方法的语音识别系统的工作流程示意图;
55.图4为合成语音文件的流程示意图;
56.图5为语音识别的流程示意图;
57.图6为识别成功封装成指令的流程示意图;
58.图7为本发明实施例语音识别方法的流程示意图之二;
59.图8为本发明实施例语音识别方法的流程示意图之三;
60.图9为本发明实施例语音识别装置的原理框图;
61.图10为本发明实施例超声波内窥镜的原理框图;
62.图11为本发明实施例电子设备的原理框图。
具体实施方式
63.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
64.本发明实施例提供了一种语音识别方法,参见图1所示,图1为本发明实施例语音识别方法的流程示意图之一,包括:
65.步骤11:每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息;
66.步骤12:获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;
67.步骤13:对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;
68.步骤14:确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备。
69.本发明的一些实施例中,可选地,预设的时间间隔为1秒。
70.预设的时间间隔越长,即每次获取的语音信息中包含越长时间的信息,会导致识别语音所需的时间越多,例如:识别10-20秒的语音信息需要3-5秒的时间,设定1秒的时间间隔是为了保证识别时间在1秒以下,保证高识别响应速率。
71.示例性的,第1秒的录音结束直接保存语音信息并进行识别,第2秒录音结束时将第1秒及第2秒的语音信息进行拼接,再进行识别;第3秒录音结束时将第2及第3秒的语音信息进行拼接,再进行识别;以此类推,第4秒录音结束、第5秒录音结束......;
72.上述语音信息的拼接方式保证了声音的持续性,避免话说了一半就结束了,有利于提高识别率。
73.本发明实施例中,语音采集器实时地采集语音信息是实时地获取全部的语音信息,并对语音信息进行识别,由此具备高及时性和高识别效率。而现有的部分语音识别方法中,语音采集器在未被唤醒之前,仅采集特定的语音词,采集到之后被特定语音词唤醒,进而采集特定语音词之后一段时间内的其他语音,对其他语音进行语音识别,并根据识别结果执行目标操作。例如,智能手机中,为了唤醒手机语音助手,需要用户说出特定的唤醒词,用户说出唤醒词之后,手机语音助手被唤醒,进而采集并识别用户说出的唤醒词之后的语音信息,根据识别结果执行目标操作。
74.本发明的一些实施例中,可选地,预分配的存储空间可以是预分配的缓存空间,进一步保障了读写速率,保障了本发明实施例语音识别方法的高及时性和高识别效率。
75.缓存(cache),是指可以进行高速数据交换的存储器,它先于内存与cpu交换数据,因此速率很快。缓存的工作原理是当cpu要读取一个数据时,首先从cpu缓存中查找,找到就立即读取并送给cpu处理;没有找到,就从速率相对较慢的内存中读取并送给cpu处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。正是这样的读取机制使cpu读取缓存的命中率非常高(大多数cpu可达90%左右),也就是说cpu下一次要读取的数据90%都在cpu缓存中,只有大约10%需要从内存读取。这大大节省了cpu直接读取内存的时间,也使cpu读取数据时基本无需等待。总的来说,cpu读取数据的顺序是先缓存后内存。
76.在本发明实施例中,通过每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息,不需要用户提前发出唤醒指令,即能够实
时地采集所述语音信息;并且,通过获取一次语音采集器采集的语音信息之后,获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备,本发明实施例还将每次获取到的语音信息不间断识别,本发明实施例的语音识别具有高及时性和高识别效率。
77.本发明的一些实施例中,可选地,
78.步骤12中,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据,包括:
79.步骤121:根据所述存储信息以及本次获取的所述语音信息,核验所述预分配的存储空间中的未被占用空间是否足够用于存储本次获取的所述语音信息,得到核验结果;
80.步骤122:若所述核验结果为所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息,将本次获取的所述语音信息存储至所述预分配的存储空间;
81.步骤123:若所述核验结果为所述预分配的存储空间中的未被占用空间不足够用于存储本次获取的所述语音信息,删除所述预分配的存储空间中存储时刻最早的目标数据,使得所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息;将本次获取的所述语音信息存储至所述预分配的存储空间;
82.步骤124:根据所述存储信息,对所述预分配的存储空间是否存储有前一次获取的所述语音信息进行检验,得到检验结果;
83.步骤125:若所述检验结果为存储有前一次获取的所述语音信息,根据所述待识别语音包合成策略,将本次获取的所述语音信息与前一次获取的所述语音信息进行合成,得到待识别语音数据包;
84.步骤126:若所述检验结果为未存储有前一次获取的所述语音信息,根据所述待识别语音包合成策略,将本次获取的所述语音信息合成为所述待识别语音数据包。
85.本发明实施例中,目标数据在预分配的存储空间中的空间占用量为第一空间占用量,预分配的存储空间中的未被占用空间与存储本次获取的所述语音信息所需的未被占用空间之间的差量为第二空间占用量,第一空间占用量与第二空间占用量相等,使得删除目标数据之后所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息。
86.可以理解的,虽然每次获取均隔预设的时间间隔,但是每次获取到的语音信息的空间占用量并不一定相等,例如:一段时间内,语音采集器采集语音的区域内有多人多段对话;另一段时间内,语音采集器采集语音的区域内无人说话,则记录上述两段时间内语音的语音信息所包含的信息量是不一样的,语音信息的空间占用量不相等。由此,步骤123中每次删除的目标数据的空间占用量不一定相等,需要具体计算得到第二空间占用量,再根据第二空间占用量确定目标数据的第一空间占用量。
87.此外,本发明实施例中,目标数据是所述预分配的存储空间中存储时刻最早的数据,有利于避免将前一次获取的语音信息误删除,前一次获取的语音信息为上一个预设的时间间隔时获取的语音信息,存储时刻较晚。在误删除前一次获取的语音信息的情况下,本
发明实施例虽然能够补救并保证完成语音识别(步骤124及步骤126),但是误删除前一次获取的语音信息而造成的语音信息不连续,可能会进一步造成识别准确率降低以及发送错误的目标操作指令。由此,上述目标数据为存储时刻最早的数据的设置,能够避免由于误删除前一次获取的语音信息而造成的语音信息不连续,进一步避免由于语音识别结果不连续造成的识别准确率降低以及发送错误的目标操作指令。
88.本发明的一些实施例中,可选地,语音采集器持续采集语音信息,设定一个缓存(例如:缓存容量为存储2秒语音信息所需的容量)。
89.每个1秒中,获取语音采集器采集的语音信息,将语音信息存储至上述预先开辟的缓存中。在存储至上述缓存之前,判断当前缓存的容量是否超过设定的缓存容量;若超出,计算超出的具体容量,并根据存储至该缓存的时序,移除当前缓存中最早存储至缓存的第一数据(该数据占据的存储容量空间与超出的具体容量相等),提高语音识别的响应速度和准确性。
90.本发明实施例中,步骤126中,所述检验结果为未存储有前一次获取的所述语音信息,可以代表:本次获取为第一次获取语音信息。由此,根据所述待识别语音包合成策略,将本次获取的所述语音信息合成为所述待识别语音数据包。
91.参见图2所示,图2为应用本发明实施例语音识别方法的时序示意图,其中,用户说出自定义的命令词,语音识别系统通过识别用户所说的命令词,从而发出特定的操作指令(相当于本发明实施例中的目标操作指令)给到第三方系统(相当于本发明实施例中医疗设备的系统),第三方系统收到指令后立即执行,这是一个可重复操作的过程,用户可随时的说出各种需求操作。
92.本发明的一些实施例中,语音识别系统首先根据用户自定义的命令词和资源文件构建特定的离线资源,然后通过收集到的语音文件和构建的离线资源进行对比,判断该段语音文件是否包含用户自定义的命令词,不同的命令词封装成为不同的指令,然后把这些指令发送到第三方系统从而达到用户所需要执行的操作。
93.下面详细的介绍一下语音识别系统的操作流程:
94.1.合成语音文件:语音识别系统自启动后就一直收集周围的声音形成语音文件,直到用户停止语音识别系统。
95.2.命令词:所谓的命令词就是用户自己定义的,一般言简意赅,比如拍照,打电话给某某,开灯等等,因为命令词没有特殊规定,所以说语音识别系统可以涉及各行各业。命令词可以定义多个,满足用户各种需求。
96.3.语音识别:语音识别系统首先根据用户自定义的命令词和资源文件构建特定的离线资源,然后通过收集到的语音文件和构建的离线资源进行对比,判断该段语音文件是否包含用户自定义的命令词,如果没有包含直接下一次识别,如果包含则返回此次识别到的命令词和识别可信度(可信度值的范围为1-100)。
97.4.识别成功封装成指令:语音识别系统获取到此次识别到的命令词进行特殊处理,形成指令发送到超声内镜系统,超声内镜系统进行命令解析然后执行指令操作。
98.参见图3所示,图3为应用本发明实施例语音识别方法的语音识别系统的工作流程示意图,其中包括以下步骤(一至三):
99.一、合成语音文件,参见图4所示:
100.1)对录音设备进行一些参数的设定,包括设置高低位、声道数目、编码器、采用频率、采样位大小等等。
101.2)为了保证响应快速,语音识别系统每1s进行一次录音然后每上/下一秒进行拼接的方式组合成一个数据包。
102.3)进行wav音频文件头格式,与录音收集到的数据包进行一个组合,形成可播放的wav格式的音频文件。
103.wav是最常见的声音文件格式之一,是微软公司专门为windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。
104.二、语音识别,参见图5所示:
105.1)设置语音识别的参数,包括设置高低位、声道数目、编码器、采用频率、采样位大小、识别结果返回格式、编码、识别可信度最低值等等。
106.2)根据参数的设定去解析语音文件,对比用户设定的命令词。
107.3)获取识别结果。
108.三、识别成功封装成指令,参见图6所示:
109.1)首先和第三方系统(医疗设备如超声内镜的工作站)规定指令包的协议封装,包括协议总的长度,协议头的值,数据位等等,确保指令数据包不被丢弃和正确解析。
110.2)获取识别到的命令词,与第三方系统商定不同值对应不同的指令;
111.3)进行加密处理,第三方系统需要相应的解密处理才能获取准确的值。即一个命令词对应一个指令,如“启动扫描”对应一个命令值,该命令值经解密后得到指令。
112.4)发送指令数据包。
113.本发明的一些实施例中,可选地,参见图7所示,图7为本发明实施例语音识别方法的流程示意图之二,根据所述待识别语音包合成策略,将本次获取的所述语音信息与前一次获取的所述语音信息进行合成,包括:
114.步骤21:将本次获取的语音信息的语音数据段与前一次获取的语音信息的语音数据段进行拼接,得到拼接后的语音数据段;
115.步骤22:将预设的文件头添加至拼接后的语音数据段,得到待识别语音数据包。
116.参见图3所示,图3为应用本发明实施例语音识别方法的语音识别系统的工作流程示意图,其中包括以下步骤三:
117.三、合成语音文件,参见图4所示:
118.1)对录音设备进行一些参数的设定,包括设置高低位、声道数目、编码器、采用频率、采样位大小等等。
119.2)为了保证响应快速,语音识别系统每1s进行一次录音然后每上/下一秒进行拼接的方式组合成一个数据包。
120.3)进行wav音频文件头格式,与录音收集到的数据包进行一个组合,形成可播放的wav格式的音频文件。
121.本发明的一些实施例中,可选地,参见图8所示,图8为本发明实施例语音识别方法的流程示意图之三,对待识别语音数据包进行语音识别,得到本次的语音识别结果,包括:
122.步骤31:获取预设的用户自定义关键词库;
123.步骤32:识别待识别语音数据包中是否具有用户自定义关键词库中的用户自定义
关键词,得到本次的语音识别结果。
124.本发明的一些实施例中,可选地,所述用户自定义关键词库中的用户自定义关键词与所述目标操作指令一一映射,所述目标操作指令用于指示所述医疗设备执行目标操作;
125.参见图8所示,识别待识别语音数据包中是否具有用户自定义关键词库中的用户自定义关键词,得到本次的语音识别结果,之后包括:
126.步骤33:若本次的语音识别结果为待识别语音数据包中具有用户自定义关键词,根据识别到的用户自定义关键词,确定对应的目标操作指令。
127.示例性的,用户自定义关键词包括开启照明,则当采集的语音信息被识别出用户说了“开启照明”的内容,映射到“开启照明”对应的目标操作指令,将目标操作指令发送给医疗设备,使得医疗设备开启照明。
128.本发明的一些实施例中,可选地,
129.应用于超声波内窥镜;
130.所述用户自定义关键词库包括以下至少一项所述用户自定义关键词:
131.扫描、抓图、批注、测量、开启照明以及关闭照明。
132.在本发明实施例中,扫描可以是对待成像区域进行超声波扫描,获取待成像区域的超声波影像信息;可以理解的,扫描也可以是采用光学摄像头对待成像区域进行光学扫描,获取待成像区域的光学影像信息,光学扫描至少可以是红外光扫描、紫外光扫描、任意色谱下的扫描,以及白光条件下的扫描,所获得的影像信息可以是rgb图像,也可以是rgb下任意单一通道的图像,例如:r通道图像、g通道图像,以及b通道图像。
133.抓图,可以是对获取到的影像信息上的某一目标区域的图像进行抓取。
134.批注,可以是对被抓取区域的图像进行的批注,也可以是对整个影像信息的批注。
135.测量,可以是测量影像信息中某一目标区域的尺寸数据,可以是测量超声波影像信息中某一目标区域在某一时间段内的声波反射峰的波峰或者波谷,可以是测量rgb图像中各个通道所占的比例,还可以测量影像信息中某一目标区域的实际曝光值等等,有利于提高医生根据影像信息辅助诊断的诊断效率。
136.开启照明以及关闭照明,可以是开启超声波内窥镜的照明光源,或者关闭超声波内窥镜的照明光源。
137.在本发明实施例中,通过对超声波内窥镜进行语音操作,使得内窥镜操作人员在对患者进行内窥镜检查时,不需要腾出操作手去点击工作台上的按键(扫描、抓图、批注、测量、开启照明以及关闭照明等按键),降低了内窥镜操作人员的操作负担,内窥镜操作人员能够专心操作,提高了检查的效率和准确率。
138.本发明的一些实施例中,可选地,
139.确定与所述语音识别结果对应的目标操作指令,之前包括:
140.计算得到本次的所述语音识别结果的可信度值;
141.校验所述可信度值是否超出预设的可信度阈值,得到校验结果;
142.若所述校验结果为所述可信度值超出所述预设的可信度阈值,终止确定与所述语音识别结果对应的目标操作指令。
143.可信度值会受到用户的发音、内容以及命令词的长度的影响。尤其在本发明实施
例中,语音采集设备无需唤醒指令,实时地采集语音信息,极容易出现误识别的情况。示例性,用户说出一段话,包括了某一自定义关键词,例如:开启照明;然而,用户实际想要表达的意思是开启其自身所在屋子的照明灯光,若不存在上述校验,则会导致错误地打开医疗设备的灯光,造成误触发。
144.现实中,医疗设备误触发地打开照明使得医疗设备的可靠性差,通常不会对患者的安全造成过大的危害。
145.然而,本示例中的关键词若是“扫描”等,在一些医疗设备(例如:ct设备,computed tomography,即电子计算机断层扫描)中会造成患者还未完成必要准备(例如:还未取下随身的全部金属制品)就已经暴露在射线环境下,对患者造成安全威胁。
146.可信度阈值可以是限定一个范围作为识别的最低可信度,比如设定50,当识别可信度的值低于50时就会放弃这一次的语音识别结果,进而避免了错误识别语音信息导致的医疗设备误触发操作,提高医疗设备相对患者的安全性。
147.本发明实施例提供了一种语音识别装置,参见图9所示,图9为本发明实施例语音识别装置的原理框图,语音识别装置90包括:
148.获取模块91,用于每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息;
149.执行模块92,用于获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;
150.识别模块93,用于对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;
151.所述执行模块92,还用于确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备。
152.本发明的一些实施例中,可选地,
153.所述执行模块92,还用于根据所述存储信息以及本次获取的所述语音信息,核验所述预分配的存储空间中的未被占用空间是否足够用于存储本次获取的所述语音信息,得到核验结果;
154.所述执行模块92,还用于若所述核验结果为所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息,将本次获取的所述语音信息存储至所述预分配的存储空间;
155.所述执行模块92,还用于若所述核验结果为所述预分配的存储空间中的未被占用空间不足够用于存储本次获取的所述语音信息,删除所述预分配的存储空间中存储时刻最早的目标数据,使得所述预分配的存储空间中的未被占用空间足够用于存储本次获取的所述语音信息;将本次获取的所述语音信息存储至所述预分配的存储空间;
156.所述执行模块92,还用于根据所述存储信息,对所述预分配的存储空间是否存储有前一次获取的所述语音信息进行检验,得到检验结果;
157.所述执行模块92,还用于若所述检验结果为存储有前一次获取的所述语音信息,根据所述待识别语音包合成策略,将本次获取的所述语音信息与前一次获取的所述语音信息进行合成,得到待识别语音数据包;
158.所述执行模块92,还用于若所述检验结果为未存储有前一次获取的所述语音信
息,根据所述待识别语音包合成策略,将本次获取的所述语音信息合成为所述待识别语音数据包。
159.本发明的一些实施例中,可选地,
160.所述执行模块92,还用于将本次获取的所述语音信息的语音数据段与前一次获取的所述语音信息的语音数据段进行拼接,得到拼接后的语音数据段;
161.所述执行模块92,还用于将预设的文件头添加至所述拼接后的语音数据段,得到所述待识别语音数据包。
162.本发明的一些实施例中,可选地,
163.所述识别模块93,还用于获取预设的用户自定义关键词库;
164.所述识别模块93,还用于识别所述待识别语音数据包中是否具有所述用户自定义关键词库中的用户自定义关键词,得到本次的所述语音识别结果。
165.本发明的一些实施例中,可选地,
166.所述用户自定义关键词库中的用户自定义关键词与所述目标操作指令一一映射,所述目标操作指令用于指示所述医疗设备执行目标操作;
167.所述识别模块93,还用于若本次的所述语音识别结果为所述待识别语音数据包中具有所述用户自定义关键词,根据识别到的所述用户自定义关键词,确定对应的所述目标操作指令。
168.本发明的一些实施例中,可选地,
169.应用于超声波内窥镜;
170.所述用户自定义关键词库包括以下至少一项所述用户自定义关键词:
171.扫描、抓图、批注、测量、开启照明以及关闭照明。
172.本发明的一些实施例中,可选地,
173.所述执行模块92,还用于计算得到本次的所述语音识别结果的可信度值;
174.所述执行模块92,还用于校验所述可信度值是否超出预设的可信度阈值,得到校验结果;
175.所述执行模块92,还用于若所述校验结果为所述可信度值超出所述预设的可信度阈值,终止确定与所述语音识别结果对应的目标操作指令。
176.本技术实施例提供的语音识别装置90能够实现图1至图8的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
177.本发明实施例提供了一种超声波内窥镜,参见图10所示,图10为本发明实施例超声波内窥镜的原理框图,超声波内窥镜100包括:
178.用于采集语音信息的语音采集器101;
179.如本发明实施例所述的语音识别装置102。
180.本技术实施例提供的超声波内窥镜100中的语音识别装置102能够实现图9的装置实施例语音识别装置90实现的各项功能,并达到相同的技术效果,为避免重复,这里不再赘述。
181.本发明实施例提供了一种电子设备110,参见图11所示,图11为本发明实施例电子设备110的原理框图,包括处理器111,存储器112及存储在存储器112上并可在处理器111上运行的程序或指令,程序或指令被处理器执行时实现本发明的任一项语音识别方法中的步
骤。
182.本发明实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如上述任一项的语音识别方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
183.其中,所述的可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
184.上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1