一种具有语音波段识别功能的客户端及其识别方法与流程

文档序号:29493626发布日期:2022-04-06 14:15阅读:132来源:国知局
一种具有语音波段识别功能的客户端及其识别方法与流程

1.本发明涉及语音识别技术领域,具体为一种具有语音波段识别功能的客户端及其识别方法。


背景技术:

2.在各类会议中,需要形成文字版会议记录,便于事后追溯或跟踪。传统的解决方式是,在会议现场配置有专业的速记团队对会议的内容进行记录,或在会后对会议音频进行逐段文字手动听写输入及记录。现有人工速记听写方式受限于记录员的业务熟练程度和打字速度,记录效率较低、工作量大。建设一套智能语音识别系统,在会议中应用智能语音识别技术,将语音实时转成文字,支持手动编辑及修改个别有误的转写,会议结束即可保存成稿,可极大降低对记录员业务素质的要求。还支持对会议音频进行保存,便于会后存档及重听确认转写内容准确性。可通过对历史会议录音进行离线批量转写,能够迅速将录音数据转化为便于检索文字数据,为进一步数据挖掘和分析奠定基础。
3.现有的语音识别装置,因为远程实时语音转文字同步效率较低,造成会议记录员工作量大且易出现记录错误的问题;因此,不满足现有的需求,对此我们提出了一种具有语音波段识别功能的客户端及其识别方法。


技术实现要素:

4.本发明的目的在于提供一种具有语音波段识别功能的客户端及其识别方法,以解决上述背景技术中提出的现有语音识别装置,因为远程实时语音转文字同步效率较低,造成会议记录员工作量大且易出现记录错误的问题。
5.为实现上述目的,本发明提供如下技术方案:一种具有语音波段识别功能的客户端,包括综合音频识别服务器壳体、语音识别麦克风,所述综合音频识别服务器壳体的下端设置有底座,所述底座的下端四角均设置有防震脚垫,所述综合音频识别服务器壳体的上端设置有防电磁干扰金属屏蔽盖,所述综合音频识别服务器壳体的内部设置有散热通道,所述散热通道的上下两端均设置有多孔散热主板架,每个所述散热通道的一端均设置有电磁阀,且电磁阀与散热通道法兰连接,每个所述散热通道的另一端均设置有散热口,且散热口设置在综合音频识别服务器壳体的一侧,每个所述多孔散热主板架的内壁均设置有主板固定板,且主板固定板与多孔散热主板架螺栓固定连接,每个所述主板固定板的表面均设置有服务器主板,且服务器主板与主板固定板螺栓固定连接,所述电磁阀的一端设置有集中散热进风管,且集中散热进风管与电磁阀法兰连接,所述集中散热进风管的下端设置有散热风机,且散热风机与集中散热进风管管道连接,所述语音识别麦克风的上端设置有麦克风音频控制座,所述麦克风音频控制座的上端设置有主杆,所述主杆的上端设置有斜拉杆,且斜拉杆与主杆转轴连接,所述斜拉杆的上端设置有主麦克风,且主麦克风与麦克风音频控制座电性连接。
6.优选的,所述主杆的外侧设置有升降套,且升降套与主杆嵌套连接,所述升降套的
一侧设置有实时语音转文字显示屏,实时语音转文字显示屏与升降套转轴连接,且实时语音转文字显示屏与麦克风音频控制座电性连接。
7.优选的,所述升降套的另一侧设置有升降套锁定螺栓,且升降套锁定螺栓与升降套螺纹连接,所述语音识别麦克风的下方设置有降噪麦克风,且降噪麦克风与麦克风音频控制座电性连接,所述麦克风音频控制座的一侧设置有开关,且开关与麦克风音频控制座电性连接。
8.优选的,所述语音识别麦克风的上端一侧设置有电磁屏蔽板,且电磁屏蔽板与语音识别麦克风卡槽固定连接,所述语音识别麦克风的一侧设置有无线传输天线,且无线传输天线与麦克风音频控制座电性连接,所述语音识别麦克风的下端四角均设置有降噪胶垫,且降噪胶垫与语音识别麦克风胶黏连接。
9.优选的,所述电磁屏蔽板的两侧均设置有降噪棉层,所述主麦克风的一侧设置有防喷罩,且防喷罩与斜拉杆螺栓固定连接。
10.优选的,所述多孔散热主板架的一侧设置有网络线缆,且网络线缆与服务器主板电性连接。
11.优选的,所述散热口的后端设置有线缆接口,且线缆接口与服务器主板电性连接,所述散热口的后端设置有防电磁干扰翻板,且防电磁干扰翻板与综合音频识别服务器壳体转轴连接。
12.优选的,所述综合音频识别服务器壳体的一侧设置有触控交互屏,且触控交互屏与服务器主板电性连接。
13.优选的,一种具有语音波段识别功能的客户端的识别方法,包括以下步骤:
14.步骤一:用户在使用语音识别麦克风进行录音时,声音先被防喷罩过滤防止喷麦,之后由主麦克风收音,与此同时降噪麦克风对环境提前进行环境音收录,经过麦克风音频控制座对声音进行声音和环境音的降噪分离后,由无线传输天线通过无线网络传输给综合音频识别服务器壳体,电磁屏蔽板为主麦克风提供了前方干扰磁场的屏蔽效果,而降噪棉层降低了声音回弹产生的杂音,声音数据被麦克风音频控制座加密打包上传至综合音频识别服务器壳体内部的声音处理单元,经过语音处理并实时转化成文字信息,并将文字信息实时传输给语音识别麦克风上的实时语音转文字显示屏,用以实时显示录音时的语音转文字效果,并且可以通过实时语音转文字显示屏来对实时录入的文字进行编辑和修改,提高语音转文字输入的准确性,再将修改后的数据通过无线传输天线传输给综合音频识别服务器,综合音频识别服务器可将文字信息云端保存在内部,用户可通过手机电脑还有语音识别麦克风上的实时语音转文字显示屏实时远程查看录入结果,极大提高了装置在会议语音记录上的记载效率,语音识别麦克风集收音、声音预处理、打包上传、语音转文字实时显示和编辑、文本远程查看客户端为一体的收音和客户端装置;
15.步骤二:综合音频识别服务器壳体内部的服务器主板分为三个单元:语音音频分离调音台单元;语音识别引擎服务器单元;数据网络存储转发单元,综合音频识别服务器壳体的线缆接口拥有丰富的数据接口,拥有usb接口、卡侬线接口、网口,用以一个机器满足多种应用场景,音频分离器通过usb电缆接入应用服务器,应用服务器通过网线与交换机相连,然后连入智能语音识别引擎服务器,x架构服务器作为智能语音识别引擎服务器,是语音识别功能的核心设备,因为高度集成化的综合音频识别服务器壳体散热效果直接影响了
装置的信息处理性能表现,所以本装置采用上下双层主板中间层互通散热的设计,极大提高了主板间散热的效率,散热风机将冷空气吹入集中散热进风管后,经过电磁阀进入散热通道,散热通道为多孔透气管道,散热通道通过的空气可将其上下两端的发热单元热量吸引吹出,最后热量从散热口排出,而触控交互屏可实时监控装置的使用情况并且能对数据进行管理。
16.与现有技术相比,本发明的有益效果是:
17.1、本发明通过语音识别麦克风的设置,用户在使用语音识别麦克风进行录音时,声音先被防喷罩过滤防止喷麦,之后由主麦克风收音,与此同时降噪麦克风对环境提前进行环境音收录,经过麦克风音频控制座对声音进行声音和环境音的降噪分离后,由无线传输天线通过无线网络传输给综合音频识别服务器壳体,电磁屏蔽板为主麦克风提供了前方干扰磁场的屏蔽效果,而降噪棉层降低了声音回弹产生的杂音,使得录制的声音干净准确,声音数据被麦克风音频控制座加密打包上传至综合音频识别服务器壳体内部的声音处理单元,经过语音处理并实时转化成文字信息,并将文字信息实时传输给语音识别麦克风上的实时语音转文字显示屏,用以实时显示录音时的语音转文字效果,并且可以通过实时语音转文字显示屏来对实时录入的文字进行编辑和修改,提高语音转文字输入的准确性,再将修改后的数据通过无线传输天线传输给综合音频识别服务器,综合音频识别服务器可将文字信息云端保存在内部,用户可通过手机电脑还有语音识别麦克风上的实时语音转文字显示屏实时远程查看录入结果,极大提高了装置在会议语音记录上的记载效率,语音识别麦克风集收音、声音预处理、打包上传、语音转文字实时显示和编辑、文本远程查看客户端为一体的收音和客户端装置,极大优化了收音和文字编辑的流程,减少中间设备间信息转发造成的信息传输延迟,使得录音的同时即可对转化的文字进行查看和编辑,可将音频和文字同时记录,极大方便了会议记录员的工作效率。
18.2、通过综合音频识别服务器壳体的设置,综合音频识别服务器壳体内部的服务器主板分为三个单元:语音音频分离调音台单元;语音识别引擎服务器单元;数据网络存储转发单元。综合音频识别服务器壳体的线缆接口拥有丰富的数据接口,拥有usb接口、卡侬线接口、网口,用以一个机器满足多种应用场景,音频分离器通过usb电缆接入应用服务器,应用服务器通过网线与交换机相连,然后连入智能语音识别引擎服务器。x架构服务器作为智能语音识别引擎服务器,是语音识别功能的核心设备,因为高度集成化的综合音频识别服务器壳体散热效果直接影响了装置的信息处理性能表现,所以本装置采用上下双层主板中间层互通散热的设计,极大提高了主板间散热的效率,散热风机将冷空气吹入集中散热进风管后,经过电磁阀进入散热通道,散热通道为多孔透气管道,散热通道通过的空气可将其上下两端的发热单元热量吸引吹出,最后热量从散热口排出,而触控交互屏可实时监控装置的使用情况并且能对数据进行管理,可实现角色定位、智能过滤、同步校对、多人协录、多路语音同时识别转写等功能,支持流式或句式模式识别,音字转写能力引擎采用私有云部署,保障了用户信息安全。客户端是在服务器群组模式下开发设计的,能够根据需要自由扩充接入的会议室数量,且能搭载丰富的语料数据库,实现高速、高准确率的语音识别。
附图说明
19.图1为本发明的整体结构示意图;
20.图2为本发明的综合音频识别服务器壳体内部结构示意图;
21.图3为本发明的综合音频识别服务器壳体俯视结构示意图;
22.图4为本发明的语音识别麦克风结构示意图;
23.图5为本发明的语音识别功能系统拓扑示意图;
24.图6为本发明的服务器架构语音识别系统硬件拓扑示意图;
25.图中:1、综合音频识别服务器壳体;2、底座;3、防电磁干扰金属屏蔽盖;4、防震脚垫;5、触控交互屏;6、散热口;7、防电磁干扰翻板;8、散热通道;9、多孔散热主板架;10、散热风机;11、主板固定板;12、服务器主板;13、网络线缆;14、集中散热进风管;15、电磁阀;16、语音识别麦克风;17、麦克风音频控制座;18、主杆;19、斜拉杆;20、主麦克风;21、降噪胶垫;22、降噪麦克风;23、开关;24、防喷罩;25、电磁屏蔽板;26、降噪棉层;27、升降套;28、实时语音转文字显示屏;29、升降套锁定螺栓;30、无线传输天线;31、线缆接口。
具体实施方式
26.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
27.请参阅图1-6,本发明提供的一种实施例:一种具有语音波段识别功能的客户端,包括综合音频识别服务器壳体1、语音识别麦克风16,综合音频识别服务器壳体1的下端设置有底座2,底座2的下端四角均设置有防震脚垫4,综合音频识别服务器壳体1的上端设置有防电磁干扰金属屏蔽盖3,综合音频识别服务器壳体1的内部设置有散热通道8,散热通道8的上下两端均设置有多孔散热主板架9,每个散热通道8的一端均设置有电磁阀15,且电磁阀15与散热通道8法兰连接,每个散热通道8的另一端均设置有散热口6,且散热口6设置在综合音频识别服务器壳体1的一侧,每个多孔散热主板架9的内壁均设置有主板固定板11,且主板固定板11与多孔散热主板架9螺栓固定连接,每个主板固定板11的表面均设置有服务器主板12,且服务器主板12与主板固定板11螺栓固定连接,电磁阀15的一端设置有集中散热进风管14,且集中散热进风管14与电磁阀15法兰连接,集中散热进风管14的下端设置有散热风机10,且散热风机10与集中散热进风管14管道连接,语音识别麦克风16的上端设置有麦克风音频控制座17,麦克风音频控制座17的上端设置有主杆18,主杆18的上端设置有斜拉杆19,且斜拉杆19与主杆18转轴连接,斜拉杆19的上端设置有主麦克风20,且主麦克风20与麦克风音频控制座17电性连接。
28.进一步,主杆18的外侧设置有升降套27,且升降套27与主杆18嵌套连接,升降套27的一侧设置有实时语音转文字显示屏28,实时语音转文字显示屏28与升降套27转轴连接,且实时语音转文字显示屏28与麦克风音频控制座17电性连接,升降套27用以固定实时语音转文字显示屏28。
29.进一步,升降套27的另一侧设置有升降套锁定螺栓29,且升降套锁定螺栓29与升降套27螺纹连接,语音识别麦克风16的下方设置有降噪麦克风22,且降噪麦克风22与麦克风音频控制座17电性连接,麦克风音频控制座17的一侧设置有开关23,且开关23与麦克风音频控制座17电性连接,升降套锁定螺栓29可调节升降套27在主杆18外侧的位置,方便调节实时语音转文字显示屏28的高度。
30.进一步,语音识别麦克风16的上端一侧设置有电磁屏蔽板25,且电磁屏蔽板25与
语音识别麦克风16卡槽固定连接,语音识别麦克风16的一侧设置有无线传输天线30,且无线传输天线30与麦克风音频控制座17电性连接,语音识别麦克风16的下端四角均设置有降噪胶垫21,且降噪胶垫21与语音识别麦克风16胶黏连接,电磁屏蔽板25为主麦克风20提供了前方干扰磁场的屏蔽效果。
31.进一步,电磁屏蔽板25的两侧均设置有降噪棉层26,主麦克风20的一侧设置有防喷罩24,且防喷罩24与斜拉杆19螺栓固定连接,降噪棉层26降低了声音回弹产生的杂音,使得录制的声音干净准确。
32.进一步,多孔散热主板架9的一侧设置有网络线缆13,且网络线缆13与服务器主板12电性连接,网络线缆13用以与服务器主板12、麦克风音频控制座17、手机电脑客户端的远程网络连接使用。
33.进一步,散热口6的后端设置有线缆接口31,且线缆接口31与服务器主板12电性连接,散热口6的后端设置有防电磁干扰翻板7,且防电磁干扰翻板7与综合音频识别服务器壳体1转轴连接,综合音频识别服务器壳体1的线缆接口31拥有丰富的数据接口,拥有usb接口、卡侬线接口、网口,用以一个机器满足多种应用场景。
34.进一步,综合音频识别服务器壳体1的一侧设置有触控交互屏5,且触控交互屏5与服务器主板12电性连接,触控交互屏5可实时监控装置的使用情况并且能对数据进行管理,可实现角色定位、智能过滤、同步校对、多人协录、多路语音同时识别转写等功能的后台调节操作。
35.进一步,一种具有语音波段识别功能的客户端的识别方法,包括以下步骤:
36.步骤一:用户在使用语音识别麦克风16进行录音时,声音先被防喷罩24过滤防止喷麦,之后由主麦克风20收音,与此同时降噪麦克风22对环境提前进行环境音收录,经过麦克风音频控制座17对声音进行声音和环境音的降噪分离后,由无线传输天线30通过无线网络传输给综合音频识别服务器壳体1,电磁屏蔽板25为主麦克风20提供了前方干扰磁场的屏蔽效果,而降噪棉层26降低了声音回弹产生的杂音,使得录制的声音干净准确,声音数据被麦克风音频控制座17加密打包上传至综合音频识别服务器壳体1内部的声音处理单元,经过语音处理并实时转化成文字信息,并将文字信息实时传输给语音识别麦克风16上的实时语音转文字显示屏28,用以实时显示录音时的语音转文字效果,并且可以通过实时语音转文字显示屏28来对实时录入的文字进行编辑和修改,提高语音转文字输入的准确性,再将修改后的数据通过无线传输天线30传输给综合音频识别服务器,综合音频识别服务器可将文字信息云端保存在内部,用户可通过手机电脑还有语音识别麦克风16上的实时语音转文字显示屏28实时远程查看录入结果,极大提高了装置在会议语音记录上的记载效率,语音识别麦克风16集收音、声音预处理、打包上传、语音转文字实时显示和编辑、文本远程查看客户端为一体的收音和客户端装置,极大优化了收音和文字编辑的流程,减少中间设备间信息转发造成的信息传输延迟,使得录音的同时即可对转化的文字进行查看和编辑,可将音频和文字同时记录,极大方便了会议记录员的工作效率;
37.步骤二:综合音频识别服务器壳体1内部的服务器主板12分为三个单元:语音音频分离调音台单元;语音识别引擎服务器单元;数据网络存储转发单元,综合音频识别服务器壳体1的线缆接口31拥有丰富的数据接口,拥有usb接口、卡侬线接口、网口,用以一个机器满足多种应用场景,音频分离器通过usb电缆接入应用服务器,应用服务器通过网线与交换
机相连,然后连入智能语音识别引擎服务器,x86架构服务器作为智能语音识别引擎服务器,是语音识别功能的核心设备,因为高度集成化的综合音频识别服务器壳体1散热效果直接影响了装置的信息处理性能表现,所以本装置采用上下双层主板中间层互通散热的设计,极大提高了主板间散热的效率,散热风机10将冷空气吹入集中散热进风管14后,经过电磁阀15进入散热通道8,散热通道8为多孔透气管道,散热通道8通过的空气可将其上下两端的发热单元热量吸引吹出,最后热量从散热口6排出,而触控交互屏5可实时监控装置的使用情况并且能对数据进行管理,可实现角色定位、智能过滤、同步校对、多人协录、多路语音同时识别转写等功能,支持流式或句式模式识别,音字转写能力引擎采用私有云部署,保障了用户信息安全,客户端是在服务器群组模式下开发设计的,能够根据需要自由扩充接入的会议室数量,且能搭载丰富的语料数据库,实现高速、高准确率的语音识别。
38.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1