具有角色分离功能的语音转写处理装置及控制方法与流程

文档序号：19867249发布日期：2020-02-08 05:27阅读：1082来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及一种具有角色分离功能的语音转写处理装置及控制方法。

背景技术：

在各类会议中，需要形成文字版的会议记录，便于事后追溯或跟踪。现有的人工听写方式受限于记录员的业务熟练程度和打字速度，记录效率较低。

技术实现要素：

本发明的发明目的在于提供一种具有角色分离功能的语音转写处理装置及控制方法，能够有效提高会议记录效率。

基于同一发明目的，本发明目具有两个独立的技术方案：

1、一种具有角色分离功能的语音转写处理装置，包括话筒语音输入单元，其特征在于：话筒语音输入单元的信号输出端接语音转写单元，所述语音转写单元用于将语音转换成文字；所述语音转写单元的信号输出端接控制单元，控制单元接通信模块，所述通信模块用于传送语音转换的文字数据。

进一步地，话筒语音输入单元具有信号采集模块，所述信号采集模块具有前置放大电路。

进一步地，所述信号采集模块具有选频电路，信号采集模块的前置放大电路输出端接所述选频电路。

进一步地，话筒语音输入单元具有混音模块，所述混音模块用于识别当前输入音频信号的话筒；信号采集模块的信号输出端接混音模块，混音模块的信号输出端接语音转写单元。

进一步地，所述话筒语音输入单元外接音量调整旋钮，所述音量调整旋钮用于调整话筒语音输入的音量。

进一步地，话筒语音输入单元与语音转写单元之间设有检波模块。

进一步地，所述话筒语音输入单元接音频输出驱动模块，所述音频输出驱动模块用于外接扩音设备或耳机。

进一步地，话筒输入的音频信号一路通过现场扬声设备或耳机播放；另一路通过语音转写单元将音频信号转换成文字数据，控制单元将文字数据传送至记录端，记录端可对文字数据进行校对、整理。

进一步地，控制单元同时将文字数据传送至现场客户端的显示屏。

2、一种上述具有角色分离功能的语音转写处理装置的控制方法，其特征在于，话筒输入的音频信号一路通过现场扬声设备或耳机播放；另一路通过语音转写单元将音频信号转换成文字数据，控制单元将文字数据传送至记录端，记录端可对文字数据进行校对、整理。

进一步地，控制单元同时将文字数据传送至现场客户端的显示屏。

本发明具有的有益效果：

本发明话筒语音输入单元的信号输出端接语音转写单元，所述语音转写单元用于将语音转换成文字；所述语音转写单元的信号输出端接控制单元，控制单元接通信模块，所述通信模块用于传送语音转换的文字数据。本发明通过语音转写单元将会议现场的语音信息转换成文字数据，显著提高了会议记录效率。

本发明话筒语音输入单元具有混音模块，所述混音模块用于识别当前输入音频信号的话筒；信号采集模块的信号输出端接混音模块，混音模块的信号输出端接语音转写单元。本发明通过混音模块对当前话筒进行识别，即，识别出当前转换生成的文字数据来自于哪个话筒，使得转换记录信息更加全面。

本发明信号采集模块具有选频电路，通过选频电路进一步提高了语音转写单元的识别率。

本发明所述选频模块与语音转写单元之间设有检波模块，避免在输入信号过大的情况下出现编解码削波失真，保证输入到语音转写单元的信号最大限度不失真。

本发明话筒语音输入单元接音频输出驱动模块，所述音频输出驱动模块用于外接扩音设备或耳机。本发明实现语音转写时，同时还可将现场话筒音频信号通过扩音设备进行播放，还可通过耳机进行监听。

附图说明

图1是本发明的电路原理框图；

图2是本发明语音输入单元的电路原理框图；

图3是本发明前面板示意图；

图4是本发明后面板示意图。

具体实施方式

下面结合附图所示的各实施方式对本发明进行详细说明，但应当说明的是，这些实施方式并非对本发明的限制，本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代，均属于本发明的保护范围之内。

实施例一：

具有角色分离功能的语音转写处理装置

如图1所示，话筒语音输入单元的信号输出端接语音转写单元，所述语音转写单元用于将语音转换成文字；所述语音转写单元的信号输出端接控制单元，控制单元接通信模块，所述通信模块用于传送语音转换的文字数据。实施时，语音转写单元采用dsp芯片，控制单元采用arm芯片。

如图1所示，所述话筒语音输入单元外接音量调整旋钮，所述音量调整旋钮用于调整话筒语音输入的音量。话筒语音输入单元与语音转写单元之间设有检波模块。所述话筒语音输入单元接音频输出驱动模块，所述音频输出驱动模块用于外接扩音设备或耳机。控制单元与话筒语音输入单元之间接控制驱动电路，控制单元外接显示屏。

如图2所示，话筒语音输入单元具有信号采集模块，所述信号采集模块具有前置放大电路，实施时，信号放大采用低噪音运放进行两级放大，考虑到一级放大的增益带宽积不够，容易引起自激，在线路输入部分采用衰减来实现。信号采集模块还具有选频电路，信号采集模块的前置放大电路输出端接所述选频电路。实施时，选频电路采用高性能350hz～7.5khz的选频电路。话筒语音输入单元具有混音模块，所述混音模块用于识别当前输入音频信号的话筒；信号采集模块的信号输出端接混音模块，混音模块的信号输出端接语音转写单元。

如图3所示，前面板包括液晶屏1，用于显示当前开启通道、设备ip地址和设备id；语音转写通道音量调整旋钮2、电平指示光柱3、耳机监听音量调节旋钮4、6.3耳机插孔5、电源指示灯6。

如图4所示，后面板包括电源输入插座7、保险管8、电源开关9、网络音频数据输出10、rs23控制接口11、两路音频主输出端口，间距3.81凤凰端子12，级联输入接口13、级联输出接口14、mic选择拨码开关和48v幻象电源拨码开关15、16通道输入凤凰端口，平衡线路输入16。其中，两路音频主输出端口主要是考虑到本地监听的应用，满足监听需求。

本发明提供16路信号输入，自动开启只有信号输入的通道，通道闸门动作电平能自动调整或手动调整，每个通道均装有限幅器以及防止静电干扰或者放电损坏电路或接口的esd保护电路。每个通道提供通道工作状态指示灯，方便查看正在开启的通道。设备的硬件电路板上设置有线路输入和话筒输入开关，通过该开关可以实现话筒音频输入和线路音频输入的切换，可以应对不同的使用环境。

语音转写单元通过开关电源芯片实现对阵列话筒的48v幻象供电和模拟电路部分的正负15v供电。线路音频输入时，通过网络发送的udp语音数据包可以保证解码端数据传输的连续性，控制命令的发送是采用tcp协议，发送完控制命令后系统断开tcp连接，socket处于等待连接状态。话筒音频输入时，话筒经过放大后的信号连接到信号采集模块输入端，通过混音模块和采集模块进行通信，确定当前输出音频信号来自于哪一只话筒，进而将通道信息打入到ip数据码流中，传输到pc端，通过私有协议实现发言话筒的甄别。

实施例二：

具有角色分离功能的语音转写处理装置的控制方法

基于实施例一的语音转写处理装置，话筒输入的音频信号一路通过现场扬声设备播放；另一路通过语音转写单元将音频信号转换成文字数据，控制单元将文字数据传送至记录端，记录端可对文字数据进行校对、整理，控制单元同时将文字数据传送至现场客户端的显示屏。会议结束时，也可输出会议记录。如果后期要追溯会议内容，也可通过关键词检索的方式精准定位会议视频和录音的节点。

通过现场扬声设备播放的同时，还可通过耳机进行监听。

还可通过线路输入音频信号，通过切换开关实现话筒输入音频信号与线路输入音频信号的切换。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明，它们并非用以限制本发明的保护范围，凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：史东东;王辉;井祥虎;林升;沈鸿泰;张小博;卞飞;雷鸣;林林;穆永鹏
技术所有人：北京中电慧声科技有限公司;中国电子科技集团公司第三研究所
我是此专利的发明人

上一篇：一种洗衣机及控制方法与流程
上一篇：衣物处理设备及其洗涤控制方法与流程