本发明属于语音识别技术领域,涉及一种智能麦克风系统,具体是一种基于语音识别的会议记录智能麦克风系统。
背景技术:
会议是一种普遍的社会现象,几乎有组织的地方都会有会议,会议记录更是尤为重要,会议记录是指在会议过程中,由记录人员把会议的组织情况和具体内容记录下来,就形成了会议记录。“记”有详记与略记之别:略记是记会议大要,会议上的重要或主要言论;详记则要求记录的项目必须完备,记录的言论必须详细完整。若需要留下包括上述内容的会议记录则要靠“录”,“录”有笔录、音录和影像录几种,对会议记录而言,音录、像录通常只是手段,最终还要将录下的内容还原成文字,笔录也常常要借助音录、像录,以之作为记录内容最大限度地再现会议情境的保证。
然而会议的记录方式始终不够便捷,最基本的方式是记录人员手记,这个方式收手速的影响,只能略记,无法完成还原真个会议过程,现在常用的方式是录记,记录人员会后观看录音录像,并手动将会议内容转成方便存储查阅的文字,这需要耗费记录人员大量的时间和精力。现有的录音笔等录音设备只能简单的实现录音存储功能,而且有存储容量的限制。
技术实现要素:
本发明的目的在于提供一种基于语音识别的会议记录智能麦克风系统,实现实时接收会议语音内容,完成语音识别,并构建长期的会议记录云存储库,大大减轻会议记录人员的工作负担。
本发明的目的可以通过以下技术方案实现:
一种基于语音识别的会议记录智能麦克风系统,包括相互通信连接的智能麦克风端、电脑端以及服务器端;
所述智能麦克风端,采用具有wifi连接功能和触控显示屏幕的麦克风,通过麦克风上的触控显示屏幕完成基本的交互,实现麦克风设备与无线网络的连接,完成账号的登录和电脑端的绑定,对会议实时语音进行存储降噪处理,将识别结果和音频文件传回电脑端处理,动态更新本地缓存;
所述电脑端,安装有完整的会议记录程序,实现会议的相关信息完善,会议的时间、主题、与会人、会议纪要、相关文档信息的填入,并上传服务器端存储,支持历史会议查阅,同时支持对语音自动识别的结果验证,通过附听音频,编辑修改已有识别结果,保证结果的准确性;
所述服务器端,包括数据库服务器、接收服务器、web服务器、运算服务器,提供会议音频存储功能、会议文档存储查阅功能、企业账号管理与控制功能和云端语音技术支撑功能。
进一步地,所述智能麦克风端包括语音采集模块、长时间在线语音转写模块以及数据传输模块;
所述语音采集模块,用于采集音频数据,然后对音频进行二次处理,使音频符合相应的数据结构、清晰度和音量,最后进行保存;
所述长时间在线语音转写模块,连接讯飞云服务器,将语音采集模块处理过后的音频上传到讯飞云服务器,然后得到识别结果;
所述数据传输模块,获取语音采集模块的音频片段数据和长时间在线语音转写模块的语音识别结果,对数据进行编号处理,然后使用socket协议,把数据传输到电脑端。
进一步地,所述智能麦克风端的工作流程如下:
s1,连接wifi并进行语种或方言选择以及降噪设置和增强设置;
s2,判断是否启动省电模式,若启动省电模式,则进入步骤s5,若未启动省电模式,则进入步骤s3;
s3,判断是否启动自动降噪,若启动自动降噪,则启动对音频数据进行实时降噪处理的程序,若未启动自动降噪,则直接进入步骤s4;
s4,判断是否启动自动增强,若启动自动增强,则启动对音频数据进行实时自动增强处理的程序,若未启动自动增强,则直接进入步骤s5;
s5,用户开始说话,麦克风开始录音,采集用户说话的音频数据;
s6,使用vad技术对音频数据进行切分,提高识别成功率并适配讯飞云服务器接口的要求;
s7,实时将切分后的音频片段数据上传到讯飞云服务器进行在线识别、翻译操作;
s8,保存音频片段数据和语音识别结果,并上传数据到电脑端;
s9,电脑端实时显示识别结果,完成会议记录工作。
本发明的有益效果:本发明提供的会议记录智能麦克风系统,通过在会议场地部署智能麦克风的方式,实现实时接收会议语音内容,并将接收结果传回电脑端完成语音识别,形成不同与会人员的完整对话记录,同时上传服务器端,构建长期的会议记录云存储库,这个流程自动完成,大大减轻会议记录人员的工作负担,记录人员只需给予系统少量的干预,即可轻松完成所有会议记录。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的系统示意图。
图2是本发明智能麦克风端的系统示意图。
图3是本发明智能麦克风端的工作流程图。
图4是本发明服务器端的系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于语音识别的会议记录智能麦克风系统,包括相互通信连接的智能麦克风端、电脑端以及服务器端。
智能麦克风端,采用具有wifi连接功能和触控显示屏幕的麦克风,通过麦克风上的触控显示屏幕完成基本的交互,实现麦克风设备与无线网络的连接,完成账号的登录和电脑端的绑定,对会议实时语音进行存储降噪处理,将识别结果和音频文件传回电脑端处理,动态更新本地缓存。
如图2所示,智能麦克风端包括语音采集模块、长时间在线语音转写模块以及数据传输模块。
语音采集模块,用于采集音频数据,然后对音频进行二次处理,使音频符合相应的数据结构、清晰度和音量等技术指标,最后进行保存。其中,主要的处理包括降噪、自动增强、vad检测和音频切分,降噪和自动增强用于处理音频本身,提高语音识别的效果,然后使用vad检测出音频的静音点,在静音点处切分,并切除无效片段,使之符合语音转写的格式要求。
长时间在线语音转写模块,连接讯飞云服务器,将语音采集模块处理过后的音频上传到讯飞云服务器,然后得到识别结果。通过不断地向讯飞云提交低于30s且具有内容的语音片段,使之达到近乎实时的长时间语音识别效果。
数据传输模块:获取语音采集模块的音频片段数据和长时间在线语音转写模块的语音识别结果,对数据进行编号处理,然后使用socket协议,把数据传输到电脑端。
如图3所示,智能麦克风端的工作流程如下:
s1,连接wifi并进行语种或方言选择以及降噪设置和增强设置。
s2,判断是否启动省电模式,若启动省电模式,则进入步骤s5,若未启动省电模式,则进入步骤s3。
s3,判断是否启动自动降噪,若启动自动降噪,则启动对音频数据进行实时降噪处理的程序,若未启动自动降噪,则直接进入步骤s4。
s4,判断是否启动自动增强,若启动自动增强,则启动对音频数据进行实时自动增强处理的程序,若未启动自动增强,则直接进入步骤s5。
s5,用户开始说话,麦克风开始录音,采集用户说话的音频数据。
s6,使用vad技术对音频数据进行切分,提高识别成功率并适配讯飞云服务器接口的要求。
s7,实时将切分后的音频片段数据上传到讯飞云服务器进行在线识别、翻译等操作。
s8,保存音频片段数据和语音识别结果,并上传数据到电脑端。
s9,电脑端实时显示识别结果,完成会议记录工作。
电脑端,安装有完整的会议记录程序,实现会议的相关信息完善,会议的时间、主题、与会人、会议纪要、相关文档信息的填入,并上传服务器端存储,支持历史会议查阅,同时支持对语音自动识别的结果验证,通过附听音频,编辑修改已有识别结果,保证结果的准确性。基于服务端服务能力的不断提升,本地端也会不断升级和更新,不断优化用户体验。
如图4所示,服务器端,服务端包含数据库服务器、接收服务器、web服务器、运算服务器,提供会议音频存储功能、会议文档存储查阅功能、企业账号管理与控制功能、云端语音技术支撑功能等。
本发明提供的会议记录智能麦克风系统,通过在会议场地部署智能麦克风的方式,实现实时接收会议语音内容,并将接收结果传回电脑端完成语音识别,形成不同与会人员的完整对话记录,同时上传服务器端,构建长期的会议记录云存储库,这个流程自动完成,大大减轻会议记录人员的工作负担,记录人员只需给予系统少量的干预,即可轻松完成所有会议记录。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。