录音方法、终端及计算机可读存储介质与流程

文档序号：18598047发布日期：2019-09-03 22:17阅读：211来源：国知局

本发明涉及录音领域，尤其涉及一种录音方法、终端及计算机可读存储介质。

背景技术：

在移动会议、演讲、语音备忘录、采访、轻音乐、大音量音乐以及网络音视频课程等录音场景下，已有的产品形态多年已来录音的创新十分的有限。以sony或philips的产品为代表的录音笔经过近几年的发展，虽然也能与手机app进行文件传输、分享和语音转文字，但是其语音转文字的准确率和设备操作都显得过于麻烦，用户学习成本较高，使用距离和场景有很大的限制。

录音场景包括现有的移动会议，现场演讲，在线教育，刑侦机关，电话或现场采访，音乐会等等录音场景设备，

技术实现要素：

本发明的主要目的是提供一种录音方法、终端及计算机可读存储介质，该录音方法、终端及计算机可读存储介质旨在解决现有录音设备无法适用多种录音场景，且录音效果不佳的技术问题。

为实现上述目的，本发明提出的一种录音方法，所述录音方法的步骤包括：

在获取到录音指令后，获取所处的录音场景；

当所处的录音场景为通话录音场景时，进入通话录音模式；

当所处的录音场景为播放录音场景时，进入播放录音模式；

当所处的录音场景为本地录音场景时，进入本地录音模式。

优选地，所述录音方法的步骤还包括：

当处于本地录音模式时，判断是否获取到接听通话指令，

当确定为获取到所述接听通话指令时，切换至所述通话录音模式。

优选地，所述录音方法的步骤还包括：

在获取到vip录音指令后，获取所处的录音场景；

当所处的录音场景为本地录音场景时，进入vip录音模式。

优选地，所述进入通话录音模式的步骤具体包括：

获取通话状态下的下行声源和上行声源；

对所述下行声源和上行声源均进行音量增强和噪声抑制处理；

将处理后的下行声源和上行声源混合并进行录制。

优选地，所述进入播放录音模式的步骤具体包括：

获取外部连接设备的音频数据并录制。

优选地，所述进入本地录音模式的步骤具体包括：

对录音方向进行灯光指示；

采集声音数据，并增益所述录音方向上的声音数据，抑制所述录音方向以外的声音数据后进行录制。

优选地，所述抑制所述录音方向以外的声音数据的步骤具体包括：

对所述录音方向以外的声音数据进行降噪处理；

对降噪处理后的声音数据进行回音消除处理。

优选地，所述录音方法的步骤还包括：

将录制得到的音频数据切分为音频片段；

将所述音频片段转换为对应的文字，并根据所述录音方向为每段文字标注角色标签。

此外，本发明还提供一种终端，所述终端包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的录音程序，其中所述录音程序被所述处理器执行时，实现如上所述的录音方法的步骤。

此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有录音程序，所述录音程序被处理器执行时实现如上所述的录音方法的步骤。

本申请的方案中，在获取到用户按下的录音指令后，获取录音设备当前所处的录音场景。录音场景可以根据接听电话或播放音频时的反馈信号来判断。当录音设备获取到当前所处的录音场景为通话录音场景时，即用户此时正在进行通话，录音设备进入通话录音模式。通话状态时，录音设备会接收到远端传过来的下行声源和近端的上行声源，针对该状态，通话录音模式可以对应地进行声源的增强和噪声的抑制，并通过算法将上下行通道的声源进行混合，然后进行录制语音。从而也可以很好的提高通话双方语音的质量，提高语音的清晰度和可懂度。当录音设备获取到当前所处的录音场景为播放录音场景时，即用户正将录音设备与外部音频播放设备连接，且该音频播放设备处于播放状态。录音设备与外部音频播放设备的连接方式可以包括蓝牙连接、wifi连接和usb连接。在播放录音场景时，录音设备主要获取的是音频播放设备的系统声源，并进行录制。当录音设备获取到当前所处的录音场景为本地录音场景时，即用户既不处于通话录音场景，也不处于播放录音场景，录音设备只需要进行正常录音即可。本申请通过对不同的录音场景设计针对性的录音模式，能够基于所处录音场景的特点进行区别性地录音，提高语音的清晰度和可懂度，削弱不相干的噪音和回声。此外，还可以为后续语音转文字提供更好的基础。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明的录音方法终端结构的示意图；

图2为本发明的录音方法第一实施例的流程示意图；

图3为本发明的录音方法第二实施例的流程示意图；

图4为本发明的录音方法第三实施例的流程示意图；

图5为本发明的录音方法第四实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例的录音终端是具有语音采集功能和输出功能的终端设备。

如图1所示，该用户终端可以包括：处理器1001，例如cpu，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、rf(radiofrequency，射频)电路，传感器、音频电路、wifi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在移动终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

传统的录音终端一般都是将设备当成usb存储设备，插入电脑拷贝录音文件，而本发明实施例的录音终端可以是集成了已有的数据上云的多种方式(wifi，蜂窝通信3g，4g，5g，usb转有线网口)，为需求不同的各类用户准备了多种数据上云的方式，解决了他们可能在数据上云时可能遇到的麻烦。其中，当多种传输方式同时存在的情况下，一般优先级是有线网口>wifi>4g。而且，本发明实施例的录音终端不仅可以支持传统的u盘拷贝方式，还可以利用当今发展迅速的互联网技术，可以从手机app，电脑web页面进行查看。而且查看的内容不仅有录音文件，同步的还有录音文件对应的文字信息，文字信息与录音的片段一一对应并具备角色分离的标记。

本领域技术人员可以理解，图1中示出的终端的结构并不构成对用户终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要包括输入单元比如键盘，键盘包括无线键盘和有线键盘，用于连接客户端，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的录音程序，并执行以下操作：

在获取到录音指令后，获取所处的录音场景；

当所处的录音场景为通话录音场景时，进入通话录音模式；

当所处的录音场景为播放录音场景时，进入播放录音模式；

当所处的录音场景为本地录音场景时，进入本地播放录音模式。