基于语音通信的录音方法以及录音系统、通信终端的制作方法

文档序号：2835977阅读：213来源：国知局

专利名称：基于语音通信的录音方法以及录音系统、通信终端的制作方法
技术领域：
本发明涉及语音通信技术领域，特别涉及基于语音通信的录音方法以及录音系统、通信终端。
背景技术：
基于语音通信的录音系统是一种能同时进行多路电话实时录音及语音播放的设备，是计算机技术与语音技术的结合。由于采用了先进的数码录音技术，配以功能强大、可靠的软件，并借助大容量计算机硬盘作为存储介质，完全突破了传统的电话录音概念。通过该录音系统可实现自动记录主叫号码和被叫号码，同时对多路语音通道录音或监听，自动备份，以及灵活的录音查询方式。同时，该录音系统可以按客户需求自动对硬盘进行维护，从而保证系统的不间断、稳定工作。参考图1所示的是现有的基于语音通信的录音系统的结构示意图。如图1所示，所述录音系统10包括语音解码器101、语音混合器102以及语音编码器103。根据图1所示的录音系统10，通常采用的录音方法是首先将未解码的(即编码的)下行语音数据经过所述语音解码器101进行解码，生成解码后的下行语音数据；然后，将解码后的下行语音数据和未编码的上行语音数据通过所述语音混合器102混音以后，再经过所述语音编码器 103进行编码，以生成编码的录音语音数据文件。现有的录音方法的缺陷是在对上行语音数据进行编码之外需要引入一个新的语音编码流程(语音编码器103)。考虑到语音编码特别是高质量的语音编码(例如AMR-NB 编码和AMR-WB编码)可能有较高的计算复杂度，这种录音方法会给语音通信系统，特别是低端的移动语音通信设备带来计算资源和功耗压力。更多的关于语音通信的录音方法以及录音系统可以参考公开号为US2006173563A1的美国专利申请文件录音通信系统和方法(Sound recordingcommunication system and method),同样没有角军决上述问题。

发明内容
本发明解决的问题是减少语音通信的录音系统中语音编码过程，从而降低录音流程的计算复杂度。为解决上述问题，本发明实施例提供一种基于语音通信的录音方法，包括获取来自通信终端之间通话过程中的语音数据段；对所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语音信息；基于包含语音信息的语音数据段形成录音数据。可选地，所述语音数据段包括至少一帧语音数据。可选地，所述语音数据段包括上行语音数据段和下行语音数据段。可选地，所述对所述语音数据段进行语音检测包括对已编码的或未编码的上行语音数据段进行语音检测；对已解码的或未解码的下行语音数据段进行语音检测。可选地，所述基于包含语音信息的语音数据段形成录音数据包括
4
若只有下行语音数据段包含语音信息，则将未解码的该下行语音数据段作为录音数据；若只有上行语音数据段包含语音信息，则将已编码的该上行语音数据段作为录音数据；若上行语音数据段和对应的下行语音数据段都包含语音信息，则将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据。可选地，还包括若上行语音数据段和下行语音数据段都不包含语音信息，则将已编码的该上行语音数据段或者未解码的该下行语音数据段作为录音数据；或者设置静音数据作为录音数据。可选地，所述通信终端包括移动终端和/或固话终端。本发明实施例还提供了一种录音系统，所述录音系统适于对语音数据进行录音，包括获取单元，用于获取来自通信终端之间通话过程中的语音数据段；检测单元，用于对所述获取单元获取到的所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语音信息；处理单元，用于根据所述检测单元检测到的包含语音信息的语音数据段形成录音数据。可选地，所述语音数据段包括至少一帧语音数据。可选地，所述语音数据段包括上行语音数据段和下行语音数据段。可选地，所述检测单元包括第一检测单元和第二检测单元；其中，所述第一检测单元用于对已编码的或未编码的上行语音数据段进行语音检测；所述第二检测单元用于对已解码的或未解码的下行语音数据段进行语音检测。可选地，所述处理单元用于若只有下行语音数据段包含语音信息，则将未解码的该下行语音数据段作为录音数据；若只有上行语音数据段包含语音信息，则将已编码的该上行语音数据段作为录音数据；若上行语音数据段和对应的下行语音数据段都包含语音信息，则将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据。可选地，所述处理单元还用于若上行语音数据段和下行语音数据段都不包含语音信息，则将已编码的该上行语音数据段或者未解码的该下行语音数据段作为录音数据；或者设置静音数据作为录音数据。本发明实施例还提供一种包括上述录音系统的通信终端。可选地，所述通信终端包括移动终端和/或固话终端。与现有技术相比，本发明技术方案具有以下有益效果对获取到的来自通信终端之间通话过程中的语音数据段进行语音检测判断是否包含语音信息，然后基于包含语音信息的语音数据段形成录音数据。这样就不需要对所有获取到的语音数据都进行语音混合、再经过语音编码后形成录音数据，从而减少了录音过程中的语音编码过程，降低了录音系统的计算复杂度。
具体实施例中，在同一时间段内分别对相应的上行语音数据段和下行语音数据段进行语音检测。针对不同的语音编码格式，有些编码的语音数据段会包含语音检测所需的信息，此时对已编码的上行语音数据段和未解码的下行语音数据段中获取语音检测所需的信息并进行语音检测；有些编码的语音数据段不包含语音检测所需的信息，此时则需要从未编码的上行语音数据段和已解码的下行语音数据段中获取语音检测所需的信息并进行语音检测。根据检测结果，分为如下情形1)若只有下行语音数据段包含语音信息，则将未解码的该下行语音数据段作为录音数据；2)若只有上行语音数据段包含语音信息，则将已编码的该上行语音数据段作为录音数据；3)若上行语音数据段和对应的下行语音数据段都包含语音信息，则将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据；4)若上行语音数据段和下行语音数据段都不包含语音信息，则将已编码的该上行语音数据段或者未解码的该下行语音数据段作为录音数据；或者设置静音数据作为录音数据。本技术方案基于包含语音信息的语音数据段形成录音数据，同时尽可能地利用已编码的上行语音数据段和未解码的下行语音数据段形成录音数据，从而降低了录音系统的编码过程，减少了录音系统的计算复杂度。

图1是现有技术的基于语音通信的录音系统的结构示意图；图2是本发明的一种基于语音通信的录音方法的具体实施方式
的流程示意图；图3是本发明的一种基于语音通信的录音方法的具体实施例的流程示意图；图4是本发明的一种录音系统的具体实施例的结构示意图。
具体实施例方式发明人发现在现有的基于语音通信的录音系统中，在对上行语音数据进行编码之外需要引入一个新的语音编码流程。考虑到语音编码特别是高质量的语音编码(例如 AMR-NB编码和AMR-WB编码)可能有较高的计算复杂度，这种录音方法会给语音通信系统，特别是低端的移动语音通信设备带来计算资源和功耗压力。针对上述问题，发明人经过研究，提供了一种基于语音通信的录音方法以及录音系统，其中所述录音系统对获取到的来自通信终端之间通话过程中的语音数据段进行语音检测判断是否包含语音信息，然后基于包含语音信息的语音数据段形成录音数据。这样就不需要对所有获取到的语音数据都进行语音混合、再经过语音编码后形成录音数据，从而减少了录音过程中的语音编码过程，降低了录音系统的计算复杂度。为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施方式
做详细的说明。参考图2是本发明的一种基于语音通信的录音方法的具体实施方式
的流程示意图。如图2所示，所述基于语音通信的录音方法包括步骤Sl 获取来自通信终端之间通话过程中的语音数据段。具体地，所述语音数据段是指在通话过程中某一时间段内通信终端之间传输的语音数据。在本实施例中，语音数据是以帧结构形式进行传输的，相应地，获取所述语音数据段的方式可以是以每一帧为单位时间获取语音数据，这样所述语音数据段中包含一帧语音数据；也可以是以连续多帧(2个或2个以上)为单位时间获取语音数据，这样所述语音数据段中包含多帧语音数据。但在实际应用中，并不限于上述获取语音数据段的方式。进一步地，所述语音数据段包括上行语音数据段和下行语音数据段。其中所述上行语音数据段是指从通信终端发出的语音数据中获取到的语音数据段，所述下行语音数据段是指从通信终端接收到的语音数据中获取到的语音数据段。在本实施例中，所述上行语音数据和下行语音数据采用同一种语音编解码算法或者标准，相应地，录音系统也采用与之相匹配的算法或者标准进行录音。本实施例中，所述通信终端包括移动终端和/或固话终端，所述移动终端可以是手机，所述固话终端即固定电话(座机)，在实际应用中，所述通信终端还可以是其他具有通讯功能的设备。本步骤所述的获取过程可以是获取至少一帧对应的上行语音数据和下行语音数据，例如，第一帧上行语音数据和第一帧下行语音数据；也可以是在预定时间段内分别获取这一预定时间段内的上行语音数据和下行语音数据，作为获取到的上行语音数据段和下行语音数据段。具体地说，例如，在第1秒到第10秒这段时间内分别获取上行语音数据和下行语音数据，形成这10秒内的上行语音数据段和下行语音数据段。步骤S2 对所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语首{曰息。具体地，在本步骤中，所述对所述语音数据段进行语音检测包括对已编码的或未编码的上行语音数据段进行语音检测；对已解码的或未解码的下行语音数据段进行语音检测。其中所述上行语音数据段和下行语音数据段是在同一时间段内相对应的上行语音数据和下行语音数据。本领域技术人员理解，在录音系统中，对于不同的语音编码格式(例如 AMR-NB编码、AMR-WB编码等)，有些编码的语音数据段会包含有标识位，所述标识位用于指示该语音数据段中含有语音检测所需的信息，那么，在这种情况下，可以从已编码的上行语音数据段和未解码的下行语音数据段中获取语音检测所需的信息并进行语音检测；而有些编码的语音数据段则不包含所述标识位，那么，在这种情况下，则需要从未编码的上行语音数据段和已解码的下行语音数据段中获取语音检测所需的信息并进行语音检测。本步骤中，所述语音检测方法是将获取到的语音数据段消除噪声后，通过分析获取到的语音，检测所需信息的数学特征或参量等过程，将所述语音数据段分类为包含语音信息的语音数据段和不包含语音信息的语音数据段。其中，常用的数学特征或参量包括频域上的峰值和坡度(Spectrum Peak andSlope Analysis)，相关系数(Correlation Coefficients)，信噪比(Signal and NoiseRatio)等。例如，当频域上的峰值和坡度大于设定阈值时，则认为所述语音数据段为包含语音信息的语音数据段；反之，所述语音数据段则为不包含语音信息的语音数据段。需要说明的是，上述语音检测方法对所述上行语音数据段和下行语音数据段都适用，并且检测过程也相同，在此不再分别描述。但在实际应用中，所述语音检测方法并不局限于上述实施例，本领域技术人员还可以利用其它可行的语音检测方法对语音数据段进行语音检测，在此不作赘述。步骤S3 基于包含语音信息的语音数据段形成录音数据。具体地，基于所述步骤S2的检测结果，本步骤包括如下几种具体情况，结合参考图3所示的基于语音通信的录音方法的具体实施例的流程示意图，如图3所示，分别对所述
7上行语音数据段和下行语音数据段进行语音检测(步骤S21和S22，相当于步骤S2的语音检测过程)，根据语音检测的结果进行录音判决(步骤S23，相当于步骤S2的判断所述语音数据段中是否包含语音信息)，所述录音判决包括如下几种情况，则执行相应的步骤情况(1)在同一时间段内，对应的上行语音数据段和下行语音数据段中，若只有所述下行语音数据中含有语音信息，则执行步骤S31，将未解码的下行语音数据段作为录音数据。需要说明的是，无论上述步骤S2检测时是对所述未解码的下行语音数据段进行检测的还是对所述已解码的下行语音数据段进行检测的，通常在录音系统中都会保存所述未解码的下行语音数据，因此这里只需要直接将未解码的下行语音数据段将作为这一时间段内的录音数据复制加到录音文件中。情况(2)在同一时间段内，对应的上行语音数据段和下行语音数据段中，若只有所述上行语音数据段中含有语音信息，则执行步骤S32，将已编码的上行语音数据段作为录音数据。需要说明的是，相类似地，无论上述步骤S2检测时是对所述已编码的上行语音数据段进行检测的还是对所述未编码的上行语音数据段进行语音检测的，通常在录音系统中都会保存所述已编码的上行语音数据，因此这里只需要直接将已编码的上行语音数据段将作为这一时间段内的录音数据复制加到录音文件中。情况(3)在同一时间段内，对应的上行语音数据段和下行语音数据段中，若所述上行语音数据段和下行语音数据段中都含有语音信息时，则执行步骤S331语音混合和步骤S332语音编码。需要说明的是，相类似地，无论上述步骤S2是对已解码的所述下行语音数据段和未编码的所述上行语音数据段进行检测的，还是对未解码的所述下行语音数据段和已编码的上行语音数据段进行检测的，通常在录音系统中都会保存所述已解码的所述下行语音数据段和未编码的所述上行语音数据段，因此这里也只需要将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据，而该录音数据将作为这一时间段内的录音数据复制加到录音文件中。情况(4)在同一时间段内，对应的上行语音数据段和下行语音数据段中，若所述上行语音数据段和下行语音数据段中都不含有语音信息时，则执行步骤S34，任意选择一种语音数据段作为录音数据或者将静音数据作为录音数据。需要说明的是，相类似地，无论上述步骤S2是对已解码的所述下行语音数据段和未编码的所述上行语音数据段进行检测的，还是对所述已编码的上行语音数据段和未解码的下行语音数据段进行检测的，通常在录音系统中都会保存所述已编码的上行语音数据段和未解码的下行语音数据段，因此这里也只需要任意选择其中一种语音数据段作为录音数据，同样该录音数据将作为这一时间段内的录音数据复制加到录音文件中。这里之所以在所述上行语音数据段和下行语音数据段中都不含有语音信息时，仍需要将其中一种语音数据段作为录音数据是因为所形成的录音数据将放入录音文件中，为了保证录音文件中录音数据的连续性和完整性，即在每个时间段内都有录音数据。需要说明的是，当所述录音文件的格式支持静音时，也可以将该时间段内的录音数据设置为静音数据，所述设置静音数据的过程为本领域技术人员公知技术，在此不作赘述。需要说明的是，在本实施例中，需要将基于所述步骤S3形成的各个时间段的录音数据按时间先后顺序排列后放入录音文件中，而通常由于录音文件的语音编码格式或标准只支持一路语音数据段的记录，即在同一时间段内不支持多个语音数据段(如上行和下行)同时录音。因此，本实施例中，针对上述情况(1)、情况⑵和情况(4)，由于在同一时间段内只需要将已编码的上行语音数据段和未解码的下行语音数据段中的一种语音数据段作为录音数据复制加到录音文件中，因此适于录音文件的语音编码格式或标准。而针对上述情况(3)，当所述上行语音数据段和下行语音数据段中都含有语音信息时，由于在同一时间段需要上行和下行两个语音数据段，这样不适于录音文件的语音编码格式或标准，因此本实施例中将通过混音器将所述已解码的下行语音数据段以及所述未编码的上行语音数据段进行语音混合，然后再对经过混音后的语音数据段进行语音编码形成录音数据。本发明实施例还提供了一种录音系统，所述录音系统适于对语音数据进行录音。如图4所示的是本发明的一种录音系统的具体实施例的结构示意图。参考图4，所述录音系统20包括获取单元201、检测单元202以及处理单元203。其中，所述检测单元202还包括第一检测单元2021和第二检测单元2022，分别适于检测上行语音数据段和下行语音数据段。具体地，所述获取单元201用于获取来自通信终端之间通话过程中的语音数据段。所述语音数据段是指在通话过程中某一时间段内通信终端之间传输的语音数据。在本实施例中，语音数据是以帧结构形式进行传输的，所述获取单元201可以是以每一帧为单位时间获取语音数据，这样所述语音数据段中包含一帧语音数据；也可以是以连续多帧(2 个或2个以上)为单位时间获取语音数据，这样所述语音数据段中包含多帧语音数据。但在实际应用中，并不限于上述获取语音数据段的方式。进一步地，所述语音数据段包括上行语音数据段和下行语音数据段。其中所述上行语音数据段是指从通信终端发出的语音数据中获取到的语音数据段，所述下行语音数据段是指从通信终端接收到的语音数据中获取到的语音数据段。在本实施例中，所述上行语音数据和下行语音数据采用同一种语音编解码算法或者标准，相应地，录音系统也采用与之相匹配的算法或者标准进行录音。本实施例中，所述通信终端包括移动终端和/或固话终端，所述移动终端可以是手机，所述固话终端即固定电话(座机)，在实际应用中，所述通信终端还可以是其他具有通讯功能的设备。所述检测单元202用于对所述获取单元201获取到的所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语音信息。在具体实施例中，所述检测单元202包括第一检测单元2021，用于对已编码的或未编码的上行语音数据段进行语音检测；以及第二检测单元2022，用于对所述已解码的或未解码的下行语音数据进行语音检测。其中所述上行语音数据段和下行语音数据段是在同一时间段内相对应的上行语音数据和下行语音数据。所述处理单元203用于根据所述检测单元202检测到包含语音信息的语音数据段形成录音数据。在具体实施例中，所述处理单元203根据所述检测单元202不同的检测结果，包括如下四种处理过程1)若只有下行语音数据段包含语音信息，则将未解码的该下行语音数据段作为录音数据；2)若只有上行语音数据段包含语音信息，则将已编码的该上行语音数据段作为录音数据；3)若上行语音数据段和对应的下行语音数据段都包含语音信息，则将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据；4)若上行语音数据段和下行语音数据段都不包含语音信息，则将已编码的该上行语音数据段或者未解码的该下行语音数据段作为录音数据；或者设置静音数据作为录音数据。上述四种处理过程的具体实施例可以参考前述步骤S3的描述，在此不再赘述。本发明实施例还提供了一种通信终端，所述通信终端包括如图4所述的录音系统 20，所述录音系统20通常设置在所述通信终端的内部，当所述通信终端与其他通信终端进行通话过程中，所述录音系统20可以获取通话过程中的语音数据段，并根据本技术方案的录音方法形成录音数据，其中，上行语音数据段为该通信终端发送的语音数据，下行语音数据段为该通信终端从其他通信终端接收到的语音数据。综上，本技术方案对获取到的来自通信终端之间通话过程中的语音数据段进行语音检测判断是否包含语音信息，然后基于包含语音信息的语音数据段形成录音数据。这样就不需要对所有获取到的语音数据都进行语音混合、再经过语音编码后形成录音数据，从而减少了录音过程中的语音编码过程，降低了录音系统的计算复杂度。本发明虽然已以较佳实施例公开如上，但其并不是用来限定本发明，任何本领域技术人员在不脱离本发明的精神和范围内，都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改，因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰，均属于本发明技术方案的保护范围。
权利要求
1.一种基于语音通信的录音方法，其特征在于，包括获取来自通信终端之间通话过程中的语音数据段；对所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语音信息；基于包含语音信息的语音数据段形成录音数据。
2.根据权利要求1所述的基于语音通信的录音方法，其特征在于，所述语音数据段包括至少一帧语音数据。
3.根据权利要求1所述的基于语音通信的录音方法，其特征在于，所述语音数据段包括上行语音数据段和下行语音数据段。
4.根据权利要求3所述的基于语音通信的录音方法，其特征在于，所述对所述语音数据段进行语音检测包括对已编码的或未编码的上行语音数据段进行语音检测；对已解码的或未解码的下行语音数据段进行语音检测。
5.根据权利要求4所述的基于语音通信的录音方法，其特征在于，所述基于包含语音信息的语音数据段形成录音数据包括若只有下行语音数据段包含语音信息，则将未解码的该下行语音数据段作为录音数据；若只有上行语音数据段包含语音信息，则将已编码的该上行语音数据段作为录音数据；若上行语音数据段和对应的下行语音数据段都包含语音信息，则将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据。
6 根据权利要求5所述的基于语音通信的录音方法，其特征在于，还包括若上行语音数据段和下行语音数据段都不包含语音信息，则将已编码的该上行语音数据段或者未解码的该下行语音数据段作为录音数据；或者设置静音数据作为录音数据。
7.根据权利要求1所述的基于语音通信的录音方法，其特征在于，所述通信终端包括移动终端和/或固话终端。
8.一种录音系统，所述录音系统适于对语音数据进行录音，其特征在于，包括获取单元，用于获取来自通信终端之间通话过程中的语音数据段；检测单元，用于对所述获取单元获取到的所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语音信息；处理单元，用于根据所述检测单元检测到的包含语音信息的语音数据段形成录音数据。
9.根据权利要求8所述的录音系统，其特征在于，所述语音数据段包括至少一帧语音数据。
10.根据权利要求8所述的录音系统，其特征在于，所述语音数据段包括上行语音数据段和下行语音数据段。
11.根据权利要求10所述的录音系统，其特征在于，所述检测单元包括第一检测单元和第二检测单元；其中，所述第一检测单元用于对已编码的或未编码的上行语音数据段进行语音检测；所述第二检测单元用于对已解码的或未解码的下行语音数据段进行语音检测。
12.根据权利要求11所述的录音系统，其特征在于，所述处理单元用于若只有下行语音数据段包含语音信息，则将未解码的该下行语音数据段作为录音数据；若只有上行语音数据段包含语音信息，则将已编码的该上行语音数据段作为录音数据；若上行语音数据段和对应的下行语音数据段都包含语音信息，则将已解码的该下行语音数据段和未编码的该上行语音数据段进行语音混合和语音编码后的结果作为录音数据。
13.根据权利要求12所述的录音系统，其特征在于，所述处理单元还用于若上行语音数据段和下行语音数据段都不包含语音信息，则将已编码的该上行语音数据段或者未解码的该下行语音数据段作为录音数据；或者设置静音数据作为录音数据。
14.一种通信终端，其特征在于，包括权利要求8至13任一项所述的录音系统。
15.根据权利要求14所述的通信终端，其特征在于，所述通信终端包括移动终端和/或固话终端。
全文摘要
一种基于语音通信的录音方法以及录音系统、通信终端，其中所述基于语音通信的录音方法包括获取来自通信终端之间通话过程中的语音数据段；对所述语音数据段进行语音检测，以判断所述语音数据段中是否包含语音信息；基于包含语音信息的语音数据段形成录音数据。本技术方案减少语音通信的录音系统中语音编码过程，从而降低录音流程的计算复杂度。
文档编号G10L19/00GK102523329SQ20111034210
公开日2012年6月27日申请日期2011年11月2日优先权日2011年11月2日
发明者吴晟, 张本好, 徐晶明, 李昙, 林福辉, 韩大晗申请人:展讯通信(上海)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐晶明;林福辉;李昙;韩大晗;吴晟;张本好
技术所有人：展讯通信(上海)有限公司
我是此专利的发明人