混音测试系统、方法、装置及存储介质与流程

文档序号：15836955发布日期：2018-11-07 07:58阅读：304来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及混音测试系统、方法、装置及存储介质，属于计算机技术领域。

背景技术

混音是指将不同来源的声音信号进行混合处理的过程。在语音会话过程中，混音装置需要将不同会话参与方发出的语音信号进行混音再发送至各个会话参与方。为了保证会话过程中每个会话参与方的语音信号不丢失，需要对混音装置的混音效果进行测试。

目前，测试混音装置的混音效果的方式，包括：多个会话参与方的语音信号经过混音装置混音后，由播放组件播放混音得到的混音文件；人工识别该混音文件是否包括该多个会话参与方的语音信号；根据人工识别结果得到混音测试结果。

然而，随着会话参与方的数量的增加，人工测试混音效果的准确率随之降低，且测试效率不高。

技术实现要素：

本申请提供了一种混音测试系统、方法、装置及存储介质，可以解决人工测试混音效果的准确率较低，且测试效率不高的问题。本申请提供如下技术方案：

第一方面，提供了一种混音测试系统，所述系统包括：

声音仿真平台，用于生成至少两种仿真声音序列；并将所述至少两种仿真声音序列发送至所述混音组件，所述仿真声音序列由至少一种基础声音信号组成；

所述混音组件，用于获取所述至少两种仿真声音序列；对所述至少两种仿真声音序列进行混音，得到混音文件；将所述混音文件发送至所述混音分析平台；

所述混音分析平台，用于获取所述混音文件；对所述混音文件进行分析，得到所述混音文件中的基础声音信号的信息；根据所述基础声音信号的信息确定混音测试结果。

可选地，所述混音文件包括n帧混音信号，所述n为正整数，所述混音分析平台，用于：

对第i帧混音信号进行采样，得到第i帧采样值，所述i为小于所述n的正整数；

对所述第i帧采样值进行时频变换，得到第i帧变换后的混音信号；

将所述第i帧变换后的混音信号与不同种类的基础声音信号进行匹配，得到第i帧基础声音信号的信息；

将各帧基础声音信号的信息合并，得到所述混音文件中的基础声音信号的信息。

可选地，所述混音分析平台，用于：

对于每个仿真声音序列，在所述混音文件中的基础声音信号的信息包括所述仿真声音序列中的至少一种基础声音信号的信息时，确定所述混音文件中包括所述仿真声音序列。

可选地，所述混音分析平台，用于：

对于每个仿真声音序列，根据所述混音文件中的基础声音信号的信息与所述仿真声音序列中的基础声音信号的信息的匹配程度，确定所述仿真声音序列的完整度。

可选地，所述声音仿真平台包括至少两个仿真终端，所述至少两个仿真终端中的每个仿真终端，用于：

读取预存的声音生成文件，所述声音生成文件包括用于生成所述仿真声音序列的至少一种基础声音信号的信息；

根据所述声音生成文件进行声音编码，得到所述仿真声音序列；

其中，不同的仿真终端生成的仿真声音序列不同。

可选地，所述仿真终端，用于：

在所述读取声音生成文件之前，通过音频通信协议与其他仿真终端建立音频连接。

可选地，所述基础声音信号为双音多频dtmf信号。

第二方面，提供了一种混音测试方法，所述方法包括：

读取声音生成文件，所述声音文件包括至少一种基础声音信号的信息，所述基础声音信号用于生成仿真声音序列；

根据所述声音生成文件进行声音编码，得到所述仿真声音序列；

将所述仿真声音序列发送至混音组件，所述仿真声音序列用于供所述混音组件进行混音，得到混音文件；所述混音文件用于供混音分析平台进行分析，得到混音测试结果。

第三方面，提供了一种混音测试方法，所述方法包括：

获取混音组件发送的混音文件，所述混音文件是所述混音组件对声音仿真平台发送的至少两种仿真声音序列进行混音得到的；

对所述混音文件进行分析，得到所述混音文件中的基础声音信号的信息；

根据所述基础声音信号的信息确定混音测试结果。

第四方面，提供了一种混音测试装置，所述装置包括：

文件读取模块，用于读取声音生成文件，所述声音文件包括至少一种基础声音信号的信息，所述基础声音信号用于生成仿真声音序列；

声音编码模块，用于根据所述声音生成文件进行声音编码，得到所述仿真声音序列；

声音发送模块，用于将所述仿真声音序列发送至混音组件，所述仿真声音序列用于供所述混音组件进行混音，得到混音文件；所述混音文件用于供混音分析平台进行分析，得到混音测试结果。

第五方面，提供了一种混音测试装置，所述装置包括：

文件获取模块，用于获取混音组件发送的混音文件，所述混音文件是所述混音组件对声音仿真平台发送的至少两种仿真声音序列进行混音得到的；

文件分析模块，用于对所述混音文件进行分析，得到所述混音文件中的基础声音信号的信息；

结果确定模块，用于根据所述基础声音信号的信息确定混音测试结果。

第六方面，提供一种混音测试装置，所述装置包括处理器和存储器；所述存储器中存储有程序，所述程序由所述处理器加载并执行以实现第一方面所述的混音测试方法；或者，实现第二方面所述的混音测试方法。

第七方面，提供一种计算机可读存储介质，所述存储介质中存储有程序，所述程序由所述处理器加载并执行以实现第一方面所述的混音测试方法；或者，实现第二方面所述的混音测试方法。

本申请的有益效果在于：通过由声音仿真平台生成至少两种仿真声音序列；混音组件对该至少两种仿真声音序列进行混音，得到混音文件；由混音分析平台对该混音文件进行分析，得到混音文件中的基础声音信号的信息；根据该基础声音信号的信息确定混音测试结果得到混音测试结果；可以解决人耳测试混音组件的混音效果时，识别效率不高且准确率较差的问题；由于混音分析平台自动分析混音组件的混音效果，而无需人工参与识别，因此，可以提高测试混音组件的混音效果的效率。另外，由于混音分析平台可以通过识别得到基础声音信号的信息来确定各个仿真声音序列是否均被混音，因此，随着仿真声音序列的种类的增多，还可以提高测试混音组件的混音效果的准确率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，并可依照说明书的内容予以实施，以下以本申请的较佳实施例并配合附图详细说明如后。

附图说明

图1是本申请一个实施例提供的混音测试系统的结构示意图；

图2是本申请一个实施例提供的混音测试方法的流程图；

图3是本申请一个实施例提供的声音仿真平台生成仿真声音序列的流程图；

图4是本申请一个实施例提供的混音分析平台获取混音测试结果的流程图；

图5是本申请另一个实施例提供的混音分析平台获取混音测试结果方法的流程图；

图6是本申请一个实施例提供的混音测试装置的框图；

图7是本申请一个实施例提供的混音测试装置的框图；

图8是本申请一个实施例提供的混音测试装置的框图。

具体实施方式

下面结合附图和实施例，对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请，但不用来限制本申请的范围。

首先，对本申请涉及的若干名词进行解释。

仿真声音序列：用于模拟语音会话时会话参与者发出的语音信号。仿真声音序列由至少一种基础声音信号生成。不同的基础声音信号之间相互组合可以生成不同的仿真声音序列。示意性地，基础声音信号为双音多频(dualtonemultifrequency，dtmf)信号。

dtmf信号：由一个高频信号和一个低频信号叠加组成的组合信号。其中，高频信号是从预设的高频群中任意选择的一个高频信号，低频信号是从预设的低频群中任意选择的一个高频信号。可选地，高频群包括4种高频信号，低频群包括4种低频信号，此时，不同高频信号与低频信号的组合可以得到16种dtmf信号，这16种dtmf信号可以通过16个编码指示。

混音：是指将不同来源的声音信号进行混合处理(或者叠加处理)的过程。

图1是本申请一个实施例提供的混音测试系统的结构示意图，如图1所示，该系统至少包括：声音仿真平台110、混音组件120和混音分析平台130。

声音仿真平台110可以设置于计算机、个人计算机、手机、可穿戴式设备等终端中。可选地，声音仿真平台110包括至少两个仿真终端111。其中，仿真终端111可以是虚拟终端；或者，也可以是实体的终端设备，本实施例对此不作限定。

可选地，至少两个仿真终端111之间预先建立有音频连接。比如：至少两个仿真终端111之间预先通过视频会议系统接入视频会议，该视频会议支持语音通话。其中，视频会议系统(或称，会议电视系统)是指两个或两个以上的参与方通过传输线路及多媒体设备将音频、视频和文件资料中的至少一种进行互传，以实现远程会议的系统设备。当然，至少两个仿真终端111之间建立音频连接的场景也可以是其它场景，比如|：多人语音聊天室等场景。

声音仿真平台110用于生成至少两种仿真声音序列，并将该至少两种仿真声音序列发送至混音组件120。

可选地，声音仿真平台110通过有线通信或者无线通信的方式与混音组件120建立连接。比如：声音仿真平台110通过以太网与混音组件120建立连接。

混音组件120可以设置于计算机、个人计算机、手机、可穿戴式设备等终端中；或者，也可以设置于服务器中，本实施例对此不作限定。混音组件120可以实现为具有混音功能的硬件、软件、或者软硬件相结合的组件。混音组件120用于对获取到的至少两种仿真声音序列进行混音，得到混音文件；并将该混音文件发送至混音分析平台130。

示意性地，混音文件为脉冲编码调制(pulsecodemodulation，pcm)文件。

可选地，混音组件120通过有线通信或者无线通信的方式与混音分析平台130建立连接。比如：混音组件120通过以太网与混音分析平台130建立连接。

混音分析平台130可以设置于计算机、个人计算机、手机、可穿戴式设备等终端中。可选地，混音分析平台130可以与声音仿真平台110设置在同一设备中；或者，混音分析平台130还可以与声音仿真平台110设置在不同设备中。

混音分析平台130用于获取混音组件120得到的混音文件，并对该混音文件进行分析，得到混音文件中的基础声音信号的信息；根据基础声音信号的信息确定混音测试结果得到混音测试结果。

其中，基础声音信号的信息用于指示基础声音信号的类型，比如：基础声音信号的编码、名称等。

可选地，本实施例中，仅以混音组件120的数量为1个为例进行说明；在实际实现时，该混音组件120的数量也可以为多个，也即，对多个混音组件120的混音效果进行测试，本实施例对此不作限定。

图2是本申请一个实施例提供的混音测试方法的流程图，本实施例以该的方法应用于图1所示的混音测试系统中为例进行说明。该方法至少包括以下几个步骤：

步骤201，声音仿真平台生成至少两种仿真声音序列。

其中，仿真声音序列由至少一种基础声音信号组成。比如：仿真声音序列由2种或者2种以上的基础声音信号组成。可选地，基础声音信号为dtmf信号。

可选地，声音仿真平台包括至少两个仿真终端，每个仿真终端生成一种仿真声音序列，且不同的仿真终端生成的仿真声音序列不同。本实施例不对仿真终端的数量作限定，示意性地，该仿真终端的数量大于2且小于等于191。

示意性地，仿真终端生成仿真声音序列，包括：读取预存的声音生成文件；根据该声音生成文件进行声音编码，得到仿真声音序列。

其中，声音生成文件包括用于生成仿真声音序列的至少一种基础声音信号的信息。可选地，该声音生成文件为pcm文件。

比如：声音生成文件包括至少一种dtmf信号的编码，仿真终端根据该至少一种dtmf信号的编码进行声音编码，得到dtmf声音码流，该dtmf声音码流即为仿真声音序列。

可选地，为了模拟真实语音会话场景，每个仿真终端在生成仿真声音序列之前，可以通过音频通信协议与其他仿真终端之间建立音频连接。示意性地，音频通信协议可以是h323协议；或者，也可以是会话初始协议(sessioninitiationprotocol，sip)；或者，还可以是其它类型用于建立音频连接的协议，本实施例不对音频通信协议的类型作限定。

步骤202，声音仿真平台将至少两种仿真声音序列发送至混音组件。

可选地，声音仿真平台通过以太网将至少两种仿真声音序列发送至混音组件。声音仿真平台可以同时发送至少两种仿真声音序列；或者，也可以分别发送至少两种仿真声音序列，本实施例不对至少两种仿真声音序列的发送方式作限定。

参考图3所示的声音仿真平台生成并发送仿真声音序列的流程图，该过程至少包括如下几个步骤：

步骤31：声音仿真平台中的每个仿真终端通过音频通信协议与其他仿真终端之间建立音频连接。

步骤32：仿真终端读取预存的声音生成文件。

步骤33：仿真终端根据声音生成文件进行声音编码，得到仿真声音序列。

步骤34：仿真终端将该仿真声音序列发送至混音组件。

可选地，上述流程仅是示意性地，在实际实现时，可以包括更少或者更多的步骤，本实施例对此不作限定。

步骤203，混音组件获取至少两种仿真声音序列；对至少两种仿真声音序列进行混音，得到混音文件。

可选地，混音组件获取到至少两种仿真声音序列之后，将该至少两种仿真声音序列逐帧进行叠加，得到混音文件。可选地，混音文件为pcm文件。

步骤204，混音组件将混音文件发送至混音分析平台。

可选地，混音组件通过以太网将混音文件发送至混音分析平台。

步骤205，混音分析平台获取混音文件；对混音文件进行分析，得到混音文件中的基础声音信号的信息；根据混音文件中的基础声音信号的信息确定混音测试结果。

可选地，参考图4所示的混音分析平台获取混音测试结果的流程图，该过程至少包括以下几个步骤：

步骤41：获取混音文件。

步骤42：对混音文件进行分析，得到混音文件中的基础声音信号的信息。

混音文件包括n帧时域的混音信号，n为正整数。为了降低分析混音文件的难度，混音分析平台需要将混音信号转换至频域。此时，混音分析平台对第i帧(当前帧)混音信号进行采样，得到第i帧采样值；对第i帧采样值进行时频变换，得到第i帧变换后的混音信号；将第i帧变换后的混音信号与不同种类的基础声音信号进行匹配，得到第i帧基础声音信号的信息；将各帧基础声音信号的信息合并，得到混音文件中的基础声音信号的信息。i为小于n的正整数。

在将第i帧变换后的混音信号与不同种类的基础声音信号进行匹配时，混音分析平台可以在第i帧变换后的混音信号构成的频谱中，识别频率分量占全频带能量的比例超过频率阈值的基础声音信号，获取该基础声音信号的信息。

其中，频率阈值存储在混音分析平台中，该频率阈值可以是开发人员设置的，本实施例不对频率阈值的设置方式作限定。

时频变换可以是快速傅里叶变换(fastfouriertransformation，fft)；或者，也可以是傅里叶变换(fouriertransform，ft)，本实施例不对时频变换的方式作限定。

可选地，基础声音信号的信息可以是基础声音信号的编码，比如：dtmf信号的16种不同的编码。

步骤43：根据混音文件中的基础声音信号的信息确定混音测试结果。

可选地，混音分析平台分析混音文件是否包括全部的仿真声音序列，得到混音测试结果；和/或，混音分析平台分析混音文件中某一仿真声音序列的完整度，得到混音测试结果。

示意性地，混音分析平台分析混音文件是否包括全部的仿真声音序列，包括：对于每个仿真声音序列，在混音文件中的基础声音信号的信息包括仿真声音序列中的至少一种基础声音信号的信息时，确定混音文件中包括仿真声音序列。

示意性地，混音分析平台分析混音文件中某一仿真声音序列的完整度，包括：对于每个仿真声音序列，根据所述混音文件中的基础声音信号的信息与所述仿真声音序列中的基础声音信号的信息的匹配程度，确定所述仿真声音序列的完整度。比如：对于每个仿真声音序列，混音分析平台在混音文件中的基础声音信号的信息中，检测包括的该仿真声音序列的基础声音信号的信息的比例，得到仿真声音序列的完整度。

可选地，为了更清楚地理解本申请提供的获取混音测试结果的过程，下面对该过程进行举例说明，在本实例中，以时频变换的方式为fft，基础声音信号为dtmf信号为例，参考图5，该过程至少包括以下几个步骤：

步骤51：获取混音文件。

步骤52：对第i帧混音信号进行采样，得到第i帧采样值。

步骤53：对第i帧采样值进行快速傅里叶变换，得到第i帧变换后的混音信号。

步骤54：识别第i帧变换后的混音信号中的dtmf信号，得到单帧dtmf信号的信息。

步骤55：检测i的值是否为n；在i为n时，执行步骤56；在i不为n时，另i＝i+1，执行步骤52。

步骤56：将n帧dtmf信号的信息合并，得到连续的多帧dtmf信号的信息。

步骤57：将多帧dtmf信号的信息与声音生成文件中的基础声音信号的信息进行比较，得到混音测试结果。

比如：混音分析平台的混音测试结果参考下表一，其中，仿真终端标识用于指示不同的仿真终端；原dtmf信息是仿真终端读取的声音生成文件中的基础声音信号的信息；混音后的dtmf信息是混音分析平台识别得到基础声音信号的信息。

表一：

综上所述，本实施例提供的混音测试方法，通过由声音仿真平台生成至少两种仿真声音序列；混音组件对该至少两种仿真声音序列进行混音，得到混音文件；由混音分析平台对该混音文件进行分析，得到混音文件中的基础声音信号的信息；根据该基础声音信号的信息确定混音测试结果得到混音测试结果；可以解决人耳测试混音组件的混音效果时，识别效率不高且准确率较差的问题；由于混音分析平台自动分析混音组件的混音效果，而无需人工参与识别，因此，可以提高测试混音组件的混音效果的效率。另外，由于混音分析平台可以通过识别得到基础声音信号的信息来确定各个仿真声音序列是否均被混音，因此，随着仿真声音序列的种类的增多，还可以提高测试混音组件的混音效果的准确率。

图6是本申请一个实施例提供的混音测试装置的框图，本实施例以该的装置应用于图1所示的混音测试系统中的声音仿真平台110为例进行说明。该装置至少包括以下几个模块：文件读取模块610、声音编码模块620和声音发送模块630。

文件读取模块610，用于读取声音生成文件，所述声音文件包括至少一种基础声音信号的信息，所述基础声音信号用于生成仿真声音序列；

声音编码模块620，用于根据所述声音生成文件进行声音编码，得到所述仿真声音序列；

声音发送模块630，用于将所述仿真声音序列发送至混音组件，所述仿真声音序列用于供所述混音组件进行混音，得到混音文件；所述混音文件用于供混音分析平台进行分析，得到混音测试结果。

相关细节参考上述方法实施例。

图7是本申请一个实施例提供的混音测试装置的框图，本实施例以该的装置应用于图1所示的混音测试系统中的混音分析平台130为例进行说明。该装置至少包括以下几个模块：文件获取模块710、文件分析模块720和结果确定模块730。

文件获取模块710，用于获取混音组件发送的混音文件，所述混音文件是所述混音组件对声音仿真平台发送的至少两种仿真声音序列进行混音得到的；

文件分析模块720，用于对所述混音文件进行分析，得到所述混音文件中的基础声音信号的信息；

结果确定模块730，用于根据所述基础声音信号的信息确定混音测试结果。

相关细节参考上述方法实施例。

需要说明的是：上述实施例中提供的混音测试装置在进行混音测试时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将混音测试装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的混音测试装置与混音测试方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图8是本申请一个实施例提供的混音测试装置的框图，该装置可以是包含图1所示的混音测试系统中的声音仿真平台110的装置；或者，也可以是包含图1所示的混音测试系统中的混音分析平台130的装置。该装置包括处理器801和存储器802。

处理器801可以包括一个或多个处理核心，比如：4核心处理器、8核心处理器等。处理器801可以采用dsp(digitalsignalprocessing，数字信号处理)、fpga(field－programmablegatearray，现场可编程门阵列)、pla(programmablelogicarray，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(centralprocessingunit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器801可以在集成有gpu(graphicsprocessingunit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器801还可以包括ai(artificialintelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的混音测试方法。

在一些实施例中，混音测试装置还可选包括有：外围设备接口和至少一个外围设备。处理器801、存储器802和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。示意性地，外围设备包括但不限于：射频电路、触摸显示屏、音频电路、和电源等。

当然，混音测试装置还可以包括更少或更多的组件，本实施例对此不作限定。

可选地，本申请还提供有一种计算机可读存储介质，所述计算机可读存储介质中存储有程序，所述程序由处理器加载并执行以实现上述方法实施例的混音测试方法。

可选地，本申请还提供有一种计算机产品，该计算机产品包括计算机可读存储介质，所述计算机可读存储介质中存储有程序，所述程序由处理器加载并执行以实现上述方法实施例的混音测试方法。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王展;胡小鹏;顾振华
技术所有人：苏州科达科技股份有限公司
我是此专利的发明人

上一篇：一种双涵道推力复合辅翼的后单桨式复合翼货运飞机的制作方法
上一篇：一种用于茶叶加工的茶叶揉捻机的制作方法