一种扬声器位置确定方法、装置、终端及存储介质与流程

文档序号：17742238发布日期：2019-05-24 20:15阅读：146来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明实施例涉及数据处理技术，尤其涉及一种扬声器位置确定方法、装置、终端及存储介质。

背景技术：

智能音箱等终端已经被广泛使用，上述终端中的扬声器通常为无指向设计，即声波尽可能向360°方向辐射，使得扬声器可随意摆放以及用户在说话过程中可随意走动。

当扬声器放置在房间的不同位置时，将播放模式调整为与扬声器所在位置匹配的播放模式，可以产生更好的播放效果，示例性的，如使辐射至听者和非听者的声压级差增大，或者，产生合适的多个声束营造环绕效果。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：由于无法实现确定扬声器所在位置，因此，无法根据扬声器所在位置确定合适的播放模式，影响了用户的使用体验。

技术实现要素：

本发明实施例提供一种扬声器位置确定方法、装置、终端及存储介质，以实现确定扬声器所在位置。

第一方面，本发明实施例提供了一种扬声器位置确定方法，该方法包括：

获取当前录制信号，所述当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到；

确定当前录制信号对应的当前声学特征信号；

根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息。

进一步的，所述确定当前录制信号对应的当前声学特征信号，包括：

所述传声器的个数为至少两个，计算每个传声器的当前录制信号对应的房间脉冲响应信号(roomimpulseresponse，rir)；

从所述房间脉冲响应信号中提取对应的当前声学特征信号。

进一步的，所述从所述房间脉冲响应信号中提取对应的当前声学特征信号，包括：

将所述房间脉冲响应信号中最大绝对值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，将所述积分声能值作为所述当前声学特征信号。

进一步的，所述声学特征信号与位置的对应关系通过扬声器位置确定模型得到。

进一步的，所述获取当前录制信号之前，还包括：

获取训练录制信号和对应的扬声器的训练位置信息，所述训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到；

确定训练录制信号对应的训练声学特征信号；

将所述训练声学特征信号作为输入变量，对应的训练位置信息作为输出变量，训练分类器模型，将训练后的分类器模型作为所述扬声器位置确定模型。

进一步的，所述扬声器的训练位置信息包括所述扬声器的训练距离信息和所述扬声器的训练角度信息，所述扬声器的训练距离信息由所述扬声器距房间的各墙面的距离大小确定，所述扬声器的训练角度信息由所述扬声器的旋转方向所在直线与参考面之间的夹角确定。

进一步的，所述扬声器的训练距离信息由所述扬声器距房间的各墙面的距离大小确定，包括：

所述扬声器距房间的两个墙面的距离相比于距所述房间的其它两个墙面的距离近，且距相对两个墙面的远距离与近距离之比与1的差值大于第一预设距离阈值，所述第一预设阈值大于等于1，则所述扬声器的训练距离信息属于第一训练距离信息；

所述扬声器距房间的一个墙面的距离相比于距所述房间的其它三个墙面的距离近，且距与所述房间的距离近的墙面的相对墙面的远距离与距所述房间的距离近的墙面的近距离之比与1的差值大于第一预设距离阈值，所述第一预设距离阈值大于等于1，则所述扬声器的训练距离信息属于第二训练距离信息；

所述扬声器距相对两个墙面的远距离与近距离之比与1的差值小于第二预设距离阈值，所述第二预设阈值小于1，则所述扬声器的训练距离信息属于第三训练距离信息。

第二方面，本发明实施例还提供了一种扬声器位置确定装置，该装置包括：

当前录制信号获取模块，用于获取当前录制信号，所述当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到；

当前声学特征信号确定模块，用于确定当前录制信号对应的当前声学特征信号；

扬声器的位置信息确定模块，用于根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息。

进一步的，所述当前声学特征信号确定模块，包括：

房间脉冲响应信号确定子模块，用于所述传声器的个数为至少两个，计算每个传声器的当前录制信号对应的房间脉冲响应信号；

当前声学特征信号确定子模块，用于从所述房间脉冲响应信号中提取对应的当前声学特征信号。

进一步的，所述当前声学特征信号确定子模块，包括：

当前声学特征信号确定单元，用于将所述房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，将所述积分声能值作为所述当前声学特征信号。

进一步的，所述声学特征信号与位置的对应关系通过扬声器位置确定模型得到。

进一步的，该装置还包括：

训练录制信号和训练位置信息获取模块，用于获取训练录制信号和对应的扬声器的训练位置信息，所述训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到；

训练声学特征信号确定模块，用于确定训练录制信号对应的训练声学特征信号；

扬声器位置确定模型生成模块，用于将所述训练声学特征信号作为输入变量，对应的训练位置信息作为输出变量，训练分类器模型，将训练后的分类器模型作为所述扬声器位置确定模型。

进一步的，所述扬声器的训练距离信息由所述扬声器距房间的各墙面的距离大小确定，包括：

第三方面，本发明实施例还提供了一种终端，该终端包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

传声器，用于发出测试信号；

扬声器，用于同步录制所述测试信号，得到录制信号；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例第一方面所述的方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例第一方面所述的方法。

本发明实施例通过获取当前录制信号，当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到，确定当前录制信号对应的当前声学特征信号，根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息，上述通过基于声学特征信号与扬声器位置的对应关系，实现了确定扬声器的位置信息。

附图说明

图1是本发明实施例中的一种扬声器位置确定方法的流程图；

图2是本发明实施例中的一种从房间脉冲响应信号中提取对应的积分声能值的示意图；

图3是本发明实施例中的一种扬声器和传声器的结构示意图；

图4是本发明实施例中的一种训练位置信息的示意图；

图5是本发明实施例中的另一种训练位置信息的示意图；

图6是本发明实施例中的另一种扬声器位置确定方法的流程图；

图7是本发明实施例中的一种房间脉冲响应信号的示意图；

图8是本发明实施例中的一种积分声能值的示意图；

图9是本发明实施例中的一种扬声器位置确定装置的结构示意图；

图10是本发明实施例中的一种终端的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例

图1为本发明实施例提供的一种扬声器位置确定方法的流程图，本实施例可适用于确定扬声器的位置信息的情况，该方法可以由扬声器位置确定装置来执行，该装置可以采用软件和/或硬件的方式实现，该装置可以配置于终端中，例如，智能音箱等。如图1所示，该方法具体包括如下步骤：

步骤110、获取当前录制信号，当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到。

在本发明的实施例中，扬声器可用于发出当前测试信号，传声器可用于同步录制当前测试信号并得到当前录制信号，传声器可位于扬声器顶部，扬声器和传声器可放置于房间内，传声器的个数可以为至少一个。可以理解到，当前录制信号的个数与传声器的个数相同，每个传声器可以同步录制由扬声器发出的当前测试信号，得到当前录制信号。

当前测试信号的信号类型可以为最大长度序列(maximumlengthsequence，mls)信号。将mls信号作为激励信号能够在背景噪声较大的环境下比较精确的测量出生成的频率响应特性。同样的，当前录制信号的信号类型也可以为mls信号。最大长度序列是一个简单的二进制数字序列，也就是序列中存在0和1两种数字，下面对最大长度序列进行进一步说明，具体的：首先，设定一个二进制数的数组u，数组u共有t个二进制数，每个二进制数有w位，u[p][q]表示数组u中第q个二进制数的第p位。v是一个w位二进制数，v的值预先设定，称为最大长度序列种子，v[p]表示v的第p位。假设数组u中的第一个二进制数为0，记为：u[p][0]＝0，0≤p≤w，并可以根据公式u[x][y+1]＝(u[0][y]×v[x+1])xoru[x+1][y]确定数组u的其它是各二进制数。其中，xor表示异或运算，0≤x≤w。根据上式不断迭代填充数组u，当填充到第2^w个元素时会出现重复，即u[p][0]＝u[p][2^w]，0≤p≤w。也就是说在保证数组元素不重复的前提下，t的最大值为2^w。设u是一个长度为t-1的二进制序列，根据如下公式给赋值：u[y]＝u[x][y+1]，1≤y≤t-1，0≤x≤w-1，则u即是一个长度为t-1的最大长度序列，可以看出，根据x的不同取值，可以得到w种不同的序列。

基于上述，最大长度序列是由数组v和数组u的第一个元素确定的，因此，可将最大长度序列看成是确定性的随机序列或伪随机序列。最大长度序列的长度一般为2^w-1，w是任意正整数，最大长度序列中二进制数“1”的个数比二进制数“0”的个数多一个。如果用高电平表示最大长度序列中的数字1，低电平表示最大长度序列中的数字0，形成激励信号，则该激励信号即是mls信号。

需要说明的是，mls信号中w可根据实际情况进行设定，在此不作具体限定。示例性的，如w＝13。此外，当前测试信号可以预先存储于终端的存储模块中，为了提高确定的扬声器的位置信息的准确性，可对当前测试信号进行测试，重复测试次数可以根据实际情况进行设定，在此不作具体限定。示例性的，如重复测试次数为3。基于上述，设定w＝13，重复录制测试次数为3，则当前测试信号的总长度均为3×(2¹³-1)。此外，为了加快运算速度，可在存储模块中也内置和上述mls信号对应的两组排序数组，当当前测试信号的总长度为3×(2¹³-1)时，两组排序数组的长度将分别为8191个排序值。需要说明的是，当前录制信号与当前测试信号的长度相等。

步骤120、确定当前录制信号对应的当前声学特征信号。

在本发明的实施例中，为了确定扬声器的位置信息，需要对当前录制信号进行处理，得到对应的当前声学特征信号。可以通过如下方式确定当前录制信号对应的当前声学特征信号：计算传声器的当前录制信号对应的当前房间脉冲响应信号，从房间脉冲响应信号中提取声学特征信号。需要说明的是，上述针对的是每个传声器，即计算每个传声器同步录制得到的当前录制信号对应的当前房间脉冲响应信号，从房间脉冲响应信号中提取声学特征信号。

需要说明的是，步骤110所述的为了加快运算速度，可在存储模块中也内置和上述mls信号对应的两组排序数组，上述可以实现快速从当前录制信号中得到对应的房间脉冲响应信号。

步骤130、根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息。

在本发明的实施例中，为了确定扬声器的位置信息，可以采用基于预先建立的声学特征信号与位置的对应关系的方式来确定。声学特征信号与位置的对应关系可以通过扬声器位置确定模型得到，扬声器位置确定模型可以基于分类器模型训练生成，分类器模型可以为支持向量机、决策树、随机森林、逻辑回归、线性回归和神经网络等，具体可根据实际情况进行确定，在此不作具体限定。

扬声器的位置信息具体可以包括扬声器的距离信息和扬声器的角度信息，其中，扬声器的位置信息可由扬声器距房间的各墙面的距离大小确定，扬声器的角度信息可由扬声器旋转方向所在直线与参考面之间的夹角确定。更为具体的：

扬声器的位置信息可由扬声器距房间的各墙面的距离大小确定，可作如下理解：如果扬声器距房间的两个墙面的距离相比于距该房间的其它两个墙面的距离近，且距相对两个墙面的远距离与近距离之比与1的差值大于第一预设距离阈值，则扬声器的距离信息属于第一距离信息；如果扬声器距房间的一个墙面的距离相比于该房间的其它三个墙面的距离近，且距与房间的距离近的墙面的相对墙面的远距离与距房间的距离近的墙面的近距离之比与1的差值大于第一预设距离阈值，则扬声器的距离信息属于第二距离信息；如果扬声器距相对两个墙面的远距离与近距离之比与1的差值小于第二预设距离阈值，则扬声器的距离信息属于第三距离信息，第一预设距离阈值大于等于1，第二预设距离阈值小于1。基于上述，可以理解到，扬声器的距离信息可以分为三类，分别为第一距离信息、第二距离信息和第三距离信息。其中，第一距离信息可以用a表示，第二距离信息可以用b表示，第三距离信息可以用c表示。

扬声器的角度信息可由扬声器旋转方向所在直线与参考面之间的夹角确定，可作如下理解：扬声器可在房间内旋转，并可将扬声器的旋转方向所在直线与参考面之间的夹角划分为不同的角度区域，以逆时针旋转方向为正方向，每个角度区域属于同一角度信息，如可将360°等分为n个角度区域，则第一角度区域(即第一角度信息)为第二角度区域(即第二角度信息)为第i角度区域(即第i角度信息)为第(n-1)角度区域(即第(n-1)角度信息)为第n角度区域(即第n角度信息)为其中，i＝1，2，......，n-1，n。基于上述，可以理解到，扬声器的角度信息可以分为n类，分别为第一角度信息、第二角度信息、……、第i角度信息、……、第(n-1)角度信息和第n角度信息。角度信息可以用i表示。

需要说明的是，扬声器的旋转方向所在直线与参考面平行时，扬声器的旋转方向所在直线与参考面之间的夹角为0°。还需要说明的是，如果扬声器的位置信息中的距离信息属于第三距离信息，则可不对扬声器的位置信息中的角度信息进行区分，即认为均属于同一训练角度信息。另需要说明的是，n的具体数值大小可根据实际情况进行设定，在此不作具体限定。示例性的，如4≤n≤24。

基于上述，扬声器的位置信息可作如下理解：扬声器的位置信息可以为扬声器的距离信息和扬声器的角度信息形成的组合。示例性的，如扬声器的位置信息可以为第一距离信息和第一角度信息形成的组合。此外，扬声器的位置信息可以表示为ai、bi或c。

需要说明的是，扬声器的位置信息是在确定当前声学特征信号后，基于预先建立的声学特征信号与位置的对应关系得到的，扬声器的位置信息是扬声器的距离信息和扬声器的角度信息的一个组合。

还需要说明的是，在确定扬声器的位置信息后，可以根据位置信息选择合适的播放模式。

本实施例的技术方案，通过获取当前录制信号，当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到，确定当前录制信号对应的当前声学特征信号，根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息，上述通过基于声学特征信号与扬声器位置的对应关系，实现了确定扬声器的位置信息。

可选的，在上述技术方案的基础上，确定当前录制信号对应的当前声学特征信号，具体可以包括：传声器的个数为至少两个，计算每个传声器的当前录制信号对应的房间脉冲响应信号。从房间脉冲响应信号中提取对应的当前声学特征信号。

在本发明的实施例中，房间脉冲响应信号可作如下理解：通常，表示由声源到传声器传播过程的声学信道由声脉冲响应描述，对于封闭环境而言(如房间)，则称为房间脉冲响应。房间脉冲响应信号是一个由声源位置(即扬声器位置)发出到传声器位置的脉冲响应信号，它反映了封闭环境的声学环境的所有声学特性。房间脉冲响应信号通常可以分为三部分：直达声、前期反射和后期反射(或称后期混响)，房间脉冲响应前期反射部分的各个脉冲之间具有较明显的时间延迟，随时间呈现分立排列，而后期反射部分则在时间上呈现较为密集的连续分布。

可以在扬声器的顶部设置传声器，传声器的个数可以为至少两个。每个传声器将同步录制扬声器发出的当前测试信号，得到对应的当前录制信号。确定当前录制信号对应的当前声学特征信号，可作如下理解：对于每个传声器，计算其得到的当前录制信号对应的房间脉冲响应信号，从房间脉冲响应信号中提取对应的当前声学特征信号，当前声学特征信号可以为积分声能值。

可选的，在上述技术方案的基础上，从房间脉冲响应信号中提取对应的当前声学特征信号，具体可以包括：将房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，将积分声能值作为当前声学特征信号。

在本发明的实施例中，对于每个传声器，计算该传声器的当前录制信号对应的房间脉冲响应信号，将该房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，即从该起始时刻开始，每隔预设时间间隔阈值计算预设时间段内的积分声能值，将积分声能值作为当前声学特征信号。可以理解到，对于每个房间脉冲响应信号，将得到至少一个积分声能值，具体积分声能值的个数可以根据实际情况进行设定，在此不作具体限定。此外，预设间隔时间段、预设时间间隔阈值和预设时间段的具体数值也可根据实际情况进行设定，在此不作具体限定。具体的：第g个传声器的房间脉冲响应信号用rirg(t)表示，起始时刻用t0表示，预设时间间隔段用δt表示，传声器的个数用r表示，积分声能值的个数用s表示，则第g个传声器的房间脉冲响应信号rirg(t)对应的第l个积分声能值可表示如下：其中，g＝1，2，......，r，l＝1，2，......，s。示例性的，如积分声能值的个数为s＝11，预设时间间隔段为δt＝0.27ms，即每隔0.27ms，计算0.27ms内的积分声能值，得到11个积分声能值。如图2所示，给出了一种从房间脉冲响应信号中提取对应的积分声能值的示意图。

需要说明的是，为了使积分声能值可以不受扬声器响度和传声器灵敏度的影响，可对各积分声能值进行归一化处理，归一化的参考基准值可以为某个传声器的某个积分声能值。具体的：归一化的参考基准值可以为第h个传声器的第z个积分声能值，则第g个传声器的房间脉冲响应信号rirg(t)对应的第l个积分声能值可用如下公式表示：其中，g＝1，2，......，r，l＝1，2，......，s。示例性的，如h＝1，z＝1，则第g个传声器的房间脉冲响应信号rirg(t)对应的第l个积分声能值可用如下公式表示：

可选的，在上述技术方案的基础上，声学特征信号与位置的对应关系可以通过扬声器位置确定模型得到。

在本发明的实施例中，声学特征信号与位置的对应关系可以通过扬声器位置确定模型得到，扬声器位置确定模型基于分类器模型训练生成。扬声器位置确定模型可以基于分类器模型训练生成的原因在于：由于扬声器的位置信息具体可以包括扬声器的距离信息和扬声器的角度信息，其中，扬声器的距离信息和扬声器的角度信息均可以划分为多类，相应的，扬声器的位置信息也可以划分为多类，而扬声器的位置信息不同时，获取到的声学特征信号也将不同，基于上述，上述声学特征信号与位置的对应关系可理解为一种多分类问题，而分类器模型可用于解决分类问题，因此，可基于分类器模型训练生成扬声器位置确定模型，扬声器位置确定模型可以确定声学特征信号与位置的对应关系。

分类器模型可以如前文所述的支持向量机、决策树、随机森林、逻辑回归、线性回归和神经网络等，具体可根据实际情况进行选择，在此不作具体限定。

可选的，在上述技术方案的基础上，获取当前录制信号之前，具体还可以包括：获取训练录制信号和对应的扬声器的训练位置信息，训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到。确定训练录制信号对应的训练声学特征信号。将训练声学特征信号作为输入变量，对应的训练位置信息作为输出变量，训练分类器模型，将训练后的分类器模型组为扬声器位置确定模型。

在本发明的实施例中，可以通过如下方式训练扬声器位置确定模型：获取两组或两组以上的训练样本，每组训练样本可以包括训练录制信号和对应的扬声器的训练位置信息，其中，训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到。可通过如下方式得到上述两组或两组以上的训练样本：在扬声器的顶部设置至少两个传声器，将扬声器放置在某个房间的某个位置，并确定该扬声器的训练位置信息，该扬声器在该位置发出训练测试信号，各传声器同步录制该训练测试信号，得到对应的训练录制信号，上述训练录制信号和对应的扬声器的训练位置信息组成一组训练样本，改变扬声器的位置信息，并重复上述获得训练录制信号和对应的扬声器的训练位置信息的过程，以得到其它组训练样本。这里可以通过如下方式改变扬声器的训练位置信息：将扬声器放置在某个房间的某一位置，确定扬声器的训练位置信息，即确定扬声器的训练距离信息和扬声器的训练角度信息，保持扬声器的训练距离信息不变，每旋转一次扬声器，便确定一次扬声器的训练角度信息，得到多个扬声器的训练位置信息，再改变扬声器的训练距离信息，重复上述过程，也将得到多个扬声器的训练位置信息，上述多个扬声器的训练位置信息对应同一房间。之后，还可以将扬声器放置于其它房间，重复上述过程，以得到对应房间的多个扬声器的训练位置信息。当然可以理解到，在每个扬声器的训练位置信息情况下，都将获取对应的训练录制信号。需要说明的是，上述所述的每组训练样本中训练录制信号的个数与传声器的个数相同，即有多少个传声器同步录制扬声器发出的训练测试信号，则该组训练样本中便有同样个数的训练录制信号。换句话说，每组训练样本包括至少一个训练录制信号，和与上述训练录制信号对应的一个扬声器的训练位置信息，即每组训练样本中不同训练录制信号的训练位置信息相同。示例性的，如传声器的个数为4个，则每组训练样本中将包括4个训练录制信号，该4个训练录制信号对应同一个训练位置信息，上述4个训练录制信号和与4个训练录制信号对应的同一个训练位置信息组成一组训练样本。

对于训练测试信号来说，训练测试信号的信号类型同样可以为最大长度序列信号，相应的，训练录制信号的信号类型便为最大长度序列信号。确定训练录制信号对应的训练声学特征信号，可作如下理解：对于每组训练样本中每个训练录制信号，计算该训练录制信号对应的训练房间脉冲响应信号，将该训练房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，将该积分声能值作为对应的训练声学特征信号。可以理解到，每个训练房间脉冲响应信号可能对应多个积分声能值。

将训练声学特征信号作为输入变量，对应的训练位置信息作为输出变量，训练分类器模型，将训练后的分类器模型作为扬声器位置确定模型，可作如下理解：分类器模型可以包括支持向量机、决策树、随机树、逻辑回归、线性回归和神经网络等。需要说明的是，分类器模型具体可以根据实际情况进行设定，在此不作具体限定。下面以支持向量机和神经网络为例进行进一步说明。

支持向量机在处理多分类问题时，需要构造合适的多分类器。通常构造多分类器的方法有如下两种：方法一、直接法，即将多个分类面的参数求解直接合并到一个最优问题中，然后通过求解该最优问题一次性实现多分类；方法二、间接法，主要是通过对多个两类分类器的组合来实现多类分类器的构造，常见的方法有“一对一”和“一对多”。“一对一”的方法将多分类问题拆解为多个两分类问题，如对于k类问题，可构造k(k-1)/2组二元分类器，将每组分类器的待分类训练样本标记为正负两类，然后进行训练。“一对多”的方法，无需向“一对一”的方法那样构造很多分类器，对于k类问题只需要组合k组分类器即可，在训练分类器时，通过构造第k类训练样本标记为正类，将其它训练样本标记为负类。

基于神经网络训练生成扬声器位置确定模型，可作如下理解：获取训练录制信号和对应的扬声器的训练位置信息，训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到，确定训练录制信号对应的训练声学特征信号，将训练声学特征信号输入神经网络，得到对应的扬声器的预测位置信息，根据扬声器的预测位置信息和扬声器的训练位置信息，得到神经网络的损失函数，根据损失函数的输出值调整神经网络的网络参数，直至损失函数的输出值小于等于预设阈值，则确定神经网络已训练完成，同时，神经网络的网络参数得以确定，将训练完成的神经网络作为扬声器位置确定模型。

可选的，在上述技术方案的基础上，扬声器的训练位置信息包括扬声器的训练距离信息和扬声器的训练角度信息，扬声器的训练距离信息由扬声器距房间的各墙面的距离大小确定，扬声器的训练角度信息由扬声器的旋转方向所在直线与参考面之间的夹角确定。

在本发明的实施例中，扬声器的训练位置信息可以包括扬声器的训练距离信息和扬声器的训练角度信息，其中，扬声器的训练位置信息可以由扬声器距房间的各墙面的距离大小确定，扬声器的训练角度信息可以由扬声器的旋转方向所在直线与参考面之间的夹角确定。

扬声器的训练位置信息可以由扬声器距房间的各墙面的距离大小确定，可作如下理解：通过扬声器距房间的各墙面的距离大小，将扬声器的训练距离信息进行划分，使得扬声器的训练距离信息可以分为几类。示例性的，如果扬声器距房间的两个墙面的距离相比于距该房间的其它两个墙面的距离近，且距相对两个墙面的远距离与近距离之比与1的差值大于第一预设距离阈值，则扬声器的训练距离信息属于第一训练距离信息；如果扬声器距房间的一个墙面的距离相比于该房间的其它三个墙面的距离近，且距与房间的距离近的墙面的相对墙面的远距离与距房间的距离近的墙面的近距离之比与1的差值大于第一预设距离阈值，则扬声器的训练距离信息属于第二训练距离信息；如果扬声器距相对两个墙面的远距离与近距离之比与1的差值小于第二预设距离阈值，则扬声器的训练距离信息属于第三训练距离信息，第一预设距离阈值大于等于1，第二预设距离阈值小于1。基于上述，可以理解到，扬声器的训练距离信息可以分为三类，分别为第一训练距离信息、第二训练距离信息和第三训练距离信息，其中，第一训练距离信息可以用d表示，第二训练距离信息可以用e表示，第三训练距离信息可以用f表示。

扬声器的训练角度信息可由扬声器旋转方向所在直线与参考面之间的夹角确定，可作如下理解：扬声器可在房间内旋转，并可将扬声器的旋转方向所在直线与参考面之间的夹角划分为不同的训练角度区域，以逆时针旋转方向为正方向，每个训练角度区域属于同一训练角度信息，其中，参考面可以为距房间的各墙面中距离近的墙面。具体的：可将360°等分为m个角度区域，则第一训练角度区域(即第一训练角度信息)为第二训练角度区域(即第二训练角度信息)为第j训练角度区域(即第j训练角度信息)为第(m-1)训练角度区域(即第(m-1)训练角度信息)为第n训练角度区域(即第n训练角度信息)为其中，j＝1，2，......，m-1，m。基于上述，可以理解到，扬声器的训练角度信息可以分为m类，分别为第一训练角度信息、第二训练角度信息、……、第j训练角度信息、……、第(m-1)角度信息和第m角度信息。其中，训练角度信息可以用j表示。

需要说明的是，扬声器的旋转方向所在直线与参考面平行时，扬声器的旋转方向所在直线与参考面之间的夹角为0°。还需要说明的是，如果扬声器的训练位置信息中的训练距离信息属于第三训练距离信息，则可不对扬声器的训练位置信息中的训练角度信息进行区分，即认为均属于同一训练角度信息。另需要说明的是，m的具体数值大小可根据实际情况进行设定，在此不作具体限定。示例性的，如4≤m≤24。

基于上述，扬声器的训练位置信息可作如下理解：扬声器的训练位置信息可以为扬声器的训练距离信息和扬声器的训练角度信息形成的组合。示例性的，如扬声器的训练位置信息可以为第一训练距离信息和第一训练角度信息形成的组合。此外，扬声器的训练位置信息可以表示为dj、ej或f。

需要说明的是，为了使各积分声能值可以不受扬声器响度和传声器灵敏度的影响，同时使得训练得到的扬声器位置确定模型具有更好的适用性，可对积分声能值进行归一化处理，归一化的参考基准值可以为某个传声器的某个积分声能值。

可选的，在上述技术方案的基础上，扬声器的训练距离信息由扬声器距房间的各墙面的距离大小确定，具体可以包括：扬声器距房间的两个墙面的距离相比于距房间的其它两个墙面的距离近，且距相对两个墙面的远距离与近距离之比与1的差值大于第一预设距离阈值，第一预设阈值大于等于1，则扬声器的训练距离信息属于第一训练距离信息。扬声器距房间的一个墙面的距离相比于距房间的其它三个墙面的距离近，且距与房间的距离近的墙面的相对墙面的远距离与距房间的距离近的墙面的近距离之比与1的差值大于第一预设距离阈值，第一预设距离阈值大于等于1，则扬声器的训练距离信息属于第二训练距离信息。扬声器距相对两个墙面的远距离与近距离之比与1的差值小于第二预设距离阈值，第二预设阈值小于1，则扬声器的训练距离信息属于第三训练距离信息。

在本发明的实施例中，扬声器放置在某个房间，传声器位于扬声器的顶部，如果扬声器距该房间的两个墙面的距离相比于扬声器距该房间的其它两个墙面的距离近，且距相对两个墙面的远距离与近距离之比与1的差值大于第一预设距离阈值，则扬声器的训练距离信息属于第一训练距离信息。

如果扬声器距该房间的一个墙面的距离相比于扬声器距该房间的其它三个墙面的距离近，且距与房间的距离近的墙面的相对墙面的远距离与距房间的距离近的墙面的近距离之比与1的差值大于第一预设距离阈值，则扬声器的训练距离信息属于第二训练距离信息。

如果扬声器距相对两个墙面的远距离与近距离之比与1的差值小于第二预设距离阈值，则扬声器的训练距离信息属于第三训练距离信息，其中，第二预设距离阈值小于1。可以理解到，如果扬声器的训练距离信息属于第三训练距离信息，则可以说明扬声器距房间的各墙面的距离大小相近，即扬声器位于房间的中心。

需要说明的是，第一预设距离阈值大于等于1，第二预设距离阈值小于1，第一预设距离阈值和第二预设距离阈值的具体数值大小，可以根据根据实际情况进行设定，在此不作具体限定。

还需要说明的是，如果房间的某侧因开窗或开门而没有墙面，则可以认为扬声器距离该侧的距离无限远。

另需要说明的是，本发明实施例所述的扬声器可以为单个扬声器单元，也可以为由多个扬声器单元组成的环形阵列，具体可根据实际情况进行设定，在此不作具体限定。

为了更好的理解扬声器的训练位置信息如何确定，下面以具体示例进行说明。具体的：如图3所示，给出了一种扬声器和传声器的结构示意图，图3中扬声器为由六个独立的发生单元所组成的环形阵列，传声器的个数为四个，分分别为传声器1、传声器2、传声器3和传声器4，四个传声器位于扬声器的顶部，并对称分布。

如图4所示，给出了一种训练位置信息的示意图。图4中墙面1和墙面3(图4中未示出)为两个相对墙面，墙面2和墙面4(图4中未示出)为两个相对墙面。扬声器距离房间的墙面1和墙面2的距离相比于房间的其它两个墙面(即墙面3和墙面4)的距离近，并且距墙面3的距离与距墙面1的距离之比与1的差值大于第一预设距离阈值，第一预设距离阈值为1，则扬声器的训练距离信息属于第一训练距离信息。同时，图4中参考面为墙面1，扬声器的旋转方向所在直线与参考面之间的夹角为j。基于上述，图4中扬声器的训练位置信息为dj。

如图5所示，给出了另一种训练位置的示意图。图5中墙面1和墙面3(图5中未示出)为两个相对墙面，墙面2(图5中未示出)和墙面4(图5中未示出)为两个相对墙面。扬声器距离房间的墙面1的距离相比于房间的其它三个墙面(即墙面2、墙面3和墙面4)的距离近，并且距墙面3的距离与距墙面1的距离之差大于第一预设距离阈值，第一预设距离阈值为1，则扬声器的训练距离信息属于第二训练距离信息。同时，图5中参考面为墙面1，扬声器的旋转方向所在直线与参考面之间的夹角为j。基于上述，图5中扬声器的训练位置信息为ej。

图6为本发明实施例提供的另一种扬声器位置确定方法的流程图，本实施例可适用于确定扬声器的位置信息的情况，该方法可以由扬声器位置确定装置来执行，该装置可以采用软件和/或硬件的方式实现，该装置可以配置于终端中，例如，智能音箱等。如图6所示，该方法具体包括如下步骤：

步骤210、获取训练录制信号和对应的扬声器的训练位置信息，训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到。

步骤220、确定训练录制信号对应的训练声学特征信号。

步骤230、将训练声学特征信号作为输入变量，对应的训练位置信息作为输出变量，训练分类器模型，将训练后的分类器模型作为扬声器位置确定模型。

步骤240、获取当前录制信号，当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到。

步骤250、传声器的个数为至少两个，计算每个传声器的当前录制信号对应的房间脉冲响应信号。

步骤260、将房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，将积分声能值作为当前声学特征信号。

步骤270、根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息，声学特征信号与位置的对应关系通过扬声器位置确定模型得到。

在本发明的实施例中，需要说明的是，为了使积分声能值可以不受扬声器响度以及传声器灵敏度的影响，可以对积分声能值进行归一化处理，归一化处理的参考基准值可以选择某个传声器的某个积分声能值。

为了更好的理解本发明实施例所提供的技术方案，下面以具体示例进行说明。具体的：将如图3所示的扬声器和传声器放置于某个房间某处，扬声器发出当前测试信号，四个传声器同步录制当前测试信号，得到对应的当前录制信号，当前测试信号和当前录制信号的信号类型均为最大长度序列信号。对于每个传声器，计算该传声器的当前录制信号对应的房间脉冲响应信号，将房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，从起始时刻开始，每隔0.27ms计算0.27ms时长的共计11个积分声能值，并将积分声能值作为当前声学特征信号。可以理解到，对于每个传声器来说，该传声器对应的当前声学特征信号的个数为11个。将四个传声器所对应的积分声能值作为输入变量输入扬声器位置确定模型，得到扬声器的位置信息，并确定扬声器的位置信息中扬声器的距离信息属于第一距离信息，以及，扬声器的角度信息为第一角度信息。如图7所示，给出了一种房间脉冲响应信号的示意图。图7中为四个传声器对应的房间脉冲响应信号，其中，横坐标为采样频率为44100hz对应的采样点数。如图8所示，给出了一种积分声能值的示意图。图8为四个传声器对应的积分声能值，每个传感器对应的积分声能值的个数为11个。

图9为本发明实施例提供的一种扬声器位置确定装置的结构示意图，本实施例可适用于确定扬声器的位置信息的情况，该装置可以采用软件和/或硬件的方式实现，该装置可以配置于终端中，例如，智能音箱。如图9所示，该装置具体包括：

当前录制信号获取模块310，用于获取当前录制信号，当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到。

当前声学特征信号确定模块320，用于确定当前录制信号对应的当前声学特征信号。

扬声器的位置信息确定模块330，用于根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息。

在本发明的实施例中，需要说明的是，扬声器位置确定装置可以与扬声器和传声器集成于同一终端，如智能音箱。扬声器位置确定装置还可以与扬声器和传声器位于不同终端，具体可根据实际情况进行设定，在此不作具体限定。

可选的，在上述技术方案的基础上，当前声学特征信号确定模块320，具体可以包括：

房间脉冲响应信号确定子模块，用于传声器的个数为至少两个，计算每个传声器的当前录制信号对应的房间脉冲响应信号。

当前声学特征信号确定子模块，用于从房间脉冲响应信号中提取对应的当前声学特征信号。

可选的，在上述技术方案的基础上，当前声学特征信号确定子模块，具体可以包括：

当前声学特征信号确定单元，用于将房间脉冲响应信号中最大绝对幅值对应的时刻作为起始时刻，计算预设间隔时间段内的积分声能值，将积分声能值作为当前声学特征信号。

可选的，在上述技术方案的基础上，声学特征信号与位置的对应关系通过扬声器位置确定模型得到。

可选的，在上述技术方案的基础上，该装置具体还可以包括：

训练录制信号和训练位置信息获取模块，用于获取训练录制信号和对应的扬声器的训练位置信息，训练录制信号为传声器对扬声器在对应的训练位置上发出的训练测试信号同步录制得到。

训练声学特征信号确定模块，用于确定训练录制信号对应的训练声学特征信号。

扬声器位置确定模型生成模块，用于将训练声学特征信号作为输入变量，对应的训练位置信息作为输出变量，训练分类器模型，将训练后的分类器模型作为扬声器位置确定模型。

可选的，在上述技术方案的基础上，扬声器的训练位置信息具体可以包括扬声器的训练距离信息和扬声器的训练角度信息，扬声器的训练距离信息由扬声器距房间的各墙面的距离大小确定，扬声器的训练角度信息由扬声器的旋转方向所在直线与参考面之间的夹角确定。

可选的，在上述技术方案的基础上，扬声器的训练距离信息由扬声器距房间的各墙面的距离大小确定，具体可以包括：

扬声器距房间的两个墙面的距离相比于距房间的其它两个墙面的距离近，且距相对两个墙面的远距离与近距离之比与1的差值大于第一预设距离阈值，第一预设阈值大于等于1，则扬声器的训练距离信息属于第一训练距离信息。

扬声器距房间的一个墙面的距离相比于距房间的其它三个墙面的距离近，且距与房间的距离近的墙面的相对墙面的远距离与距房间的距离近的墙面的近距离之比与1的差值大于第一预设距离阈值，第一预设距离阈值大于等于1，则扬声器的训练距离信息属于第二训练距离信息。

扬声器距相对两个墙面的远距离与近距离之比与1的差值小于第二预设距离阈值，第二预设阈值小于1，则扬声器的训练距离信息属于第三训练距离信息。

本发明实施例所提供的扬声器位置确定装置可执行本发明任意实施例所提供的扬声器位置确定方法，具备执行方法相应的功能模块和有益效果。

图10为本发明实施例提供的一种终端的结构示意图。图10显示的终端仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。如图10所示，本发明实施例提供的终端，包括处理器41、存储器42、输入装置43、输出装置44、扬声器45和传声器46；终端中处理器41的数量可以是一个或多个，图10中以一个处理器41为例；终端中的处理器41、存储器42、输入装置43、输出装置44、扬声器45和传声器46可以通过总线或其他方式连接，图10中以通过总线连接为例。

存储器42作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的终端显示方法对应的程序指令/模块(例如，使用扬声器位置确定装置中的当前录制信号获取模块310、当前声学特征信号确定模块320和扬声器的位置信息确定模块330)。处理器41通过运行存储在存储器42中的软件程序、指令以及模块，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的应用于终端的扬声器位置确定方法。

存储器42可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器42可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器42可进一步包括相对于处理器41远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置43可用于接收用户输入的数字或字符信息，以产生与终端的用户设置以及功能控制有关的键信号输入。输出装置44可包括显示屏等显示终端。

扬声器45，用于发出测试信号。

传声器46，用于同步录制测试信号，得到录制信号。

当然，本领域技术人员可以理解，处理器还可以实现本发明任意实施例所提供应用于终端的扬声器位置确定方法的技术方案。该终端的硬件结构以及功能可参见实施例的内容解释。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例所提供的一种扬声器位置确定方法，该方法包括：

获取当前录制信号，当前录制信号为传声器对扬声器发出的当前测试信号同步录制得到。

确定当前录制信号对应的当前声学特征信号。

根据当前声学特征信号、声学特征信号与位置的对应关系，确定扬声器的位置信息。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(randomaccessmemory，ram)、只读存储器(read-onlymemory，rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory，eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(computerdiscread-onlymemory，cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、射频等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——局域网(localareanetwork，lan)或广域网(wideareanetwork，wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

当然，本发明实施例所提供的一种计算机可读存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的终端的扬声器位置确定方法中的相关操作。对存储介质的介绍可参见实施例中的内容解释。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄坤朋;谢守华
技术所有人：国光电器股份有限公司;广州市国光电子科技有限公司;梧州国光科技发展有限公司
我是此专利的发明人

上一篇：一种丙二酸盐克罗诺杆菌CRISPR分型方法与流程
上一篇：一种炒货快速冷却设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。