话音增强方法及其装置的制造方法_4

文档序号：9693331阅读：来源：国知局

通过设置仅当通过使用相机信息识别出脸部时才执行预处理操作的条件，可以进一步增加话音检测效率。因而，图8的用于可穿戴设备的话音增强装置20具有与具有框结构的图2的话音增强装置20的几乎相同的结构。在图8的可穿戴设备的例子中，麦克风可以位于标记为?的位置处。例如，麦克风可以被放置在可穿戴设备的左上端和右下端。然而，麦克风的位置和数量不限于此，并且麦克风可以被放置在其它各种位置处。
[0092]用于可穿戴设备的话音增强装置20的方向估计单元23通过使用相机图像信息来通知是否识别出脸部。接下来，如果识别出脸部，则话音检测单元22和话音增强单元24操作。如果没有识别出脸部，则话音检测单元22和话音增强单元24不操作。如果可穿戴设备具有单一麦克风，贝方向估计单元23的方向信息τ不被发送给话音增强单元24。
[0093]图9示出根据实施例的用于耳机或助听器的话音增强装置10。
[0094]当用户说话时，通过空气而且通过例如用户的头骨来发送话音。对于直接戴在用户的头上的耳机或者直接戴在用户的耳中的助听器，可以检测经由用户的头骨发送的骨传导。因而，除了话音信息之外，用于耳机或助听器的话音增强装置的话音检测单元12可以通过使用骨传导传感器信息来检测话音。
[0095]本发明构思涉及一种搜索在用户说话时刻的说话者方向来增强话音的方法，其中该方法是一种通过区分话音部分和非话音部分来高效地操作并且确保高性能的话音增强方法。根据本发明构思，除了移动电话之外，话音增强方法也可以应用于TV、平板或助听器。特别是，诸如手表、指环或眼镜的身体附着型计算设备(可穿戴计算机或可穿戴设备)正在受到关注并且以产品形式出现在工业上，并且如果所述方法与这些设备结合，则该方法可以贡献为高效的低功率算法。
[0096]本发明构思也可以被具体化为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可以存储在之后可以被计算机系统读取的数据的任何记录设备。
[0097]计算机可读记录介质的示例包括只读存储器(R0M)、随机存取存储器(RAM)、⑶-R0M、磁带、软盘、光数据存储器件等(诸如通过互联网的数据传输)。计算机可读记录介质也可以分布在网络耦合的计算机系统上，以便计算机可读代码在分布式方式被存储和运行。此外，用于完成本发明构思的功能程序、代码和代码段可以被本发明构思所属的领域中熟练的程序员所容易地解释。
[0098]虽然已经参照其实施例示出和描述了此发明构思，但是本领域普通技术人员将理解，可以在此进行形式和细节上的各种改变而不脱离如所附权利要求定义的本发明构思的精神和范围。优选实施例应该仅被认为是描述性意义，而不是为了限制的目的。因此，本发明构思的范围不是由本发明构思的详细描述来定义，而是由所附权利要求来定义，并且该范围之内的所有差异将被解释为被包括在本发明构思中。
【主权项】
1.一种话音增强装置，包括: 传感器单元，包括至少一个麦克风；话音检测单元，用于通过使用传感器单元的信号来检测说话者的话音；方向估计单元，用于通过使用传感器单元的信号来估计说话者的方向，并且生成指示所估计的方向的方向信息；以及话音增强单元，用于增强输入到麦克风的说话者的话音，其中话音检测单元基于检测话音的结果来控制方向估计单元和话音增强单元的操作，并且方向估计单元向话音增强单元发送方向信息。2.—种话音增强装置，包括: 传感器单元，包括至少一个麦克风；话音检测单元，用于通过使用传感器单元的信号来检测说话者的话音；方向估计单元，用于通过使用传感器单元的信号来估计说话者的方向，并且生成指示所估计的方向的方向信息；以及话音增强单元，用于增强输入到麦克风的说话者的话音，其中方向估计单元基于估计方向的结果来控制话音检测单元的操作，并且向话音增强单元发送方向信息，并且话音检测单元基于检测话音的结果来控制话音增强单元的操作。3.如权利要求1或2所述的话音增强装置，其中传感器单元包括麦克风、相机和骨传导传感器中的至少一个，其中话音检测单元通过使用麦克风的信号来检测是否存在话音成分，通过使用相机的信号来检测说话者的嘴唇的运动，通过使用骨传导传感器的信号来检测说话者是否已经说话，或者通过组合麦克风、相机和骨传导传感器中的至少两个来检测话音。4.如权利要求1或2所述的话音增强装置，其中传感器单元包括从至少两个麦克风和相机中选择的至少一个，并且其中方向估计单元通过使用所述至少两个麦克风的信号之间的差或者通过使用相机的信号来识别说话者的脸部或者检测说话者的嘴唇的运动，来估计方向。5.如权利要求1或2所述的话音增强装置，其中话音增强单元包括至少一个滤波器，并且当话音检测单元检测到话音时，更新所述至少一个滤波器的因子，并且如果话音检测单元没有检测到话音，则估计用于噪声建模的噪声。6.如权利要求1或2所述的话音增强装置，其中话音增强单元使用从方向估计单元接收的方向信息来执行以下操作的至少一个:对期望的信号源到达每个麦克风的时间的调整、对麦克风之间的偏差的纠正以及对信号源的分离。7.如权利要求1或2所述的话音增强装置，其中传感器单元包括麦克风、相机、骨传导传感器、接近传感器、红外传感器、加速度传感器和超声波传感器中的至少一个。8.如权利要求1所述的话音增强装置，其中基于检测话音的结果来控制打开和关闭方向估计单元。9.如权利要求2所述的话音增强装置，其中基于估计方向的结果来控制打开或关闭话音检测单元。10.—种话音增强方法，包括: 检测说话者的话首；基于检测话音的结果，通过使用输入信号来估计说话者的方向，并且生成指示所估计的方向的方向信息；以及基于检测话音的结果，通过使用估计方向的方向信息来增强说话者的话音。11.一种话音增强方法，包括: 通过使用输入信号来估计说话者的方向并且生成指示所估计的方向的方向信息；基于估计方向的结果来检测说话者的话音；以及基于检测话音的结果，通过使用所估计的方向的方向信息来增强说话者的话音。12.如权利要求10或11所述的话音增强方法，其中输入信号是来自麦克风、相机、骨传导传感器、接近传感器、红外传感器、加速度传感器和超声波传感器中的至少一个的信号。13.如权利要求10所述的话音增强方法，其中基于在话音的检测中是否检测到话音来确定是否发起方向的估计中的方向估计。14.如权利要求11所述的话音增强方法，其中基于在方向的估计中是否估计到方向来确定是否发起话音的检测中的话音检测。15.—种计算机可读记录介质，在其上具体化有用于运行权利要求10或11的话音增强方法的程序。
【专利摘要】一种话音增强方法，包括：通过使用输入信号来估计说话者的方向，生成指示所估计的方向的方向信息；基于估计方向的结果来检测说话者的话音，以及基于检测话音的结果，通过使用方向的估计的方向信息来增强说话者的话音。
【IPC分类】G10L21/0208
【公开号】CN105453174
【申请号】CN201480044082
【发明人】赵在衍, 崔玮玮, 李承烈
【申请人】三星电子株式会社
【公开日】2016年3月30日
【申请日】2014年5月30日
【公告号】EP3002753A1, US20160111113, WO2014196769A1

完整全部详细技术资料下载

当前第4页1 2 3 4