语音干扰滤除的方法、电子装置及计算机可读存储介质与流程

文档序号：16236777发布日期：2018-12-11 22:41阅读：199来源：国知局

本发明涉及语音处理
技术领域：
，尤其是涉及一种语音干扰滤除的方法、电子装置及计算机可读存储介质。
背景技术：
随着科技的发展，具有播放功能的电子装置(如智能电视、电脑、手机等)因具备丰富的功能与复杂的选项，传统的控制方法(如遥控器控制、触摸控制、键鼠控制)已不足以带来便捷的控制与直觉式使用者体验，因此多数产品开始导入语音控制。然而，使用者在利用所述电子装置播放电影或音乐时，若想要通过语音控制所述电子装置，则必须关闭正在播放的电影或音乐，否则使用者所发出的控制语音容易受到所述电子装置所产生的音源干扰，其控制语音无法被所述电子装置精确识别，降低了使用者语音控制的控制效率和准确率。技术实现要素：鉴于以上内容，有必要提供一种语音干扰滤除的方法、电子装置及计算机可读存储介质，可以让使用者所发出的控制语音不会受到所述电子装置输出的音源干扰，使得控制语音被所述电子装置精确识别，提高了使用者语音控制的控制效率。本发明实施方式提供一种语音干扰滤除的方法，包括步骤：通过所述音频采集单元获取外部环境中的第一音频信号，所述第一音频信号中包括用户语音信号；获取所述音频输出单元输出的第二音频信号；过滤所述第一音频信号中的语音音区以得到第一背景音频信号，过滤所述第二音频信号中的语音音区以得到第二背景音频信号；通过对比所述第一背景音频信号和所述第二背景音频信号，得到所述第一音频信号和所述第二音频信号之间的时间差t和扩音参数x；依据所述时间差t及所述扩音参数x，对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号；合成所述第一音频信号与所述第三音频信号，得到与所述用户语音信号接近的第四音频信号。本发明实施方式还提供一种电子装置，所述电子装置包括存储器、处理器、音频采集单元、音频输出单元及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如所述语音干扰滤除的方法的步骤。进一步地，本发明实施方式还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如所述语音干扰滤除的方法的步骤。相较于现有技术，所述的语音干扰滤除的方法、电子装置及计算机可读存储介质，能够使得使用者的控制语音被所述电子装置精确识别，提高了使用者语音控制的控制效率。附图说明图1是本发明实施例之电子装置的架构图。图2是本发明实施例之语音干扰滤除系统的程序模块图。图3是本发明实施例之语音干扰滤除方法的步骤流程图。主要元件符号说明电子装置2语音干扰滤除系统10存储器20处理器30音频采集单元40音频输出单元50获取模块100过滤模块200对比模块300修改模块400合成模块500如下具体实施方式将结合上述附图进一步说明本发明。具体实施方式参阅图1所示，是本发明实施例之电子装置2的架构图。在本实施例中，所述电子装置2中包括语音干扰滤除系统10、存储器20、处理器30、音频采集单元40及音频输出单元50。所述电子装置2可以是智能家电、智能手机、电脑等。其中，所述存储器20至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。所述处理器30可以是中央处理器(centralprocessingunit，cpu)、控制器、微控制器、微处理器、或其他数据处理芯片等。参阅图2所示，是所述语音干扰滤除系统10的程序模块图。所述语音干扰滤除系统10包括获取模块100、过滤模块200、对比模块300、修改模块400以及合成模块500。所述模块被配置成由一个或多个处理器(本实施例为处理器30)执行，以完成本发明。本发明所称的模块是完成特定功能的计算机程序段。所述存储器20用于存储所述语音干扰滤除系统10的程序代码等资料。所述处理器30用于执行所述存储器20中存储的程序代码。所述获取模块100用于通过所述音频采集单元40获取外部环境中的第一音频信号，所述第一音频信号中包括用户语音信号。所述获取模块100还用于获取所述音频输出单元50输出的第二音频信号。在本实施例中，所述第二音频信号是从所述电子装置2内部获取，而不是在所述音频输出单元50输出时从外部采集。所述过滤模块200用于过滤所述第一音频信号中的语音音区以得到第一背景音频信号，过滤所述第二音频信号中的语音音区以得到第二背景音频信号。在本实施例中，所述语音音区是指人类正常声音频率对应的音区，例如80-1000hz音区。所述对比模块300用于对比所述第一背景音频信号和所述第二背景音频信号，得到所述第一音频信号和所述第二音频信号之间的时间差t和扩音参数x。在本实施例中，所述对比模块300取样所述第一背景音频信号以提取所述第一背景音频信号中多个取样点的第一特征值序列，及取样所述第二背景音频信号以提取所述第二背景音频信号中多个取样点的第二特征值序列。其中，计算所述第一特征值序列与所述第二特征值序列的方法包括：设定一固定区间作为计算能量值的时间区间，区间长度为t。在所述第一背景音频信号与所述第二背景音频信号的相同时间点，以所述区间长度t设置连续n个所述固定区间。在本实施例中，以n＝10为例。计算所述第一背景音频信号中设置的10个固定区间的能量值，得到第一区间能量序列，记为e1[10]＝{e11，e12，…，e110}。依据各固定区间内音频信号的振幅大小为该固定区间计算一对应的能量值，其中，e11为第一个固定区间的能量值、e12为第二个固定区间的能量值，以此类推。同样地，计算所述第二背景音频信号中设置的10个固定区间的能量值，得到第二区间能量序列，记为e2[10]＝{e21，e22，…，e210}。其中，e21为第一个固定区间的能量值、e22为第二个固定区间的能量值，以此类推。针对所述第一背景音频信号和所述第二背景音频信号，依序将每一固定区间的能量值与后一固定区间的能量值进行比较，得到多个特征值。特征值的计算公式如下：其中，em为第m个所述固定区间的能量值。根据所述第一区间能量序列计算得到多个特征值，以取得第一特征值序列。在本实施例中，所述第一特征值序列记为c1[9]。根据所述第二区间能量序列计算得到多个特征值，以取得第二特征值序列。在本实施例中，所述第二特征值序列记为c2[9]。所述对比模块300还用于对比所述第一特征值序列c1[9]与所述第二特征值序列c2[9]，得到一数值k，使得c1m+k＝c2m。例如，若c1[9]＝{0，1，0，-1，1，1，1，0，0}，c2[9]＝{0，-1，1，1，1，0，0，1，0}，可以看出c13＝c21＝0、c14＝c22＝-1、…、c19＝c27＝0，此时所述数值k为2。所述时间差t等于所述区间长度t与所述数值k的乘积。所述对比模块300还用于根据所述数值k计算所述扩音参数x。计算所述扩音参数x的公式如下:其中，e1n为所述第一背景音频信号中第n个所述固定区间的能量值，e2n为所述第二背景音频信号中第n个所述固定区间的能量值。例如：e110＝{3.7，3.8，6.0，5.9，3.8，5.0，5.6，6.5，7.1，7.4}，e210＝{5.0，4.9，3.2，4.2，4.7，5.4，5.9，6.2，6.8，7.3}，当k＝2时，此时，所述扩音参数x＝1.1971。所述修改模块400用于依据所述时间差t及所述扩音参数x，对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号。公式如下：s3(t)＝-xs2(t-t)其中，s3(t)为所述第三音频信号，s2(t)为所述第二音频信号。所述合成模块500用于合成所述第一音频信号与所述第三音频信号，得到与所述用户语音信号接近的第四音频信号。s4(t)＝s1(t)+s3(t)其中，s4(t)为所述第四音频信号，s1(t)为所述第一音频信号，s3(t)为所述第三音频信号。在本实施例中，所述第四音频信号为已经消除背景噪声的用户控制语音，可以直接输入至所述电子装置2语音辨识系统进行辨识进而控制所述电子装置2。参阅图3所示，是本发明实施例之语音干扰滤除的方法的步骤流程图。所述语音干扰滤除的方法应用于所述电子装置2中，通过处理器30执行存储器20中存储的程序代码实现。步骤s302，通过所述音频采集单元40获取外部环境中的第一音频信号，所述第一音频信号中包括用户语音信号。步骤s304，获取所述音频输出单元50输出的第二音频信号。步骤s306，过滤所述第一音频信号中的语音音区以得到第一背景音频信号，过滤所述第二音频信号中的语音音区以得到第二背景音频信号。步骤s308，通过对比所述第一背景音频信号和所述第二背景音频信号，得到所述第一音频信号和所述第二音频信号之间的时间差t和扩音参数x。步骤s310，依据所述时间差t及所述扩音参数x，对所述第二音频信号进行时间补偿、放大和反相操作以得到第三音频信号。步骤s312，合成所述第一音频信号与所述第三音频信号，得到与所述用户语音信号接近的第四音频信号。以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林燕星
技术所有人：南宁富桂精密工业有限公司
我是此专利的发明人