语音加强装置与应用于其上的方法

文档序号:2830698阅读:273来源:国知局
专利名称:语音加强装置与应用于其上的方法
技术领域
本发明涉及一种语音加强装置与应用于其上的方法,尤其涉及一种利用 语音强化技术和相关信号处理技术,而能对声音信号中的人声语音作出加强 效果的装置与方法。
背景技术
在一般的声音输出接口或输出效果的声音处理应用上,例如电影、电视、 计算机、音响的扩音器的声音输出,或是手机、电话、麦克风收音等的扩音 器声音输出,其输出的声音包含了有各种频率波段的声音波形,并包括了有 主要内容的对话人声、背景声、杂声或其它声音等,而对于某些声音的输出 为了要能改变其听觉上的效果,或是要特别加强出某些声音的重要性,便需 要对其声音信号进行进一步的音效处理。详细来说,也就是要在所要输出的声音效果上加强我们所特别需要强调 人声语音的内容,例如加强电影中的主角人物的对话频段,或是加强在电 话声音输出中的人声频段,以相对于某一环境或信号中其它重要性较为次之 的背景声或是杂声,能够有较为明显的对比和强调性的输出表现,以达到清 晰呈现和清楚地听力识别的目的,这是声音处理技术上很重要的一项技术和 议题。承上所述,此一人声语音加强或是语音强化(Speech Enhancement)的技 术,目前已有各方面惯用技术的使用和应用,如图1所示,为一惯用技术加 强特定频段的波形示意图,其中在该图上方的波形图为原始的声音输出波 形,其横轴表示为频率的大小,而纵轴则表示为波形输出的强弱,而在该图 下方的波形图则为经过处理的波形。由于一般人声的声音显示频率约在500 赫兹(Hz)到6K或7K赫兹(即6000到7000Hz)之间,所以若超过此范围的声 音频率则己非一般人声语音的频率范围,由此图所示, 一般加强人声语音的 技术为直接在其声音输出的频段中撷取出其中的lK到3K赫兹(Hz)的频段信号直接进行加强输出,或是可为经由一时域(Time Domain)的滤波器对信号 的某一特定频段进行带通的滤波处理而加强其输出,如此虽然能达到将所需 的人声语音频段部分进行强化的目的,但其中所存在的一些背景声或噪声等 非主要内容的声音则也会被一并加强,从而导致对比上的效果并不会特别明 显而清楚。部分的数字及模拟电视会采用此种方式或类似的处理方式来强化 其语音输出。另外,如图2所示,为另一惯用技术进行人声语音加强的系统运行示意 图,其中在处理上此技术是在频域(Frequency Domain)下对一单声道输入的声 音信号进行处理,并需要对信号所转换的频率取样比(Frequency Sample mte, 简称为FS mte)或所谓的取样频率进行数字处理,而一般常用的声音信号频 率取样比或取样频率包含有44.1K、 48K、 32K赫兹等,运算上便是将信号 以"快速傅立叶转换"(Fast Fourier Transform,简称为FFT)的方式撷取出整 体的频谱,再经由图中所示的语音加强运算10进行处理后而能对在频率领 域下特定分辨率的各取样值进行各种算法,以消减非主要的背景声频率、杂 声频率,或是加强所需要的人声语音频率等处理过程,而经由此处理过程所 能得到的结果可有占极大比例的人声语音频段输出,并再经由"反快速傅立 叶转换"(Inverse FFT,简称为IFFT)后转回时间域以进行声音输出。而上述的技术,包括该语音加强运算10等,已普遍运用在电话或手机 的声音输出上,且特别以GSM格式的手机为主要的功能应用对象;目前此 技术已知的处理模式或处理方法包含有频谱消减(Spectral Subtraction)逼近、 信号子空间(Signal Subspace)逼近、能量抑制信号子空间(Energy Constrained Signal Subspace)逼近、改进的频谱消减(Modified Spectral Subtraction)逼近、 线性预测留数方法(Linear Prediction Residual Method)等处理模式或方法;而 在诸如一般的立体声的声音输出上,大部分采用左右两声道分开处理的方式 来完成其语音强化的功能。以上述图1的方式,虽可不需进行费时的转换处理运算便可完成其语音 强化,但缺点在于所作的处理并不是非常明显与突出,无法有效地将人声与 其它声音作明显的区别强化或滤除。而其图2所使用的技术,则虽然能有效 地利用傅立叶转换的运算,从而能针对在频率领域下特定分辨率的各取样值 来撷取出人声频率或背景声频率,并进行对应所需的强化或滤除,然而,当此技术分别运用在左右两声道上的处理时,对于系统在运算的处理过程上会较为耗用其系统存储器(例如DRAM或SRAM)的资源,并且在从FFT以在 频率领域下提供该语音加强运算10作处理后,需再作IFFT后才能在时间域 下输出其处理结果,且此种由FFT再作IFFT的运算过程也会非常耗用系统 存储器的资源,并会占用处理器大量运算资源及效能。发明内容因此,如何解决此一惯用技术的问题,便成为本发明的主要目的。 本发明的目的在于提供一种语音加强装置与应用于其上的方法,能够利 用惯用的语音强化技术和相关的信号混合、低通滤波、降频与升频的处理技 术,而能对声音信号中的人声语音频段作出明显而清晰的加强效果,并能有 效地改善运算处理上的耗能和存储器资源耗用的问题。本发明为一种语音加强方法,应用于一语音加强装置上,该方法包含下列步骤接收一声音信号,该声音信号的取样频率为一第一频率;对该声音信号进行一降频处理,进而形成一降频声音信号,该降频声音信号的取样频率为一第二频率,该第二频率低于该第一频率;对该降频声音信号进行一语 音加强运算,进而形成一语音加强声音信号;以及对该语音加强声音信号进 行一升频处理,进而形成一升频声音信号,该升频声音信号的取样频率为该 第一频率。本发明另一方面为一种语音加强方法,应用于一语音加强装置上,该方 法包含下列步骤将一左声道声音信号和一右声道声音信号进行一第一信号 混合处理,进而形成一声音信号;对该声音信号进行一语音加强运算,进而 形成一语音加强声音信号;以及将该语音加强声音信号分别与该左声道声音 信号和该右声道声音信号进行一第二信号混合处理和一第三信号混合处理 后,进行信号输出。本发明另一方面为一种语音加强装置,该装置包含有 一降频器,用以 对取样频率为一第一频率的一声音信号进行一降频处理,进而形成一降频声 音信号,该降频声音信号的取样频率为一第二频率,该第二频率低于该第一 频率; 一语音加强运算器,信号连接于该降频器,用以对该降频声音信号进 行一语音加强运算,进而形成一语音加强声音信号;以及一升频器,信号连接于该语音加强运算器,用以对该语音加强声音信号进行一升频处理,进而 形成一升频声音信号,该升频声音信号的取样频率为该第一频率。本发明另一方面为一种语音加强装置,该装置包含有 一第一混合器, 用以将一左声道声音信号和一右声道声音信号进行一第一信号混合处理,进 而形成一声音信号; 一语音加强运算器,用以对该声音信号进行一语音加强 运算,进而形成一语音加强声音信号;以及一第二混合器和一第三混合器, 用以将该语音加强声音信号分别与该左声道声音信号和该右声道声音信号 进行一第二信号混合处理和一第三信号混合处理后,进行信号输出。


图1为一惯用技术加强特定频段的示意图。图2为另一惯用技术进行人声语音加强的系统运行示意图。图3为可运行出各种音效处理功能的多媒体播放装置的示意图。图4为本发明的语音加强装置30的示意图。图5为本发明第一优选实施例的流程图。图6为FIR形式的一半频段滤波器的示意图。图7(a)至图7(c)为升频处理的补进取样值与滤除高频部分的运行示意图。图8为本发明第二优选实施例的流程图。图9为一 IIR形式的串叠双二阶滤波器的示意图。其中,附图标记说明如下-10语音加强运算 20 音效数字信号处理器201~204 声音数字处理音效频道一 四 211-215信号输入 200多任务器23系统存储器30 语音加强装置301第一混合器302第二混合器303第三混合器311第一延迟器312第二延迟器32第一低通滤波器320'-3222 延迟器3200加法器33降频器34语音加强运算器35升频器36第二低通滤波器37增益器 VI 声音信号V2滤除高频声音信号 V3 降频声音信号 V4语音加强声音信号 V5 升频声音信号 V6语音加强与滤除高频声音信号 fl、 f2、 f3 曲线S0 S5、 S0, S4'、 S0" S4" 取样值具体实施方式
本发明通过下列附图及说明,以获得一更深入的了解如现有技术所述,在惯用技术中己有针对人声语音的频段进行强化的技 术,并已应用在具有声音播放功能的相关装置或设备上,例如电视、计算机、 手机等,而本发明的目的在于改善惯用技术中对于语音强化功能的运算过程 所会造成的耗能处理与系统存储器耗用的问题,另外本发明仍继续利用惯用的语音强化(SpeechEnhancement)技术中既有的语音加强运算功能,也就是经 由使用一语音加强运算模块或语音加强运算器,利用傅立叶转换的运算而能 在频道领域下对特定的频段进行加强或消减的功能,其目的除了在于能将人 声语音进行强化而能和其它背景声、杂声有明显而清晰的对比外,还能有效 地改善惯用技术的大量耗用处理器资源及效能与系统存储器资源耗用等问 题。请参阅图3,为一可运行出各种音效处理功能的多媒体播放装置的示意 图,该多媒体播放装置可为一数字电视机,使用者能够经由相关的使用者接 口或于一屏幕显示(On Screen Display(简称OSD))设定菜单上进行和声音显 示效果有关的设定控制或偏好调整。此装置主要是利用一音效数字信号处理 器20,来对多种声音信号进行数字处理,其声音信号输入可视该处理器20 所能处理的类型或格式而有不同数量的信号输入,如图标的声音信号输入 211-215可包含有由声音解码器(AudioDecoder)的信号输入、新力/飞利浦 数字接口(SONY/PHILIPS Digital Interface,简称SPDIF)格式的信号输入、高 分辨率多媒体接口 (High Definition Multimedia Interface ,简称HDMI)格式的 信号输入、芯片间声音(Inter-IC Sound,简称12S)格式的信号输入、模拟数字 转换(Analog Digital Change)格式的信号输入等。而一系统存储器23则能提供运算处理上的存储器资源。这些信号可为数字格式信号,或由模拟转换为数字格式后输入,并由一多任务器200输至其中的多种声音数字处理音效频道一 四201~204内进行 处理与输出。其中各音效频道依处理功能的不同可包含有音量控制(VolumeControl)、低音调整(Bass Adjustment)、高音调整(Treble Adjustment)、环绕 (Surround)、语音清晰(Superior Voice)等,而使用者控制或调整该设定菜单后 便能启动对应的音效处理功能,同理,该音效频道的数目为根据该处理器20 所能处理的功能而定。本发明的语音加强方法便可应用在上述的多媒体播放装置上,进一步来 说,本发明的方法与应用是将上述多种声音数字处理音效频道中和该语音清 晰(Superior Voice)功能有关的频道,也就是能进行其语音强化功能处理的频 道,加以改善其中的运算处理方式,从而能够使得使用者在将本发明所设计 的语音加强方法所对应的音效频道启动之后,便能得到人声明显而清晰的输 出效果。请参阅图4,为本发明的一语音加强装置30的优选实施例示意图。承上 所述,该语音加强装置30可应用于这些音效频道中和语音加强功能有关的 其中的一个频道与对应的输入构造中,且经本发明的该语音加强装置30处 理后的声音信号也可由该图3所示的构造加以输出。如图4所示,该语音加 强装置30主要设置了有三个混合器301-303、两个延迟器311 312、两个 低通滤波器(Low Pass Filter)32和36、 一降频器33、 一语音加强运算器34、 以及一升频器35,而在此图中也显示了各单元彼此间的信号连接关系。而首先,我们将所输入至该语音加强装置30中的一左声道声音信号和 一右声道声音信号(可为这些信号输入211~215中同时以左右二声道传送的 一信号输入)利用该第一混合器301进行一第一信号混合处理而形成一声音 信号VI ,而该声音信号VI便为本发明所要进行语音加强的运算处理对象。于此,相较于现有技术的将单声道输入的声音信号分别应用在左右两声 道上的处理,本发明能将运算过程上所可能耗用该系统存储器23(可为 DRAM或SRAM)的资源减少了一半,这是因为若对该左声道和右声道声音 信号个别进行运算处理时,该系统存储器23便需要分别对这两信号各提供 一部分的记忆空间以进行运算,且该处理器20于运算所需的运算效能也包括了对左声道和右声道声音信号的处理过程,但本发明只需对单一的该声音 信号VI进行运算处理即可,且该第一信号混合处理可为直接将该左声道和右声道声音信号相加后再除以2而成为该声音信号VI,因此其混合后仍具 有完整的信号内容。所以除了运算过程上的记忆资源的耗用或该处理器20 运算所需的运算效能等,便都仅为惯用技术的一半而已,因而能够有效解决 惯用技术的问题。另外,我们将所要作语音强化处理的信号降频,详细来说在不影响其声 音输出效果的条件下来减少待处理信号的取样频率,上述方法不但在降频后 于频段上仍包含人声语音的大部分能量,不会影响人声语音的品质,还能够 进一步地减少其运算量,而能大幅改善存储器及处理器运算效能耗用的问 题,其具体实施方式
说明如下。同时参阅图5,为本发明第一优选实施例的流程图,其中的步骤S11便 为上述的该第一信号混合处理的过程。而该左声道和右声道声音信号在进行 输入时,其频率取样比(FS rate)或所谓的取样频率为一第一频率,如现有技 术所述,针对语音强化的频率取样比可为44.1K、 48K、 32K赫兹(Hz)等,而 所产生的该声音信号V1也具有相同的该第一频率;而在此实施例中,我们 设计该左、右声道声音信号以及该声音信号VI具有的该第一频率,为在一 单位时间内具有n个取样值的取样频率。然而,步骤S12为本发明的降频处理流程,我们先对该声音信号V1进 行低通滤波处理,再作降频的处理。在此例中,我们利用该第一低通滤波器 32来对该声音信号VI进行一第一低通滤波处理,而形成一滤除高频声音信 号V2,且仅将该声音信号V1的高频部分滤除而未改变其取样频率,因此, 该滤除高频声音信号V2在单位时间内仍具有n个取样值。然后,由该降频器33将该滤除高频声音信号V2进行降频处理,将原单 位时间内的n个取样值,降低为n/2个取样值,而形成一降频声音信号V3; 举例来说,在此第一优选实施例中,我们设计将所要处理的取样频率降为原 取样频率的一半,而该第一低通滤波器32便可选用一半频段滤波器 (Half-Band Filter),而能针对该降频器33进行取样频率降一半的处理过程, 用以防止高频信号影响(alias)降频处理。在图6中显示出了该第一低通滤波 器32为一半频段滤波器的示意图,如图所示,该滤波器包含有23个延迟器320-3222和一加法器3200,由于这些延迟器有一半的计算系数为O(即相隔 一个的系数,仅中央的系数不为0而已),所以能够有效减少运算量,而23 个延迟器与其系数的乘积并相加的结果便为其低通滤波的结果。承上的流程图,在步骤S12中我们便是使用可将取样频率降一半的该降 频器33来对该滤除高频声音信号V2进行一降频处理而形成该降频声音信号 V3,该降频声音信号V3的取样频率为一第二频率,我们设计降频后的该第 二频率为原来的该第一频率的m分之一,而在此实施例中是将m取为2,也 就是降了一半,从而使得所形成的该降频声音信号V3于该单位时间内具有 n/2个取样值。在此实施例中,我们使用的该第一频率为48K赫兹,所以降频后的第二 频率便为24K赫兹,同时该降频处理也将原本n个取样值中每m个取样值 中消减(m-l)个取样值,举例来说,我们将m取为2,便是在每2个取样值中 消减l个取样值,若假设原本的n为1024,则新的取样值在该单位时间内有 m分之n个取样值便縮减成为512个取样值。因此,在作语音强化的傅立叶 转换运算时所取的取样值个数和其取样频率一样也作了减半的处置,所以其 频域的分辨率(Frequency Resolution)(即为对应的频率除以其取样值个数)仍 是相同的;是故,经由降频与取样值个数縮减的处理仍旧能保有和原本信号 相同频域分辨率的表现。接着,在步骤S13中便是利用该语音加强运算器34来对该降频声音信 号V3进行一语音加强运算而形成一语音加强声音信号V4。而在此实施例中, 该语音加强运算器34所进行的该语音加强运算为目前惯用的技术,例如 将该语音加强运算釆用一种数字信号处理的频谱消减(Spectml Subtraction)逼 近的语音加强运算,来对所输入的该降频声音信号V3作处理;由于前一步 骤的降频处理,我们可以有效的将该语音加强运算器34所要进行的运算量 和对于该系统存储器23所要使用到的资源空间等,都可以达到降为原先一 半的情形,从而能够改善存储器及处理器运算效能耗用等问题。另外,该语音加强运算的处理并未改变该降频声音信号V3的频率,所 以所输出的该语音加强声音信号V4和该降频声音信号V3具有相同的该第 二频率。而为了将所处理好的该语音加强声音信号V4进一步加入原本包含 人声与背景声的左右声道声音信号中以正确地输出,而接着在步骤S14中将该语音加强声音信号V4作对应的升频和低通滤波等处理过程。因此接着便先利用该升频器35对该语音加强声音信号V4进行一升频处理而形成一升频 声音信号V5,而在此实施例中由于之前我们先作了频率减半的处理,因此 相对的此时的该升频处理便为将其信号的频率升为两倍,使得该升频声音信 号V5的取样频率成为原来的该第一频率,同时使该升频声音信号V5于该 单位时间内能具有原来的n个取样值。在此实施例中,我们将该语音加强声音信号V4的第二频率(24K赫兹) 升两倍(因m取为2)而成为该升频声音信号V5的第一频率(48K赫兹),同时 该升频处理也将每两个取样值之间补进(m-l)个数值为零的取样值而成为原 来的n个取样值,即在此例中将縮减后的512个取样值在每两个取样值之间 补进1个取样值而成为原来的1024个取样值,而利用此一补进取样值个数 的作法便能完成其升频过程。接着,便是再利用该第二低通滤波器36来对该升频声音信号V5进行一 第二低通滤波处理而形成一语音加强与滤除高频声音信号V6,其中在此例 中的该第二低通滤波器36可和该第一低通滤波器32 —样采用相同的该半频 段滤波器(Half-Band Filter),而所形成的该语音加强与滤除高频声音信号V6 便具有原来的n个取样值,即此实施例中的1024个取样值,如步骤S14。而在图7(a)至(c)的示意图中表示了上述利用补进取样值个数与滤除高频 的作法来完成该升频处理与该第二低通滤波处理,其中的一曲线fl可表为一 低频的频率,而一曲线f2为一高频的频率,在该曲线fl上有6个取样值 S0 S5,当我们要将低频的频率升至高频的频率时,可对该曲线fl的每两个 取样值之间补进其值为0的取样值S0' S4',而形成该曲线f2,如图7(a)所 示,接着便可经由该第二低通滤波器36运算而获得增补取样值个数 S0" S4",如图7(b),最后,结合这些取样值S0 S5与该增补取样值S0" S4", 即可回复至原始取样频率(即第一频率)的一曲线f3,如图7(c)。而在此实施例的步骤S15中我们还设计有一增益器37,用以将该语音加 强与滤除高频声音信号V6进行一信号增益控制的处理,而能将该语音加强 与滤除高频声音信号V6加以调整。举例而言,我们可利用该增益器37再对 其信号进行调整放大或调整縮小,而其中该增益器37所能产生的信号加强 放大为一种正的信号增益值(gain),也就是能将我们所要加回去的人声语音部分所表现出的音量再加以控制其放大的比率,而能使得人声语音加强的效果 更加明显。而最后将处理完的信号加回原信号的步骤,由于在上述的滤波及语音加强运算过程中会造成相位延迟(Group Delay),因此我们可使用该第一延迟器 311和第二延迟器312来分别将原来的该左声道和右声道声音信号进行一第 一信号延迟处理和一第二信号延迟处理,且在此实施例中,这些信号延迟处 理为延迟一相同的时间后再将该左声道和右声道声音信号进行输出,并使用 该第二混合器302和该第三混合器303将信号调整后的该语音加强与滤除高 频声音信号V6分别与延迟后的该左声道声音信号和该右声道声音信号进行 一第二信号混合处理和一第三信号混合处理后,也就是直接将上述进行完人 声语音强化的频段分别加回该左声道和右声道声音信号之中后,便能将所需 的音效结果进行信号输出而达成所述目的,如步骤S15。综上所述,我们除了可以先将左右两声道进行混合并只对单一的声音信 号进行处理以减少其处理器大量运算资源以提高效能与减少其存储器资源 需求外,还可再进一步作降频处理而能再减少运算量,因而能更加强上述的 效能,同时,这样的处理方式并不会影响最后人声语音强化后的背景声音, 而能够正常的在原本的声音输出上有效地加强人声语音的能量,从而能成功 解决与改善现有技术所提及的问题。另外,在本发明的第一优选实施例中是以频率减半的降频处理与对应的 频率增两倍的升频处理作举例说明,然而,我们还可以更进一步地以频率减 为三分之一(后续对应的升频处理便为增三倍)或频率减为四分之一(后续对 应的升频处理便为增四倍)的处理,来减少更多的处理器运算量与存储器资源 耗用,也就是说我们可将本发明中的该m值取为大于1的正整数(在本发明 概念中m和n都为正整数),例如2、 3、 4等,来进行不同程度的运算处理, 然而需注意的是若该m值取的越大时,则所需滤除的高频频段也就越大,而 可能会影响人声语音频段;因此,将m值最多取为4的设计为较可能的实际 运算条件。而在本发明的第二优选实施例中,我们便采用将所要作信号处理的频率 降为原来的三分之一,且对应的升频处理则增三倍作举例说明,其流程图如 图8所示;在此第二优选实施例中的步骤S21、 S23、 S25和第一优选实施例的步骤Sll、 S13、 S15相同,第二优选实施例和第一优选实施例的差别仅在 于步骤S22中将降频处理以减为三分之一的方式进行,并对应地于步骤S24 中将升频处理以增三倍的方式进行。另外,所使用的低通滤波器也需加以调整;在此第二优选实施例中使用 一种由IIR形式的串叠双二阶滤波器(IIR Cascade Bi-Quad Filter)为主所构成 的一抽样滤波器(Decimation Filter)或一插值滤波器(Interpolation Filter)而能 表现出较佳的效果;图9所示为此种滤波器的示意图,而如图中虚线所示的 部分便为主要的IIR形式的串叠双二阶滤波器的构造(其中系数aO a2、bl b2 为运算时所使用的系数);我们将此种滤波器使用在上述图4中的这些低通滤 波器32、 36,如此便能将此第二优选实施例中所指定的降频与升频的处置有 效地达成。因此,综上所述,利用惯用技术的语音加强运算可对相关声音输出接口 的声音信号中的人声语音部分进行强化,且通过本发明的信号混合、滤波与 降频所组成的信号处理构造和处理方式,能够更进一步地降低处理器的运算 量及系统存储器的耗用,有效地增加整体系统的效能,而能改善与解决惯用 技术的问题,因而能成功地达到本发明的主要目的。任何熟悉本技术领域的技术人员,可在运用与本发明相同目的的前提 下,使用本发明所揭示的概念和实施例变化来作为设计和改进其它一些方法 的基础。这些变化、替代和改进不能背离权利要求所限定的本发明的保护范 围。因此,本发明由本领域普通技术人员任施匠思而为诸般修饰,然而都不 脱离随附的权利要求所欲保护的范围。
权利要求
1.一种语音加强方法,应用于一语音加强装置上,该方法包含下列步骤接收一声音信号,该声音信号的取样频率为一第一频率;对该声音信号进行一降频处理,进而形成一降频声音信号,该降频声音信号的取样频率为一第二频率,该第二频率低于该第一频率;对该降频声音信号进行一语音加强运算,进而形成一语音加强声音信号;以及对该语音加强声音信号进行一升频处理,进而形成一升频声音信号,该升频声音信号的取样频率为该第一频率。
2. 如权利要求1所述的语音加强方法,其特征是该方法还包含下列步骤: 将一左声道声音信号和一右声道声音信号进行一第一信号混合处理,进而形成该声音信号;以及将该升频声音信号分别与该左声道声音信号和该右声道声音信号进行 一第二信号混合处理和一第三信号混合处理后,进行信号输出。
3. 如权利要求2所述的语音加强方法,其特征是该方法还包含下列步骤 在将该升频声音信号分别与该左声道声音信号和该右声道声音信号进行该 第二信号混合处理和该第三信号混合处理以进行信号输出的步骤中,将该左 声道声音信号与该右声道声音信号先分别进行一第一信号延迟处理和一第 二信号延迟处理。
4. 如权利要求2所述的语音加强方法,其特征是该方法还包含下列步骤: 在将该升频声音信号分别与该左声道声音信号和该右声道声音信号进行该 第二信号混合处理和该第三信号混合处理以进行信号输出的步骤中,将该升 频声音信号先进行一信号增益控制。
5. 如权利要求1所述的语音加强方法,其特征是该方法还包含下列步骤: 在该降频处理之前,对该声音信号进行一第一低通滤波处理,进而形成一滤除高频声音信号;以及在该升频处理之后,对该升频声音信号进行一第二低通滤波处理,进而 形成一语音加强与滤除高频声音信号。
6. —种语音加强方法,应用于一语音加强装置上,该方法包含下列步骤:将一左声道声音信号和一右声道声音信号进行一第一信号混合处理,进 而形成一声音信号;对该声音信号进行一语音加强运算,进而形成一语音加强声音信号;以及将该语音加强声音信号分别与该左声道声音信号和该右声道声音信号 进行一第二信号混合处理和一第三信号混合处理后,进行信号输出。
7. —种语音加强装置,该装置包含有一降频器,用以对取样频率为一第一频率的一声音信号进行一降频处 理,进而形成一降频声音信号,该降频声音信号的取样频率为一第二频率, 该第二频率低于该第一频率;一语音加强运算器,信号连接于该降频器,用以对该降频声音信号进行 一语音加强运算,进而形成一语音加强声音信号;以及一升频器,信号连接于该语音加强运算器,用以对该语音加强声音信号 进行一升频处理,进而形成一升频声音信号,该升频声音信号的取样频率为 该第一频率。
8. 如权利要求7所述的语音加强装置,其特征是该装置还包含 一第一混合器,用以将一左声道声音信号和一右声道声音信号进行一第一信号混合处理,进而形成该声音信号;以及一第二混合器和一第三混合器,用以将该升频声音信号分别与该左声道 声音信号和该右声道声音信号进行一第二信号混合处理和一第三信号混合 处理后,进行信号输出。
9. 如权利要求8所述的语音加强装置,其特征是该装置还包含有一第一 延迟器和一第二延迟器,用以分别将该左声道声音信号和该右声道声音信号 进行一第一信号延迟处理和一第二信号延迟处理后,输入至该第二混合器和 该第三混合器。
10. 如权利要求8所述的语音加强装置,其特征是该装置还包含有一增益 器,用以将该升频声音信号进行一信号增益控制,进而输入至该第二混合器 和该第三混合器。
11. 如权利要求7所述的语音加强装置,其特征是该装置还包含 一第一低通滤波器,用以在该降频处理之前,对该声音信号进行一第一低通滤波处理,进而形成一滤除高频声音信号;以及一第二低通滤波器,用以在该升频处理之后,对该升频声音信号进行一 第二低通滤波处理,进而形成一语音加强与滤除高频声音信号。
12.—种语音加强装置,该装置包含有-一第一混合器,用以将一左声道声音信号和一右声道声音信号进行一第 一信号混合处理,进而形成一声音信号;一语音加强运算器,用以对该声音信号进行一语音加强运算,进而形成 一语音加强声音信号;以及一第二混合器和一第三混合器,用以将该语音加强声音信号分别与该左 声道声音信号和该右声道声音信号进行一第二信号混合处理和一第三信号 混合处理后,进行信号输出。
全文摘要
本发明为一种语音加强装置与应用于其上的方法,其中该装置包含有一降频器、一语音加强运算器、一升频器,该方法包含下列步骤对一声音信号进行一降频处理而形成一降频声音信号;对该降频声音信号进行一语音加强运算而形成一语音加强声音信号;以及对该语音加强声音信号进行一升频处理而形成一升频声音信号。本发明能够利用惯用的语音强化技术和相关的信号混合、低通滤波、降频与升频的处理技术,而能对声音信号中的人声语音频段作出明显而清晰的加强效果,并能有效地改善运算处理上的耗能和存储器资源耗用的问题。
文档编号G10L21/02GK101221767SQ200810008518
公开日2008年7月16日 申请日期2008年1月23日 优先权日2008年1月23日
发明者张荣贵, 林煌翔, 郭道宁, 陈绍喜, 黄上已 申请人:晨星半导体股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1