速度可变的话音信号再生装置的制作方法

文档序号：2819916阅读：237来源：国知局

专利名称：速度可变的话音信号再生装置的制作方法
技术领域：
本发明涉及速度可变的话音信号(Speech signal)再生方法，特别是涉及速度可变的话音信号再生方法，该方法能够以调整的速度播放存储于存储介质中的话音信号，同时避免音色的任何降低，或者在由话音信号再生装置如磁带播放机、VCR、多媒体设备、计算机等播放话音信号时当变化播放速度时出现的话音信号的丢失，使得能够听到播放的话音信号好象一个人快速地或慢慢地讲话。
在磁带或视频播放机中，一般地，当播放速度变化时音频的音色也变化。当以高速进行播放时，所播放的音频信号离开其原始的音频水平，使得听到一个“唧唧”声。在低播放速度时，产生典型地称为“磁带松开声”的声音。
这种现象出现的原因是因为当记录在记录介质上的音频信号播放速度变化时，其频率的水平和音调分量变化。作为防止这种现象的一种常规方法，日本专利公开出版号平成4-168499(1992年6月16日)公开了部分播放由存储缓冲器读出的音频信号的方法。根据这个方法，当播放速度加倍时，由存储缓冲器读出的音频信号以这样的方式部分地播放只有其两连续的时间片(time-slice)之一被播放。
在根据上述常规方法以双倍速度播放有声记录“I go to school with Jane”，分别相应于

图1所示的阴影部分的原始话音分量被消除去，所以仅可再生话音“I towith Jane”。
由于以较高播放速度常规方法只播放部分话音以保持话音的音色，该话音的原始含义受到损坏。结果使用常规再生装置很难理解话音的含义。此外，它使收听者感觉不舒服。
因此，本发明的目的是解决上述问题和提供速度可变话音信号再生的方法，该方法能够以调整的速度播放存储在存储介质中的话音信号，同时避免音色的任何降低，或者由话音信号再生装置播放话音信号时在变化播放速度时出现的话音信号的丢失，使得能够听到播放的话音信号好象一个人快速地或慢慢地讲话。
根据本发明，这个目的是利用适于接收数字话音信号并处理它们的一个信号处理器，适用于存储通过信号处理器处理的数字话音信号的一个存储器和适用于控制该信号处理器及存储器的一个微计算机提供速度可变话音信号再生方法实现的，包括步骤(a)使用平均幅度差函数从数字话音信号中检测特别的音调；(b)根据第一步骤的结果从话音信号中分离出浊音和清音；(c)暂时地存储在第二步分离清音；(d)复制或删除在第二步分离的浊音的一部分，藉此调制话音信号的长度；和(e)合成在第四步骤调制的浊音与在第三步骤暂时存储在存储器中的清音。
本发明提供一种速度可变话音信号再生方法，该方法使用适于接收数字话音并处理它们的一个信号处理器，适用于存储通过信号处理器处理的数字话音信号的一个存储器和适用于控制该信号处理器和存储器的一个微计算机。根据本发明，速度可变话音信号再生方法包括使用平均幅度差函数(AMDF)从数字话音信号中检测特别的音调的第一步骤，根据第一步骤的结果从话音信号中分离出浊音和清音音的第二步骤，暂时地存储在第二步骤分离的清音的第三步骤，复制或删除在第二步骤分离出的浊音的一部分，由此调制话音信号的长度的第四步骤，和合成在第四步骤调制的浊音与在第三步骤暂时地存储在存储器中的清音。
根据本发明，优选是在第一步骤执行的特别话音信号音调的检测使用下式得到Γn(k)=Σm=0∞|x(n+m)ω1(m)-x(n+m-k)ω2(m+k)|]]> 式中N窗口函数的一定段；m取样位置；k相应于被检测的特别话音信号音调的时间常数。
优选地，第二步骤以这样的方式进行当在第一步骤检测话音信号为具有特别的音调，它们被识别为浊声，因而被检测为不具有特别音调的话音信号被识别为清音。
根据本发明，最好是在第四步骤执行的信号调制是通过把一个窗口函数应用到相应于浊音的一个音调的话音信号部分而实现的，该窗口函数提供从每个话音源延伸的一定信号长度，调制的信号如下式所示xm(n)＝hm(tm－n)x(n)式中，xm(n)调制的话音信号；
hm(n)窗口函数；tm每个话音源的位置；和x(n)输入话音信号(在时间轴n上话音的数量)。最好地，调制浊音与在第一步骤执行的清音的合成使用下式取得x(n)Σqaqxq(n)hq(tq-n)Σqhq2(tq-n)]]>式中，αq调整合成的话音数量的变量；x(n)调制的话音特性x(n)＝(x(n－δq))；tq(n)每个调制的话音源的位置；和δq用于确定播放速度的变量。
从下面对照附图的实施例的叙述中，本发明的其它目的和方案变得清楚了，其中图1是说明常规的速度可变话音再生方法的图；图2是根据本发明用于执行速度可变话音信号再生方法的速度可变话音信号再生装置的图示方框图；图3是说明图2的安排的详细方框图；图4是说明根据本发明用于执行话音信号再生方法的微计算机的操作的流程图；和图5A至5E是分别说明根据本发明使用在图2至4中所示的装置调制话音信号的过程的波形图。
现在结合附图叙述根据本发明的速度可变话音信号再生方法的优选实施例。
图2是表示用于执行本发明的速度可变话音信号再生方法的速度可变话音信号再生装置的方框图。
如图2所示，该装置包括一个模/数(A/D)变换器1，用于变换模拟话音信号为数字话音信号。数字信号处理器2接到A/D变换器1。数字信号处理器2用于处理由A/D变换器1以数字信号的形式变换的话音信号。数/模(D/A)变换器3接到数字信号处理器2，将以数字信号处理器2处理的数字话音信号变换为模拟话音信号。该装置还包括一个存储器4，适用于暂时存储加在数字信号处理器2的数字话音信号，和一个微计算机5，适用于根据外加的控制信号来控制数字信号处理器2。
如图3中所示的，数字信号处理器2包括一个多路复用器6，适用于首先同时地接收从A/D变换器1来的数字话音信号和存储在存储器4中的修改的话音信号，然后在微计算机5的控制下选择地输出所接收的两个话音信号之一。信号处理器7接到多路复用器6的输出。信号处理器7用于处理从多路复用器6输出的话音信号或修改的话音信号，因而合成所选择的信号部分。信号处理器7还在微计算机5的控制下控制数字信号处理器2的整个操作1。解码器8接到信号处理器7的输出，解码器8接收控制信号并且将它发送到数字信号处理器2的所选择的单元。一个读/写指令控制单元9、一个存储地址指定单元10、一个存储器数据输出单元11和一个数据输出单元12连接到解码器8的输出。根据从解码器8接收的控制信号，读写指令控制单元9检查存储器4是处于其读状态或者写状态并且根据存储器4的状态输出读或写指令。存储地址指定单元10用于指定相应于存储单元的地址，根据从解码器8接收的控制信号，该数据将被存储。存储器数据输出单元11适用于根据从解码器8接收的控制信号将通过信号处理器7处理的修改的话音信号发送到存储器4。另一方面，数据输出单元12根据从解码器8来的控制信号将通过信号处理器7处理的修改的话音信号发送到数/模变换器3。数字信号处理器2还包括一个存储控制单元13，它从读/写指令单元9接收读或写指令和控制在存储器4中记录新的话音信号或检测记录的话音信号的操作。
在图3中，标号14表示存储器数据输入单元，用于接收存储在存储器4中的数据和将它发送到多路复用器6。
现在结合图4和5详细地叙述具有上述安排的速度可变话音再生装置的操作。
微计算机5开始取样从A/D变换器1接收的数字话音信号，它还输出控制信号到信号处理器7，如图4所示。如果假定一个取样数据具有16比特的容量，用于每个取样的取样数据的数量是80，和在160话音信号被取样时开始信号处理，即在收到相应于一帧的取样数据的数量时，微计算机5控制多路复用器6将由A/D变换器1变换的数字话音信号(80取样数据)加到信号处理器7(步骤S1)。然后微计算机5检测接收的加到信号处理器7的话音信号(取样数据)的数量并检查所检测的话音信号数量是否相应于一帧(步骤S2)。在步骤S2确定接收的取样数据不相应于一帧时，微计算机5返回到步骤S1，然后将控制信号加在多路复用器6。根据从微计算机5接收的控制信号，多路复用器6发送从A/D变换器1接收的数字话音信号(80取样数据)到信号处理器7。
在步骤S2确定接收的话音信号(取样数据)的数量相应于一帧时，微计算机5执行对信号处理器7的控制操作，以使用ADMF执行信号处理过程(步骤S3)。在微计算机5的控制下，信号处理器7执行AMDF信号处理过程，因而检测话音信号(160取样数据)的特别音调。
ADMF方法是使用窗口函数用于检测话音信号的特别音调的方法。在这个情况下，话音信号具有特别的音调，它们被确定为浊音。另一方面，在话音信号不具有特别音调时，它们被确定为清音。这样的AMDF方法可用下式表示Γn(k)=Σm=0∞|x(n+m)ω1(m)-x(n+m-k)ω2(m-k)|]]> 式中，N窗口函数的一定段；m取样位置；k相应于被检测的特别话音信号音调的时间常数。
当在上述过程中检测到话音信号的周期分量时，则检查相应的话音信号部分是否相应于清音(步骤S4)。如果确定该话音信号部分相应于清音(如图5A中所示的)，则微计算机5将控制信号加到信号处理器7，而信号处理器7发送话音信号而不处理相应于清音的话音信号部分。信号处理器7还将控制信号加到解码器8，以便将清音数据存储到存储器4。根据从信号处理器7来的控制信号，解码器8输出控制信号，这样信号又分别被发送到读/写指令单元9、存储地址指定单元10和存储数据输出单元11。
读/写指令单元9输出一个读指令，以便在存储器4中存储从信号处理器7输出的清音数据。从读/写指令单元9来的控制信号被加到存储器控制单元13，然后加到存储器4。另一方面，存储地址指定单元10输出相应于存储清音数据的存储单元的地址。因此，存储器4在其相应于由存储地址指定单元10指定的地址的存储单元存储从存储器数据输出单元11输出的清音数据。
如果在步骤S4确定具有周期分量的话音信号部分不相应于清音，则微计算机5将控制信号加到信号处理器7以便处理话音信号部分。
即，信号处理器7复制或删除相应于浊音的话音信号部分，因此调制语音信号的长度(步骤S6)。在通过复制或删除浊声的一部分执行调制的过程中，话音信号的一个音调部分与另一个音调信号部分合成时，在话音信号的结合部分可出现信号间的碰撞(strike)，因而导致形成不希望的脉动分量的现象。
为了避免这种现象，通过将希望的窗口函数加到每个信号分量来进行信号调制。窗口函数可用下式表示xm(n)＝hm(tm－n)x(n)式中，xm(n)已调制的话音信号；hm(n)窗口函数；tm每个话音源的位置；和X(n)输入话音信号(在时间轴几上的话音总数)。
在信号调制完成之后，微计算机5将控制信号加到信号处理器7，信号处理器7又将控制信号加到解码器8，以检测存储在存储器4中的清音数据。根据信号处理器7来的控制信号，解码器8执行控制操作，从读/写指令单元9输出写指令。写指令通过存储器控制单元13发送到存储器4。
解码器8也将控制信号加在存储地址指定单元10，以便输出与存储在存储器4中的清音数据相关的地址。因此，存储器4输出存储在其指定存储单元中的清音数据。从存储器4输出的清音数据经过存储数据输入单元14发送到多路复用器6。另一方面，微计算机5将控制信号加到多路复用器6，以至从存储器4输出的清音数据可由信号处理器7接收。
如图5D和5E所示，信号处理器7合成所接收的清音数据与通过信号处理过程调制的浊音(步骤S7)。在信号合成之后得到的结果话音信号被发送到数据输出单元12，数据输出单元12根据解码器8的控制信号又把话音信号发送到D/A变换器3。在信号合成之后最后得到的话音信号X(n)可用下式表示x(n)=Σqaqxq(n)hq(tq-n)Σqhq2(tq-n)]]>
式中，xq调节合成话音数量的变量；x(n)已调制的话音特性(x(n)＝x(n－δq)tq(n)每个已调制话音源的位置；和δq确定播放速度的变量。
D/A变换器3变换从信号处理器7输出的数字话音信号为模拟话音信号，然后最终地输出它(步骤S8)。因此，使用者可在变化的播放速度听到话音信号，而音色无任何降低或播放的话音信号的丢失。
从上面的叙述已清楚了，本发明提供一种速度可变的话音再生方法，利用一个话音再生装置即使在话音信号播放速度变化时也能够避免音色的任何降低或被播放的话音信号的丢失，因此向使用者提供改善的业务。
虽然本发明已被叙述为应用在话音信号再生装置，它也可应用于多媒体设备，在该设备中进行高速扫描。
虽然为了说明目的已公开了本发明的优选实施例，本领域的技术人员应懂得各种修改和增加是可能的，而不脱离所附权利要求书中公开的本发明的范围和精神。
权利要求
1.一种速度可变的话音信号再生方法，该方法使用适于接收数字话音信号并处理它们的一个信号处理器，一个存储器，适于存储通过该信号处理器处理的数字话音信号，和一个微计算机，适用于控制信号处理器和存储器，该方法包括步骤(a)使用平均幅度差函数从数字话音信号中检测特别的音调；(b)根据第一步骤的结果从该话音信号中分离浊音和清音；(c)暂时存储在第二步分离的清音；(d)复制或删除在第二步分离的浊音的一部分，因而调制该话音信号的长度；和(e)合成在第四步调制的清音与在第三步暂时存储于存储器中的清音。
2.根据权利要求1的速度可变话音信号再生方法，其中在第一步进行检测特别的话音信号音调是使用下式得到的Γn(k)=Σm=0∞|x(n+m)ω1(m)-x(n+m-k)ω2(m-k)|]]> 式中，N窗口函数的一定段；m取样位置；k相应于被检测的特别话音信号音调的时间常数。
3.根据权利要求1的速度可变话音信号再生方法，其中第二步以这样方式进行当在第一步话音信号被检测为具有特别的音调时，它们被认为是浊音，而被检测为不具有特别音调的话音信号被识别为清音。
4.根据权利要求1的速度可变话音信号再生方法，其中在第四步进行的信号调制是应用窗口函数实现的，它提供从每个话音源延伸的一定的信号长度，位置到相应于浊音的一个音调的话音信号部分，调制的话音信号如由下式指示xm(n)＝hm(tm－n)x(n)式中，xm(n)调制的话音信号；hm(n)该窗口函数；tm每个话音源的位置，和x(n)输入话音信号(在时间轴几上的话音总量)。
5.根据权利要求1的速度可变话音信号再生方法，其中在第五步进行的合成调制的浊音与清音声是使用下式实现的x(n)=Σqaqxq(n)hq(tq-n)Σqhq2(tq-n)]]>式中，xq调节合成话音总量的变量；x(n)调制的话音特性(x(n)＝x(n－δq)tq(n)每个已调制话音源的位置；和δq确定播放速度的变量。
全文摘要
一种速度可变的话音信号再生方法能够以调节的速度播放存储在存储介质中的话音信号同时避免音色的任何降低或在变化播放速度时出现话音信号丢失，使得被播放的话音信号可被听到好象一个人快速地慢慢地讲话时的情况。该方法包括步骤使用平均幅度差函数从输入数字话音信号中检测特别的音调，根据第一步的结果从该话音信号中分离出浊音和清间，暂时地存储在第二步分离的清音，复制或删除在第二步分离的浊音的一部分，因而调制该话音信号的长度，和合成在第四步调制的浊音与在第三步暂时存储在存储器中的清音。
文档编号G10L21/04GK1149739SQ96109378
公开日1997年5月14日申请日期1996年8月8日优先权日1995年9月30日
发明者金哲弘申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金哲弘
技术所有人：三星电子株式会社
我是此专利的发明人

上一篇：用于鉴别话音信号的非话音和清音的方法和装置的制作方法
上一篇：卡拉ok装置和卡拉ok通信系统的制作方法