实时跟踪声音信号的基本频率的制作方法

文档序号:11140252阅读:599来源:国知局
实时跟踪声音信号的基本频率的制造方法与工艺

本发明涉及实时跟踪声音信号。



背景技术:

例如在频闪观测器的领域中要求对被测试者的声音信号的基本频率的分析。可借助于频闪观测器判断声音唇的移动性。例如在通过壳体或空气导管麦克风上通过被测试者的发音完成触发对声音唇的图像采集。

为了开始发音,声音唇被置于发音位置,即,其相互松弛地依靠且因此关闭声门。声音唇通过气流被置于颤动状态,使得空气通过每次打开和关闭间歇地离开发音腔。存在复杂的周期性的、由泛音构成的颤动。诸如70-1000Hz的频率在此取决于声音唇的长度。

在频闪观测器的领域中,基于所述(基本)频率控制频闪观测器。被安置在内窥镜上的频闪观测器用于在借助于声音信号的基本频率确定的合适时间点记录声音唇的图像。



技术实现要素:

本发明的目的在于简化例如在光谱学中的用于跟踪声音信号的基本频率的结构。

通过根据所述权利要求书的方法和装置实现该目的。

根据本发明,采样装置在预定的时间间隔上对被测试者的声音信号进行采样,由此获得声音信号的采样数据,由采样数据形成数据包,其将数据包发送给计算装置。计算装置接收数据包且根据包含在数据包中的采样数据计算声音信号的基本频率。采样装置基于由计算装置计算的基本频率设定计时器,并且在计时器到期时发出触发信号。

本发明的优点在于,可在不同的地点执行记录声音信号和分析声音信号,由此可缩小接收装置的结构。此外可行的是,非同步地确定声音信号的基本频率从而控制频闪观测器,由此可避免用于实时确定基本频率的昂贵结构。

附图说明

下文中参考附图根据实施例更详细地描述本发明。附图中:

图1示出针对根据本发明的一实施例的用于跟踪声音信号的基本频率的过程1、过程2和过程3的流程图。

图2示出根据本发明的一实施例的用于跟踪声音信号的基本频率的设备的示意性框图。

图3示出根据本发明的一实施例的跟踪声音信号的基本频率的示意图。

具体实施方式

图1示出三个过程,即,过程1、过程2和过程3,其中,过程1和2或3和2可分别在不同的地点上实施,且过程1和3可在同一地点上实施。

过程1包括下述步骤:在预定的时间间隔上对被测试者的诸如发音流的声音信号进行采样(S1),由此获得声音信号的采样数据;由采样数据形成数据包(S2);将数据包发送给计算装置(S3),且只要过程1未结束则重复所述步骤(在S4中为否)。

过程2包括下述步骤:接收来自采样装置的数据包(S5),在计算装置上根据包含在数据包中的采样数据计算声音信号的基本频率f0(S6)且计算T0=1/f0,将T0发送给采样装置(S7),且只要过程2未结束则重复所述步骤(在S8中为否)。

过程3包括下述步骤:在采样装置上接收T0(S9),检查计时器是否到期(S10),当计时器到期时发出触发信号且将计时器设定成T0(S11)(在S10中为是),且只要过程3未结束则重复所述步骤(在S11中为否)。

在过程3开始时,当过程2还未接收到T0时,计时器可被设置成T0的预定值。若所接收的T0值不同于预定的T0值或不同于之前设置的T0值,则计时 器在其到期之后被设置成接收的T0值。这表示,计时器总被设置成当前的T0值。

优选地,计时器在收集采样数据的采样装置侧上。在计时器到期时触发信号被发出至闪光灯或频闪观测器,从而产生闪光信号,例如用于由照相机拍摄声音唇。

为避免在之前设置在计时器中的T0值与新的待设置在计时器中的T0值之间的跳跃,根据本发明的一实施例例如在使用已知调节器的情况下滑动地执行老的T0值与新的T0值之间的过渡。

在计时器到期时被发出的触发信号可控制频闪观测器,该频闪观测器例如被布置在被测试者的声门附近且与照相机一起用于记录声门的图像。

在步骤S1中,声音信号例如通过被布置在被测试者的声门附近的麦克风被记录。

在步骤S2中形成的数据包包含确定数量的声音信号采样值,该采样值通过在预定的时间间隔上采样声音信号而被获取。例如下述情况可触发步骤S1至步骤S2的过渡,即,当获得确定数量的采样值时。这表示,当获得确定数量的采样值时触发形成数据包。

图2示出根据本发明的一实施例的用于跟踪声音信号的基本频率的设备100的示意性框图。

装置100包括采样装置10和计算装置20。前述的过程1和3可在采样装置10中被实施,该采样装置例如被安置在内窥镜上。过程2可在分开设置的计算装置20中被实施。

采样装置10包括记录单元11、处理单元12和计时器13。记录单元11获得被麦克风记录的声音信号。记录单元11可包括麦克风。

处理单元12获得被记录单元11记录的声音信号,且以确定的采样频率执行对声音信号的采样。在此获得具有确定的比特分辨率的采样值。处理单元12将采样值组合成具有确定比特长度的数据包。这表示,数据包包含确定数量的数据值。若通过采样获得确定数量的数据值,处理单元12产生数据包且将其发送至计算装置20。处理单元12的功能可通过DSP(数字信号处理器)、FPGA(现 场可编程门阵列)等实施。处理装置12也可包括处理器和存储程序的存储器,该程序在通过处理器执行时实现处理装置12的前述功能。

数据包可通过串行接口102被发送给计算装置20。采样装置10与计算装置20之间的连接可以是有线连接或是无线的。

计算装置20接收来自采样装置10的数据包,且根据包含在其中的采样值计算声音信号的基本频率f0。这表示,计算装置20根据包含在数据包中的采样值执行对声音信号的频率分析。计算装置20也计算时间T0=1/f0。计算装置20例如通过串行接口102将T0发送至采样装置10。

计算装置20的功能可通过DSP(数字信号处理器)、FPGA(现场可编程门阵列)等实施。计算装置20也可包括处理器和存储程序的存储器,该程序在通过处理器执行时实现计算装置20的前述功能。

由计算装置20发送的时间T0例如通过处理单元12被提供至计时器13。计时器13被设定成T0,其在时间T0到期时发出触发信号,例如用于控制闪光灯或频闪观测器。

图3示出根据本发明的一实施例的获取和跟踪声音信号的基本频率f0的视图。

y(t)示出被测试者的声音信号的信号曲线。图3示出具有100Hz频率的作为正弦波的信号曲线。例如,记录单元11可提供用于处理单元12的信号曲线y(t)。

采样频率为对应于大致22.7μs的持续时间的44.1kHz,以该采样频率采样信号曲线。采样值的分辨率为16比特,且包长度包括1023字节,这对应于大致23.22ms的持续时间。注意,本发明不限制于该值。一个数据包例如可包括声音信号的十次颤动。

若获得1024字节的采样值,触发信号P(t)触发产生或完成且发送数据包。图3示出数据包,即,包1、包2、包3和包4,通过P(t)触发包的生成和发送。

在图1所示的过程1中或通过图2中的采样装置10可以分别执行对信号曲线y(t)的上述采样以及产生和发送数据包。

根据包含在数据包中的采样值计算信号曲线y(t)的基本频率f0。根据数据包 (包1)首次计算f0。图3示出在信号曲线采样、包产生、发送包、计算f0和T0以及将计时器设定成T0之间的延迟。

通过首次计算f0将计时器设定成T0=1/f0。若在处理数据包(包2)之后改变f0,则在之前设定的时间到期之后计时器被设置成新计算的时间,或可平均旧的T0值和新的T0值。也可行的是,将恒定相位或随时间升高的相位叠加至T0,从而使得可以在旧的和新的值T0之间平滑过渡。

通过上述的配置,可在时间上跟踪基本频率f0。特别地,基于与声音信号非同步的处理数据包的操作再次产生用于闪光灯或频闪观测器的与声音信号同步的实时触发信号。

例如,频闪观测器被安置在内窥镜上,其位于被测试者的声门附近。频闪观测器根据触发信号产生闪光,且被安置在内窥镜上的照相机拍摄获取声音唇的图像。图3示出所获取的图像,作为非同步图像数据包,即,帧1、帧2、帧3。

可在图1所示的过程2中或通过图2中的计算装置20执行对基本频率f0的上述计算。可通过过程3或采样装置10、特别通过设定计时器13产生触发信号。

在图3所示的示例中,在针对数据包的第一采样与对(新)计算的基本频率f0控制之间的延迟为大致61.64ms,然而这对于获取声音唇的合适图像是可忽略的。

根据本发明,通过对声音信号进行采样获得的采样数据以数据包被发送至被处理用于检测声音信号的基本频率的装置。由此可缩小采样装置的结构。此外可行的是,与控制频闪观测器非同步地确定声音信号的基本频率,由此可避免用于实时确定基本频率的复杂结构。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1