乐器的调音设备和其中使用的计算机程序的制作方法

文档序号:2829546阅读:404来源:国知局
专利名称:乐器的调音设备和其中使用的计算机程序的制作方法
技术领域
本发明涉及一种用于乐器的调音设备,特别涉及一种用于在对乐器的调音工作中判断音调的音高的调音设备以及其中使用的计算机程序。
背景技术
调音设备被设计用来协助用户对乐器进行调音工作。当用户在乐器中产生音调时,调音设备分析声波以得到音名、八度音(octave)和与目标音高的差,即乐器的当前调音状态,并且通过可视图像向用户通知当前调音状态。
在日本专利公开第Hei 3-42412号中公开了现有技术调音设备的典型示例。在下文中简要描述在该日本专利公开中公开的现有技术方法。当将声波从乐器提供给现有技术调音设备时,调音设备将该声波转换为音频输入信号,并且从该音频输入信号产生脉冲序列。当音频输入信号保持电势电平高于0时,现有技术调音设备也将脉冲保持在高电平上。在音频输入信号衰减到低于0时,所述脉冲被衰减为低电平。如果音频输入信号在长时间内保持电势电平高于0,则对应的脉冲具有长脉冲宽度。另一方面,如果音频输入信号在短时间内将电势电平升高为高于0,则对应的脉冲缩小脉冲宽度。由于这一原因,无规律的脉冲形成所述脉冲序列,并且脉冲宽度是可变的。
现有技术调音设备将等于从超过0的第一脉冲上升到超过0的下一脉冲上升的时间周期的延迟时间引入原始脉冲序列,并且产生第一延迟脉冲序列。还将等于从超过0的第二脉冲上升到超过0的第三脉冲上升的时间周期的延迟时间引入第一延迟脉冲序列,并且产生第二延迟脉冲序列。以这一方式,将分别等于第二脉冲周期之后的原始脉冲序列的脉冲间隔的延迟时间相继引入延迟脉冲序列。
随后,现有技术调音设备为了与原始脉冲序列的相关性而检查延迟脉冲序列。如果总延迟时间量等于与音调的音高强相关的音频输入信号的主要重复周期,则发现与原始脉冲序列的相关性较高。另一方面,如果总延迟时间量与音频输入信号的主要重复周期不同,则延迟脉冲序列具有与原始脉冲序列的低相关值。因此,尽管存在短重复周期对音频输入信号的不良影响,但是可以通过对延迟脉冲序列的相关性分析来确定关于声波的音调的音高。在下文中,将在所述日本专利公开中公开的现有技术调音设备称为“第一现有技术调音设备”。
在日本专利申请公开第Hei 9-257558号中公开了另一现有技术调音设备,其为对在所述日本专利公开中公开的现有技术调音设备的改进。在该日本专利申请公开中公开的现有技术调音设备将音频输入信号与使得有可能辨别音频输入信号中的高电平峰值的阈值、和使得有可能辨别音频输入信号中的低电平峰值的另一阈值进行比较,并且确定高电平峰值和低电平峰值。还从音频输入信号产生原始脉冲序列,并且还从该原始脉冲序列产生延迟脉冲序列。现有技术调音设备确定在所述峰值处原始脉冲序列和每个延迟脉冲序列之间的相关性,并且进一步在总延迟时间量的基础上确定音调的音高。在下文中,将在所述日本专利申请公开中公开的现有技术调音设备称为“第二在所述日本专利申请公开中还描述了另一种调音方法,并且在下文中将其称为“第三现有技术调音设备”。将时间延迟连续地引入音频输入信号中,并且第三现有技术调音设备在整个波形中确定延迟的音频输入信号和音频输入信号之间的相关性。
在第一现有技术调音设备和第二现有技术调音设备中遇到以下问题相关性的准确性易受零交叉点周围的噪声和强谐波损害。假设噪声分量紧接在主要重复周期的脉冲升高之前将音频输入信号的电势电平迅速升高超过0。该噪声使主要重复周期比通常长。结果,相关性降低。强谐波也使主要重复周期模糊不清。在原始脉冲序列中出现极多数量的零交叉点,并且每个零交叉点具有强相关性的可能性。由于这一原因,第一和第二现有技术调音设备在所有零交叉点处确定极大数量的延迟脉冲序列,并且必须为了所有零交叉点处的相关性而进行大量计算。结果,某些零交叉点处的相关性的值互相接近,并且噪声的影响变得严重。
第三现有技术调音设备中固有的问题是对于相关性的大量计算。如果要在大量目标音高上为乐器调音,则该调音工作需要长时间周期,使得第三现有技术调音设备较不可行。

发明内容
因此,本发明的一个重要目的是提供一种调音设备,其在不经大量计算的情况下准确地确定音调的实际音高。
本发明的另一重要目的是提供一种在所述调音设备中加载的计算机程序。
本发明人考虑到现有技术中固有的问题,并且注意到对于要分析的每个音调,存在等于钢琴的键的数目的多种可能性。钢琴典型地具有88个键,使得对于要分析的每个音调,存在88种可能性。在此情形中,对于88个延迟值,要重复88次自相关,所述88个延迟值相当于分别表示这88个钢琴音调的波形的88个重复周期。对每个钢琴音调的估计需要大量计算。
本发明人将其努力集中在如何减少计算量上。本发明人注意到应当把自相关集中于有可能在其中发现要分析的音调的音区(register)中的候选者。
为了达到所述目的,本发明提出通过多步自相关或者自相关的重复来逐步缩小表示音调的波形的频率范围。
根据本发明的一个方面,提供一种用于协助用户对乐器进行调音工作的调音设备,包括转换器,将代表在所述乐器中产生的音调的振动转换为代表该振动的电信号;数据处理系统,连接于转换器,并且对所述电信号的波形进行多步自相关,以便逐步缩小以所述音调为特征的频率范围;以及人机界面,连接于所述数据处理系统,并且显现多步自相关的结果。
根据本发明的另一方面,提供一种表示用于协助对乐器进行调音工作的方法的计算机程序,并且所述方法包括以下步骤a)将代表在乐器中产生的音调的振动转换为代表该振动的电信号;b)将代表所述电信号的波形的数据信息积存在数据存储器中;c)通过重复对所述数据信息的自相关,缩小以所述音调为特征的波形的频率范围;以及d)显现缩小的频率范围。


根据结合附图进行的以下描述,将更清楚地理解所述调音设备和计算机程序的特征及优点,在附图中图1是示出根据本发明的便携式调音设备的外观的示意图,图2是示出合并在便携式调音设备中的电子系统的系统配置的框图,图3A和3B是示出在便携式调音设备的触摸板液晶显示设备上产生的可视图像的正视图,图4是示出代表音调的声波的电信号的基频分量和基本图像的关系的曲线图,图5A和5B是示出用来产生灰度图像的基本图像的叠加的视图,图6是示出主例程中的作业序列的流程图,图7是示出用于显现相位差的子例程中的作业序列的流程图,图8A和8B是示出基本图像的叠加的视图,图9是示出用于估计实际音高的子例程的作业序列的流程图,图10是示出用于自相关的子例程的作业序列的流程图,图11是示出在对于钢琴的自相关中使用的变量的视图,图12A是示出所述变量和自相关之间的关系的曲线图,图12B是示出对于高音区中的音调的自相关的最大值的曲线图,图12C是示出对于低音区中的音调的自相关的最大值的曲线图,图13是示出合并在根据本发明的另一调音设备中的触摸板液晶显示板的正视图,以及图14是示出在该调音设备中进行的作业序列的流程图。
具体实施例方式
在对乐器的调音工作中使用实施本发明的调音设备。换言之,用户借助便携式调音设备来给乐器调音。
调音设备包括转换器、连接到该转换器的数据处理系统、以及连接到数据处理单元的人机界面。当在乐器中产生音调时,代表该音调的振动被输入到转换器中,并且转换器将该振动转换为代表所述振动的电信号。表示所述音调的数据信息形成电信号的波形,并且该电信号被提供给数据处理单元。
数据处理系统对电信号的波形进行多步自相关,并且通过该多步自相关来分析电信号的频率特性,例如某些频率分量的周期性。在多步自相关中包括至少两种自相关。首先通过所述至少两种自相关之一来确定与波形强相关的比较宽的频率范围,并且通过在该比较宽的频率范围内进行的另外一个或一些种类的自相关来缩小频率范围。缩小的频率范围精确地表示电信号的频率特性,从而精确地表示音调。因为所述比较宽的频率范围比整个频率范围窄,所以在数据处理系统上用于所述另外一个或一些种类的自相关的负荷较轻。因此,负荷的减小使得音调的特征较为清楚。
第一实施例参考附图的图1,实施本发明的便携式调音设备1被设计用来协助用户对直立式钢琴2进行调音工作,并且作为PDA(个人数字助理)来提供所述便携式调音设备。
便携式调音设备1包括外壳1a、将在下文中参考图2进行描述的数据处理系统1b、触摸板显示设备3和麦克风4。在外壳1a内部提供数据处理系统1b,并且在外壳1a中设置触摸板显示设备3。麦克风4连接到连接电缆4a,并且在连接电缆4a的另一端上提供的插头4b被插入外壳1a上的插座(未示出)。
用户将麦克风4指向直立式钢琴2,并且按下黑键和白键之一。键运动引起相关联的弦的振动,并且表示音调的声波传播到麦克风4。便携式调音设备1完成至少两个任务,即,确定音调的音名(pitch name),并显现音调的目标音高和实际音高之间的相位差。
数据处理系统1b连接到触摸板显示设备3,并且还通过插座(未示出)和连接电缆4a连接到麦克风。触摸板显示设备3充当人机界面,使得用户可以通过触摸板显示设备3与数据处理系统1b通信。在此实例中,液晶显示板和透明导体薄膜组合形成触摸板显示设备3。通过麦克风4将音调转换为模拟音频信号,并且将该音频信号提供给数据处理系统1b。
如图2所示,数据处理系统1b包括被缩写为“CPU”的中央处理单元10、被缩写为“ROM”的只读存储器11、被缩写为“RAM”的随机存取存储器12、信号接口13、图形控制器14、触摸板控制器15和共享总线系统16。中央处理单元10、只读存储器11、随机存取存储器12、信号接口13、图形控制器14和触摸板控制器15连接到共享总线系统16,使得中央处理单元10可与那些系统组件11、12、13、14和15通信。可以将中央处理单元10、只读存储器11、随机存取存储器12和共享总线系统16的一部分集成在作为微计算机的单片半导体芯片上。
将计算机程序存储在只读存储器11中,并且将形成该计算机程序的指令代码从只读存储器11依序读出到共享总线系统16。被如此读出到共享总线系统16上的指令代码由中央处理单元10取出,并且被执行以完成给定任务。该计算机程序包括主例程和子例程。
中央处理单元10是数据处理能力的源,并且通过执行所述指令代码来完成作业。当用户向数据处理系统1b提供电力时,主例程开始在中央处理单元10上运行。中央处理单元10首先将数据处理系统1b初始化,并且等待用户的指令。将在下文中描述主例程中的若干作业。
所述子例程之一被分配用来显现音调的实际频率和音调的目标频率之间的差。当用户指示数据处理系统1b协助他或她对直立式钢琴2进行调音工作时,主例程开始在中央处理单元10上运行,并且周期性地分支到用于所述显现的子例程。另一个子例程被分配用来估计在乐器中产生的音调的音名,并且主例程周期性地分支到用于估计音名的该子例程。在此实例中,便携式调音设备1通过两步自相关来估计实际音高。该自相关使得有可能估计输入的周期信号的周期性。
随机存取存储器12向中央处理单元10提供工作区。在调音工作中,将数字音频信号或一系列音频数据代码积存在随机存取存储器12中,并且中央处理单元10检查这一系列音频数据代码,以查看假设模拟音频信号具有多少频率、以及由这一系列音频数据代码表示的音调是否具有等于目标音高的实际音高。
信号接口13具有放大器和模拟-数字转换器,并且,将模拟音频信号从麦克风4提供给放大器。通过该放大器放大模拟音频信号,并且在放大之后将其提供给模拟-数字转换器。以固定的时间间隔对该模拟音频信号进行采样,并且将关于该模拟音频信号的离散值转换为音频数据代码。将音频数据从模拟音频信号更替(relay)为这一系列音频数据代码。在此示例中,将采样频率调整为44.1千赫兹。中央处理单元10从信号接口13周期性地取出该音频数据代码,并且将该音频数据代码积存在随机存取存储器12中。
图形控制器14连接到触摸板显示设备3的液晶显示板。图形控制器14在中央处理单元10的控制下,在液晶显示板上产生可视图像。可视图像形成画面,并且每个画面在一个或多个帧内出现在液晶显示板上。所述画面的图像将在下文中进行详细描述。在下一帧中,所述画面改变为新的画面或者被保持。标准个人数字助理通常以15Hz到20Hz重复所述帧。该帧频率小于通过直立式钢琴2产生的最低音调的音高。
触摸板控制器15连接到触摸板显示设备3的透明导体薄膜,并且与图形控制器14协作。触摸板控制器15在产生于液晶显示板上的可视图像上提供坐标。当用户利用诸如笔的合适工具来按压与可视图像重叠的透明导体薄膜的一部分时,触摸板控制器15确定液晶显示板上的可视图像。在该可视图像表示某些指令的情况下,中央处理单元10通过由触摸板控制器15指定的一个或多个图像来识别用户的指令。
图3A和3B示出了在触摸板显示设备3上产生的不同画面30a和30b。画面30a和30b具有至少4个区域31、33、34和35。区域31被分配给表示模拟音频信号的实际波形与目标波形的相位差的程度的灰度图像32a、32b、...。目标波形代表要将乐器调谐到的目标音高或目标频率。在所述实际波形的基础上确定实际信号周期或实际重复周期,并且所述重复周期是实际频率的倒数。
尽管灰度图像32a是从两个色调产生的,但是至少3个色调或者阴影,即较浅、较深和中间阴影形成灰度图像32b。从两个色调产生的灰度图像32a表示音频信号的实际波形和目标波形之间的相位上的一致性。另一方面,当在音频信号的实际波形与目标波形之间出现某种程度的相位差时,由多于两个的色调形成的灰度图像32b出现在区域31中。如果该相位差与灰度图像32b表示的相位差不同,则在触摸板显示设备3上产生也从多于两个的色调产生的另一灰度图像,如将在下文中详细描述的那样。
区域33和35被分配给按钮开关的图像。“7B”、“8”、“9”、“res”、“ver”、“4F”、“5G”、“6A”、“-10”、“+10”、“1C”、“2D”、“3E”、“-”、“+”、“0”、“b”和“#”被表示按钮开关的边缘的矩形包围。在数字“7”、“4”、“5”、“6”、“1”、“2”和“3”与字母“B”、“F”、“G”、“A”、“C”、“D”和“E”之间共享按钮开关“7B”、“4F”、“5G”、“6A”、“1C”、“2D”和“3E”。所述字母表示音名。用户通过利用工具按下按钮开关来指定音名和八度音。当用户按压按钮开关“工具”的图像时,在整个区域而不是图3A和3B所示的图像上显示作业列表。
区域34被分配给调音信息。利用矩形中的4个子区域来标注缩写“oct-note”、“keyNo.”、“cent”和“freq”。缩写“oct-note”、“keyNo.”、“cent”和“freq.”以及在这些缩写下面产生的可视图像在下文中进行详细描述。
在缩写“oct-note”下面的可视图像表示被分配了要作为目标的音调的音名以及该音调所属的八度音。可视图像“5-A”意思是要作为目标的音调是第5个八度音中的A。中央处理单元10通过子例程的执行来确定音名和八度音,并且通过缩写“oct-note”下面的子区域中的可视图像来向用户通知该音名和八度音。
在缩写“keyNo.”下面的可视图像表示被分配了处于“5-A”的键的键编号。直立式钢琴2具有88个黑键和白键,并且将键编号“1”至“88”分配给这88个黑键和白键。将第5个八度音中的音名A分配给具有键编号“49”的键。
在缩写“cent”下面的可视图像表示两个音调之间的音程。如本领域技术人员所熟知的那样,乐律中的全音相当于200音分(cent),并且,因此,半音相当于100音分。当用户希望指定与音调“5-A”偏离四分音的音调时,他或她通过按钮开关的可视图像输入“50”音分。当如图3A和3B中的可视图像那样在“cent”下面的子区域中产生“00”的可视图像时,将发现音调恰好处于第5个八度音中的A处。
在缩写“freq.”下面的可视图像表示与在由用户输入的数据期间要将乐器调谐到的目标音高相对应的目标频率。为了目标音高“freq.”,将利用音程“cent”来修改与所指定的音名相对应的频率。在图3A和3B中,与音名“5-A”和音程“00”一起,在缩写“freq”下面的子区域中读取数值图像“440.00”。这意味着通过乐器2产生的第5个八度音中的音调“A”将被发现处于440.00赫兹处。尽管未在图中示出,但是当便携式调音设备1协助用户对直立式钢琴2进行调音工作时,便携式调音设备1可以在没有用户指定的情况下估计在直立式钢琴2中产生的音调的目标频率,并且产生该目标频率的可视图像。
在调音工作的开始,用户可以通过借助于对按钮开关的图像的操作而进行的标准音高、音名、八度音和音程的数据输入,来指定目标音高的值。如在下文中详细描述的那样,便携式调音设备1可以估计某个音高上的音调。在便携式调音设备1基于所估计的音高确定音名的情况下,用户仅输入标准音高和音程。
在两种情况下,中央处理单元10使图形控制器14在缩写“oct-note”和“cent”下面产生表示音名、八度音和以音分为单位的音程的可视图像。中央处理单元10在音名和八度音的基础上确定键编号,并且还在音名、八度音和音程的基础上确定基频。所述基频以被分配了目标音名的音调为特征,并且在此实例中充当目标音高。
为了迅速确定键编号和频率,在只读存储器11中,对于若干标准音高值,将若干八度音中的音名、被分配给标准钢琴的黑键和白键的键编号和基频值互相关联。当用户通过触摸板液晶显示设备3输入标准音高的值、音名和八度音时,中央处理单元10在从触摸板控制器15报告的坐标的基础上确定给定八度音中的音名,并且以该给定八度音中的音名访问只读存储器11中被分配给所指定的标准音高的表。然后,将基频和键编号从只读存储器12读出到中央处理单元10。中央处理单元10将表示音名、八度音、键编号和目标频率的可视数据提供给图形控制器14,并且,在图形控制器14的控制下,在区域34中产生可视图像。
如果用户进一步输入距被分配了所述音名的音调的音程-当前在区域34中产生其可视图像-则触摸板控制器15向中央处理单元10报告由用户按压的按钮开关的可视图像的坐标,并且中央处理单元10将音程从音分转换为赫兹。中央处理单元10将用赫兹表示的音程加到基频上,并且将表示新基频的可视数据提供给图形控制器14。在图形控制器14的控制下,在区域34中产生以音分为单位的音程的可视图像和新基频的可视图像。
当声波从直立式钢琴2传播到便携式调音设备1时,便携式调音设备1为了实际频率和目标频率之间的相位差而分析模拟音频信号,并且在触摸板液晶显示设备3上显现该相位差。如果用户指示便携式调音设备确定音名,则便携式调音设备1通过两步自相关来估计音调的实际频率,并且确定音调的目标频率。因此,便携式调谐设备1可以通过可视图像而将目标音名与所述相位差一起通知给用户。因此,根据本发明的便携式调音设备1通过相位差的可视图像和目标音名的可视图像来协助用户进行调音工作。
根据本发明的便携式调音设备1具有两种操作模式,即手动模式和自动模式。当用户指定目标音名时,便携式调音设备1进入手动模式,并且通过一个或多个灰度图像来显现实际频率和目标频率之间的相位差。另一方面,当用户在没有任何对音名的指定的情况下指定标准音高和音程时,便携式调音设备1进入自动模式。便携式调音设备1在自动模式中确定目标音名和相位差,并且显现它们。因此,主例程和用于显现相位差的子例程对于手动模式和自动模式二者是共有的。由于这一原因,首先对主例程和用于显现相位差的子例程进行描述,并且在对主例程和用于确定相位差的子例程的描述之后,描述用于估计目标音高的子例程。
当主例程在中央处理单元10上运行时,用户输入标准音高、音名“oct-note”、音程“cent”和窗口尺寸W。主例程周期性地分支到用于显现相位差的子例程。在下文中,将详细描述所述主例程和两个子例程。
用于显现相位差子例程表示用于产生灰度图像32a或32b的方法,从而参考图4来说明该方法。该方法的特定特征之一在于基本图像的叠加。术语“叠加”表示用来使对象互相重合(register)的动作。通过该叠加,从基本图像产生灰度图像32a/32b,其表示音频信号的每个单个实际波形与目标音高上的单个目标波形之间的相位差的程度。
在下文中,为根据本发明的方法定义一些术语。“循环时间”相当于通过灰度图像表示的时间周期。“窗口”是等于目标频率Hz的倒数和任意数字之间的乘积的时间周期,并且比循环时间短。用户针对灰度图像的分辨率来将窗口设置为指定尺寸,如将在下文中详细描述的那样。在图4中,用“Hz’”来标注目标频率Hz的倒数,并且在该图所示的曲线图中,窗口比目标频率的倒数Hz’长2.5倍。
“基本图像”表示在每个窗口中出现的音频信号的基频分量的实际波形,并且,“极性图案”重复地在窗口中出现。基频分量表示音调的实际频率。极性图案表示一对负电势区和正电势区。表示负电势区的极性图案的一部分、以及表示正电势区的极性图案的剩余部分分别被称为“负区段(portion)”和“正区段”。当音频信号的基频分量将电势电平从负改变为正时,极性图案开始。正区段通过音频信号的上升和音频信号的衰减而继续,并且在从正到负的电势改变时终止。另一方面,当音频信号的基频分量改变为负时,负区段开始,并且一直持续到电势再次改变为正为止。
便携式调音设备1首先对关于音频信号的离散值进行采样,并且将所述离散值作为音频数据积存在随机存取存储器12中。随后,从所述离散值提取基频分量或实际频率,并且将表示该基频分量或实际频率的基频数据积存在随机存取存储器12中。从所积存的基频数据中提取多个基频数据系列以用于多个窗口。所述多个基频数据系列的每一个占据所述窗口之一。将在一个系列的首部的基频数据从在前一组的首部的基频数据起延迟倒数Hz’。因此,在每个基频数据系列和下一基频数据系列之间引入等于目标频率的倒数Hz’的延迟时间。
分别将所述多个基频数据系列转换为多个极性数据系列。该极性数据表示基频分量的正电势区和负电势区,并且被存储在随机存取存储器12中。每个极性数据系列表示基本图像。由于在基频数据系列和下一个基频数据系列之间引入了延迟时间,因此每个基本图像也被从前一个基本图像起延迟了等于目标频率的倒数Hz’的时间周期,并且与前一个基本图像部分重叠。
随后,将基本图像或多个极性数据系列互相重合或叠加。尽管极性图案占据了与音频信号的实际频率的倒数Hz’的重复周期相等的时间周期,但是基本图像之间的延迟时间等于目标频率的倒数Hz’。由于这一原因,实际频率和目标频率之间的相位差对基本图像具有影响。当将基本图像互相叠加时,只要音频信号的实际频率的信号周期或重复周期等于目标频率的倒数Hz’,每个负图案和每个正图案就准确地叠加在其它负图案和其它正图案上。如果所述信号周期或重复周期短于或长于目标频率的倒数Hz’,则每个基本图像的负区段和正区段之间的边界偏离下一个基本图像的负区段和正区段之间的边界,并且在每个循环时间内,从第一边界到最后的边界,相邻基本图像之间的偏移量增大。当便携式调音设备1进行到下一个循环时间时,灰度图像的基本图像从当前循环时间中的基本图像起改变。结果,该灰度图像看起来好像被略微移动一样。当便携式调音设备1从所述循环时间到下一个循环时间重复更新灰度图像时,用户觉得好像灰度图像在区域31中从一侧向另一侧流动一样。
用户针对分辨率设置窗口。窗口越短,分辨率越高。叠加后的基本图像,即灰度图像31a/31b占据整个区域31。为了在整个区域31中产生灰度图像,便携式调音设备1适当地放大该灰度图像,并且放大率根据窗口的长度或窗口的尺寸W而变化。
当用户指示便携式调音设备1延长窗口时,很多基本图像占据该窗口,使得便携式调音设备以相对小的放大率来放大每个基本图像,这是因为所述很多基本图像被调整为区域31的恒定长度。另一方面,当用户指示便携式调音设备缩短窗口时,少数基本图像占据该窗口,使得便携式调音设备以相对大的放大率来放大每个基本图像,以便使灰度图像31a/31b占据整个区域31。由于基本图像被放大,因此偏移量也被放大,并且用户可以通过灰度图像来辨别极小的偏移量。因而,短窗口使得清楚地显现在音频信号的重复周期和目标频率的倒数Hz’之间的相位差。
现在假设用户通过有选择地按压区域33中的按钮开关的图像而输入第5个八度音中的音名“A”,中央处理单元10确认手动模式,并且确定目标音高是440.00赫兹。假设用户没有输入距目标音高的偏移量或音程。中央处理单元10请求图形控制器14在区域34中产生可视图像“5-A”、“49”、“00”和“440.00”,如图3A和3B所示。
当用户按下被分配了键编号49的键时,在直立式钢琴2的内部产生钢琴音调,并且表示该钢琴音调的声波被传播到麦克风4。利用麦克风4将该声波转换为音频信号,并且通过连接电缆4a将该音频信号传送到信号接口13。
以比目标频率的倒数Hz’短得多的固定间隔来对所述音频信号进行采样,并且从关于该音频信号的离散值中提取基频分量。将表示该基频分量的基频数据积存在随机存取存储器12中。每个基频分量代表音频信号的实际频率,并且在图4中用40a或40b来进行标注。
从所积存的基频数据40a或40b中提取多个基频数据系列。在所述多个基频数据系列的每一个和下一个基频数据系列之间引入等于目标频率的倒数Hz’的延迟时间。
将所述多个基频数据系列转换为多个极性数据系列。在此实例中,分别用“1”和“0”来代替正离散值和负离散值。比特串“1”表示极性图案的正区段,并且在图4中被涂成黑色。另一方面,比特串“0”表示极性图案的负区段,并且在图4中被涂成白色。音频信号的基频分量40a/40b的单个信号波形形成一对正区段和负区段,使得将极性数据表示为多对正负区段。
由于所述窗口比目标频率的倒数Hz’长2.5倍,因此中央处理单元10分别提取所述多个极性数据系列以用于所述窗口,并且所述多个极性数据系列表示基本图像41a、41b、41c、41d、41e、...或41f、41g、41h、41i、...。在相邻的两个极性数据系列之间引入等于目标频率的倒数Hz’的延迟时间,使得基本图像41b、41c、41d、41e、...或41g、41h、41i、41j、...与之前的极性数据系列41a、41b、41c、41d、...或41f、41g、41h、41i、...偏离目标频率的倒数Hz’。
音频信号的基频分量40a使电势电平以440.00赫兹摆动,使得每个信号波形在长度上等于目标频率的倒数Hz’。正区段在长度上等于音频信号的基频分量40a的波长的一半,并且负区段也等于音频信号的基频分量40a的波长的另一半。由于这一原因,正区段和负区段之间的边界恰好与时间轴上的零交叉点对齐。由于窗口比目标频率的倒数Hz’长2.5倍,因此基本图像41a、41b、41c、41d、41e、...分别完全占据所述窗口。换句话说,基本图像41a、41b、41c、41d、41e、...的每一个与其它基本图像41b、41c、41d、41e、...、41a相同。
另一方面,音频信号的基频分量40b具有比目标频率的倒数Hz’长的波长,使得基本图像41f、41g、41h、41i、41j...中的极性图案的每一个变得比目标频率的倒数Hz’长。正区段和负区段之间的边界不与时间轴上的零交叉点对齐,并且2.5个极性图案不能占据单个窗口。结果,每个窗口中的正区段和负区段之间的比率改变,并且正区段和负区段之间的边界随着时间一起移动。
中央处理单元10将该极性数据系列的位模式与其它极性数据系列的位模式进行比较,好像如图5A或图5B所示,图像41a、41b、41c、41d、41e、...或41f、41g、41h、41i、41j、...互相叠加一样。
当直立式钢琴2产生相当于音频信号的基频分量40a的声波时,基本图像41a、41b、41c、41d、41e、...具有与其它基本图像41b、41c、41d、41e、...、41a的边界对齐的正区段和负区段之间的边界,并且基本图像41a、41b、41c、41d和41e被形成为如图5A所示的灰度图像32a。尽管图形控制器14在中央处理单元10的控制下、以更新定时在区域32a中重复地产生灰度图像32a,但是灰度图像32a与之前的循环时间中的灰度图像相同。因此,便携式调音设备向用户通知已经在键编号49正确地为直立式钢琴2调音。
另一方面,如果直立式钢琴2产生相当于音频信号的基频分量40b的声波,则音频信号的基频分量40b具有比目标频率的倒数Hz’长的信号周期,并且因此,音频信号的基频分量40b的极性图案变得比音频信号的基频分量40a的极性图案长。窗口也比目标频率的倒数Hz’长2.5倍。结果,两个奇数(two-odd)极性图案占据该窗口。在基本图像41f、41g、41h、41i、41j、...和接下来的基本图像41g、41h、41i、41j、...之间也引入延迟时间。当如图6B所示将基本图像41f、41g、41h、41i、41j...互相叠加时,基本图像41g、41h、41i、41j、...中的正区段和负区段之间的边界与基本图像41f、41g、41h、41i、41j、...中的正区段和负区段之间的边界偏离极短的时间a1。结果,基本图像41f、41g、41h、41i和41j被形成为灰度图像32b。灰度图像32b由多于两个的色调组成,并且与表示在目标音高上的音调的灰度图像32a不同。
当更新灰度图像32b时,基本图像41f、41g、41h、41i、41j被改变为不同的基本图像41k、...。将基本图像41f与基本图像41k进行比较,可以理解正区段和负区段之间的边界从基本图像41f移动到基本图像41k。由于这一原因,用户觉得灰度图像32b在区域31中向旁边移动。当图形控制器14重复地产生灰度图像32b时,用户通过灰度图像32b的移动而了解与目标音高的差异。
如果循环时间等于在音频信号的基频分量40b的信号周期和目标频率的倒数Hz’之间的公倍数之一,则代表与目标音高的差异的灰度图像在区域31中不会向旁边流动。然而,多于两个的色调形成代表与目标音高的差异的灰度图像。结果,用户识别出与目标音高的差异。因此,用户可以在灰度图像32a和32b中的色调数目的基础上确定直立式钢琴2是否已经被调谐到目标音高。
上述调音工作是通过对计算机程序的执行来实现的。如上文所述,该计算机程序分解为主例程和子例程。当主例程在中央处理单元10上运行时,便携式调音设备1为了要进行的作业而与用户通信,并且将其自己调整为由用户给定的状态。图6示出了与对直立式钢琴2的调音工作有关的主例程的一部分。所述子例程之一SB1被分配用于相位差的显现,即灰度图像32a/32b的产生,并且在图7中示出。首先参照图6和7来描述主例程和子例程SB1。
主例程周期性地分支到子例程SB1,并且中央处理单元10在循环时间内重复地产生灰度图像。尽管在主例程的步骤2和步骤3之间插入子例程SB1,但是主例程在每个定时器中断分支到子例程SB1,而不管主例程中的作业如何。
假设用户接通便携式调音设备1的电源开关。中央处理单元10将数据处理系统1b初始化,并且为了调音参数而与用户通信。所述调音参数之一是标准音高值。标准音高是要将与合唱曲有关的所有乐器和演唱者调音到的A处的频率。已经提出了诸如440赫兹、442赫兹、439赫兹等的若干标准音高值。其它调音参数是音名、以音分为单位的音程和窗口尺寸“W”。
当进入调音工作时,中央处理单元10首先请求图形控制器14在触摸板液晶显示设备3上依序向用户产生提示消息,如步骤S1。触摸板控制器15向中央处理单元10通知由用户按压的区域的坐标,并且中央处理单元10确定用户的指令、值和选项,如步骤S2。首先,图形控制器14产生标准音高候选者的数值图像。假设用户按压其中产生数值图像“440.000赫兹”的区域。然后,中央处理单元10借助于触摸板控制器15来判定标准音高为440.000赫兹。中央处理单元10还以相似的方式与图形控制器14和触摸板控制器15协作,以便确定音名、以音分为单位的音程和窗口尺寸W。假设用户将第5个八度音中的A、0音分和标准尺寸-即2.5倍-输入便携式调音设备1。中央处理单元10确认音名,即目标频率Hz、音程和窗口尺寸W分别是440赫兹、0音分和2.5,即比目标频率Hz的倒数Hz’长2.5倍。
当完成步骤S1和S2处的作业时,主例程准备好分支到子例程SB1,并且图形控制器14在区域31上产生灰度图像,如步骤S3和S4。在下文中,参考图7来描述步骤S3和S4处的作业。
随后,中央处理单元10为了调音曲线而与图形控制器14和触摸板控制器15协作,如步骤S5。术语“调音曲线”是指指示音名和目标频率之间的关系的曲线,并且将多个调音曲线以表的形式存储在只读存储器11中。所述多个调音曲线或表表示例如大钢琴和直立式钢琴的不同类型的钢琴的音名和目标频率之间的优选关系。这是因为以下事实在比乐律中的标准频率值高的某些频率值处,音乐家觉得高音区中的音调较自然。所述某些值根据钢琴的类型和型号而变化。由于这一原因,为钢琴准备多条调音曲线。调音曲线之一充当默认的调音曲线,使得只要用户没有选择另一条调音曲线,就将该默认调音曲线用于调音工作。图形控制器14产生表示不同类型钢琴的所述多条调音曲线的图像。当用户按压被分配给所述调音曲线之一的区域时,触摸板控制器15向中央处理单元10通知该区域的坐标,并且中央处理单元10确定该调音曲线。
随后,中央处理单元10请求图形控制器14产生提示用户输入音名的提示消息,并且等待一段时间。当在预定时间周期内在触摸板液晶显示设备3上显示提示消息时,中央处理单元10反复地确定用户是否输入了音名,如步骤S6。当用户按压音名的区域和八度音的区域时,触摸板控制器15向中央处理单元10通知该区域的坐标,使得中央处理单元10在调音曲线的基础上确定该音名的目标频率Hz,如步骤S7。中央处理单元10将该目标频率Hz与音名一起写入随机存取存储器12。
另一方面,如果所述预定时间周期在没有任何数据输入的情况下到期,则中央处理单元10进行到步骤S8,并确定用户是否将以音分为单位的音程输入到便携式调音设备1。详细地讲,中央处理单元10请求图形控制器14产生提示用户输入以音分为单位的音程的提示消息,并且等待数据输入。当用户按压数值图像的区域时,触摸板控制器15向中央处理单元10通知分配给该区域的坐标,并且中央处理单元10确定距所选择的音名的音程。换言之,中央处理单元10利用以音分为单位的音程来修改目标频率Hz,如步骤S9。中央处理单元10重新写入已经存储在随机存取存储器12中的目标频率Hz。
如果所述预定时间在没有任何数据输入的情况下到期,则中央处理单元10在不做任何修改的情况下进行到步骤S10,并且确定用户是否改变窗口的尺寸W。图形控制器14产生提示消息,并且触摸板控制器15检查触摸板,以查看用户输入了普通尺寸还是大尺寸。当用户输入比目标频率Hz的倒数Hz’长2.5倍的普通尺寸W时,触摸板控制器15向中央处理单元10通知所按压区域的坐标,并且中央处理单元10判定窗口具有普通尺寸,如步骤S11。中央处理单元10将窗口的尺寸W写入随机存取存储器12。如果在预定时间周期期间用户没有输入尺寸W,则中央处理单元10保持默认尺寸,即普通尺寸,并且返回步骤6。假设用户选择了普通尺寸。
用户可以首先以默认尺寸W将钢琴2调谐到目标频率Hz。当用户希望将钢琴2精确地调谐到目标频率Hz时,用户增大尺寸W。然后,中央处理单元10放大区域31中的灰度图像,并且使用户识别出与目标频率Hz的细微差异。结果,用户将钢琴2精确地调谐到目标音高。
即使当中央处理单元10在步骤S11改变窗口的长度时,中央处理单元10也返回步骤6。当用户改变音名时,便携式调音设备通过子例程SB1而以新的音名对直立式钢琴2进行调音工作。这样,中央处理单元10重复由步骤S6至S11组成的循环,直到用户指示便携式调音设备完成调音工作为止。
在此实例中,通过PDA(个人数字助理)来实现便携式调音设备。在标准PDA中,以15到20赫兹来更新触摸板液晶显示器上的图像。因此,主例程以15到20赫兹的间隔分支到子例程SB1。
假设主例程分支到子例程SB1。当麦克风4将音频信号提供给信号接口13时,合并在信号接口13中的模拟-数字转换器对关于该音频信号的离散值周期性地进行采样,并且由中央处理单元10取出该离散值,如步骤S20。在此实例中,采样频率是44.1千赫兹。中央处理单元10将表示该离散值的音频数据传送到随机存取存储器12,以便将该音频数据积存在随机存取存储器12中,如步骤S21。
中央处理单元10检查随机存取存储器12,以查看在随机存取存储器12中是否发现预定数目的音频数据,如步骤S22。在此实例中,所述预定数目落在1024和2048之间的范围内。当音频数据正朝着所述预定数目增加时,步骤S22处的答案给出为否定“否”,并且中央处理单元10返回步骤S20。这样,中央处理单元10重复由步骤S20至S22组成的循环,以便增加音频数据。
当音频数据达到所述预定数目时,步骤S22处的答案改变为肯定“是”。对于肯定答案“是”,中央处理单元10在目标频率Hz的基础上确定滤波因子,如步骤S23。滤波因子定义带通滤波器的滤波特性。带宽和中心频率充当该滤波因子。
随后,对音频数据进行带通滤波,使得从该音频数据提取由基频数据表示的基频分量,如步骤S24。换言之,从音频数据中消除谐波和噪声。基频数据被存储在随机存取存储器12中。
随后,中央处理单元10从随机存取存储器12中读出窗口的尺寸W,并且计算窗口的长度。如上文所述,用户已经输入了普通尺寸,即2.5倍。中央处理单元10从随机存取存储器12中读出目标频率Hz和尺寸W。中央处理单元10确定目标频率Hz的倒数Hz’,并且将该倒数Hz’乘以2.5。这样,中央处理单元10将窗口设置为(Hz’×2.5),如步骤S25。
随后,中央处理单元10在循环时间内从已经存储在随机存取存储器12中的基频数据中提取多个基频数据系列,如步骤S26。每个基频数据系列被适配为占据所述窗口之一。换言之,窗口的长度等于每个系列中的基频数据的数目和采样周期之间的乘积。在每个系列的第一个基频数据和下一系列的第一个基频数据之间引入时间延迟,并且该时间延迟等于目标频率的倒数Hz’。
随后,分别将所述多个基频数据系列转换为多个极性数据系列,如步骤S27。如上文所述,如果基频数据具有正数,则利用表示二进制数“1”的极性数据来代替该基频数据。另一方面,如果基频数据具有负数,则利用表示二进制数“0”的极性数据来代替该基频数据。结果,将比特串保留在随机存取存储器12中。
图8A示出了表示基本图像41a、41b、41c、41d和41e的5个比特串,并且图8B示出了与图8A中示出的比特串不同的5个比特串,并且这5个比特串表示基本图像41f、41g、41h、41i和41j。在此实例中,每个系列包含25个极性数据,并且分别将25个地址分配给这25个极性数据。分别将这25个极性数据转换为25个比特,并且将这25个比特写入分别被分配了所述25个地址的25个存储位置。这样,这25个比特形成与基本图像41a至41j之一相对应的每个比特串。由于每个比特具有“1”或“0”,因此利用两个色调、即黑色和白色来表示基本图像。
随后,中央处理单元10通过这些比特串的算术平均来叠加基本图像41a至41e或41f至41j。对基本图像41a至41e或比特串41a至41e的算术平均产生灰度数据42a,即(5555500000555550000055555)/5,并且对基本图像41f至41j的算术平均产生灰度数据42b,即(3233433232212232334332322)/5。这样,中央处理单元10通过对比特串41a至41e或41f至41i的算术平均来产生灰度数据,如步骤S28。
最后,中央处理单元10将灰度数据42a或42b提供给图形控制器14,并且图形控制器14在区域31上产生灰度图像32a或32b,如步骤S29。由于音频信号的基频40a等于目标频率Hz,因此比特串41a至41e彼此相同,并且利用与比特串41a至41e相同的比特串来表示灰度数据42a。因此,图形控制器14从灰度数据42a产生两个色调的灰度图像32a。
另一方面,音频信号的基频40b小于目标频率Hz,使得比特串41f至41j彼此不同。结果,多于两种的不同数字表示灰度数据42b。由于这一原因,图形控制器14在灰度图像32b中产生多于两个的色调。
因此,主例程周期性地分支到子例程SB1,并且在区域31中周期性地更新灰度图像32a或32b。当用户觉得灰度图像32a或32b模糊时,他或她在步骤S10给出肯定答案“是”,并且将不同的尺寸输入到便携式调音设备。然后,窗口的长度变得小于2.5,并且在步骤S29,中央处理单元10指示图形控制器14以大的放大率产生灰度图像32b的一部分。灰度图像的这一部分占据整个区域31。因此,便携式调音设备1使用户清楚地看到与目标频率Hz的差异。
当音频信号具有等于目标频率Hz的基频40a时,在一系列帧中,在区域31中重复地产生灰度图像32a,并且在区域31中,该灰度不改变相对位置。由于这一原因,灰度图像32a看起来好像停止在区域31中的位置上一样。
如果音频信号具有大于或小于目标频率Hz的基频,则用户看到灰度图像在区域31中移动,或者由多于两个的色调组成。详细地讲,在循环时间等于实际频率的倒数和目标频率的倒数Hz’之间的公倍数的情况下,不管实际频率和目标频率之间的一致性如何,灰度图像都看起来好像停止了一样。然而,灰度图像仍然由多于两个的色调组成。由于这一原因,用户借助于由多于两个的色调组成的灰度图像而识别出不一致。当循环时间不等于所述公倍数时,用户看到由多于两个的色调组成的灰度图像在所述区域中移动。因此,只要基频与目标频率Hz不同,用户就必定识别出所述不一致。
假设基频接近目标频率Hz。便携式调音设备使灰度图像减慢,并且用户感觉难以确定灰度图像是否仍然移动。在此情形中,用户指示便携式调音设备扩展灰度图像,使得便携式调音设备1在区域31中横向放大灰度图像的一部分。因此,灰度图像的色调比先前的色调更快地横向移动。然后,用户识别出实际频率和目标频率Hz之间的不一致,并且继续对钢琴2的调音工作。
如将从前面的描述理解的那样,用户通过尺寸可变的灰度图像来将乐器调谐到目标频率Hz。
在下文中对用于估计实际频率的子例程进行描述。如果在步骤S6没有肯定答案“是”的情况下用户按下键,则主例程不仅周期性地分支到用于显现相位差的子例程,还周期性地分支到用于估计目标音名的子例程。已经描述了子例程SB1,并且出于简单起见而不重复该描述。以诸如每秒若干次的相对长的时间间隔重复对实际频率的估计。图9示出了用于估计目标音高的子例程SB2。
主例程周期性地分支到子例程SB2。麦克风4不断地将模拟音频信号提供给信号接口13,以进行模拟-数字转换,并且中央处理单元10从信号接口13取出音频数据代码,如步骤S30。以44.1千赫兹对模拟音频信号进行采样。
中央处理单元10检查音频数据代码,以查看声波是否具有大于阈值的响度值,如步骤S31。如果用户保持环境安静,则响度值低于所述阈值,并且步骤S31处的答案给出为否定“否”。对于否定答案“否”,中央处理单元10通过步骤S32a返回步骤S30。在步骤S32a,中央处理单元10删除已经积存在随机存取存储器12中的音频数据代码。即使在瞬间产生了大噪声,也会在步骤S32a删除表示该噪声的音频数据代码,使得噪声对所述估计不具有任何影响。这样,中央处理单元10重复由步骤S30、S31和S32a组成的循环,直到步骤S31处的答案改变为止。
当音调打破寂静时,模拟音频信号使电势电平摆动超过阈值,并且步骤S31处的答案改变为肯定“是”。然后,中央处理单元10将音频数据代码存储在随机存取存储器12中,如步骤S32b。
随后,中央处理单元10检查随机存取存储器12,以查看预定数目的音频数据代码是否在继续,如步骤S32c。所述预定数目将在下文中结合自相关来进行描述。
如果音频数据代码的数目小于所述预定数目,则步骤S32c处的答案给出为否定“否”,并且中央处理单元10返回步骤S30。这样,中央处理单元10重复由步骤S30、S31、S32a、S32b至S32c组成的循环,以便增加存储在随机存取存储器12中的音频数据代码的数目。
当中央处理单元10在随机存取存储器12中发现预定数目的音频数据代码时,步骤S32c处的答案改变为肯定“是”。对于肯定答案“是”,中央处理单元10进行到用于自相关的子例程S33。子例程S33将在下文中参考图10来进行详细描述。当完成子例程S33中的作业时,中央处理单元10删除在随机存取存储器12中积存的音频数据代码,并且返回步骤S30。这样,中央处理单元10重复由步骤S30至S34组成的循环,以便估计实际音高。
如本领域技术人员所公知的那样,可以通过自相关R(m)来确定信号的波形x(k)的周期性。在自相关过程中,对于不同的延迟时间m的值计算自相关R(m),并且在计算结果中寻找自相关R(m)的最大值。在自相关R(m)的最大值的基础上确定波形x(k)的周期性。
在此实例中,将钢琴键盘分为两个音区,即高音区和低音区,并且便携式调音设备1首先假定将通过自相关R(m)而在其中发现所述音调的音区,在下文中,将其称为“初步(introductory)自相关”。随后,便携式调音设备1进行在下文中被称为“主自相关”的自相关R(m)’或R(m)”,以便在通过粗略的自相关假定的音区中确定实际频率,即音调的音高。模拟音频信号的波形由音频数据代码表示,并且用“x(k)”来标注该波形。在关于自相关的描述中,将音频数据代码称为“样本”。在此实例中,被分配了从1到44的键编号的键形成低音区,并且剩余的键,即被分配了从45到88的键编号的键,属于高音区。
详细地讲,当中央处理单元10进入子例程S33时,中央处理单元10将变量m设置为0,如步骤S40a。中央处理单元10将变量m从当前值“0”改变为第一值。变量m表示以毫秒为单位的延迟时间,并且在初步自相关R(m)中取4个值-即6、12、25、50-之一,如图11所示。因此,在步骤S40b,中央处理单元10采用6毫秒作为延迟时间m。在只读存储器11中将延迟时间m的值制成表,并且在图2中用参考标号50来标注这个表。
预定数目的音频数据代码或样本已经被积存在随机存取存储器12中,并且初步自相关R(m)需要500到1000个样本。中央处理单元10通过使用等式1来对第一延迟时间值计算自相关R(m),如步骤S41。
R(m)=Σk=0M-mx(k)x(k-m)]]>等式1其中M落在500和1000之间的范围内,并且m从6通过12和25改变到50。等式1代表以下运算,其中,将由M个样本表示的波形x(k)和从波形x(k)延迟了延迟时间m的值的延迟波形x(k-m)之间的乘积累加,并且对乘积的和数求平均。由于初步自相关R(m)旨在找出大体趋势,因此相对小数目的样本,即500到1000个样本参与该计算。
当对于当前数目的延迟时间完成了初步自相关R(m)时,中央处理单元10检查表50,以查看是否已经对所有值完成了初步自相关R(m),如步骤S42。由于在步骤40b将延迟时间设置为第一值,因此答案给出为否定“否”,并且中央处理单元10返回步骤S40b。在步骤S40b,将延迟时间m增大为第二值“12”,并对第二值“12”执行初步自相关R(m)。以这一方式,中央处理单元10重复由步骤S40b到S42组成的循环,以便对于延迟时间m的所有值计算初步自相关R(m)。
当在步骤S41对最后的值“50”计算了初步自相关R(m)时,步骤S42处的答案改变为肯定“是”,使得中央处理单元10进行到步骤S43。中央处理单元10在步骤S43判定初步自相关R(m)是否从正改变为负。如图12A所示,尽管低音区中的音调使初步自相关R(m)保持值为正,但是高音区中的音调使初步自相关R(m)将值从正改变为负。因此,初步自相关R(m)和延迟时间之间的关系使得有可能给出步骤S43处的答案。
当音调属于高音区时,步骤S43处的答案给出为肯定“是”,并且中央处理单元10通过对波形x(i)的主自相关R(m)’来估计该音调的实际频率,如步骤S44。另一方面,如果音调属于低音区,则步骤S43处的答案给出为否定“否”,并且中央处理单元10通过对波形x(j)的主自相关R(m)”来估计该音调的实际频率,如步骤S45。
主自相关R(m)’由等式2表示。
R(m)′=Σj=0M1-mx(j)x(j-m)]]>等式2其中M1是512,并且m是从10.54、11.16、11.83、...112.5、119.2和126.3的组中选择的延迟时间。因为高音区中的音调的波长比较短,所以样本数目M1小。如上文所述,被分配了从45到88的键编号的键属于高音区,并且音名是从第4个八度音中的F到第8个八度音中的C。变量m的值等于高音区中的所有音调的基频的倒数,使得变量m取44个值之一。变量m的值,即10.54、11.16、11.83、...112.5、119.2和126.3是在标准音高和采样速率为440赫兹和44.1千赫兹的条件下确定的。
因此,将变量m表示为(1/音调的基频)×44.1k。“k”是指1000。这样,通过使用等式2,对于延迟时间m的所有值计算了主自相关R(m)’。将计算结果存储在随机存取存储器12中。
另一方面,主自相关R(m)”由等式3表示。
R(m)′′=Σj=0M2-m/2x(j)x(j-m)]]>等式3其中M2是2048,并且m是从由133.8、141.7、150.2、...1428、1513和1603组成的组中选择的延迟时间。由于从0到(M2-m/2)重复计算,因此减少了对于波形x(j)的样本数目。延迟时间m取等于低音区中的每个音调的基频的倒数的值。如上文所述,被分配了键编号1的键到被分配了键编号44的键属于低音区,使得音名从0八度音中的A变化到第4个八度音中的E。因此,在与结合高音区所述的条件相同的条件下,延迟时间m或倒数从133.8通过141.7、150.2、...、1428和1513变化到1604。这样,对于44个延迟时间m的值,重复对2048个样本的主自相关R(m)”。将计算结果存储在随机存取存储器12中。有可能减少样本以减小计算量。
延迟时间对应于样本系列和下一个样本系列之间的偏移量。由于以44.1千赫兹的固定间隔对样本,即音频数据代码进行采样,因此有可能在延迟点没有发现任何样本。在这一情形中,通过插值产生样本系列,以便获得步骤S41处的样本x(k-m)、步骤S44处的x(i-m)和步骤S45处的x(j-m)。
当完成主自相关R(m)’或R(m)”的计算时,中央处理单元10在随机存取存储器12中搜索最大值,如步骤S46,并且确定使主自相关R(m)’或R(m)”最大的延迟时间m的值。
图12B示出了高音区中的主自相关R(m)’,并且图12C示出了低音区中的主自相关R(m)”。如图12B所示,曲线PL1在10.54毫秒的延迟时间之后不久开始上升,并且在数据处理范围内的延迟时间m1处最大,并且朝着126.3毫秒的延迟时间衰减。另一方面,曲线PL2在133.8毫秒的延迟时间处开始上升,并且在延迟时间m2处最大,并且朝着1603毫秒的延迟时间衰减。这样,中央处理单元10首先在随机存取存储器12中搜索R(m)’的最大值或R(m)”的最大值,并且确定使主自相关R(m)’或R(m)”最大的延迟时间m1或m2。
由于延迟时间m1或m2几乎等于音频信号的基频的倒数,因此中央处理单元10估计某个目标频率上的音调,如步骤S47,并且确定音名,如步骤S48。中央处理单元10还访问所述表,以便确定键编号。
中央处理单元10请求图形控制器14在分别被分配给缩写“freq.”、“oct-note”和“keyNo”的子区域下面产生表示目标频率、音名和键编号的可视图像。
如将从以上描述认识到的那样,通过初步自相关从音域中选择所述音区之一,并且通过主自相关估计目标频率。将主自相关重复等于所选音区中的音名数目的次数,从而显著减少了计算量。因为预先减少了候选者的数目,所以音区的选择使得有可能增强抗噪声特性。根据本发明的调音设备通过减少候选者来准确地辨别微弱音调的音高。
第二实施例转到图13,实现第二实施例的调音设备1A包括外壳1Aa、数据处理系统(未示出)、触摸板液晶显示设备3A和内置麦克风4A。外壳1Aa、数据处理系统(未示出)和触摸板液晶显示板3A在结构上与第一实施例的1a、1b和3的结构相似,并且为简单起见,在下文中不加入进一步的描述。然而,在以下描述中,利用指定数据处理系统1b的对应系统组件的相同参考标号来标注该数据处理系统(未示出)的系统组件。内置麦克风4A安装在外壳1Aa内部,并且如所示出的那样使其暴露在外壳1Aa的前表面。
在触摸板液晶显示设备3A上产生画面30A,并且在画面30A中包括区域31A、33A、34A和35A。将区域31A、33A和35A分配给要在区域31、33和35中产生的可视图像,并且灰度图像32Ab表示音调的目标音高和实际音高之间的不一致性。
将区域34A划分为用“oct-note”、“KeyNo”、“cent”和“freq.”标注的4个子区域。缩写“oct-note”、“KeyNo”和“cent”与结合第一实施例描述的那些相同,并且,与第一实施例中的可视图像相似,在这些子区域中产生的可视图像表示音名和八度音、键编号和以音分为单位的音程。然而,子区域34Aa中的可视图像与第一实施例的可视图像不同。子区域34A中的可视图像表示实际基频和目标基频。可视图像“430.00/440.00”意思是音调的实际基频和目标基频分别为430.00赫兹和440.00赫兹。因此,将实际基频与相位差和目标基频一起显现在调音设备1A上。
为了确定实际基频,在便携式调音设备1A中采用三步自相关。主例程和用于显现相位差的子例程与在图6和7中示出的那些相同,并且以用于确定实际频率的步骤来修改子例程SB2。换言之,用子例程SB2’来代替子例程SB2。
将图14与图9相比较,可以理解,在步骤S32c和S33之间以及与步骤S33并列地在步骤S32d和S34之间引入步骤S32d和S35。步骤S33处的作业序列在图10中示出。由于这一原因,为简单起见,在下文中将描述集中于步骤S32d和S35。
当将预定数目的音频数据代码积存在随机存取存储器12中时,步骤S32c处的答案给出为肯定“是”。对于该肯定答案,中央处理单元10检查随机存取存储器12,以查看是否已经确定了目标音名,如步骤S32d。如果步骤S32d处的答案给出为否定“否”,则中央处理单元10进行到步骤S33,并且进入子例程S33。已经参考图10描述了子例程S33,并且为了避免不希望的重复而省略该描述。当中央处理单元10估计某个目标频率上的音调时,中央处理单元10确定目标音名,并且将表示该目标音名的数据信息存储在随机存取存储器12中。由于这一原因,在下一次数据处理中,步骤S32d处的答案改变为肯定。
对于步骤S32d处的肯定答案,中央处理单元10计算主自相关R(m)。主自相关R(m)与主自相关R(m)”相似。延迟时间以ΔP的固定间隔从P0+(P0-P1)/2变化到P0+(P2-P0)/2。P0是目标音名的基频的倒数,P1是在目标音名P0前面的音名处的基频的倒数,并且P2是紧接在目标音名P0之后的音名处的基频的倒数。ΔP是普通人敏感的频率的倒数。用户从存储在只读存储器11中的候选者中选择固定间隔ΔP。可以将从P0+(P0-P1)/2到P0+(P2-P0)/2的范围压窄到P0+(P0-P1)/n到P0+(P2-P0)/n之间的范围,其中n是大于2的自然数。
主自相关R(m)在某个延迟时间被最大化。所述某个延迟时间等于表示音调的实际基频的音频信号的波长,从而中央处理单元10在所述某个延迟时间的基础上确定实际基频。
已经在步骤S47确定了目标频率,并且通过步骤S35处的执行确定了实际频率。由于这一原因,中央处理单元10请求图形控制器14在子区域34Aa中产生可视图像。
如将从以上描述理解的那样,通过三步自相关来依序确定音区、目标音名和实际频率。
实施例的变型尽管已经示出和描述了本发明的特定实施例,但是对于本领域技术人员来说将清楚的是,在不背离本发明的精神和范围的情况下,可以进行各种改变和修改。
可以将麦克风4内置于外壳1a中,并且可以按照与图6所示不同的顺序来排列步骤1、2和5,可以将通过步骤S20、S21和S22处的作业积存的音频数据代码有选择地用作要通过步骤S30、S31和S32处的作业积存的音频数据代码。
根据本发明的调音设备可以被设计用于例如小提琴家族的另一种类的乐器。不同种类的乐器通常具有不同的音域。因此,术语“高音区”和“低音区”随着乐器的种类而变化。延迟时间m的值将被发现处于延迟时间的一个范围和延迟时间的另一范围之间的边界的两侧,这使得初步自相关的趋势彼此不同。在此实例中,所述趋势是初步自相关的值的极性上的改变。如果高音区和低音区具有与第一实施例的边界不同的边界,则延迟时间的这两个范围从第一实施例的范围起变化,并且因此,延迟时间m的值与第一实施例中的值不同。在所述边界两侧选择多于或小于4个值。此外,音域在一种乐器和另一种乐器之间是不同的。实际上,诸如大提琴的乐器的高音区形成诸如小提琴的另一乐器的低音区的一部分。因此,延迟时间m的值,即6、12、25和50不对本发明的技术范围设置任何限制。
低音区可以与高音区部分重叠。例如,被分配了键编号1至50的键形成低音区,并且被分配了键编号39至88的键形成高音区。尽管主自相关R(m)’/R(m)”的计算量增大,但是中央处理单元10更准确地估计某个频率上的音调。
可以将键盘划分为多个两个的音区。对于初步自相关,将发现延迟时间m的值在所述音区之间的每个边界周围。因此,多于两个的音区需要多组延迟时间值。
作为示例,将乐器的音域划分为低音区、中音区和高音区。尽管在上述实施例中,在最后的延迟时间值m4处的极性的基础上,确定音调所属的音区,但是可以将多个标准用于这三个音区。第一个标准与上述实施例的标准相同。另一标准是在初步自相关R(m)的最小值和初步自相关R(m)改变为负时所处的延迟时间之间的关系。因此,存在若干种方法来确定音调所属的音区。为了估计音调的目标频率,步骤S43b分支到步骤S44/S45和用于中音区的另一步骤S49。在步骤S49处的主自相关中,中音区内的音调的基频的倒数充当延迟时间m。
数目M1和数目M2是示例,并且512和2048不对本发明的技术范围设置任何限制。在采样间隔和音区中的音调的最长波长的基础上确定样本数目M1和M2。如果最长波长比优选实施例的最长波长短,则数目M1少于512。
步骤S41处的变量m的数目不对本发明的技术范围设置任何限制。可以对多于4个的延迟时间m的值计算初步自相关R(m)。而且,可以用等式来表示该变量,并且中央处理单元10在步骤S40b和步骤S41之间确定延迟时间m的值。
延迟时间m的值的数目是在标准音高和采样速率为440赫兹和44.1千赫兹的条件下确定的。在不同条件的情况中,延迟时间m的值的数目与结合第一实施例所述的数目不同。
PDA不对本发明的技术范围设置任何限制。可以在个人计算机系统中加载本发明的计算机程序。此外,可以通过布线逻辑电路来实现本发明的方法。
可以用发光二极管的阵列、或者例如有机电致发光板的另一种显示板来代替液晶显示板。
简单的调音设备可以执行图9和10中示出的主例程和子例程的一部分。换言之,从安装在简单的调音设备中的计算机程序中去除了用于显现相位差的子例程。
麦克风不对本发明的技术范围设置任何限制。可以直接从弦的振动产生音频信号。这种振动-电信号转换器可以是压电元件。
调音设备1/1A的组成部件与权利要求语言相关如下。麦克风4/4A对应于“转换器”,并且直立式钢琴2充当“乐器”。数据处理系统1b以及包括主例程和子例程SB1、SB2和SB2’的计算机程序充当“数据处理系统”。初步自相关和主自相关形成“多步自相关”的各部分。触摸板液晶显示设备3/3A充当“人机界面”。
数据处理系统1b和子例程SB2作为整体构成“第一执行器”,并且由等式1表示的初步自相关对应于“自相关”。数据处理系统1b和子例程S33作为整体构成“第二执行器“,并且由等式2和3表示的主自相关对应于“另一自相关”。
中央处理单元10以及步骤S40a、S40b、S41和S42处的作业充当第一执行器的“预计算例程”,并且中央处理单元10和步骤S43处的作业充当第一执行器的“判断例程”。
中央处理单元10以及步骤S44和S45处的作业充当第二执行器的“预计算例程”,并且中央处理单元10以及步骤S46和S47处的作业充当第二执行器的“判断例程”。
数据处理系统1b和子例程SB1充当“另一数据处理系统”。中央处理单元10和步骤S20至S27处的作业充当“基本图像产生器”,并且中央处理单元10以及步骤S28和S29处的作业充当“合成图像产生器”。中央处理单元10和步骤S20至S29的循环充当“时间保持器”。
权利要求
1.一种用于协助用户对乐器(2)进行调音工作的调音设备,包括转换器(4;4A),将代表在所述乐器(2)中产生的音调的振动转换为代表所述振动的电信号;数据处理系统,连接于所述转换器,并且向所述用户提供协助;以及人机界面(3;3A),连接于所述数据处理系统,并且显现所述协助,其特征在于所述数据处理系统(1b,SB2;SB2’)对所述电信号的波形进行多步自相关(R(m),R(m)’/R(m)”)、以便逐步缩小以所述音调为特征的频率范围,并且请求所述人机界面(3;3A)显现所述多步自相关(R(m),R(m)’/R(m)”)的结果。
2.如权利要求1所述的调音设备,其中,所述数据处理系统包括第一执行器(1b,SB2;1b,SB2’),计算自相关,以便确定所述音调落入的某个音区,和第二执行器(1b,S33),对于与所述某个音区中的音调相对应的延迟波形计算另一自相关,以便确定所述音调的音高。
3.如权利要求2所述的调音设备,其中,所述第一执行器具有预计算例程(10,S40a,S40b,S41,S42),对于从所述波形(x(k))延迟了延迟时间(m)的值的假定波形(x(k-m))计算所述自相关(R(m)),如此选择所述延迟时间(m)的值,以便使对于表示一音区中的音调的波形的假定波形(x(k-m))的所述自相关(R(m))表现出与对于表示另一音区中的音调的波形的假定波形(x(k-m))的所述自相关(R(m))的趋势不同的趋势,以及判断例程(10,S43),检查所述自相关的结果,以查看对于从所述波形延迟的假定波形的所述自相关(R(m))是否表现出任一趋势,并且确定所述某个音区。
4.如权利要求3所述的调音设备,其中,如此选择所述延迟时间的值,使得对于所述音区中的所述假定波形的所述自相关(R(m))表现出与对于由所述另一音区中的所述假定波形的所述自相关(R(m))表现出的极性改变不同的极性改变。
5.如权利要求3所述的调音设备,其中,所述自相关由下式表示R(m)=Σk=0M-mx(k)x(k-m)]]>其中x是表示所述波形的样本,M是所述样本的数目,并且m是所述延迟时间的值。
6.如权利要求3所述的调音设备,其中,所述判断例程(10,S43)确定所述自相关(R(m))的值是否被发现处于正区域和负区域之一中,或者在所述负区域和所述正区域之间改变,并且判断所述音区之一是所述某个音区。
7.如权利要求2所述的调音设备,其中所述第二执行器(1b,S33)包括预计算例程(10,S44,S45),对于从所述波形(x(i),x(j))延迟的、并且分别表示所述某个音区中的音调的假定波形(x(i-m),x(j-m)),计算所述另一自相关(R(m)’,R(m)”),和判断例程(10,S46,S47),在所述另一自相关(R(m)’,R(m)”)的结果中搜索所述另一自相关(R(m)’,R(m)”)的最大值,并且基于在所述最大值处引入假定波形(x(i-m),x(j-m))之一的延迟时间(m),确定表示所述音调的所述波形的波长。
8.如权利要求7所述的调音设备,其中所述另一自相关由下式表示R(m)′=Σj=0M1-mx(j)x(j-m)]]>其中,x是表示所述波形的样本,M1是样本的数目,并且m是延迟时间的值。
9.如权利要求7所述的调音设备,其中,所述另一自相关由分别用于所述音区中的音调和所述另一音区中的音调的以下等式之一表示,R(m)′=Σj=0M1-mx(j)x(j-m)]]>其中,x是表示所述波形的样本,M1是样本的数目,并且m是延迟时间的值,以及R(m)′′=Σj=0M2-m/2x(j)x(j-m)]]>其中,x是表示所述波形的样本,M2是样本的数目,并且m是延迟时间的值。
10.如权利要求1所述的调音设备,还包括另一数据处理系统(1b,SB1),连接于所述转换器(4;4A)和所述人机界面(3;3A),并且通过对所述波形的分析,产生表示所述音调的目标频率和所述音调的实际频率之间的相位差的合成图像(32a,32b;32Ab)。
11.如权利要求10所述的调音设备,其中,所述另一数据处理系统(1b;SB1)包括基本图像产生器(10,S20-S27),连接于所述转换器(4;4A),并且如此产生代表在所述音调中包含的某个频率分量的重复周期的多个基本图像(41a-41e;41f-41j),使得将所述基本图像(41a-41e;41f-41j)的窗口时间周期彼此部分重叠,以及合成图像产生器(10,S28,S29),连接于所述基本图像产生器(10,S20-S27),如此叠加所述基本图像(41a-41e;41f-41j),使得消除所述窗口时间周期的每一个和跟随在所述窗口时间周期的所述每一个之后的下一个窗口时间周期之间的延迟时间,以便产生所述合成图像(32a,32b;32Ab),并且使所述人机界面(3;3A)显现所述合成图像(32a,32b;32Ab)。
12.如权利要求11所述的调音设备,其中,所述基本图像产生器(10,S20-S27)从被分配了各自的数据位置的波形数据系列产生所述基本图像(41a-41e;41f-41j)中的每一个,所述合成图像产生器(10,S28,S29)从合成数据系列产生所述合成图像(32a,32b;32Ab),并且通过对波形数据的算术平均来产生所述合成数据(42a,42b)中的每一个,其中所述波形数据的每一个占据在所述多个波形数据系列之一中的所述数据位置之一上。
13.如权利要求11所述的调音设备,所述另一数据处理系统还包括时间保持器(10,S20-S29),连接于所述基本图像产生器(10,S20-S27)和所述合成图像产生器(10,S28,S29),并且使所述基本图像产生器(10,S20-S27)和所述合成图像产生器(10,S28,S29)以比所述窗口时间周期中的每一个长的间隔来产生所述基本图像(41a-41e;41f-41j)和所述合成图像(10,S28,S29)。
14.一种表示用于协助对乐器(2)进行调音工作的方法的计算机程序,所述方法包括以下步骤a)将代表在所述乐器(2)中产生的音调的振动转换为代表所述振动的电信号;b)将代表所述电信号的波形的数据信息(x(k),x(i),x(j))积存在数据存储器(12)中;c)通过重复对所述数据信息(x(k),x(i),x(j))的自相关(R(m),R(m)’,R(m)”),缩小以所述音调为特征的所述波形的频率范围;以及d)显现缩小的频率范围。
15.如权利要求14所述的计算机程序,其中,所述步骤c)包括以下子步骤c-1)对所述数据信息(R(m))计算自相关(R(m)),以便确定所述音调落入的某个音区,以及c-2)对于与所述某个音区中的音调相对应的延迟波形(x(i-m),x(j-m)),计算另一自相关(R(m)’,R(m)”),以便确定所述音调的音高。
16.如权利要求15所述的计算机程序,其中,所述子步骤c-1)包括以下子步骤c-1-1)对于从所述波形(x(k))延迟了延迟时间(m)的值的假定波形(x(k-m)),计算所述自相关(R(m)),如此选择所述延迟时间(m)的值,以便使对于表示一音区中的音调的波形(x(k))的假定波形(x(k-m))的所述自相关(R(m))表现出与对于表示另一音区中的音调的波形(x(k))的假定波形(x(k-m))的所述自相关(R(m))的趋势不同的趋势,以及c-1-2)检查所述自相关(R(m))的结果,以查看对于表示所述音调的所述波形(x(k))的假定波形(x(k-m))的所述自相关(R(m))是否表现出任一趋势,并且确定所述某个音区。
17.如权利要求16所述的计算机程序,其中,所述自相关R(m)由下式表示,R(m)=Σk=0M-mx(k)x(k-m)]]>其中,x是关于所述波形的所述数据信息,M是所述数据信息的数目,并且m是所述延迟时间的值。
18.如权利要求15所述的计算机程序,其中,所述子步骤c-2)包括以下子步骤,c-2-1)对于从所述波形(x(i),x(j))延迟的、并且分别表示所述某个音区中的音调的假定波形(x(i-m),x(j-m)),计算所述另一自相关(R(m)’,R(m)”),和c-2-2)确定引入所述假定波形(x(i-m),x(j-m))之一的延迟时间(m)的量,其所述另一自相关(R(m)’,R(m)”)在所述子步骤c-2-2)中被最大化。
19.如权利要求18所述的计算机程序,其中,所述另一自相关由以下等式表示,R(m)′=Σj=0M1-mx(j)x(j-m)]]>其中,x是所述数据信息,M1是所述数据信息的数目,并且m是延迟时间的值。
20.如权利要求18所述的计算机程序,其中,所述另一自相关由分别用于一音区中的音调和另一音区中的音调的以下等式中的一个表示,R(m)′=Σj=0M1-mx(j)x(j-m)]]>其中,x是所述数据信息,M1是所述数据信息的数目,并且m是延迟时间的值,以及R(m)′′=Σj=0M2-m/2x(j)x(j-m)]]>其中,x是所述数据信息,M2是所述数据信息的数目,并且m是延迟时间的值。
全文摘要
一种便携式调音设备(1),包括麦克风(4)、数据处理系统(1b)和触摸板液晶显示设备(3),并且协助用户对直立式钢琴(2)进行调音工作;当用户按下键时,表示音调的声波被传播到麦克风(4),并被转换为音频信号,所述音频信号的波形被转换为音频数据代码;数据处理系统(1b)首先对少量的延迟波形(x(k-m))的音频数据代码计算初步自相关(R(m)),以便确定音调所属的音区,并且随后对该音区中的延迟波形(x(i-m),x(j-m))的音频数据代码计算主自相关(R(m)’,R(m)”),以便估计音调的音高;由于通过初步自相关(R(m))将音域压窄到所述音区,因此在主自相关(R(m)’,R(m)”)中,计算量相对较小。
文档编号G10L25/90GK1892811SQ20061009417
公开日2007年1月10日 申请日期2006年6月27日 优先权日2005年7月4日
发明者奥山福太郎 申请人:雅马哈株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1