用于dat音频修复的音频数据的模式匹配方法

文档序号:6740062阅读:338来源:国知局
专利名称:用于dat音频修复的音频数据的模式匹配方法
技术领域
本发明涉及一种匹配方法,尤其涉及一种音频数据的模式匹配方法。
背景技术
DAT (digtal audio tape)指的是数字音频磁带,这是一种高密度数字磁带录音介质,频率采样为三种模拟LP32KHZ、数字44.1KHZ及模拟48KHZ,主要流行于上世纪九十年代。由于开发代价及制造代价高昂及出于对版权的考虑,其在当时面向的主要用途为专业领域,多为灌制CD前的母带制作。因此目前世界各国的电台、电视台等机构留存着很多存有珍贵录音资料的DAT磁带,由于磁带不利于保存,并且面临着DAT技术逐步退出市场,适用的DAT转录机越来越少,因此对这些DAT磁带的转录工作是刻不容缓的。然而,在使用DAT转录机将DAT磁带上的数据转录为数字音频数据时,由于该类型的DAT转录机器本身固有的缺陷,使转录数据会随机产生小段的扭曲、丢失等现象。我们在实践中发现,转录数据中丢失的数据的持续时间约为O.1 1. 5秒,这严重了影响转录音频的最终试听效果。并且我们发现,这种丢失数据段出现的频率和位置也不是固定的,而是和具体的机器、录制开始时间、转录数据长度等因素有关,较长的数据丢失现象一般每10分钟左右出现一次,在一段20分钟左右的音频数据中数据丢失或损坏现象出现频率约为2 8次。因此,经过DAT转录机转录得到的数字音频需要进行修复。上述的这种DAT转录过程中发生的现象不是在个别的DAT转录机上发生的偶然现象,而是几乎每台DAT转录机在转录时都会发生上述的现象,只是出现的频率或时间不同。由于目前DAT技术逐步退出了市场,这种DAT转录机已经停产,而厂家也不再提供技术支持,因此在硬件上修复转录得到的数字音频是不可能的。而到国外专门的修复机构去修复的话,成本会很高。因此必须考虑通过数字处理等技术手段来对转录得到的音频结果进行分析、研究,以找到修复方法、手段,实现对DAT的转录音频的修复。因此,本领域的技术人员致力于开发一种音频数据的模式匹配方法,在DAT转录音频中找到可用的数据用于DAT音频修复。

发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术间题是提供一种音频数据的模式匹配方法,通过对磁带的两次转录得到的两个转录音频进行模式匹配,获得可用于转录音频的修复的数据,尤其是对DAT磁带的两次转录得到的两个转录音频进行模式匹配,获得可用于DAT磁带的转录音频的修复的数据。为实现上述目的,本发明提供了一种音频数据的模式匹配方法,其特征在于,包括步骤100使用转录机对磁带进行第一次转录,获得的数字波形音频作为第一转录音频;使用所述转录机对所述磁带进行第二次转录,获得的数字波形音频作为第二转录音频;所述第一转录音频和所述第二转录音频的采样频率相同;
步骤200将所述第一转录音频和所述第二转录音频的数据进行归一化处理;将完成所述归一化处理的所述第一转录音频和所述第二转录音频中长度较长的一个作为主文件,长度较短的一个作为辅文件;步骤300将所述辅文件相对于所述主文件对齐;步骤400分割所述主文件,得到多个样本段作为主文件样本段,并对各个所述主文件样本段编号;步骤500在所述辅文件中搜索与各个所述主文件样本段的波形匹配的样本段作为辅文件样本段,得到各个所述主文件样本段与各个所述辅文件样本段之间的匹配关系;步骤600分析所述匹配关系,得到可用的所述主文件样本段和可用的所述辅文件样本段;步骤700输出所述可用的所述主文件样本段和所述可用的所述辅文件样本段作 为用于对所述磁带进行音频修复的数据。进一步地,所述步骤100中的所述转录机为DAT转录机,所述磁带为DAT磁带。进一步地,所述步骤100中的采样频率为44.1kHz。进一步地,所述步骤300中的将所述辅文件相对于所述主文件对齐包括步骤310将所述辅文件中的前20%位置处取一个样本段,在所述主文件的前10% -30%的范围内搜索与所述样本段的起点位置PBm的数据匹配的数据的位置Pmin;步骤320若Pmin < O,则对齐失败;若Pmin > PBm,则设定所述主文件上与所述辅文件匹配的起点位置Pa1i为PAh = Pmin_PBm,所述辅文件上与所述主文件匹配的起点位置PBh为所述辅文件的起点位置Pbci ;若Pmin < PBm,则设定所述主文件上与所述辅文件匹配的起点位置PAh为所述主文件的起点位置Paci,所述辅文件上与所述主文件匹配的起点位置PBh为PBh=PBm-Pmin ;gpmin = PBm,则所述主文件和所述辅文件已对齐,设定所述主文件上与所述辅文件匹配的起点位置Pah为所述主文件的起点位置ρω,所述辅文件上与所述主文件匹配的起点位置PBh为所述辅文件的起点位置Pm。进一步地,所述步骤310中的所述样本段的长度为217。进一步地,所述步骤400中的对所述主文件的所述分割是等长度的分割,经过所述分割得到的所述各个主文件样本段的长度皆为214。进一步地,所述步骤400中的对各个所述主文件样本段的编号是从所述主文件的所述起点位置pAh开始依次递增的。进一步地,所述步骤500中的在所述辅文件中进行的所述搜索是从所述辅文件的所述起点位置PBh开始的。进一步地,所述步骤500中的与一个所述主文件样本段波形匹配的一个所述辅文件样本段中的各个数据与所述主文件样本段中的各个数据依次对应且相等。进一步地,所述步骤600中的分析所述匹配关系包括步骤610对于每一个所述主文件样本段和与其波形匹配的一个所述辅文件样本段,获取所述主文件样本段在所述主文件中相对于所述起点位置PAh的位置Pa和所述辅文件样本段在所述辅文件中相对于所述起点位置PBh的位置Pb ;步骤620若Pa = PB,则所述主文件样本段和所述辅文件样本段为所述可用的所述主文件样本段和所述可用的所述辅文件样本段;若Pa > Pb,则所述主文件样本段为所述可用的所述主文件样本段;若Pb > Pa,则所述辅文件样本段为所述可用的所述辅文件样本段。在本发明的较佳实施方式中,使用本发明的音频数据的模式匹配方法对DAT磁带进行了音频修复,包括步骤使用DAT转录机对DAT磁带进行第一次转录,获得的数字波形音频作为第一转录音频,使用上述DAT转录机对该DAT磁带进行第二次转录,获得的数字波形音频作为第二转录音频,其中,第一转录音频和第二转录音频的采样频率皆为44.1kHz ;将第一转录音频和第二转录音频的数据进行归一化处理,并将其中长度较长的一个作为主文件,长度较短的一个作为辅文件;确定主文件上与辅文件匹配的起点位置PAh,确定辅文件上与主文件匹配的起点位置PBh,使辅文件相对于主文件对齐;等长度分割主文件,得到多个长度皆为214的样本段作为主文件样本段,并对各个主文件样本段编号;在从辅文件上与主文件匹配的起点位置PBh开始搜索辅文件中与各个主文件样本段的波形匹配的样本段作为辅文件样本段,得到各个主文件样本段与各个辅文件样本段之间的匹配关系;分析该匹配关系,得到可用的主文件样本段和可用的辅文件样本段;将可用的主文件样本段和可用的辅文件样本段输出,作为用于对该DAT磁带的转录音频进行修复的数据。由此可见,本发明的音频数据的模式匹配方法通过对DAT磁带进行两次转录得到两个转录音频,通过对这两个转录音频进行匹配,得到这两个转录音频中可用的样本段,这些可用的样本段可用于对DAT磁带的转录音频进行修复。因此本发明为DAT的转录音频的修复创造了条件,从而有利于转录DAT磁带以抢救这些磁带中存储的珍贵录音资料。并且,本发明的音频数据的模式匹配方法并不限于用于DAT磁带,还可以用于其他磁带或存储媒介,因而具有广泛的应用领域和应用前景。以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。


图1是本发明的音频数据的模式匹配方法的流程图。图2是作为数字波形音频的转录音频的示意图。图3是本发明的音频数据的模式匹配方法中确定匹配的起点位置的一个示例的示意图。图4是本发明的音频数据的模式匹配方法中确定匹配的起点位置的另一个示例的示意图。图5是在辅文件B中搜索与主文件A的各个主文件样本段匹配的辅文件样本段的示意图。
具体实施例方式在本实施例中,应用本发明的音频数据的模式匹配方法对DAT磁带进行音频修复,如图1所示,包括步骤步骤100,获得第一及第二转录音频。本步骤中,首先使用一台DAT转录机对需要修复的DAT磁带进行第一次转录,获得一个数字波形音频,将该数字波形音频作为第一转录音频;然后再使用该DAT转录机对该DAT磁带进行第二次转录,获得另一个数字波形音频,将该数字波形音频作为第二转录音频。其中,第一转录音频和第二转录音频的采样频率皆为44.1kHz0步骤200,对转录音频进行预处理。本步骤中,对步骤100中获得的第一及第二转录音频进行预处理,预处理包括对该第一及第二转录音频的数据进行归一化处理,以使两个转录音频能够被比较、匹配。本实施例中,使经过归一化处理的第一及第二转录音频的数据的值在-1. O 1. O的范围内。然后将两者中长度较长的一个作为主文件A,长度较短的一个作为辅文件B。其中,(如图2所示),作为数字波形音频的转录音频中的各个数据的序号(即采样点)从I开始递增(增量为I),其值与其序号在坐标系中形成波形曲线,例如图2中的数据a(Ai;i)表示该数据是转录音频中的第i个数据,其值为Ai,其序号为i。这样,转录音频的长度即其包含的数据的个数,典型地,转录音频的长度为228。步骤300,将主文件与辅文件对齐。由于后续的步骤中的比较、匹配皆是从文件头开始,因此将到步骤200中确定的主文件A和辅文件B对齐并确定匹配的起点位置是很重要的,具体地包括步骤310和320。步骤310,在辅文件中取一个样本段。具体地,在步骤200中确定的辅文件B中的前20%位置(即从辅文件B的起点位置开始距离该起点位置20%辅文件B的长度处的位置)处取一个样本段,该样本段的长度为217(即该样本段中包含217个数据,以下不作说明的长度皆表示其中包含的数据的个数),记录该样本段的起点位置PBm(可以认为起点位置是起始的数据在整个转录音频的数据中的序号)。在步骤200中确定的主文件A的前10% -30%的范围内搜索与该样本段的起点位置PBm的数据匹配的数据的位置Pmin。步骤320,确定匹配的起点位置。具体地为若Pmin < O,则对齐失败,进入步骤800 ;若Pmin > PBm,如图3所示,则设定主文件A上与辅文件B匹配的起点位置PAh为PAh = Pmin-PBm,辅文件B上与主文件A匹配的起点位置为辅文件B的起点位置Pbci ;删除主文件A上在匹配的起点位置PAh之前的部分,进入步骤400 ;若Pmin < PBm,如图4所示,则设定主文件A上与辅文件B匹配的起点位置为主文件A的起点位置Paci,辅文件B上与主文件A匹配的起点位置PBh为PBh = PBm-Pmin ;删除辅文件B上在匹配的起点位置PBh之前的部分,进入步骤400 ;若Pmin = PBm(未图示),则主文件A和辅文件B已对齐,主文件A上与辅文件B匹配的起点位置PAh为主文件A的起点位置Paci,辅文件B上与主文件A匹配的起点位置PBh为辅文件B的起点位置Pbci,进入步骤400。步骤400,分割主文件。在本步骤中,对经过步骤320的主文件A进行等长度分割,得到多个主文件样本段,这些主文件样本段的长度皆为214(即每个主文件样本段中皆包含214个数据)。从主文件A的起点位置PAh开始(即从主文件A的文件头开始,由于在步骤320中已删除了主文件A上在匹配的起点位置PAh之前的部分),对每个主文件样本段进行递增编号,例如A01、A02、A03、··· ο
步骤500,获得主文件样本段与辅文件样本段之间的匹配关系。具体地,从经过320的辅文件B的起点位置PBh(即从辅文件B的文件头开始,由于在步骤320中已删除了辅文件B上在匹配的起点位置PBh之前的部分)开始搜索与步骤400中得到的各个主文件样本段匹配的辅文件样本段,并对该辅文件样本段编号。例如,如图5所示,辅文件样本段BOl与一个主文件样本段AOl匹配,辅文件样本段B02与一个主文件样本段A02匹配。当一个辅文件样本段B02与一个主文件样本段A02匹配时,辅文件样本段B02中的各个数据与主文件样本段A02中的各个数据依次对应且相等,即辅文件样本段B02中的的第j个数据与主文件样本段A02中第j个数据的幅度相等(或者两者的幅度差小于1% ),其中j遍历主文件样本段A02和辅文件样本段B02中的所有数据的个数。具体的匹配过程为对于每一个主文件样本段,在辅文件B中从辅文件B的起点位置PBh开始上述的搜索,第一次搜索的范围为[PBh,PBh+27X214];如果未找到,则将搜索的范围向辅文件B的尾部移动长度211,即对于第k次搜索,搜索的范围为[(k-1) X2n+PBh, (k-1) X2n+PBh+27X214],其中 k = 1、2、…;如果搜索到达辅文件B的尾部仍未找到匹配该主文件样本段的辅文件样本段,则跳到下一个主文件样本段,开始搜索与该主文件样本段匹配的辅文件样本段。步骤600,分析匹配关系。本步骤通过分析步骤500中得到的匹配关系,得到可用的主文件样本段和可用的辅文件样本段,具体地包括步骤610和620。步骤610,对于每一个主文件样本段和与其波形匹配的一个辅文件样本段,获取该主文件样本段在主文件A中的位置Pa (即其开始位置相对于主文件A的文件头的位置),以及获取该辅文件样本段在辅文件B中的位置Pb (即其开始位置相对于辅文件B文件头的位置)。步骤62O,包括若Pa = PB,则该主文件样本段和该辅文件样本段为可用的主文件样本段和可用的辅文件样本段;若Pa > Pb,则该主文件样本段为可用的主文件样本段,该辅文件样本段为不可用的辅文件样本段;若Pb > Pa,则该辅文件样本段为可用的辅文件样本段,该主文件样本段为不可用的主文件样本段。如图5所示的主文件样本段A02在主文件A中的位置Pa和辅文件样本段B02在辅文件B中的位置Pb间的关系为Pa = Pb,则可知主文件样本段A02和辅文件样本段B02为可用的主文件样本段和可用的辅文件样本段。步骤700,输出步骤600中得到的可用的主文件样本段和可用的辅文件样本段,作为用于对DAT磁带的转录音频进行修复的数据。步骤800,结束。以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域的技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
权利要求
1.一种音频数据的模式匹配方法,其特征在于,包括 步骤(100)使用转录机对磁带进行第一次转录,获得的数字波形音频作为第一转录音频;使用所述转录机对所述磁带进行第二次转录,获得的数字波形音频作为第二转录音频;所述第一转录音频和所述第二转录音频的采样频率相同; 步骤(200)将所述第一转录音频和所述第二转录音频的数据进行归一化处理;将完成所述归一化处理的所述第一转录音频和所述第二转录音频中长度较长的一个作为主文件,长度较短的一个作为辅文件; 步骤(300)将所述辅文件相对于所述主文件对齐; 步骤(400)分割所述主文件,得到多个样本段作为主文件样本段,并对各个所述主文件样本段编号; 步骤(500)在所述辅文件中搜索与各个所述主文件样本段的波形匹配的样本段作为辅文件样本段,得到各个所述主文件样本段与各个所述辅文件样本段之间的匹配关系; 步骤(600)分析所述匹配关系,得到可用的所述主文件样本段和可用的所述辅文件样本段; 步骤(700)输出所述可用的所述主文件样本段和所述可用的所述辅文件样本段作为用于对所述磁带的转录音频进行修复的数据。
2.如权利要求I所述的音频数据的模式匹配方法,其中所述步骤(100)中的所述转录机为DAT转录机,所述磁带为DAT磁带。
3.如权利要求I或2所述的音频数据的模式匹配方法,其中所述步骤(100)中的采样频率为44. IkHz。
4.如权利要求3所述的音频数据的模式匹配方法,其中所述步骤(300)中的将所述辅文件相对于所述主文件对齐包括 步骤(310)将所述辅文件中的前20%位置处取一个样本段,在所述主文件的前10%-30%的范围内搜索与所述样本段的起点位置(Pbdi)的数据匹配的数据的位置(Pmin); 步骤(320)若Pmin < 0,则对齐失败;若Pmin > PBm,则设定所述主文件上与所述辅文件匹配的起点位置(PAh)为PAh = Pmin-PBm,所述辅文件上与所述主文件匹配的起点位置(PBh)为所述辅文件的起点位置(Pbci);若Pmin < Pbdi,则设定所述主文件上与所述辅文件匹配的起点位置(PAh)为所述主文件的起点位置(Paci),所述辅文件上与所述主文件匹配的起点位置(Peh)为PBh = PBm_Pmin ;若Pmin = PBm,则所述主文件和所述辅文件已对齐,设定所述主文件上与所述辅文件匹配的起点位置(PAh)为所述主文件的起点位置(Paci),所述辅文件上与所述主文件匹配的起点位置(PBh)为所述辅文件的起点位置(Pbci)。
5.如权利要求4所述的音频数据的模式匹配方法,其中所述步骤(310)中的所述样本段的长度为217。
6.如权利要求5所述的音频数据的模式匹配方法,其中所述步骤(400)中的对所述主文件的所述分割是等长度的分割,经过所述分割得到的所述各个主文件样本段的长度皆为214。
7.如权利要求6所述的音频数据的模式匹配方法,其中所述步骤(400)中的对各个所述主文件样本段的编号是从所述主文件的所述起点位置(Pa1i)开始依次递增的。
8.如权利要求7所述的音频数据的模式匹配方法,其中所述步骤(500)中的在所述辅文件中进行的所述搜索是从所述辅文件的所述起点位置(pBh)开始的。
9.如权利要求8所述的音频数据的模式匹配方法,其中所述步骤(500)中的与一个所述主文件样本段波形匹配的一个所述辅文件样本段中的各个数据与所述主文件样本段中的各个数据依次对应且相等。
10.如权利要求9所述的音频数据的模式匹配方法,其中所述步骤(600)中的分析所述匹配关系包括 步骤(610)对于每一个所述主文件样本段和与其波形匹配的一个所述辅文件样本段,获取所述主文件样本段在所述主文件中相对于所述起点位置(PAh)的位置(Pa)和所述辅文件样本段在所述辅文件中相对于所述起点位置(PBh)的位置(Pb); 步骤(620) SPa = Pb,则所述主文件样本段和所述辅文件样本段为所述可用的所述主文件样本段和所述可用的所述辅文件样本段;若匕> Pb,则所述主文件样本段为所述可用的所述主文件样本段;若匕> Pa,则所述辅文件样本段为所述可用的所述辅文件样本段。
全文摘要
本发明公开了一种音频数据的模式匹配方法,包括使用转录机对磁带进行第一及第二次转录,获得第一及第二转录音频;将第一及第二转录音频的数据进行归一化处理,并将两者中长度较长的作为主文件,长度较短的作为辅文件;将辅文件相对于主文件对齐;分割主文件,得到多个主文件样本段;在辅文件中搜索与各个主文件样本段波形匹配的辅文件样本段,得到各个主文件样本段与各个辅文件样本段间的匹配关系;分析匹配关系,得到可用的主文件样本段和辅文件样本段,并将其输出作为用于对磁带的转录音频进行修复的数据。本发明通过对磁带进行两次转录得到两个转录音频并进行匹配,得到这两个转录音频中可用的样本段,为磁带的转录音频的修复创造了条件。
文档编号G11B20/10GK102982827SQ20121051001
公开日2013年3月20日 申请日期2012年12月3日 优先权日2012年12月3日
发明者许舒亚, 李柏岩, 宋晖, 陈强斌, 王劲松, 袁征, 黄钢, 韩斌 申请人:上海音乐学院, 上海协言科学技术服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1