高频声音信号编译码技术和系统的制作方法

文档序号:2826313阅读:197来源:国知局
高频声音信号编译码技术和系统的制作方法
【专利摘要】一种用于编、译码高频声音信号的技术和其系统,预先分析原始音频信号之高频特性,以确定高频声音信号之增益,按照此增益和此编码序列将高频声音信号与此些原始音频信号混合,发送并接收此些混合后信号,过滤并放大此些混合后信号中的高频声音讯号,并将该信号数字化为时域波形信号,将此些时域波形信号转换为频谱并储存,计算并检测此些高频数据之特征参数,若符合此起始特征,则连续接收一特定间隔的此些高频数据,根据此编码逻辑定位此些高频数据中的此编码格式之数据边界,并作抗反射滤波处理,重新计算定位后高频数据的此些特征参数,且译码并校验此些定位后高频资料,若校验失败则根据此编码逻辑修复,筛选此些译码后高频数据并将其输出。
【专利说明】
高频声音信号编译码技术和系统

【技术领域】
[0001]本发明涉及高频声音信号编译码的技术和系统,尤其涉及一种编译码亚超声波信号的技术和系统。

【背景技术】
[0002]音频(aud1)信号实际上为能量波,利用空气或其他媒介传播,听觉对声音感受度的大小以响度能量分贝(dB)做为测度单位。当此能量波的振动频率在人耳能感应的范围内时称为可闻波(audible sound)。当频率高于可闻声时则称超音波(ultrasound),一般可用于医学或工程的检测或材料的加工。至于频率比可闻波低时称为低音波(infrasound),例如地震所引起的地震波。
[0003]人类的听觉范围为20Hz至20kHz的声音,最敏感的范围为2kHz到4kHz之间。利用不同的单频信号对人耳作测试后,可用一条曲线来描绘绝对遮蔽曲线(absolutethreshold curve)或静音遮蔽曲线(quiet threshold curve)。人耳听觉模型(psychoacoustic model)即是利用一个频率分析器仿真人耳听觉系统,此频率分析器由许多带通滤波器构成,其频率大约为20Hz至20kHz之间,每一个带通滤波器的带宽都不相同,这些带通滤波器的带宽称之为临界频带(critical bands)。由此人耳听觉模型可归纳出两个重要的遮蔽特性,实时域遮蔽效应及频域遮蔽效应。前者又细分为先遮蔽(pre-masking)、后遮蔽(post-masking)、以及同步遮蔽(simultaneous-masking)。当音频有多种频率成分同时出现时,则此时不同频率成分的遮蔽效应要一齐累加计算,遮蔽曲线即变得很复杂,会随着信号的能量大小、频率位置及信号特性的变化而有所不同。能量大的信号能遮蔽较大的噪音、非单频(non-tonal)信号比单频(tonal)信号的遮蔽性好、高频信号比低频信号有较强的遮蔽性。
[0004]音频水印(aud1 watermark)是将欲嵌入的水印信号,经过加密、编码、展频、或其他的处理后使得处理后的水印信号随机化。并依据人类听觉系统(Human AuditorySystem, HAS)的遮蔽效应(masking effect),将处理后的水印或其频谱成份控制并嵌入在原始音频信号可遮蔽的范围内,即可顺利将水印隐藏于音频信号中,且不会让人感觉到音频质量上的差异。隐写术(steganography)也是数字水印的一种应用,双方可利用隐藏在数字信号中的信息进行沟通。


【发明内容】

[0005]本发明于人耳较不敏感的高频区段中挑选数个频率,在音频中利用频率进行动态隐蔽编码,以在最小限度破坏原始声音频率特性的前提下隐匿编码信号,以频率的声音来编码较能抵抗周遭环境的干扰。
[0006]本发明的目的在于提供一种高频声音信号编译码技术和系统。
[0007]为达到上述目的,本发明采用以下技术方案:
[0008]一种高频声音信号编译码系统,包括一音调编辑软件和一音调侦测装置。此音调侦测装置包括一接收装置、一模拟电路、一处理单元。此模拟电路包括一自动增益控制(Automatic Gain Control, AGC)电路、一带通滤波器(band-pass filter)、一带通放大器、一模拟至数字转换器(Analogue-to-Digital Converter, ADC)。此处理单元包括一内存、一音调译码组件、以及一声音微控制单元。此音调编辑软件根据一编码逻辑和包括一起始特征的一编码格式决定高频声音信号的编码序列。此音调编辑软件预先分析原始音频信号的高频特性,根据默认的信号对噪声比(Signal-to-Noise Rat1, SNR,简称信杂比)、信号强度和高频补偿值(high-frequency compensat1n)确定高频声音信号的增益,按照此增益和此编码序列将高频声音信号与原始音频信号混合。经由一播放媒介发送混合后讯号。此接收装置接收混合后信号。此模拟电路过滤混合后信号并放大其中的高频声音信号。此模拟至数字转换器将过滤放大后的信号数字化为时域波形信号(timedomain waveform signal)。此声音微控制单元利用特定算法将时域波形信号转换为频谱(frequency spectrum)。储存频谱和时域波形信号中的高频数据于此内存中。此声音微控制单元计算高频数据的特征参数,并一直检测特征参数直到符合此起始特征为止。此音调译码组件接着连续接收一特定间隔(interval)的高频数据,并根据此编码逻辑定位于所接收的高频数据中此编码格式的数据边界。此声音微控制单元对定位后高频数据作抗反射滤波处理,并重新计算包括特定频率的能量和信杂比的特征参数。此音调译码组件根据此编码逻辑将定位后高频数据译码。此声音微控制单元校验译码后高频数据,若校验失败则根据此编码逻辑修复弱能量和低信杂比的译码后高频数据。此声音微控制单元根据译码后的综合机率和信号平均强度摒除低综合机率和弱信号的译码后高频数据,并输出经筛选的译码后高频数据。
[0009]一种高频声音信号编译码技术,包括下列步骤:根据一编码逻辑和包括一起始特征的一编码格式决定高频声音信号的编码序列,预先分析原始音频信号的高频特性,根据预设的信杂比、信号强度和高频补偿值确定高频声音信号的增益,按照此增益和此编码序列将高频声音信号与原始音频信号混合,发送混合后讯号,接收混合后信号,过滤并放大混合后信号中的高频声音讯号,将过滤放大后的信号数字化为时域波形信号,利用特定算法将时域波形信号转换为频谱,储存频谱和时域波形信号中的高频数据,计算高频数据的特征参数,一直检测特征参数直到符合此起始特征为止,接着连续接收一特定间隔的高频数据,根据此编码逻辑定位于所接收的高频数据中此编码格式的数据边界,对定位后高频数据作抗反射滤波处理,重新计算包括特定频率的能量和信杂比的特征参数,根据此编码逻辑将定位后高频数据译码,校验译码后高频数据,若校验失败则根据此编码逻辑修复弱能量和低信杂比的译码后高频数据,根据译码后的综合机率和信号平均强度摒除低综合机率和弱信号的译码后高频数据,输出经筛选的译码后高频数据。

【专利附图】

【附图说明】
[0010]凭借如在伴随图式中所图示阐明的较佳实施例的较特定描述,前述和其他此说明书的特征及优点将显而易见,其中同样的参照符号在所有图式中均归属于相同的组件。
[0011]图1所示意的架构方块图是根据示范的具体表现例图示阐明一种高频声音信号编译码系统10S。
[0012]图2是根据示范的实施例图标阐明一编码格式。
[0013]图3是根据示范的实施例图示阐明一状态机。
[0014]图4所示意的流程图是根据示范的实施例图示阐明一种高频声音信号编译码技术1T中的步骤SOOl?SO16。
[0015]主要组件符号说明:
[0016]1S高频声音信号编1T高频声音信号编译码100高频声音信号200编码格式
[0017]译码系统技术
[0018]202起始位204校验位210起始特征220编码数据
[0019]300编码逻辑310状态机400高频资料402特征参数
[0020]410定位后高频资料420译码后高频数据 500音调编辑软件 600音调侦测装置
[0021]610接收装置620模拟电路 622自动增益控制电路624带通滤波器
[0022]626带通放大器 628模拟至数字转换器630处理单元632内存
[0023]634音调译码组件 636声音微控制单兀 700背景音频信号 800混合后信号
[0024]810过滤放大后的信900播放媒介 D7?DO数据位 SOOl?S016步骤号

【具体实施方式】
[0025]图1所示意的架构方块图是根据示范的具体表现例图示阐明一种高频声音信号编译码系统10S。此高频声音信号编译码系统1S是用于实践前述之此高频声音信号编译码技术1T。请先参照图1,此高频声音信号编译码系统1S包括一音调编辑软件500和一音调侦测装置600。
[0026]图2是根据示范的实施例图标阐明一帧编码数据220。图3是根据示范的实施例图示阐明一状态机310。接下来请同时参看图1?3,此音调编辑软件500根据此编码逻辑300和包括此起始特征210的此编码格式200决定高频声音信号100的编码序列,其中此编码格式200和此编码逻辑300如前所述,于此不再赘述。此音调编辑软件500预先分析原始音频信号700的高频特性,以根据预设的信杂比、信号强度和高频补偿值确定高频声音信号的增益,按照此增益和此编码序列将高频声音信号100混合至原始音频信号700中。当混合后信号800 (未图标)经由一播放媒介900,诸如任何一多媒体或音频装置,发送混合后讯号时,此接收装置610便会接收混合后信号800,而此模拟电路620则过滤混合后信号800。根据示范的具体表现例,混合后信号800依序经过此自动增益控制电路622、此带通滤波器624、以及此带通放大器626,藉上述电路组件将混合后信号800中高于特定频率的模拟信号筛选出来并放大,以形成过滤放大后的信号810 (未图标)。此模拟至数字转换器628将过滤放大后的信号810数字化为时域波形信号。此声音微控制单元636利用特定算法将时域波形信号转换为频谱。在一些具体表现例中,特定算法是采用例如但不限于快速傅立叶变换和离散傅立叶变换等快速算法。储存频谱和时域波形信号中的高频数据400 (未图标)于此内存632中。此声音微控制单元636计算高频数据400的特征参数402 (未图示),并确定特征参数402是否符合此起始特征210。根据示范的具体表现例,此起始特征210包括但不限于此起始位202所具有的特定时长35ms、特定频率α的能量和信杂比。若特征参数402符合此起始特征210,则此音调译码组件634便会连续接收一特定间隔的高频资料400,并根据此编码逻辑300定位于所接收的高频数据400中此编码格式200的数据边界。根据示范的具体表现例,此特定间隔约为300ms,而此编码格式200的数据边界即为此帧编码数据220的边界,此帧编码数据220的边界经过定位后可为后续解码提供精准的帧移参数。在一些具体表现例中,此高频数据400包括时域波形信号中的时域数据和频谱中的频域数据,此声音微控制单元636主要使用时域数据和频域数据中的信号相关性特征来分析信号同步位置。也就是说,在译码时分析高频数据400的信号相关性特征以定位此帧编码数据220的边界。除此之外,此声音微控制单元636同时还分析出高频信号的能量包络、时域位编码周期性、平均能量,并藉此判断是否符合编码的时域特征参数。另外针对频域特征参数,主要是使用例如但不限于隐马尔可夫模型(Hidden Markov Model, HMM)的算法来分析译码路径、输出译码综合机率以代表译码的可靠性、同时还分析出信号综合信杂比参数,藉此判断编码是否符合频域特征参数。
[0027]请参照图1?3,此声音微控制单元636对定位后高频数据410作抗反射滤波处理,并重新计算包括但不限于频率的能量和信杂比的特征参数402。根据示范的具体表现例,重新计算的方式是再次利用特定算法将定位后高频数据410中的时域波形信号再次转换为频谱,储存再次转换后的频谱和时域波形信号中的高频数据400,计算再次转换后的高频数据400的特征参数402。经过此抗反射滤波处理后,可消除房间回音干扰或室外障碍物回波干扰的影响。此音调译码组件634根据此编码逻辑300将定位后高频数据410译码。此声音微控制单元636利用此校验位204进行同位检查以校验译码后高频数据420,若校验失败则此声音微控制单元636便会根据此编码逻辑300修复弱能量和低信杂比的译码后高频数据420。此声音微控制单元636根据译码后的综合机率和信号平均强度摒除低综合机率和弱信号的译码后高频数据420,并输出经筛选的译码后高频数据420以供后续处理。举例来说,译码后高频数据420可代表一控制信号,以应用于超声音遥控或是与多媒体平台互动的智能玩具。
[0028]图4所示意的流程图是根据示范的实施例阐明一种高频声音信号编译码技术1T中的步骤SOOl?S016。请同时参照图2?4,此高频声音信号编译码技术1T于所示实施例中依照下列步骤进行:首先在步骤SOOl中,根据一编码逻辑300和包括一起始特征210(未图标)的一编码格式200 (未图标)决定高频声音信号100的编码序列。此外,如图2所示,此编码格式200是由时长35ms (milliseconds)的起始位202、时长各25ms的数据位D7、D5、D4、D2、D1、以及D0、时长各30ms的数据位D6和D3、以及时长25ms的校验位204共同组成此帧编码数据220,其中8个数据位D7?DO的时长共180ms,此帧编码数据220的总时长则为270ms。另外,如图3所示,此编码逻辑300(未图标)利用一状态机(StateMachine,一种计算的数学模型)310设计编码逻辑300。根据示范的具体表现例,高频声音信号100是在例如但不限于17?19kHz的亚超音波中挑选4个频率来编码,并分别以α、β > Y > δ来代表这4个频率,其中此起始位202使用特定频率α来编码,数据位D7?DO则使用其余频率β、Y、以及δ等三者来编码。根据示范的具体表现例,此帧编码数据220从起始位202的编码频率α开始,分别根据频率α、β、Y、以及δ的状态为O或I而决定转移方向,并以此方式依序给予数据位D7?DO编码讯号,藉此可确保相邻数据位的编码有所变化,进而增加此帧编码数据220的可靠性和抗干扰特性。除此之外,因为编码数据位D7?DO时采取两种不同的时间长度,即25ms和30ms,所以在译码时可更加精确定位此帧编码数据220的边界,进而防止声音反射或是在定位此帧编码数据220的边界时出现位偏移的错误。最后的校验位204则是用以对数据位D7?DO进行奇或偶同位检查。
[0029]继续参看图2?4,接着在步骤S002中,预先分析原始音频信号700 (未图标)的高频特性,根据预设的信杂比、信号强度和高频补偿值确定高频声音信号的增益,按照此增益和此编码序列将高频声音信号100混合至原始音频信号700中。接着在步骤S003中,发送并接收混合后信号800,以过滤并放大混合后信号800中的高频声音信号100。接下来在步骤S004中,将过滤放大后的信号810(未图标)数字化为时域波形信号。然后根据步骤S005,利用特定算法将时域波形信号转换为频谱。在一些具体表现例中,特定算法是采用例如但不限于快速傅立叶变换(Fast Fourier Transform, FFT)和离散傅立叶变换(DiscreteFourier Transform, DFT)等快速算法。接着依据步骤S006,储存频谱和时域波形信号中的高频数据400 (未图标)。在一些具体表现例中,高频数据400包括时域波形信号中的时域数据和频谱中的频域数据,此高频声音信号编译码技术1T主要使用时域数据和频域数据中的信号相关性特征来分析信号同步位置。也就是说,在译码时分析高频数据400的信号相关性特征以定位此帧编码数据220的边界,其中信号相关性特征即为每帧高频数据400在译码后的特征参数402,特征参数402包括各编码频率的能量、振幅、相位、信杂比、能量包络形态、时域位编码周期性、平均能量,并藉此判断是否符合编码的时域特征参数。另外针对频域特征参数,主要是使用隐马尔可夫模型(Hidden Markov Model, HMM)的算法来分析译码路径、输出译码综合机率以代表译码的可靠性、以及分析信号综合信杂比参数,藉此判断编码是否符合频域特征参数。
[0030]如图2和4所示,之后依照步骤S007,计算高频数据400的特征参数402。接下来根据步骤S008,确定特征参数402是否符合此起始特征210,若符合此起始特征210则于步骤S009中连续接收一特定间隔的高频数据400,否则就继续检测。根据示范的具体表现例,此起始特征210包括但不限于此起始位202所具有的特定时长35ms、特定频率α的能量和信杂比。然后于步骤S010,根据此编码逻辑300定位于所接收的高频数据中此编码格式的数据边界。根据示范的具体表现例,此特定间隔约为300ms,而此编码格式200的数据边界即为此帧编码数据220的边界,此帧编码数据220的边界经过定位后可为后续解码提供精准的巾贞移(frame shift)参数。接着于步骤S011,对定位后高频数据410作抗反射滤波处理,抗反射处理是在起始位202的特定频率α后,针对频域特征参数按照一帧编码数据220的周期进行一次回音信号削弱处理,目的是降低前一位的编码频率信号对当前状态的影响。经过此步骤SOll的抗反射滤波处理后,可消除房间回音干扰或室外障碍物回波干扰的影响。于步骤S012则是重新计算特征参数402。根据示范的具体表现例,特征参数402是依照步骤S005?S007的方式来重新计算。之后于步骤S013根据此编码逻辑300将定位后高频数据410译码。接下来,于步骤S014校验译码后高频数据420,若校验失败则于步骤S015中根据此编码逻辑300修复弱能量和低信杂比的译码后高频数据420。根据示范的具体表现例,校验方式即是利用此校验位204进行同位检查(parity check)。最终在步骤S016中,校验成功或是修复后的译码后高频数据420,再根据译码后的综合机率和信号平均强度,过滤低综合机率和弱信号的译码后高频数据420,以筛选出较为可靠的译码后高频数据420并将其输出以供后续处理。举例来说,经筛选的译码后高频数据420可代表一控制信号,以应用于超声音遥控或是与多媒体平台互动的智能玩具。在一些具体表现例中,以不影响此高频声音信号编译码技术10T所欲达成的目标为原则,上述步骤S001?S016的先后顺序可随意更动、整合、分解或同步进行。举例来说,可预先分析原始音频信号700的高频特性,再来决定高频声音信号100的编码序列。也就是说,步骤SOOl和步骤S002的顺序可互换。
[0031]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【权利要求】
1.一种高频声音信号编译码系统,包括: 一音调编辑软件,根据一编码逻辑和包括一起始特征的一编码格式决定高频声音信号的编码序列,并预先分析原始音频信号的高频特性,以将高频声音信号与原始音频信号混合; 一播放媒介,发送混合后信号;以及 一音调侦测装置,包括: 一接收装置,接收混合后信号; 一模拟电路,过滤并放大混合后信号中的高频声音信号,且将过滤放大后的信号数字化为时域波形信号;以及 一处理单元,用于将时域波形信号转换为频谱、储存频谱和时域波形信号中的高频数据、计算高频数据的特征参数、检测特征参数是否符合该起始特征,若符合则连续接收一特定间隔的高频数据、定位高频数据中的该编码格式的数据边界、对定位后高频数据作抗反射滤波处理、重新计算特征参数、译码定位后高频数据、校验译码后高频数据,若校验失败则修复译码后高频数据、以及筛选并输出译码后高频数据。
2.根据权利要求1所述的高频声音信号编译码系统,其特征在于所述模拟电路包括一自动增益控制电路、一带通滤波器、一带通放大器、一模拟至数字转换器,该自动增益控制电路初步过滤混合后信号、该带通滤波器进一步过滤混合后信号中的高频声音信号、该带通放大器放大混合后信号中的高频声音信号,该模拟至数字转换器将过滤放大后的信号数字化为时域波形信号。
3.根据权利要求1所述的高频声音信号编译码系统,其特征在于所述处理单元包括一内存、一音调译码组件、以及一声音微控制单元,该内存用于储存高频数据,该音调译码组件用于接收一特定间隔的高频数据、定位高频数据中的该编码格式的数据边界、以及译码定位后高频数据,该声音微控制单元转换时域波形信号为频谱、计算高频数据的特征参数、检测特征参数是否符合该起始特征、重新计算特征参数、校验和修复译码后高频数据、以及筛选和输出译码后高频数据。
4.根据权利要求1所述的高频声音信号编译码系统,其特征在于根据默认的信杂比、信号强度和高频补偿值确定高频声音信号的增益,按照该增益和该编码序列将高频声音信号与原始音频信号混合,时域波形信号是通过快速傅立叶变换和离散傅立叶变换算法转换为频谱,该编码逻辑用于定位该编码格式的数据边界、编码定位后高频数据、修复译码后高频数据。
5.根据权利要求1所述的高频声音信号编译码系统,其特征在于所述高频声音信号的频率范围是17?19kHz。
6.根据权利要求1所述的高频声音信号编译码系统,其特征在于所述编码格式包括一起始位、多个数据位、以及一校验位,该编码逻辑利用一状态机设计编码逻辑。
7.根据权利要求1所述的高频声音信号编译码系统,其特征在于所述高频数据包括频谱中的频域资料和时域波形信号中的时域数据,特征参数包括时域特征参数和频域特征参数。
8.一种高频声音信号编译码技术,其特征在于包括: 根据一编码逻辑和包括一起始特征的一编码格式决定高频声音信号的编码序列; 预先分析原始音频信号的高频特性以将高频声音信号与原始音频信号混合; 发送并接收混合后信号,以过滤并放大混合后信号中的高频声音信号; 将过滤放大后的信号数字化为时域波形信号; 将时域波形信号转换为频谱; 储存频谱和时域波形信号中的高频数据; 计算高频数据的特征参数; 确定特征参数是否符合该起始特征,若符合该起始特征则连续接收一特定间隔的高频数据,否则就持续检测; 定位高频数据中的该编码格式的数据边界; 对定位后高频数据作抗反射滤波处理; 重新计算定位后高频数据的特征参数; 将定位后高频数据译码; 校验译码后高频数据,若校验失败则修复译码后高频数据;以及 筛选并输出译码后高频数据。
9.根据权利要求8所述的高频声音信号编译码技术,其特征在于根据默认的信杂比、信号强度和高频补偿值确定高频声音信号的增益,按照该增益和该编码序列将高频声音信号与原始音频信号混合,时域波形信号通过快速傅立叶变换和离散傅立叶变换算法转换为频谱,该编码逻辑用于定位该编码格式的数据边界、编码定位后高频数据、修复译码后高频数据。
10.根据权利要求8所述的高频声音信号编译码技术,其特征在于高频声音信号的频率范围是17?19kHzο
11.根据权利要求8所述的高频声音信号编译码技术,其特征在于所述编码格式包括一起始位、多个数据位、以及一校验位,该编码逻辑利用一状态机设计编码逻辑。
12.根据权利要求8所述的高频声音信号编译码技术,其特征在于所述高频数据包括频谱中的频域资料和时域波形信号中的时域数据,特征参数包括时域特征参数和频域特征参数。
【文档编号】G10L19/02GK104424950SQ201310467514
【公开日】2015年3月18日 申请日期:2013年10月9日 优先权日:2013年9月3日
【发明者】徐国栋, 洪金川 申请人:承芯微电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1