一种基于音频实现设备解锁的方法和系统与流程

文档序号：12041517阅读：432来源：国知局

本发明涉及音频处理技术，具体涉及一种基于音频实现设备解锁的方法和系统。

背景技术：
随着人们对手机体验要求的增强，现有的手机解锁功能已经不能满足人们的需求。现有的手机解锁功能主要可以分为：普通密码解锁，指纹解锁，头像解锁三个方面。但上述手机解锁功能已经不能满足人们的手机体验需求，具体而言，普通密码解锁的安全性很低；指纹解锁和头像解锁均基于图像，但目前的指纹倒模以及化妆技术使得指纹解锁和头像解锁的安全性降低。因此，无论是手机还是其它需要信息保密的设备，都需要安全性更高的解锁功能，但目前尚未出现这样的解锁功能。

技术实现要素：
有鉴于此，本发明的主要目的在于提供一种基于音频实现设备解锁的方法和系统，以提高设备解锁的安全性。为达到上述目的，本发明的技术方案是这样实现的：一种基于音频实现设备解锁的方法，该方法包括：设备从接收到的音频密码中提取以下至少之一：旋律、节奏、音色；当所述旋律、节奏以及音色分别与预设的旋律、节奏、音色相匹配时，所述设备解锁。提取所述旋律的过程包括：对输入信号x(n)进行降采样以获得y(n)，对y(n)进行端点检测，判定信号开始和结束的端点；据此根据乐音的短时平稳性，将信号分成多帧并提取出信号的基频；根据十二音律特性，将提取出来的所述基频转换成乐器数字接口MIDI音符。提取所述基频是基于增强的改进的梅尔倒谱系数Specmurt算法实现的；所述增强的Specmurt算法包括复小波变换实现增强的Specmurt算法，或短时傅立叶变换STFT、MDCT实现增强的Specmurt算法。提取所述节奏的过程包括：对输入信号x(n)进行降采样以获得z(n)，对z(n)进行端点检测，判定信号开始和结束的端点；对z(n)进行STFT以获得U(wk，ti)，对分成多帧的信号进行ACF以获得A(l，ti)；据此结合自相关的特点获得A(wl，ti)，其中wl＝l/fs抽样频率；联合STFT和FM-ACF以获得联合函数Y(wk，ti)＝U(wk，ti).A(wl，ti)，根据Y(wk，ti)求解出信号的节奏。提取所述音色的过程包括：对输入信号x(n)进行降采样以获得v(n)，对v(n)进行端点检测，判定信号开始和结束的端点q(n)；对v(n)求解MFCC系数并保存；对q(n)求解谱包络，对v(n)求取信号的幅度包络。当所述旋律、节奏以及音色分别与预设的旋律、节奏、音色相匹配时，所述设备解锁的过程包括：获取输入的用于解锁的音频密码的匹配失真度和路径偏差的综合值，据此判断用于解锁的音频密码的旋律与预先设置的音频密码的旋律是否低于预设的阈值，在低于阈值时对比用于解锁的音频密码的节奏和预先设置的音频密码的节奏是否一致，在一致时判断用于解锁的音频密码的音色与预先设置的音频密码的音色是否低于预设的阈值，在低于阈值时解锁设备。一种基于音频实现设备解锁的系统，该系统包括乐音特征决策模块，还包括以下模块中至少之一：旋律提取模块、节奏提取模块、音色提取模块；其中，所述旋律提取模块、节奏提取模块、音色提取模块，分别用于在设置于所述系统中时，从接收到的音频密码中提取相应的内容；所述乐音特征决策模块，用于在所述旋律提取模块、节奏提取模块、音色提取模块所分别提取的旋律、节奏以及音色分别与预设的旋律、节奏、音色相匹配时，解锁设备。所述旋律提取模块在提取旋律时，用于：对输入信号x(n)进行降采样以获得y(n)，对y(n)进行端点检测，判定信号开始和结束的端点；据此根据乐音的短时平稳性，将信号分成多帧并提取出信号的基频；根据十二音律特性，将提取出来的所述基频转换成MIDI音符。所述旋律提取模块，用于基于增强的Specmurt算法实现所述基频的提取；所述增强的Specmurt算法包括复小波变换实现增强的Specmurt算法，或STFT、MDCT实现增强的Specmurt算法。所述节奏提取模块在提取节奏时，用于：对输入信号x(n)进行降采样以获得z(n)，对z(n)进行端点检测，判定信号开始和结束的端点；对z(n)进行STFT以获得U(wk，ti)，对分成多帧的信号进行ACF以获得A(l，ti)；据此结合自相关的特点获得A(wl，ti)，其中wl＝l/fs；联合STFT和FM-ACF以获得联合函数Y(wk，ti)＝U(wk，ti).A(wl，ti)，根据Y(wk，ti)求解出信号的节奏。所述音色提取模块在提取音色时，用于：对输入信号x(n)进行降采样以获得v(n)，对v(n)进行端点检测，判定信号开始和结束的端点q(n)；对v(n)求解MFCC系数并保存；对q(n)求解谱包络，对v(n)求取信号的幅度包络。所述乐音特征决策模块在解锁设备时，用于：获取输入的用于解锁的音频密码的匹配失真度和路径偏差的综合值，据此判断用于解锁的音频密码的旋律与预先设置的音频密码的旋律是否低于预设的阈值，在低于阈值时对比用于解锁的音频密码的节奏和预先设置的音频密码的节奏是否一致，在一致时判断用于解锁的音频密码的音色与预先设置的音频密码的音色是否低于预设的阈值，在低于阈值时解锁设备。本发明基于音频实现设备解锁的技术，在解锁时对音频中的具体因素进行了考虑，从而提高了设备解锁的安全性。附图说明图1为本发明一实施例的手机解锁流程图；图2为本发明实施例的特征提取流程图；图3为本发明实施例中提取旋律的原理示意图；图4为本发明实施例中由复小波变换实现的Specmurt增强算法示意图；图5为本发明实施例中由MDCT(修正的离散余弦变换)、(傅立叶变换)DFT(只需其一)实现的Specmurt增强算法示意图；图6为本发明实施例中提取节奏的原理示意图；图7为本发明实施例中提取音色的原理示意图；图8为本发明另一实施例的手机解锁流程图；图9为本发明实施例的手机解锁流程简图。具体实施方式在实际应用中，可以进行如图1所示的流程，该流程的细化过程可由图2至图8展示。针对用户提供的音频(如用户输入的音乐)，可以进行如图2所示的处理：旋律的提取、节奏的提取、音色的提取，以获取音乐特征。需要说明的是，无论是手机还是其它需要信息保密的设备，都需要安全性更高的解锁功能，因此本发明方法和系统针对需要信息保密的设备而不仅限于手机，并且针对手机等设备实现解锁的技术是统一的。下面仅以手机为例，结合附图和实施例对本发明进行详细描述。在基于音频实现手机解锁时，可以进行如下所示的三个步骤：步骤一：对输入源(包括旋律、节奏、音色)进行采集；步骤二：用户输入解锁所需要的音频密码(包括旋律、节奏、音色)；步骤三：基于音频进行信息比对，以进行手机解锁。在执行步骤一时，可以利用手机或者其他终端设备的信息采集装置对用户的输入源进行采集。具体形式可以为：a、麦克风，通过采集空气振动波实现信号的采集。b、利用喉部震动实现的信号采集。c、利用颌骨部位震动实现的信号采集。d、其他的通过采集物体的振动来实现的信号采集。无论上述的输入源是预先设置的音频密码，还是在解锁时输入的用于解锁的音频密码，手机均可以对采集到的信号进行处理(如模数转换并记录采样频率)，并将完成处理的信号作为输入信号保存。具体而言，可以对采集到的信号分别进行如下处理：如图3所示的旋律提取；如图6所示的节奏提取；如图7所示的音色提取。在进行旋律提取时，可以进行如下操作：a、对输入信号x(n)进行降采样以获得y(n)，建议采样速率降低到22050Hz或更小，但不低于10000Hz。b、由端点检测单元对y(n)进行端点检测，判定信号开始和结束的端点；分帧单元据此根据乐音的短时平稳性，将信号分成多帧并发送给基频提取单元。c、基频提取单元利用增强的Specmurt(改进的梅尔倒谱系数)算法提取出信号的基频。d、根据十二音律特性，音律转换单元将提取出来的所述基频转换成MIDI(乐器数字接口)音符并保存到数据库中。需要说明的是，有多种实现方式可以用于增强的Specmurt算法，如使用复小波变换实现增强的Specmurt算法，或使用STFT(短时傅立叶变换)、MDCT(其中一者即可)实现增强的Specmurt算法等。在使用复小波变换实现增强的Specmurt算法时，可以进行如图4所示的操作，具体为：a)在Specmurt算法的实现过程中，考虑谐波结构的设计、对数频率下频谱的求解两个方面。采用fcent＝log2(fHz/2)*120来消除Spcmurt算法中频率fHz和对数频率fcent的关系转换后对数频率之间的距离太小，对计算基频造成很大影响的问题。通过实验选择合适的谐波结构。b)在短时分帧后利用复小波变换实现Specmurt算法时，采用复小波变换并叠加各个尺度下能量的方法降低噪声的干扰。c)利用低通滤波的方法，将每个尺度能量的分布看成是时域信号并进行低通滤波以滤除干扰频率。d)将步骤c中获得的结果同基本谐波结构解卷积。在使用STFT、MDCT实现增强的Specmurt算法时，可以进行如图5所示的操作，具体为：a)将线性频谱转换成对数频谱。b)采用提取包络的方法消除直接由线性频谱转换成对数频谱时存在的缺陷。c)同基本谐波结构解卷积。在进行节奏提取时，可以进行如下操作：a、由降采样单元对输入信号x(n)进行降采样以获得z(n)，建议为11.025Hz。b、端点检测单元对信号z(n)进行端点检测，判定信号开始和结束的端点；分帧单元据此根据乐音的短时平稳性，将信号分成多帧并保存为p(n)。c、ACF(自相关求解)单元对所述分帧单元所保存的信号p(n)进行ACF以获得A(l，ti)；FM-ACF单元据此结合自相关的特点获得A(wl，ti)，其中wl＝l/fs(抽样频率)。d、STFT，对所述分帧单元所保存的信号p(n)进行DFT以获得U(wk，ti)；公式如下：e、联合函数处理单元联合STFT和FM-ACF以获得联合函数Y(wk，ti)＝U(wk，ti).A(wl，ti)。e、根据Y(wk，ti)求解出信号的节奏并保存到数据库中。在进行音色提取时，可以进行如下操作：a、对输入信号x(n)进行降采样以获得v(n)，建议为22050Hz。对v(n)进行端点检测，判定信号开始和结束的端点。具体而言，以能量(E)和过零率(ZCR)为特征的起止点算法的根据是背景噪声与语音的短时段及特征从统计看都有相当的区别。设波形时域信号为x(1)，加窗分帧处理后得到第n帧语音信号以便为先用短时能量作第一次判别，并在此基础上用短时过零率作第二次判别。在用短时能量作第一次判别时，为了不至于把语音能量的局部下降点错误地当成起止点，常采用双门限比较的方法。b、对判定完端点的v(n)求解谱包络并保存。如：对v(n)进行短时傅立叶变换，然后对每帧信号求取极大值，将局部极大值相连以获得谱包络。c、对v(n)求取信号的幅度包络并保存。如：Teager能量算子求包络：T(v(n))＝[v(n)]2-v(n-1)*v(n+1))；可以用低通滤波器滤除高频成分，低频成分就是包络；求局部极大值，设定一个包络门限，将局部极大值相连。在执行步骤二时，可以向手机输入解锁所需要的歌曲，手机根据步骤一所述的方法采集用户输入的信息并进行处理，将处理后的结果储存到数据库中。在执行步骤三时，图2中所示的乐音特征决策模块可以进行如下操作：a、比对旋律：采用DTW(动态时间规整算法)，把时间规整和距离测度计算结合起来，减少由于时间长短的不同所引起的误差。获取输入的用于解锁的音频密码的匹配失真度和路径偏差的综合值，据此判断用于解锁的音频密码的旋律与预先设置的音频密码的旋律是否低于预设的阈值，如果低于阈值，则进行下一步比对，否则提示解锁不成功。b、比对节奏信息：对比用于解锁的音频密码的节奏和预先设置的音频密码的节奏是否一致，在一致时进行下一步比对，否则提示解锁不成功。C、比对音色信息：采用DTW方法获取谱包络、幅度包络、MFCC系数以获得最后的综合值，据此判断用于解锁的音频密码的音色与预先设置的音频密码的音色是否低于预设的阈值，如果低于阈值，手机解锁并提示解锁成功，否则提示解锁不成功。在实际应用中，也可以只对上述的旋律、节奏、音色中的一个或两个内容进行判断，以确认是否解锁，具体的判断方法与上述相应描述类似。结合以上描述可见，本发明基于音频实现设备解锁的操作思路可以表示如图9所示的流程，该流程包括以下步骤：步骤910：设备从接收到的音频密码中提取以下至少之一：旋律、节奏、音色。步骤920：当所述旋律、节奏以及音色分别与预设的旋律、节奏、音色相匹配时，所述设备解锁。所述匹配可以是完全一致，也可以是在进行旋律、节奏或音色对比时符合前述的阈值要求。综上所述可见，无论是方法还是系统，本发明基于音频实现设备解锁的技术，在解锁时对音频中的具体因素进行了考虑，从而提高了设备解锁的安全性。以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘成芳
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。