一种自动配置音效的方法、装置、移动终端及存储装置与流程

文档序号:11234962阅读:323来源:国知局
一种自动配置音效的方法、装置、移动终端及存储装置与流程

本发明涉及移动终端技术领域,具体涉及一种自动配置音效的方法、装置、移动终端及存储装置。



背景技术:

随着消费电子快速发展,智能移动终端已经成为人们日常生活中必不可少的娱乐工具,目前,人们越来越多的使用智能手机、平板电脑等智能移动终端来获取信息以及进行工作或娱乐。

各种新技术也随之产生,语音作为基本的、主要的、关键的交互方式越来越多的应用于智能设备的交互应用中,由于现阶段消费电子作为整个系统的设计短板,各个系统设计厂家,以及平台还有关键器件厂家都在降低智能设备的功耗,尽最大可能将产品以及系统的在不牺牲性能的基础上进行低功耗设计,最大程度上延长电子产品的待机时间,最终让用户能够从中更加频繁的正常使用该产品的功能,并且不用担心因为在功耗的原因而在需要使用的时候而不能正常工作。

目前现有语音识别技术主要是将识别引擎做在应用处理器上,当需要启动语音识别功能的时候需要将应用处理器唤醒,这样会同时唤醒外围器件,比如显示、触摸、led、传感器等,当然音频系统也会唤醒,因为应用处理器主要是用来进行用户交互的管理的主控模块,所以不可避免造成功耗增加。

目前做到低电功耗的方案是没办法进行语音自定义的,为了达到低功耗处理,通常是将有限的几个命令结合语音识别的引擎打包成固件烧录到dsp中去的,这样做的目的,首先尽量减少集线器的硬件单元,减少内部容量大小,降低成本,但是这样造成的问题就是用户不能进行个性化语音命令的修改,而且语音命令的固件也只能原厂在提供芯片的时候就已经定义和烧录好了,没办法更改。

现有技术中当用户打开移动终端中的音乐播放器进行播放时,如果用户需要设置自己喜欢的音乐风格或者音效模式,需要用户进行进一步的设置,繁琐的设置会加大用户的移动终端的功耗,降低待机时间。

因此,现有技术还有待于改进和发展。



技术实现要素:

本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种自动配置音效的方法、装置、移动终端及存储装置,旨在通过自定义语音命令,当执行播放音乐的语音命令的时候,不仅启动音乐相关的应用,而且将语音信号结合声纹算法进行用户身份识别,并通过用户的身份,来自动配置加载符合用户喜好的音效。

本发明解决技术问题所采用的技术方案如下:

一种自动配置音效的方法,其中,所述自动配置音效的方法包括以下步骤:

步骤a:移动终端预先保存录制好的一段用户的语音命令,所述语音命令用于当作声音信号通过声纹算法进行解析从而辨识用户的身份;

步骤b:当移动终端接收到用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过声纹算法识别和判断当前用户的身份;

步骤c:当移动终端识别出用户的身份并且播放音乐的命令被触发时,自动控制按照当前用户的听音喜好设置音乐的听音风格或者设置个性听歌菜单。

所述的自动配置音效的方法,其中,所述步骤a具体包括:

步骤a1:移动终端接收预先录制好的一段用户的语音命令,完成语音命令的自定义;

步骤a2:当启动移动终端或者开启相关应用时,通过声纹算法进行解析所述语音命令,辨识用户的身份;

步骤a3:移动终端接收增加多个不同语音命令的操作,以及在接收到对预先设置的语音命令进行修改的指令后,更新对应的语音命令。

所述的自动配置音效的方法,其中,所述步骤b具体包括:

步骤b1:移动终端接收用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过麦克风接收用户的语音命令;

步骤b2:通过音频解码器中加载的声纹算法对所述语音命令进行解析,将解析结果与预先保存的语音命令进行匹配,识别和判断用户的身份信息。

所述的自动配置音效的方法,其中,所述步骤c具体包括:

步骤c1:当识别出用户的身份信息后,移动终端接收用户播放音乐的操作指令;

步骤c2:根据当前用户的听音喜好将音效参数进行更新,自动配置音乐的听音风格或者设置个性听歌菜单。

一种自动配置音效的装置,其中,所述装置包括:

应用处理器,用于与上层应用的交互以及对用户界面的交互;

文件系统,用于保存用户跟外围设备进行交互的数据,以及应用中的数据的读写存储操作的接口;

电源管理模块,用于连接在应用处理器上各个外接设备进行供电,并通过应用处理器来进行管理和监控;

音频解码器,用于加载软件算法或者提供模拟转数字或者数字转模拟的功能,并且提供连接音频外围设备的接口;

传感器集线器,用于监听各个外围设备的工作状态以及加载和运行各类软件算法;

麦克风,用于捕捉人声信号并将声音信号传输至所述传感器集线器;

所述麦克风、传感器集线器、音频解码器、应用处理器以及文件系统依次进行连接,所述电源管理模块分别与所述传感器集线器、音频解码器、应用处理器连接进行供电。

所述的自动配置音效的装置,其中,所述应用处理器用于处理包括屏幕显示、图像处理、音频的编解码处理、系统级与应用级应用的启动和关闭、对外围设备的读写交互和将所获取到的数据保存在文件系统中。

所述的自动配置音效的装置,其中,所述音频解码器具体包括:用于加载软件算法的音频处理器单元和用于提供模拟转数字或者数字转模拟的功能的解码器单元;

所述传感器集线器具体包括:用于监听各个外围设备的工作状态,并且负责加载和运行各类软件算法的低电处理器单元和用于存储的内存单元。

所述的自动配置音效的装置,其中,所述音频解码器与传感器集线器模块通过i2s总线进行连接。

一种移动终端,其中,包括:处理器、与处理器通信连接的存储器,所述存储器存储有计算机程序,所述计算机程序用于被执行时实现所述的自动配置音效的方法;所述处理器用于调用所述存储器中的计算机程序,以实现所述的自动配置音效的方法。

一种存储装置,其中,所述存储装置存储有计算机程序,所述计算机程序能够被执行以实现所述的方法。

本发明公开了一种自动配置音效的方法、装置、移动终端及存储装置,所述方法包括:移动终端预先保存录制好的一段用户的语音命令,所述语音命令用于当作声音信号通过声纹算法进行解析从而辨识用户的身份;当移动终端接收到用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过声纹算法识别和判断当前用户的身份;当移动终端识别出用户的身份并且播放音乐的命令被触发时,自动控制按照当前用户的听音喜好设置音乐的听音风格或者设置个性听歌菜单。本发明通过自定义语音命令,当执行播放音乐的语音命令的时候,不仅启动音乐相关的应用,而且将语音信号结合声纹算法进行用户身份识别,并通过用户的身份,来自动配置加载符合用户喜好的音效。

附图说明

图1是本发明自动配置音效的方法的较佳实施例的流程图。

图2是本发明自动配置音效的装置的结构示意图。

图3是本发明自动配置音效的移动终端的功能原理框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明较佳实施例所述的窗口背景的实现方法,如图1所示,一种自动配置音效的方法,其中,包括以下步骤:

步骤s100,移动终端预先保存录制好的一段用户的语音命令,所述语音命令用于当作声音信号通过声纹算法进行解析从而辨识用户的身份。

进一步地,所述步骤s100具体包括:

步骤s101,移动终端接收预先录制好的一段用户的语音命令,完成语音命令的自定义;

步骤s102,当启动移动终端或者开启相关应用时,通过声纹算法进行解析所述语音命令,辨识用户的身份;

步骤s103,移动终端接收增加多个不同语音命令的操作,以及在接收到对预先设置的语音命令进行修改的指令后,更新对应的语音命令。

具体地,本发明使用的集线器包括一颗低电主控单元,并且具有足够的rom用来加载语音识别的算法,另外将自定义关键字的训练流程放在了应用处理器上,因为训练流程并不是经常需要进行的,可通过用户界面按步骤来进行语音命令的训练,并保存在应用处理器的文件系统中,最终可以通过使用者发送应用指令给传感器集线器的主控模块进行语音识别算法的固件更新,从而实现了自定义的语音命令功能的目的。

步骤s200,当移动终端接收到用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过声纹算法识别和判断当前用户的身份。

进一步地,所述步骤s200具体包括:

步骤s201,移动终端接收用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过麦克风接收用户的语音命令;

步骤s202,通过音频解码器中加载的声纹算法对所述语音命令进行解析,将解析结果与预先保存的语音命令进行匹配,识别和判断用户的身份信息。

具体实施时,语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolatedwordrecognition),关键词识别(或称关键词检出,keywordspotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。

根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。

另外,根据语音设备和通道,可以分为桌面(pc)语音识别、电话语音识别和嵌入式设备(手机、pda等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。

本发明主要使用目前成熟语音供应商的语音识别方案,达到实现智能设备系统的功能,该功能能够通过训练提高语音识别功能,对系统处理速度以及要求很低,mcu主频超过100mhz,ram大于64kb,离线库存储库,可以按照mcurom进行自行裁减。

当通过音频解码器中加载的声纹算法对所述语音命令进行解析的过程是:首先进行语音检测,然后进行噪音抑制和特征提取,再进行声纹确认后进行声纹匹配,识别和判断用户的身份信息。

步骤s300,当移动终端识别出用户的身份并且播放音乐的命令被触发时,自动控制按照当前用户的听音喜好设置音乐的听音风格或者设置个性听歌菜单。

进一步地,所述步骤s200具体包括:

步骤s301,当识别出用户的身份信息后,移动终端接收用户播放音乐的操作指令;

步骤s302,根据当前用户的听音喜好将音效参数进行更新,自动配置音乐的听音风格或者设置个性听歌菜单。

具体实施时,本发明因为能够进行自定义语音识别命令,所以在用户唤醒机器通过语音识别命令之后再启动应用,如启动播放音乐的应用过程中,因为每个使用者(用户)对音乐的喜好和听音能力的不同,那么都有各自喜好的音效设置,普遍来讲音乐听音风格设置都会在音乐播放应用的设置中去手动设置,那么通过本发明用户进行低电唤醒设备和启动相对应关键字的应用的时候,因为会录制一段语音命令的语音,可以将此声音信号送至声纹算法中进行解析从而辨识此时用户的身份,从而连带的自动去设置当前用户的听音喜好的音效或者设置过滤喜欢的个性听歌菜单,从而通过一个步骤节省了现有的多个步骤,从而实现了更加智能和人性化的听歌体验。

本发明通过硬件设计使只需现在同类产品30%的总功耗实现超长待机,移除mcu控制单元将自定义语音命令的功能放在移动终端,仅由低功耗dsp(digitalsignalprocessing,数字信号处理),以及加上专门用于语音识别技术所做的低功耗处理的模拟麦克风器件,从而摆脱以前需要复杂的基于移动终端的硬件和软件平台才能实现的智能功能和设备以及产品,更加低的成本,做到更加贴近实用、长待机、便捷性、也能用在更多的领域比如简单的智能器件、手环、智能家居等领域。

本发明是利用目前流行的低电唤醒功能以及自定义语音命令并关联不同的应用上,并结合声纹技术将语音信号进行身份识别,判断当前使用该设备的用户身份出来后,当播放音乐的命令被触发的时候,会自动按照当前用户的喜好自动配置音乐的听音风格,从而将需要几步进行操作的步骤,变成的更加简洁明了,从而让用户在听音的时候更加的智能人性化。

本发明还提供了一种自动配置音效的装置,如图2所示,所述装置包括:

应用处理器10,用于与上层应用的交互以及对用户界面的交互;

文件系统11,用于保存用户跟外围设备进行交互的数据,以及应用中的数据的读写存储操作的接口;

电源管理模块12,用于连接在应用处理器上各个外接设备进行供电,并通过应用处理器10来进行管理和监控;

音频解码器13,用于加载软件算法或者提供模拟转数字或者数字转模拟的功能,并且提供连接音频外围设备的接口;

传感器集线器14,用于监听各个外围设备的工作状态以及加载和运行各类软件算法;

麦克风15,用于捕捉人声信号并将声音信号传输至所述传感器集线器;

所述麦克风15、传感器集线器14、音频解码器13、应用处理器10以及文件系统11依次进行连接,所述电源管理模块12分别与所述传感器集线器14、音频解码器13、应用处理器10连接进行供电。

具体地,所述应用处理器10用于处理包括屏幕显示、图像处理、音频的编解码处理、系统级与应用级应用的启动和关闭、对外围设备的读写交互和将所获取到的数据保存在文件系统11中,以便读写。对其他外围设备进行统一管理基于多任务系统之上,基于各个系统任务的优先级进行统一管理和运行,保证整个系统能够有序的工作。

所述文件系统11用来保存用户跟外围设备进行交互的数据,以及应用中的数据的读写存储操作的接口,系统整个数据以文件形式进行管理的模块。

所述电源管理模块12主要连接在应用处理器10上各个外接设备进行供电,并通过应用处理器10来进行管理和监控,为了更好的降低整个系统的功耗,由应用处理器10基于操作系统中的对当前运行的设备和应用进行统一管理,按照优先级,以及设备的使用情况以及消耗资源,内存等情况进行管理策略保证各个应用和硬件设能够正常的工作并且合理供电。

所述音频解码器13具体包括:用于加载软件算法的音频处理器单元131和用于提供模拟转数字或者数字转模拟的功能的解码器单元132。音频处理器单元131主要是处理器单用来加载软件算法如本发明的声纹解析算法,而解码器单元统称codec单元,提供模拟转数字或者数字转模拟的功能,并且提供连接音频外围设备的接口如麦克风接口以及喇叭功放接口,耳机接口等。

本发明是通过i2s(inter—icsound,i2s总线又称集成电路内置音频总线,是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准,该总线专责于音频设备之间的数据传输,广泛应用于各种多媒体系统,它采用了沿独立的导线传输时钟与数据信号的设计,通过将数据和时钟信号分离,避免了因时差诱发的失真,为用户节省了购买抵抗音频抖动的专业设备的费用。)总线将音频解码13与传感器集线器14相连接的。

所述传感器集线器14具体包括:用于监听各个外围设备的工作状态,并且负责加载和运行各类软件算法的低电处理器单元141和用于存储的内存单元142。低电处理器单元141主要是用来管理该模块的各个外围设备的协调工作,监听各个外围设备的工作状态,并且负责加载和运行在该单元的各类软件算法,本发明主要是加载和更新从应用处理器10发送过来语音识别的固件。

本装置的具体工作流程为:将外部声音通过外部输入器件再经过传感器集线器中低电处理器单元进行运算模块进行算法解析,判断关键字是否匹配,最后自动发送不同的中断命令通过int1脚,并由音频解码器模块通路直接发送给应用处理器,因为应用处理器正处在低电待机状态下,但是运行在应用处理器上的核心进程实时监测任何可能唤醒整个系统的硬件中断信号。

当监测到新的硬件中断信号时,就会判断此时是什么优先级的以及什么类型的终端,此时对应的启动挂载在应用处理器上的外接设备硬件初始化,供电,对应的时钟设置,挂在文件系统上,读取保存系统信息,比如上次任务的读写数据或者调去文件系统当前需要显示的数据,由于传感器集线器会发出不同的中断响应,而在应用处理器的文件系统中保存了所对应的启动应用,当启动应用之后,因为采集到语音信号会通过传感器集线器,通过i2s总线送至音频解码器。

因为本发明用的数字麦克风,所以不需要进行模拟信号转换成数字信号,直接送至音频解码器中的数字处理器单元,此单元加载了声纹算法,通过将语音经过此算法解析之后,会将结果送至应用处理器进行匹对,因为在第一次身份录入的时候是通过应用处理器跟用户进行交互保存在在文件系统的,声纹原始匹配信号是保存在文件系统中的,当识别出用户信息后,会自动将音效参数相应进行更新,从而实现了本发明的目的。

其中低电处理器运算单元的算法更新,是通过第一次用户自定义语音命令所要求的,此设备可以同时支持4个语音命令,所以可以按顺序先后依次定制通过自定义软件,由于是低功耗的硬件设计,并且考虑到用户更新命令的次数不是太频繁,而且考虑更新用户语音命令的界面更友好,所以通过移动终端录制自定义语音,移动终端打开训练语音的应用,通过按钮控制采集新语音命令通过移动终端麦克,直接通过语音打包算法将语音信号转换成语音特征码数据填充到保存在唤醒算法固件中,然后对低电处理器上的语音识别算法进行擦写动作,然后通过数据总线和控制总线将更新后的唤醒算法重新写入到dsp运算模块中,从而达到了更新语音指令的目的。

本发明还提供了一种移动终端,如图3所示,所述装置包括:

如图3所示,所述移动终端包括:处理器(processor)10、存储器(memory)20、通信接口(communicationsinterface)30和总线40;其中,

所述处理器10、存储器20、通信接口30通过所述总线40完成相互间的通信;

所述通信接口30用于所述移动终端的通信设备之间的信息传输;

所述处理器10用于调用所述存储器20中的计算机程序,以执行上述各方法实施例所提供的方法,例如包括:移动终端预先保存录制好的一段用户的语音命令,所述语音命令用于当作声音信号通过声纹算法进行解析从而辨识用户的身份;当移动终端接收到用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过声纹算法识别和判断当前用户的身份;当移动终端识别出用户的身份并且播放音乐的命令被触发时,自动控制按照当前用户的听音喜好设置音乐的听音风格或者设置个性听歌菜单。

本发明还提供一种存储装置,其中,所述存储装置存储有计算机程序,所述计算机程序能够被执行以实现所述窗口背景的实现方法。

综上所述,本发明提供了一种自动配置音效的方法、装置、移动终端及存储装置,所述方法包括:移动终端预先保存录制好的一段用户的语音命令,所述语音命令用于当作声音信号通过声纹算法进行解析从而辨识用户的身份;当移动终端接收到用户通过语音命令进行低电唤醒设备或者启动进行音乐播放的应用的操作指令时,通过声纹算法识别和判断当前用户的身份;当移动终端识别出用户的身份并且播放音乐的命令被触发时,自动控制按照当前用户的听音喜好设置音乐的听音风格或者设置个性听歌菜单。本发明通过自定义语音命令,当执行播放音乐的语音命令的时候,不仅启动音乐相关的应用,而且将语音信号结合声纹算法进行用户身份识别,并通过用户的身份,来自动配置加载符合用户喜好的音效。

当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。

应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1