音频数据的获取方法、装置、存储介质及终端与流程

文档序号:16665583发布日期:2019-01-18 23:14阅读:247来源:国知局
音频数据的获取方法、装置、存储介质及终端与流程

本申请实施例涉及智能终端技术领域,尤其涉及音频数据的获取方法、装置、存储介质及终端。



背景技术:

随着智能穿戴设备的不断发展,具有智能终端功能,且能满足便携性和大屏幕视觉体验需求的智能穿戴设备逐渐得到用户的认可。

目前,智能穿戴设备在嘈杂环境中,无法准确获取用户发出的音频数据,进而影响用户的正常使用。



技术实现要素:

本申请实施例的目的是提供一种音频数据的获取方法、装置、存储介质及终端,可以提高智能穿戴设备获取音频数据的准确性。

第一方面,本申请实施例提供了一种音频数据的获取方法,包括:

接收音频数据获取信号;

根据所述音频数据获取信号,则通过骨传导方式获取第一音频数据;

对所述第一音频数据进行去噪处理,得到目标音频数据。

第二方面,本申请实施例提供了一种音频数据的获取装置,包括:

信号接收模块,用于接收音频数据获取信号;

第一音频获取模块,用于根据所述信号接收模块接收到的所述音频数据获取信号,通过骨传导方式获取第一音频数据;

去噪处理模块,用于对所述第一音频获取模块获取的所述第一音频数据进行去噪处理,得到目标音频数据。

第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所示的音频数据的获取方法。

第四方面,本申请实施例提供了一种终端,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所示的音频数据的获取方法。

本申请实施例中提供的音频数据的获取方案,首先接收音频数据获取信号;然后,根据所述音频数据获取信号,通过骨传导方式获取第一音频数据;最后,对所述第一音频数据进行去噪处理,得到目标音频数据,能够提高智能穿戴设备获取音频数据的准确性。

附图说明

图1为本申请实施例提供的一种音频数据的获取方法的流程示意图;

图2为本申请实施例提供的另一种音频数据的获取方法的流程示意图;

图3a为本申请实施例提供的另一种音频数据的获取方法的流程示意图;

图3b为本申请实施例提供的用户通过智能穿戴设备与远程专家进行远程指导的场景示意图;

图4为本申请实施例提供的另一种音频数据的获取方法的流程示意图;

图5为本申请实施例提供的另一种音频数据的获取方法的流程示意图;

图6为本申请实施例提供的一种音频数据的获取装置的结构示意图;

图7是本申请实施例提供的一种智能穿戴设备的结构示意图;

图8是本申请实施例提供的一种智能穿戴设备的示意实物图;

图9为本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本申请的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

随着智能穿戴设备的不断发展,具有手机功能,且能满足便携性和大屏幕视觉体验需求的智能穿戴设备逐渐得到用户的认可。目前,智能穿戴设备在嘈杂环境(如,噪声较大的工作车间、演唱会现场等)中,获取的音频数据噪声较大,使得无法准确获取用户输入的音频数据,进而影响用户对智能穿戴设备的正常使用和控制。

本申请实施例提供了一种音频数据的获取方法,能够在接收音频数据获取信号后,通过骨传导方式获取第一音频数据,进行去噪处理后得到目标音频数据。进而避免用户在嘈杂环境中说话时,无法准确获取用户输入的音频数据的问题,提高智能穿戴设备获取音频数据的准确性。具体方案如下所示:

图1为本申请实施例提供的音频数据的获取方法的流程示意图,该方法用于智能穿戴设备获取用户输入的音频数据的情况,该方法可以由安装有骨传导设备的智能穿戴设备或终端设备来执行,例如,该智能穿戴设备可以为智能眼镜、智能头盔、智能手环等,终端设备可以是智能手机、平板电脑、笔记本电脑等。该方法具体包括如下步骤:

步骤110、接收音频数据获取信号。

其中,音频数据获取信号可以是智能穿戴设备或其他终端设备(如手机、平板电脑等)接收到用户的触发操作而产生的用于表示用户要输入音频数据的信号。可选的,如果音频数据获取信号是用户触发其他终端设备产生的信号,则其他终端设备会将产生的音频数据获取信号通过终端设备发送至智能穿戴设备。例如,用户点击手机上的录音按键,则会触发产生音频数据获取信号,此时手机会将产生的音频数据获取信号发送至智能穿戴设备。

可选的,在本申请实施例中,触发生成音频数据获取信号的方式有很多,本申请对此不进行限定,可以是用户点击智能穿戴设备或其他终端设备上的与获取音频信号对应的固定按键,例如,录音时需要获取用户输入的音频数据,因此可以当检测用户点击了智能穿戴设备上录音按键时,即触发生成音频数据获取信号;还可以是检测智能穿戴设备或其他终端设备中预设的关联应用程序是否启动,可选的,关联应用程序可以包括语音/视频聊天程序、录音程序、远程指导程序。例如,开启远程指导程序时,会启动视频通话功能,此时必将会涉及用户音频信息的获取,因此,可以将远程指导程序设置为关联应用程序,当检测到远程指导程序启动时,即触发生成音频数据获取信号;也可以是检测智能穿戴设备的骨传导设备处是否产生了骨震动,例如,用户说话时,音频信号基于骨传导的过程,会引起骨震动,当检测骨传导设备所在处存在骨震动时,即触发生成音频数据获取信号。

可选的,在本申请实施例中,接收音频数据获取信号可以是在检测到智能穿戴设备启动或处于运动状态时开起音频数据获取信号的接收功能,例如,用户佩戴的智能穿戴设备启动或处于运动状态时,通常表示用户要使用该智能穿戴设备,因此很可能会触发音频数据获取信号,如发出语音控制指令。故,可以当检测到智能穿戴设备启动或处于运动状态时,开起音频数据获取信号的接收功能,接收音频数据获取信号。可选的,在接收音频数据获取信号时,可以是每隔预设时间(如5分钟)接收一次,也可以是实时进行接收,直到智能穿戴设备关闭。

进一步的,接收音频数据获取信号时,可以是在当前位置信息与预设位置信息匹配时,接收音频数据获取信号。

其中,预设位置信息可以是用户根据自身需求预先设定的,还可以是系统默认的,例如,可以是考虑到嘈杂环境中不容易获取用户输入的音频数据,因此可以将嘈杂环境,如商场、体育场、街道等设置为预设位置信息。当前位置信息指的是用户所在位置信息,其可以通过智能穿戴设备上的导航定位单元获取当前位置信息,还可以与智能终端进行交互,通过智能终端上的导航定位单元获取当前位置信息。

可选的,若当前位置信息与预设位置信息匹配,则说明当前位置处于嘈杂环境,则启动音频数据获取信号功能,通过骨传导方式获取用户输入的音频数据。若当前位置信息与预设位置信息不匹配,则说明当前位置不属于嘈杂环境,例如,用户在家中,此时通过常规的空气传导方式即可准确获取用户输入的音频数据。

步骤120、根据音频数据获取信号,通过骨传导方式获取第一音频数据。

其中,骨传导方式是利用人讲话时引起的头颈部骨骼的轻微震动来把声音信号收集起来转为电信号的方式。由于它不同于传统麦克风通过空气传导采集声音,所以在很嘈杂的环境里也可以把声音高清晰的传出来。可选的,本申请实施例可以通过骨传导设备来获取第一音频数据,若智能穿戴时为智能眼镜时,骨传导设备可以设置在智能眼镜镜腿部位,用户在佩戴时,设置在智能眼镜镜腿部位的骨传导设备与用户耳朵附近的头骨接触,可以很好的通过头骨震动收集声音信号。第一音频数据为用户输入的音频数据。

在本申请实施例中,如果步骤110接收到音频数据获取信号,则启动骨传导设备的语音输入功能,通过骨传导方式来收集用户输入的音频数据,通过骨传导方式获取的第一音频数据,清晰度较高,对于环境中通过空气传导的嘈杂噪声不会进入骨传导设备。例如,用户在噪声较大的车间维修机器时使用智能穿戴设备的远程指导功能向远程专家求助,此时,通过骨传导设备获取的用户输入的音频数据中可以很好的过滤掉嘈杂环境中的机器声音,保证了获取的用户输入声音的清晰度。

可选的,若接收的音频数据获取信号是通过检测关联程序启动生成的,由于关联应用程序是预先设定的运行过程中可能涉及获取音频数据的软件,但是不代表启动关联应用程序后一定获取音频数据,因此,可以预设一个时间间隔,若在该预设时间间隔内,无骨震动(即用户没有输入音频数据),则关闭骨传导设备,等到下次接收到音频数据获取信号时,再启动骨传导设备获取用户输入的音频数据。例如,检测到用户开启关联程序“微信”,则生成音频数据获取信号,当接收到音频数据获取信号后启动骨传导设备获取用户输入的音频数据,若在预设时间间隔(如1分钟)内,用户只是看微信朋友圈,并没有语音聊天或视频通话,此时关闭骨传导设备。若过了一会又接收到由于检测到用户触发了微信中的视频通话按键而生成的音频数据获取信号,则再次启动骨传导设备获取用户输入的音频数据。

需要说明的是,在通过骨传导方式获取第一音频数据之前,需要检测智能穿戴设备的骨传导设备是否正常,是否与用户头骨接触,若骨传导设备状态异常或没有与用户头骨接触,则骨传导设备是无法通过骨传导方式获取用户输入的音频数据,此时为了防止遗漏用户输入的音频数据,需要启动麦克风(基于控制传导方式工作的麦克风)或备用骨传导设备来暂时获取用户输入的音频数据且提示用户穿戴好智能穿戴设备等。

步骤130、对第一音频数据进行去噪处理,得到目标音频数据。

虽然是通过骨传导方式获取第一音频数据,受环境噪声影响较小,但是获取的第一音频数据中仍然会存在一定的噪声,例如,用户咳嗽、咬牙、挠头等产生的声音,这些声音通过空气传导方式可能不明显,但是通过骨传导方式获取则非常清晰,因此,对于通过骨传导方式获取的音频数据,仍要进行去噪处理,去除音频数据中的无效数据(如咳嗽、咬牙、挠头等声音),得到没有噪声的清晰度高的用第一音频数据作为目标音频数据。

在本申请实施例中,对第一音频数据进行去噪处理的方式有很多,对此本申请不进行限定,可以是预先通过大量的音频数据样本(包含带噪声的音频数据和无噪声的音频数据)训练滤波器,通过训练好的滤波器进行去噪处理,例如,训练的滤波器可以是最小均方误差(lms)滤波器。在对第一音频数据进行去噪处理时,还可以是分析获取的第一音频数据的音频特征(如音色、音调、频率、响度等等),由于噪声和用户输入的音频数据的音频特征不同,因此可以根据音频数据中音频特征的变化情况,将变化异常的第一音频特征对应的音频数据(即噪声部分)去除。例如,在获取的第一音频数据中第2秒到第5秒的音频特征变化异常,则说明该时间段对应的音频数据为噪声,需要将其删除。

可选的,由于得到的目标音频数据只包含用户输入的音频数据,并不包含环境噪声,因此,如果得到的目标音频数据是用户和其他用户的通话内容,则可将得到的目标音频数据进行数据加密后发送至通话另一方。如果得到的目标音频数据为用户输入的录音数据,则可将得到的目标音频数据存储在录音程序对应的存储单元中。如果得到的目标音频数据是用户对智能穿戴设备或者智能终端的控制指令,则智能穿戴设备会直接响应得到的目标音频数据或者发送至智能终端,以使智能终端响应该目标音频数据。例如,当目标音频数据为“天气预报”,则智能穿戴设备会立刻响应启动天气提示功能,向用户输出当前天气。

本申请实施例中提供的音频数据的获取方法,首先接收音频数据获取信号;然后,根据所述音频数据获取信号,通过骨传导方式获取第一音频数据;最后,对所述第一音频数据进行去噪处理,得到目标音频数据。相对于通过空气传导方式获取音频数据,本申请实施例能够在接收音频数据获取信号后,通过骨传导方式获取第一音频数据,进行去噪处理后得到目标音频数据。进而避免了用户在嘈杂环境中说话时,无法准确获取用户输入的音频数据的问题,提高智能穿戴设备获取音频数据的准确性。

图2为本申请实施例提供的一种音频数据的获取方法的流程示意图,适用于获取音频数据时,不但要获取用户所说的话,还要获取环境声音的情况,例如,用户想录一段自己解说的足球比赛视频时,既要获取足球比赛的现场声音,还要获取自己解说的声音。作为对上述实施例的进一步说明,包括:

步骤210、接收音频数据获取信号。

本申请实施例在接收音频数据获取信号后,不但要执行步骤210通过骨传导方式获取第一音频数据,还要执行步骤230获取环境音频数据。示例性的,用户在观看一场足球比赛时,想录一段自己解说的现场视频,此时,既要执行步骤220,获取自己解说的声音,还要执行步骤230,获取足球比赛的现场声音,来还原真实的比赛场景。

步骤220、根据音频数据获取信号,通过骨传导方式获取第一音频数据。

示例性的,通过骨传导设备可以很好的过滤掉嘈杂的环境声音,获取到用户输入的音频数据。

步骤230、根据音频数据获取信号获取环境音频数据。

示例性的,环境音频数据可以通过基于空气传导方式工作的麦克风获取,即现有的智能穿戴设备获取音频数据的方式,可以在智能穿戴设备上设置至少一个基于空气传导方式工作的麦克风来获取环境声音。

步骤240、根据环境音频数据和第一音频数据生成第二音频数据。

其中,第二音频数据是将环境音频数据和第一音频数据进行融合处理后得到数据,可选的,对环境音频数据和第一音频数据进行融合处理生成第二音频数据的方式有很多,本申请实施例对此不进行限定,可以是将环境音频数据的音量与第一音频数据的音量进行调整后,融合在一起生成第二音频数据,例如,将获取的足球现场音频数据调小,将用户输入的解说音频数据调大后,将两路音频数据融合在一起得到第二音频数据。

可选的,考虑到获取的环境音频数据中也包含第一音频数据,只是其掩盖在了嘈杂的环境声音中,无法很好的进行区分,因此在根据环境音频数据和第一音频数据生成第二音频数据时,还可以是将第一音频数据替换环境音频数据中的那部分第一音频数据,得到第二音频数据。例如,根据获取的用户解说音频数据,将获取的足球现场音频数据中的用户解说音频数据滤除,然后将滤除后的足球现场音频数据和获取的用户解说音频数据融合在一起,得到第二音频数据。

步骤250、对第二音频数据进行去噪处理,得到目标音频数据。

可选的,对第二音频数据进行去噪处理时,不但要滤除第一音频数据中的噪声(如咳嗽、咬牙、挠头等声音),还要生成第二音频数据时造成的新的噪声。例如,若第二音频数据是将第一音频数据和环境音频数据进行音量调整后融合生成的,则第二音频数据中会出现重叠的第一音频数据(即包括骨传导设备获取的用户解说音频数据和环境音频数据中包含的用户解说音频数据),此时的去噪处理可以是将环境音频数据中的第一音频数据部分滤除。

可选的,若第二音频数据是将第一音频数据替换环境音频数据中的第一音频数据生成的,则第二音频数据中可能出现环境声音大于第一音频数据,从而导致环境噪声过大,听不到第一音频数据的情况,此时的去噪处理可以是将环境音频数据的音量降低,提高第一音频数据的音量。

本申请实施例提供的音频数据的获取方法,能够在接收音频数据获取信号后,通过骨传导方式和空气传导方式共同获取音频数据生成第二音频数据,对第二音频数据进行去噪后得到目标音频数据。能够提高智能穿戴设备获取音频数据的准确性。

图3a为本申请实施例提供的一种音频数据的获取方法的流程示意图,图3b为本申请实施例提供的用户通过智能穿戴设备与远程专家进行远程指导的场景示意图。本申请实施例适用于智能穿戴设备的骨传导设备既用于获取音频数据,又用于输出音频数据的情况。例如,用户使用智能穿戴设备的远程指导功能时,骨传导设备既可以获取用户说的话发送给远程的专家,又可以将专家说的话输出给用户。结合图3b对上述实施例的进一步说明,包括:

步骤310、开始。

步骤320、判断是否接收到音频数据获取信号,若是,执行步骤330,若否,执行步骤350。

由于骨传导设备不但具有获取音频数据的功能,还具有传输音频数据的功能,且可以代替耳机和扬声器,将待播放的音频数据输出给用户。通过骨传导设备传输音频数据,可以解放双耳,在接收音频数据的同时也能注意到周围环境的变化,使用更加安全例如,且能够在说话音量较小时也能让对方清楚知道表达的指令。

可选的,为了使得在嘈杂的环境中也可以准确的获取和播放音频数据,可以是在接收到音频数据获取信号时,执行步骤330,通过骨传导方式获取第一音频数据;在没有接收到音频数据获取信号时,执行步骤350,通过骨传导方式输出待播放的音频数据。可选的,此时音频数据获取信号可以是由骨震动触发生成的。例如,用户在使用远程指导功能时,可以通过检测骨传导设备处是否存在骨震动,若存在,说明用户正在说话,生成音频数据获取信号,接收到生成的音频数据获取信号后执行步骤330,通过骨传导方式获取用户输入的音频数据,若不存在骨震动,则说明用户在听专家的指导,此时执行步骤350,通过骨传导方式向用户输出专家的指导音频数据。

步骤330、根据所述音频数据获取信号,通过骨传导方式获取第一音频数据。

示例性的,用户与远程专家通话过程中,当用户说话时,声音基于骨传导方式会引起骨震动,当产生骨震动时即触发生成音频数据获取信号,获取了生成的音频数据获取信号后,则会控制骨传导设备基于骨传导方式获取用户所说的话。

步骤340、对第一音频数据进行去噪处理,得到目标音频数据。

步骤350、获取待播放音频数据,通过骨传导方式输出待播放音频数据。

其中,待播放的音频数据可以是需要向用户播放的音频数据,当没有接收到音频数据获取信号时,智能穿戴设备会自动通信单元获取的远程发送过来的音频数据,并通过骨传导设备将获取的音频数据基于骨传导方式输出给用户。例如,待播放的音频数据是用户使用远程指导功能时,远程专家所说的话,用户在与远程专家通话过程中,若用户没有说话时,不会产生骨震动,即获取音频数据获取信号,此时,骨传导设备会将获取的专家指导音频数据基于骨传导方式输出给用户。

可选的,本申请实施例中骨传导方式输出的待播放音频数据并不限于用户进行通话时的通话内容,还可以是将骨传导设备代替耳机的播放功能,此时的待播放数据可以是待播放的音乐。

步骤360、如果通过骨传导方式输出待播放音频数据时,接收到音频数据获取信号,则启动备用骨传导方式获取第三音频数据。

其中,第三音频数据也为用户输入的音频数据,该音频数据可以是在通过骨传导方式输出待播放音频数据时用户输入的音频数据。

可选的,智能穿戴设备中的骨传导设备可以设置多个,一个为主骨传导设备,其余为备用骨传导设备,主骨传导设备基于主骨传导方式进行工作,备份骨传导设备基于备份骨传导方式进行工作。其中,当需要进行音频数据的获取和输出时,首先选用主骨传导设备,当主骨传导设备正在工作或状态异常时,启用备份骨传导设备,能够保证即使骨传导设备损坏或正在使用时,也能够准确获取用户输入的音频数据。

可选的,即使当前时刻主骨传导设备处于播放工作模式,也要接收音频数据获取信号,若在主骨传导设备正在基于主骨传导方式向用户输出待播放的音频数据时,接收到音频数据获取信号,则此时主骨传导设备继续执行向用户输出待播放的音频数据,启动备用骨传到设备基于备份骨传导方式获取用户输入的第三音频数据,并执行步骤340,对获取的音频数据进行去噪处理,得到目标音频数据。例如,用户听主骨传到设备发送回来的专家指导的过程中,产生了疑问,他可能会在专家说话过程中打断他,此时,主骨传导设备还在播放专家的指导,又接收到因用户说话生成的语音数据获取信号,则会启动备用骨传导设备基于备份骨传导方式来获取用户当前输入的音频数据,并进行去噪处理后,通过远程通信发送至专家所在设备。

本申请实施例提供的音频数据的获取方法,能够在接收音频数据获取信号时,通过骨传导方式获取第一音频数据,在未触发音频获取信号时,通过骨传导方式输出待播放音频数据。通过骨传导方式完成了音频数据的获取与播放两个功能,且提高智能穿戴设备获取和播放音频数据的准确性。

图4为本申请实施例提供的一种音频数据的获取方法的流程示意图,作为对上述实施例的进一步说明,包括:

步骤410、接收音频数据获取信号。

步骤420、根据音频数据获取信号,通过骨传导方式获取第一音频数据。

步骤430、提取第一音频数据对应的音频特征。

其中,音频特性可以包括音频数据对应的音色、音调、频率、响度等中的一个或多个,声源的不同,对应的音频数据的音频特征也不同,例如,第一音频数据中用户说话的音频特征与挠头声对应的音频特征完全不同。声源相同,对应的音频数据的音频特征也不一定相同,例如,用户说话和咳嗽发出的声音对应的音频特征也不同。

可选的,步骤420获取的第一音频数据中可能不止包含一个声源对应的音频数据,分别提取第一音频数据整段音频对应的各音频特征,例如,整段音频数据中既包括用户说话的音频,还包括用户挠头的音频,则分别提取用户说话的音频特征和用户挠头的音频特征。可选的,提取第一音频数据对应的音频特征,可以是通过训练的音频特征提取模型进行提取,还可以是通过预设的音频特征提取算法进行提取,本申请对此不进行限定。

步骤440、根据音频特征,判断音频数据中是否存在无效数据。

其中,无效数据指的是提取的第一音频数据中非用户语音输入的数据,例如,用户挠头产生的声音或用户咳嗽产生的声音等等。

可选的,根据音频特征,判断音频数据中是否存在无效数据,可以是预先采集并存储多种无效数据的音频特征,在判断时,将获取的第一音频数据的音频特征与预先存储的多种无效数据的音频特征进行比较,确定获取的第一音频数据中的无效数据,例如,若获取的第一音频数据中有段音频数据的音调和音色与挠头声音对应的音调和音色相同,则该段音频数据即为无效数据。也可以是将获取的第一音频数据的每种音频特征(如频率)绘制成连续曲线,分析曲线的走势,将走势发生突变的部分对应的音频数据视为无效数据。

步骤450、如果存在无效数据,则滤除第一音频数据中的无效数据,得到目标音频数据。

可选的,若获取的第一音频数据中存在无效数据,则在获取的第一音频数据中去除无效数据部分,将剩余的音频数据进行拼接后,即可完成对获取的第一音频数据进行去噪处理的过程,可得到目标音频数据。

本申请实施例提供的音频数据的获取方法,能够在接收音频数据获取信号后,通过骨传导方式获取第一音频数据,依据第一音频数据的音频特征,滤除第一音频数据中的无效数据得到目标音频数据。进而避免用户在嘈杂环境中说话时,无法准确获取用户输入的音频数据的问题,提高智能穿戴设备获取音频数据的准确性。

图5为本申请实施例提供的一种音频数据的获取方法的流程示意图,本申请实施例适用于用户语音对智能穿戴设备进行控制的情况,作为对上述实施例的进一步说明,包括:

步骤510、接收音频数据获取信号。

步骤520、根据音频数据获取信号,通过骨传导方式获取第一音频数据。

步骤530、对第一音频数据进行去噪处理,得到目标音频数据。

步骤540、对目标音频数据进行意图分析。

可选的,对目标音频数据进行意图分析的过程,即为对第一音频数据进行语义分析的过程。本申请实施例中可以通过预先建立的意图分析模型进行意图的分析。其中,意图分析模型可以是预先针对所有控制指令设置尽可能多的关键词,并建立控制指令与关键词之间的映射关系,输入神经网络模型进行学习得到的。在实际进行目标音频数据的意图分析时,可以是先对目标音频数据进行分词,然后将分词后的关键词输入训练好的意图分析模型中,模型对输入的关键词基于训练时的学习算法进行分析,输出关键词对应的意图。例如,目标音频数据为“今天天气怎么样?”,对该句话进行分词得到“今天”、“天气”、“怎么样”,并将这三个词输入意图分析模型,得到意图分析结果为用户想了解今天的天气。

步骤550、响应意图分析结果对应的控制指令。

可选的,根据语义分析结果确定目标音频数据对应的控制指令,然后响应该控制指令,例如,意图分析结果为用户想了解今天的天气,该意图对应的控制指令为“启动天气提示”,则系统响应该指令,启动天气提示功能,向用户输出当前天气。

可选的,目标音频数据对应的控制指令,可以是用户发出的对智能穿戴设备的控制指令,还可以是用户发出的对手机等终端设备的控制指令。对此不进行限定,若控制指令为终端设备对应的控制指令,智能穿戴设备可以将该控制指令通过其与终端设备之间的通信连接,发送给终端设备,以使终端设备执行该控制指令。

本申请实施例提供的音频数据的获取方法,能够在接收音频数据获取信号后,通过骨传导方式获取第一音频数据,进行去噪和意图分析,从而响应对智能穿戴设备的控制。提高智能穿戴设备获取音频数据的准确性,可以在嘈杂的环境中准确的通过语音对智能穿戴设备进行控制。

图6为本申请实施例提供的一种音频数据的获取装置的结构示意图。如图6所示,该装置包括:信号检测模块610,音频获取模块620,去噪处理模块630。

信号接收模块610,用于接收音频数据获取信号;

第一音频获取模块620,用于根据所述信号接收模块610接收到的所述音频数据获取信号,通过骨传导方式获取第一音频数据;;

去噪处理模块630,用于对所述第一音频获取模块620获取的所述第一音频数据进行去噪处理,得到目标音频数据。

进一步的,上述装置还包括:

环境音频获取模块,用于根据所述音频数据获取信号获取环境音频数据;

相应的,去噪处理模块630用于,根据所述环境音频数据和所述第一音频数据生成第二音频数据;

对所述第二音频数据进行去噪处理,得到目标音频数据。

进一步的,上述装置还包括:

音频输出模块,用于获取待播放音频数据,通过骨传导方式输出所述待播放音频数据。

进一步的,第一音频获取模块620还用于,如果通过所述骨传导方式输出所述待播放音频数据时,接收到音频数据获取信号,则启动备用骨传导方式获取第三音频数据。

进一步的,去噪处理模块630用于,提取所述第一音频数据对应的音频特征;

根据所述音频特征,判断所述音频数据中是否存在无效数据;

如果存在无效数据,则滤除所述第一音频数据中的无效数据。

进一步的,上述装置还包括:

意图分析模块,用于对所述目标音频数据进行意图分析;

指令响应模块,用于响应所述意图分析结果对应的控制指令。

进一步的,信号接收模块610还用于,在当前位置信息与预设位置信息匹配时,接收音频数据获取信号。

本申请实施例中提供的音频数据的获取装置,首先,信号接收模块610接收音频数据获取信号;然后,第一音频获取模块620根据所述音频数据获取信号,通过骨传导方式获取第一音频数据;最后,去噪处理模块630对所述第一音频数据进行去噪处理,得到目标音频数据。相对于通过空气传导方式获取第一音频数据,本申请实施例能够在接收音频数据获取信号后,通过骨传导方式获取第一音频数据,进行去噪处理后得到目标音频数据。进而避免用户在嘈杂环境中说话时,无法准确获取用户输入的音频数据的问题,提高智能穿戴设备获取音频数据的准确性。

上述装置可执行本申请前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请前述所有实施例所提供的方法。

本实施例在上述各实施例的基础上提供了一种智能穿戴设备,图7是本申请实施例提供的一种智能穿戴设备的结构示意图,图8是本申请实施例提供的一种智能穿戴设备的示意实物图。如图7和图8所示,该智能穿戴设备包括:存储器701、处理器(centralprocessingunit,cpu)702、显示部件703、触摸面板704、心率检测模组705、距离传感器706、摄像头707、骨传导扬声器708、麦克风709、呼吸灯710,这些部件通过一个或多个通信总线或信号线711来通信。

应该理解的是,图示智能穿戴设备仅仅是智能穿戴设备的一个范例,并且智能穿戴设备可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

下面就本实施例提供的用于音频数据获取的智能穿戴设备进行详细的描述,该智能穿戴设备以智能眼镜为例。

存储器701,所述存储器701可以被cpu702访问,所述存储器701可以包括高速随机存取存储器,还可以包括非易失性存储器,例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

显示部件703,可用于显示图像数据以及操作系统的操控界面,显示部件703嵌入在智能穿戴设备的镜框中,镜框内部设置有内部传输线路711,该内部传输线路711和显示部件703连接。

触摸面板704,该触摸面板704设置在至少一个智能穿戴设备镜腿的外侧,用于获取触摸数据,触摸面板704通过内部传输线路711和cpu702连接。其中,触摸面板704可检测用户的手指滑动、点击操作,并相应的把检测到的数据传输至处理器702进行处理以生成对应的控制指令,示例性的,可以是左移指令、右移指令、上移指令、下移指令等。示例性的,显示部件703可显示处理器702传输的虚拟图像数据,该虚拟图像数据可相应的根据触摸面板704检测到的用户操作进行相应变化,具体的,可以是进行画面切换,当检测到左移指令或右移指令后相应的切换上一个或下一个虚拟图像画面;当显示部件703显示视频播放信息时,该左移指令可以是进行播放内容的回播,右移指令可以是进行播放内容的快进;当显示部件703显示的为可编辑文字内容时,该左移指令、右移指令、上移指令、下移指令可以是对光标的位移操作,即光标的位置可根据用户对触摸板的触摸操作而进行移动;当显示部件703显示的内容为游戏动画画面时,该左移指令、右移指令、上移指令、下移指令可以是对游戏中的对象进行控制,如飞机游戏中,可通过该左移指令、右移指令、上移指令、下移指令分别控制飞机的飞行方向;当显示部件703可显示不同频道的视频画面时,该左移指令、右移指令、上移指令、下移指令可进行不同频道的切换,其中,上移指令和下移指令可以是切换到预置频道(如用户使用的常用频道);当显示部件703显示静态图片时,该左移指令、右移指令、上移指令、下移指令可进行不同图片之间的切换,其中,左移指令可以是切换到上一幅图片,右移指令可以是切换至下一幅图,上移指令可以是切换到上一图集,下移指令可以是切换至下一图集。该触摸面板704还可用于对显示部件703的显示开关进行控制,示例性的,当长按压触摸面板704触摸区域时,显示部件703通电显示图像界面,当再次长按压触摸面板704触摸区域时,显示部件703断电,当显示部件703通电后,可通过在触摸面板704进行上滑和下滑操作以调节显示部件703中显示图像的亮度或分辨率。

心率检测模组705,用于测得用户的心率数据,心率指每分钟的心跳次数,该心率检测模组705设置在镜腿内侧。具体的,该心率检测模组705可以是通过电脉冲测量的方式使用干性电极获取人体心电数据,根据心电数据中的振幅峰值确定心率大小;该心率检测模组705还可以是由采用光电法测量心率的光线发射和光线接收器组成,相应的,该心率检测模组705设置在镜腿底部,人体耳廓的耳垂处。心率检测模组705采集到心率数据后可相应的发送至处理器702中进行数据处理已得到佩戴者当前的心率值,在一个实施例中,处理器702在确定出用户的心率值后,可将该心率值实时显示在显示部件703中,可选的处理器702在确定出心率值较低(如小于50)或较高(如大于100)可相应的触发报警器,同时将该心率值和/或生成的报警信息通过通信模块发送至服务器。

距离传感器706,可设置在镜框上,该距离传感器706用于感应人脸到镜框的距离,该距离传感器706可采用红外感应原理实现。具体的,该距离传感器706将采集的距离数据发送至处理器702,处理器702根据该距离数据控制显示部件703的亮暗。示例性的,当确定出距离传感器706采集到的距离小于5厘米时,处理器702相应的控制显示部件703处于点亮状态,当确定出距离传感器为探测到有物体靠近时,相应的控制显示部件704处于关闭状态。

呼吸灯710,可设置在镜框的边缘,当显示部件703关闭显示画面时,该呼吸灯710可根据处理器702的控制而点亮呈渐变亮暗效果。

摄像头707,可以是设置在镜框的上边框的位置,采集用户前方的图像数据的前摄像模块,还可以采集用户眼球信息的后摄像模块,也可以是二者的结合。具体的,摄像头707采集前方图像时,将采集的图像发送至处理器702识别、处理,并根据识别结果触发相应的触发事件。示例性的,当用户在家中佩戴该穿戴设备时,通过对采集的前方图像进行识别,如果识别到家具物品,则相应的查询是否存在对应的控制事件,如果存在,则相应的将该控制事件对应的控制界面显示在显示部件703中,用户可通过触摸面板704进行对应的家具物品的控制,其中该家具物品和智能穿戴设备通过蓝牙或无线自组网进行网络连接;当用户在户外佩戴该穿戴设备时,可相应的开启目标识别模式,该目标识别模式可用于识别特定的人,摄像头707将采集的图像发送至处理器702进行人脸识别处理,如果识别到设定的预设人脸,则相应的可通过智能穿戴设备集成的扬声器进行声音播报,该目标识别模式还可以用于识别不同的植物,例如,处理器702根据触摸面板704的触摸操作以记录摄像头707采集的当前图像并通过通信模块发送至服务器以进行识别,服务器对采集图像中的植物进行识别并反馈相关的植物名称、介绍至智能穿戴设备,并将反馈数据显示在显示部件703中。摄像头707还可以是用于采集用户眼部如眼球的图像,通过对眼球的转动的识别生成不同的控制指令,示例性的,如眼球向上转动生成上移控制指令,眼球向下转动生成下移控制指令,眼球向左转动生成左移控制指令,眼球向右转动生成右移控制指令,其中,显示部件703可显示处理器702传输的虚拟图像数据,该虚拟图像数据可相应的根据摄像头707检测到的用户眼球的移动变化生成的控制指令而改变,具体的,可以是进行画面切换,当检测到左移控制指令或右移控制指令后相应的切换上一个或下一个虚拟图像画面;当显示部件703显示视频播放信息时,该左移控制指令可以是进行播放内容的回播,右移控制指令可以是进行播放内容的快进;当显示部件703显示的为可编辑文字内容时,该左移控制指令、右移控制指令、上移控制指令、下移控制指令可以是对光标的位移操作,即光标的位置可根据用户对触摸板的触摸操作而进行移动;当显示部件703显示的内容为游戏动画画面时,该左移控制指令、右移控制指令、上移控制指令、下移控制指令可以是对游戏中的对象进行控制,如飞机游戏中,可通过该左移控制指令、右移控制指令、上移控制指令、下移控制指令分别控制飞机的飞行方向;当显示部件703可显示不同频道的视频画面时,该左移控制指令、右移控制指令、上移控制指令、下移控制指令可进行不同频道的切换,其中,上移控制指令和下移控制指令可以是切换到预置频道(如用户使用的常用频道);当显示部件703显示静态图片时,该左移控制指令、右移控制指令、上移控制指令、下移控制指令可进行不同图片之间的切换,其中,左移控制指令可以是切换到上一幅图片,右移控制指令可以是切换至下一幅图,上移控制指令可以是切换到上一图集,下移控制指令可以是切换至下一图集。

骨传导扬声器708,骨传导扬声器708设置在至少一个镜腿的内壁侧,用于将接收到的处理器702发送的音频信号转换为振动信号,或用于将接收到的震动信号转换为音频信号发送至处理器702。其中,骨传导扬声器708可将声音通过颅骨传递至人体内耳,通过将音频的电信号转变为振动信号传递到颅骨耳蜗内,再被听觉神经所感知。也可以将由骨骼传递的声音传送至处理器702,通过将震动信号转变为音频的电信号后,将电信号传递到处理器702。通过骨传导扬声器708作为发声装置或声音接收装置,减少了硬件结构厚度,重量更轻,同时无电磁辐射也不会受到电磁辐射的影响,并且具备抗噪声、防水以及解放双耳的有点。

麦克风709,可设置在镜框的下边框上,用于采集外部(用户、环境)声音并传输至处理器702进行处理。示例性的,麦克风709对用户发出的声音进行采集并通过处理器702进行声纹识别,如果识别为认证用户的声纹,则相应的可接收后续的语音控制,具体的,用户可发出语音,麦克风709将采集到的语音发送至处理器702进行识别以根据识别结果生成对应的控制指令,如“开机”、“关机”、“提升显示亮度”、“降低显示亮度”,处理器702后续根据该生成的控制指令执行对应的控制处理。

在本实施例中,处理器702用于:

接收音频数据获取信号;

根据所述音频数据获取信号,通过骨传导方式获取第一音频数据;

对所述第一音频数据进行去噪处理,得到目标音频数据。

进一步的,所述接收音频数据获取信号之后,还包括:

根据所述音频数据获取信号获取环境音频数据;

相应的,所述对所述音频数据进行去噪处理,得到目标音频数据,包括:

根据所述环境音频数据和所述第一音频数据生成第二音频数据;

对所述第二音频数据进行去噪处理,得到目标音频数据。

进一步的,所述接收音频数据获取信号之前,还包括:

获取待播放音频数据,通过骨传导方式输出所述待播放音频数据。

进一步的,如果通过所述骨传导方式输出所述待播放音频数据时,接收到音频数据获取信号,则启动备用骨传导方式获取第三音频数据。

进一步的,所述对所述第一音频数据进行去噪处理,包括:

提取所述第一音频数据对应的音频特征;

根据所述音频特征,判断所述音频数据中是否存在无效数据;

如果存在无效数据,则滤除所述第一音频数据中的无效数据。

进一步的,所述得到目标音频数据之后,还包括:

对所述目标音频数据进行意图分析;

响应所述意图分析结果对应的控制指令。

进一步的,所述接收音频数据获取信号,包括:

在当前位置信息与预设位置信息匹配时,接收音频数据获取信号。

上述实施例中提供的智能穿戴设备的音频数据的获取装置及智能穿戴设备可执行本发明任意实施例所提供的音频数据的获取方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的音频数据的获取方法。

图9是本申请实施例提供的另一种终端设备的结构示意图。如图9所示,该终端可以包括:壳体(图中未示出)、存储器901、中央处理器(centralprocessingunit,cpu)902(又称处理器,以下简称cpu)、存储在存储器901上并可在处理器902上运行的计算机程序、电路板(图中未示出)和电源电路(图中未示出)。所述电路板安置在所述壳体围成的空间内部;所述cpu902和所述存储器901设置在所述电路板上;所述电源电路,用于为所述终端的各个电路或器件供电;所述存储器901,用于存储可执行程序代码;所述cpu902通过读取所述存储器901中存储的可执行程序代码来运行与所述可执行程序代码对应的程序。

所述终端还包括:外设接口903、rf(radiofrequency,射频)电路905、音频电路906、扬声器911、电源管理芯片908、输入/输出(i/o)子系统909、触摸屏912、其他输入/控制设备910以及外部端口904,这些部件通过一个或多个通信总线或信号线907来通信。

应该理解的是,图示终端设备900仅仅是终端的一个范例,并且终端设备900可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

下面就本实施例提供的用于一种终端设备进行详细的描述,该终端设备以智能手机为例。

存储器901,所述存储器901可以被cpu902、外设接口903等访问,所述存储器901可以包括高速随机存取存储器,还可以包括非易失性存储器,例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

外设接口903,所述外设接口903可以将设备的输入和输出外设连接到cpu902和存储器901。

i/o子系统909,所述i/o子系统909可以将设备上的输入输出外设,例如触摸屏912和其他输入/控制设备910,连接到外设接口903。i/o子系统909可以包括显示控制器9091和用于控制其他输入/控制设备910的一个或多个输入控制器9092。其中,一个或多个输入控制器9092从其他输入/控制设备910接收电信号或者向其他输入/控制设备910发送电信号,其他输入/控制设备910可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是,输入控制器9092可以与以下任一个连接:键盘、红外端口、usb接口以及诸如鼠标的指示设备。

其中,按照触摸屏的工作原理和传输信息的介质分类,触摸屏912可以为电阻式、电容感应式、红外线式或表面声波式。按照安装方式分类,触摸屏912可以为:外挂式、内置式或整体式。按照技术原理分类,触摸屏912可以为:矢量压力传感技术触摸屏、电阻技术触摸屏、电容技术触摸屏、红外线技术触摸屏或表面声波技术触摸屏。

触摸屏912,所述触摸屏912是用户终端与用户之间的输入接口和输出接口,将可视输出显示给用户,可视输出可以包括图形、文本、图标、视频等。可选的,触摸屏912将用户在触屏幕上触发的电信号(如接触面的电信号),发送给处理器902。

i/o子系统909中的显示控制器9091从触摸屏912接收电信号或者向触摸屏912发送电信号。触摸屏912检测触摸屏上的接触,显示控制器9091将检测到的接触转换为与显示在触摸屏912上的用户界面对象的交互,即实现人机交互,显示在触摸屏912上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。值得说明的是,设备还可以包括光鼠,光鼠是不显示可视输出的触摸敏感表面,或者是由触摸屏形成的触摸敏感表面的延伸。

rf电路905,主要用于建立智能音箱与无线网络(即网络侧)的通信,实现智能音箱与无线网络的数据接收和发送。例如收发短信息、电子邮件等。

音频电路906,主要用于从外设接口903接收音频数据,将该音频数据转换为电信号,并且将该电信号发送给扬声器911。

扬声器911,用于将智能音箱通过rf电路905从无线网络接收的语音信号,还原为声音并向用户播放该声音。

电源管理芯片908,用于为cpu902、i/o子系统及外设接口所连接的硬件进行供电及电源管理。

在本实施例中,中央处理器902用于:

接收音频数据获取信号;

根据所述音频数据获取信号,通过骨传导方式获取第一音频数据;

对所述第一音频数据进行去噪处理,得到目标音频数据。

进一步的,所述接收音频数据获取信号之后,还包括:

根据所述音频数据获取信号获取环境音频数据;

相应的,所述对所述音频数据进行去噪处理,得到目标音频数据,包括:

根据所述环境音频数据和所述第一音频数据生成第二音频数据;

对所述第二音频数据进行去噪处理,得到目标音频数据。

进一步的,所述接收音频数据获取信号之前,还包括:

获取待播放音频数据,通过骨传导方式输出所述待播放音频数据。

进一步的,如果通过所述骨传导方式输出所述待播放音频数据时,接收到音频数据获取信号,则启动备用骨传导方式获取第三音频数据。

进一步的,所述对所述第一音频数据进行去噪处理,包括:

提取所述第一音频数据对应的音频特征;

根据所述音频特征,判断所述音频数据中是否存在无效数据;

如果存在无效数据,则滤除所述第一音频数据中的无效数据。

进一步的,所述得到目标音频数据之后,还包括:

对所述目标音频数据进行意图分析;

响应所述意图分析结果对应的控制指令。

进一步的,所述接收音频数据获取信号,包括:

在当前位置信息与预设位置信息匹配时,接收音频数据获取信号。

本申请实施例还提供一种包含终端设备可执行指令的存储介质,所述终端设备可执行指令在由终端设备处理器执行时用于执行一种音频数据的获取方法,该方法包括:

接收音频数据获取信号;

根据所述音频数据获取信号,通过骨传导方式获取第一音频数据;

对所述第一音频数据进行去噪处理,得到目标音频数据。

进一步的,所述接收音频数据获取信号之后,还包括:

根据所述音频数据获取信号获取环境音频数据;

相应的,所述对所述音频数据进行去噪处理,得到目标音频数据,包括:

根据所述环境音频数据和所述第一音频数据生成第二音频数据;

对所述第二音频数据进行去噪处理,得到目标音频数据。

进一步的,所述接收音频数据获取信号之前,还包括:

获取待播放音频数据,通过骨传导方式输出所述待播放音频数据。

进一步的,如果通过所述骨传导方式输出所述待播放音频数据时,接收到音频数据获取信号,则启动备用骨传导方式获取第三音频数据。

进一步的,所述对所述第一音频数据进行去噪处理,包括:

提取所述第一音频数据对应的音频特征;

根据所述音频特征,判断所述音频数据中是否存在无效数据;

如果存在无效数据,则滤除所述第一音频数据中的无效数据。

进一步的,所述得到目标音频数据之后,还包括:

对所述目标音频数据进行意图分析;

响应所述意图分析结果对应的控制指令。

进一步的,所述接收音频数据获取信号,包括:

在当前位置信息与预设位置信息匹配时,接收音频数据获取信号。

本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的应用推荐操作,还可以执行本申请任意实施例所提供的应用推荐方法中的相关操作。

注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1