音频信息处理的方法及装置与流程

文档序号:11251014
音频信息处理的方法及装置与流程

本公开涉及音频转换的技术领域,尤其涉及一种音频信息处理的方法及装置。



背景技术:

在采访和演讲会等活动中,需要将即时的将音频信息转换为文本信息。在将音频信息转换为文本信息的过程中,需要使用具体的文件来存储所述文本信息,针对不同的应用目的,可以使用不同类型的文本格式的文件来存储文本信息。使用.txt文本格式类型的优点在于同样的存储文本信息所占用的存储空间较小;使用.doc文本格式类型的优点在于便于后期的修改和撰写;使用.pdf文本格式的优点在于便于印刷和在不同终端展示效果的一致性。在将音频信息转换为文本信息的过程中,在某些情况下,从始到终的使用一种类型的文本格式是无法满足用户的使用需求的。在现有技术中,若在此过程中更改文本格式的类型,是需要用户进入相应的应用软件中进行相关的设置的。在很多情况下,将音频信息转换为文本信息的过程是发生在现场的采访和演讲会中的,这就需要用户在进行边进行采访或者边听演讲,边进行相应的繁琐复杂的设置操作,这给用户带来不良的用户体验。如何以简单便捷的方式来解决上述问题,就成为了业界亟待解决的问题。



技术实现要素:

本公开公开实施例提供音频信息处理的方法及装置。所述技术方案如下:

根据本公开实施例的第一方面,提供一种音频信息处理的方法,包括:

接收输入的音频信息;

将所述音频信息转化为相应的文本信息;

实时监测终端接收到的手势信息;

判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

当匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案在处理音频信息的文档格式转换方面提供了更加便捷的方法,提升了文档格式变换的操作的便捷性和效率值,从而提升了用户的使用体验。

在一个实施例中,所述接收输入的音频信息之前,所述方法还包括:

设置默认的文件格式;

所述将所述音频信息转化为相应的文本信息之后,所述方法还包括:

当未监测到所述手势信息时或者当所述接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将所述文本信息按照所述默认的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:设置默认的文件格式可以在用户未能及时的设置文件格式的情况下,妥善的保存音频信息转化的文本信息。

在一个实施例中,所述实时监测终端接收到的手势信息,包括:

所述手势信息包括终端的运动状态信息和/或终端的触控状态信息;

实时监测所述终端的运动状态信息包括:实时通过所述终端中内置的重力传感器、陀螺仪中的任一者多者监测所述终端的运动状态信息;或者实时获取外部摄像头摄取到的所述终端的图像,对所述图像中的终端进行位置分析,根据分析结果确定所述终端的运动状态信息;或者实时监测外部回声定位装置得到的所述终端的回声定位信息,对所述终端的回声定位信息进行分析,根据分析结果确定所述终端的运动状态信息;

实时监测所述终端的触控状态信息包括:实时监测所述终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。

本公开的实施例提供的技术方案可以包括以下有益效果:可以通过多种方式来获得终端的手势信息,可增强获取终端的手势信息的鲁棒性,增强本技术方案在各种应用情景下的适用度。

在一个实施例中,所述实时监测终端接收到的手势信息,包括:

实时获取终端接收到的手势信息;

判断所述接收到的手势信息是否满足预设启动条件;

当所述接收到的手势信息未满足预设启动条件时,舍弃所述接收到的手势信息;

当所述接收到的手势信息满足预设启动条件时,继续执行判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果:克服了因为人手握持时抖动所产生的运动状态信息的干扰和无意中的触控所产生的触控状态信息,降低了非用户操作意图而产生的手势信息的干扰,提高了本方案的实用性和用户的操作体验。

在一个实施例中,所述判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配,包括:

筛选出所述终端的手势信息与预设的存储文件格式对应的存储操作信息库中匹配度最高的存储操作信息;

当所述匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定所述手势信息与所述存储操作信息相匹配;

当所述手势信息与所述存储操作信息相匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:排除匹配度过低的手势信息的干扰,可以提升终端的手势信息的准确度。

根据本公开实施例的第二方面,提供一种音频信息处理的装置,包括:

接收模块,用于接收输入的音频信息;

转化模块,用于将所述音频信息转化为相应的文本信息;

监测模块,用于实时监测终端接收到的手势信息;

判断模块,用于判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

第一存储模块,用于当匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案在处理音频信息的文档格式转换方面提供了更加便捷的方法,提升了文档格式变换的操作的便捷性和效率值,从而提升了用户的使用体验。

在一个实施例中,还包括:

所述接收输入的音频信息之前,还包括:

设置模块,用于设置默认的文件格式;

所述将所述音频信息转化为相应的文本信息之后,还包括:

第二存储模块,用于当未监测到所述手势信息时或者当所述接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将所述文本信息按照所述默认的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:设置默认的文件格式可以在用户未能及时的设置文件格式的情况下,妥善的保存音频信息转化的文本信息。

在一个实施例中,所述监测模块,包括:

所述手势信息包括终端的运动状态信息和/或终端的触控状态信息;

第一监测子模块,用于实时监测所述终端的运动状态信息包括:实时通过所述终端中内置的重力传感器、陀螺仪中的任一者多者监测所述终端的运动状态信息;或者实时获取外部摄像头摄取到的所述终端的图像,对所述图像中的终端进行位置分析,根据分析结果确定所述终端的运动状态信息;或者实时监测外部回声定位装置得到的所述终端的回声定位信息,对所述终端的回声定位信息进行分析,根据分析结果确定所述终端的运动状态信息;

第二监测子模块,用于实时监测所述终端的触控状态信息包括:实时监测所述终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。

本公开的实施例提供的技术方案可以包括以下有益效果:可以通过多种方式来获得终端的手势信息,可增强获取终端的手势信息的鲁棒性,增强本技术方案在各种应用情景下的适用度。

在一个实施例中,所述监测模块,包括:

获取子模块,用于实时获取终端接收到的手势信息;

第一判断子模块,用于判断所述接收到的手势信息是否满足预设启动条件;

舍弃子模块,用于当所述接收到的手势信息未满足预设启动条件时,舍弃所述接收到的手势信息;

第二判断子模块,用于当所述接收到的手势信息满足预设启动条件时,继续执行判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果:克服了因为人手握持时抖动所产生的运动状态信息的干扰和无意中的触控所产生的触控状态信息,降低了非用户操作意图而产生的手势信息的干扰,提高了本方案的实用性和用户的操作体验。

在一个实施例中,所述判断模块,包括:

筛选子模块,用于筛选出所述终端的手势信息与预设的存储文件格式对应的存储操作信息库中匹配度最高的存储操作信息;

确定子模块,用于当所述匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定所述手势信息与所述存储操作信息相匹配;

存储子模块,用于当所述手势信息与所述存储操作信息相匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:排除匹配度过低的手势信息的干扰,可以提升终端的手势信息的准确度。

根据本公开实施例的第三方面,提供一种音频信息处理的装置,所述装置包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

接收输入的音频信息;

将所述音频信息转化为相应的文本信息;

实时监测终端接收到的手势信息;

判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

当匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案在处理音频信息的文档格式转换方面提供了更加便捷的方法,提升了文档格式变换的操作的便捷性和效率值,从而提升了用户的使用体验。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种音频信息处理的方法的流程图;

图2是根据另一示例性实施例示出的一种音频信息处理的方法的流程图;

图3是根据一示例性实施例示出的一种音频信息处理的方法的步骤S13流程图;

图4是根据另一示例性实施例示出的一种音频信息处理的方法的步骤S13的流程图;

图5是根据一示例性实施例示出的一种音频信息处理的方法的步骤S14的流程图;

图6是根据一示例性实施例示出的一种音频信息处理的装置的框图;

图7是根据另一示例性实施例示出的一种音频信息处理的装置的框图;

图8是根据一示例性实施例示出的一种音频信息处理的装置的监测模块63的框图;

图9是根据另一示例性实施例示出的一种音频信息处理的装置的监测模块63的框图;

图10是根据一示例性实施例示出的一种音频信息处理的装置的判断模块64的框图;

图11是根据另一示例性实施例示出的一种音频信息处理的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种音频信息处理方法的流程图,如图1所示,该音频信息处理的方法,包括以下步骤S11-S15:

在步骤S11中,接收输入的音频信息;

在步骤S12中,将所述音频信息转化为相应的文本信息;

在步骤S13中,实时监测终端接收到的手势信息;

在步骤S14中,判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

在步骤S15中,当匹配时,将所述文本信息按照所述预设的文件格式存储。

在一个实施例中,接收输入的音频信息之前,先设置默认的文件格式;接收输入的音频信息;将该音频信息转化为相应的文本信息;该将该音频信息转化为相应的文本信息之后,当未监测到该手势信息时、或者当该接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将该文本信息按照该默认的文件格式存储。

实时监测终端接收到的手势信息;该手势信息包括终端的运动状态信息和/或终端的触控状态信息;实时监测该终端的运动状态信息包括:实时通过该终端中内置的重力传感器、陀螺仪中的任一者多者监测该终端的运动状态信息;或者实时获取外部摄像头摄取到的该终端的图像,对该图像中的终端进行位置分析,根据分析结果确定该终端的运动状态信息;或者实时监测外部回声定位装置得到的该终端的回声定位信息,对该终端的回声定位信息进行分析,根据分析结果确定该终端的运动状态信息。实时监测该终端的触控状态信息包括:实时监测该终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。当该接收到的手势信息与预设的文件格式对应的存储操作信息匹配时,将该文本信息按照该预设的文件格式存储。

实时获取终端接收到的手势信息;判断该手势信息是否满足预设启动条件;当该手势信息未满足预设启动条件时,舍弃该手势信息。筛选出该终端的手势信息与预设的存储文件格式对应的存储操作信息库中匹配度最高的存储操作信息;当该匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定该手势信息与该存储操作信息相匹配;当该手势信息与该存储操作信息相匹配时,将该文本信息按照该预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:在处理音频信息的文档格式转换方面提供了更加便捷的方法,提升了文档格式变换的操作的便捷性和效率值,从而提升了用户的使用体验。

在一个实施例中,如图2所示,在执行步骤S11之前,可执行如下步骤S21:

在步骤S21中,设置默认的文件格式;

在执行步骤S12之后,还可执行如下步骤S22:

在步骤S22中,当未监测到所述手势信息时或者当所述接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将所述文本信息按照所述默认的文件格式存储。

举例而言,在接收输入的音频信息之前,提前设置默认的文件格式,通过该默认的文件格式来存储文本信息。在音频信息转化为相应的文本信息之后,当未监测到手势信息时、或者当接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将该文本信息按照所述默认的文件格式存储。

例如,在开始接收输入的音频信息之前,提前设置默认的文件格式为pd f。在开始音频信息转化为相应的文本信息之后,在未检测到手势信息、或接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将该文本信息按照pdf的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:设置默认的文件格式可以在用户未能及时的设置文件格式的情况下,妥善的保存音频信息转化的文本信息。

在一个实施例中,如图3所示,步骤13包括步骤S31或S32:

在步骤S31中,实时监测所述终端的运动状态信息包括:实时通过所述终端中内置的重力传感器、陀螺仪中的任一者多者监测所述终端的运动状态信息;或者实时获取外部摄像头摄取到的所述终端的图像,对所述图像中的终端进行位置分析,根据分析结果确定所述终端的运动状态信息;或者实时监测外部回声定位装置得到的所述终端的回声定位信息,对所述终端的回声定位信息进行分析,根据分析结果确定所述终端的运动状态信息。

在步骤S32中,实时监测所述终端的触控状态信息包括:实时监测所述终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。

在一个实施例中,该手势信息包括终端的运动状态信息和/或终端的触控状态信息。

实时监测终端接收到的手势信息的方式分为三种:实时监测终端的运动状态信息、实时监测终端的触控状态信息、实时监测终端的运动状态信息和触控状态信息。

第一种实时监测终端接收到的手势信息的方式:实时监测该终端的运动状态信息可以根据终端内置的感应装置比如重力传感器和/或陀螺仪来进行监测。陀螺仪可以根据测量终端相对惯性空间的转动运动信息,可以测量终端的偏转、倾斜时的转动角速度。重力传感器可以监测轴向的线性动作信息,能够感知到加速力的变化;获取终端的运动状态信息还可以根据外设的摄像头来拍摄终端的运动状态信息,根据图像分析处理方法,首先通过终端的形状特征、颜色特征、角点特征和纹理特征中的一种或多种,来分析出拍摄的整幅画面中终端的图像信息,根据拍摄到的多帧图像中的终端的图像信息,连续分析在多帧画面中终端的位置变换信息,从而得到终端的运动状态信息;获取终端的运动状态信息还可以根据外设的回声定位设备,利用定位设备发射出超声波,通过折回的声音来定向,即通过空间定向的方法来获得终端的位置信息,然后通过在一个连续时间内的回声定位信息来获得终端的运动状态信息。

第二种实时监测终端接收到的手势信息的方式:实时监测终端的触控状态信息可通过实时监控终端的预设按键和触摸屏幕中的任一者或多者的触控状态信息。触控状态信息包括:双击、长按和预设的滑动轨迹。例如,通过监检预设按键是否发生了双击事件或者是长按事件;通过该监测触摸屏幕上是否发生了“L”型的触控滑动轨迹;在监测到预设按键发了长按事件的同时,检测触摸屏幕上是否发生了“Z”型的触控滑动轨迹。

第三种实时监测终端接收到的手势信息的方式:通过对上述的第一种实时监测终端接收到的手势信息的方式和第二种实时监测终端接收到的手势信息的方式的有机结合,即可得到第三种实时监测终端接收到的手势信息的方式。

本公开的实施例提供的技术方案可以包括以下有益效果:可以通过多种方式来获得终端的手势信息,增强了获取终端的手势信息的鲁棒性,提升了本技术方案在各种应用情景下的适用度。

在一个实施例中,如图4所示,步骤13包括如下步骤S41-S44:

在步骤S41中,实时获取终端接收到的手势信息;

在步骤S42中,判断所述接收到的手势信息是否满足预设启动条件,当未满足时,执行步骤S43,当满足时执行步骤S44;

在步骤S43中,当所述接收到的手势信息未满足预设启动条件时,舍弃所述接收到的手势信息;

在步骤S44中,当所述接收到的手势信息满足预设启动条件时,继续执行判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配的步骤。

举例而言,在一个实施例中,监测终端获得的运动状态信息和终端的触控状态信息中包含了很多由于用户握持终端时不自觉的微抖动所产生的运动状态信息和用户无意中的触控所产生的触控状态信息,且用户无法避免在握持终端时不发生轻微的抖动和发生无意中的触控,这些微抖动和无意中的触控所产生的手势信息并非是由用户的操作意图所产生的。

目前在业界,广泛应用在拍摄设备上的防抖动功能就是针对人们在握持设备下的微抖动而设计的,通过各种方法来补偿人在握持设备时抖动而产生的误差,来达到克服微抖动所带来的影响。在本方案中不需要专门设计一套防抖动功能来克服人们在握持设备时发生的微抖动,只需要合理设计预设启动条件来排除因为微抖动而产生的运动状态信息即可,例如:设置预设启动条件为达到预设运动状态信息阈值。当监测得到终端的运动状态信息未满足预设启动条件,舍弃该运动状态信息。对于无意中发生的触控也可以通过设置预设启动条件,例如长按时长的合理区间、双击的间隔时长和预设的滑动距离。当监测得到终端的触控状态信息未满足预设启动条件,舍弃该触控状态信息。

本公开的实施例提供的技术方案可以包括以下有益效果:克服了因为人手握持时抖动所产生的运动状态信息的干扰和无意中的触控所产生的触控状态信息,降低了非用户操作意图而产生的手势信息的干扰,提高了本方案的实用性和用户的操作体验。

在一个实施例中,如图5所示,步骤14还包括如下步骤S51-S53:

在步骤S51中,筛选出所述终端的手势信息与预设的存储文件格式对应的存储操作信息库中匹配度最高的存储操作信息;

在步骤S52中,当所述匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定所述手势信息与所述存储操作信息相匹配;

在步骤S53中,当所述手势信息与所述存储操作信息相匹配时,将所述文本信息按照所述预设的文件格式存储。

在预设的存储文件格式对应的存储操作信息库中,根据该终端的手势信息,进行匹配,筛选出匹配度最高的存储操作信息,该存储操作信息用来更改存储文档的文件格式。

根据系统预设的匹配度阈值来排除匹配度过低的存储操作信息。当该匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,才确定该手势信息与所述存储操作信息相匹配。当该匹配度最高的存储操作信息的匹配度的数值小于等于预设的匹配度阈值时,确定该手势信息与所述存储操作信息不匹配。

当该手势信息与该存储操作信息相匹配时,将该文本信息按照该预设的文件格式存储。

在本技术方案中,可选的,当手势信息与存储操信息作相匹配后,将文本信息按照预设的文档格式存储。其中,该文本信息可包括所有的文本信息,还可包括在该手势信息与该存储操作信息相匹配之后产生的文本信息。

主要文档格式包括:.txt(纯文字文档)、.rtf(丰富文本格式)、.doc(微软Word文档)、.xls(微软Excel表格)、.ppt(微软PowerPoint演示文稿)、.htm/html(网页)、.wpd(Corel WordPerfect文档)以及.pdf(可移植文档格式)等。

本公开的实施例提供的技术方案可以包括以下有益效果:排除匹配度过低的手势信息的干扰,可提升终端的手势信息的准确度。

在一个实施例中,图6是根据一示例性实施例示出的一种音频信息处理的框图。如图6所示,该装置包括接收模块61、转化模块62、监测模块63、第一存储模块64和第一存储模块65。

该接收模块61被配置为接收输入的音频信息;

该转化模块62被配置为将所述音频信息转化为相应的文本信息;

该监测模块63被配置为实时监测终端接收到的手势信息;

该判断模块64被配置为判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

该第一存储模块65被配置为当匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案在音频信息处理的文档格式转换方面提供了更加便捷的方法,提升了文档格式变换的操作的便捷性和效率值,从而提升了用户的使用体验。

在一个实施例中,如图7所示,还包括设置模块71和计算子模块72:

该设置模块71被配置为在所述接收输入的音频信息之前,设置默认的文件格式;

该第二存储模块72被配置为在将所述音频信息转化为相应的文本信息之后,当未监测到所述手势信息时或者当所述接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将所述文本信息按照所述默认的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:设置默认的文件格式可以在用户未能及时的设置文件格式的情况下,妥善的保存音频信息转化的文本信息。

在一个实施例中,如图8所示,该监测模块63包括第二获取模块81和第二判断模块82:

该第一监测子模块81被配置为实时监测所述终端的运动状态信息包括:实时通过所述终端中内置的重力传感器、陀螺仪中的任一者多者监测所述终端的运动状态信息;或者实时获取外部摄像头摄取到的所述终端的图像,对所述图像中的终端进行位置分析,根据分析结果确定所述终端的运动状态信息;或者实时监测外部回声定位装置得到的所述终端的回声定位信息,对所述终端的回声定位信息进行分析,根据分析结果确定所述终端的运动状态信息。

该第二监测子模块82被配置为实时监测所述终端的触控状态信息包括:实时监测所述终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。

本公开的实施例提供的技术方案可以包括以下有益效果:通过多种方式来获得终端的手势信息,增强了获取终端的手势信息的鲁棒性,提升了本技术方案在各种应用情景下的适用度。

在一个实施例中,如图9所示,该第一存储模块64包括获取子模块91、第一判断子模块92、舍弃子模块93和第二判断子模块94:

该获取子模块91被配置为实时获取终端接收到的手势信息;

该第一判断子模块92被配置为判断所述接收到的手势信息是否满足预设启动条件;

该舍弃子模块93被配置为当所述接收到的手势信息未满足预设启动条件时,舍弃所述接收到的手势信息;

该第二判断子模块94被配置为当所述接收到的手势信息满足预设启动条件时,继续执行判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果:克服了因为人手握持时抖动所产生的运动状态信息的干扰和无意中的触控所产生的触控状态信息,降低了非用户操作意图而产生的手势信息的干扰,提高了本方案的实用性和用户的操作体验。

在一个实施例中,如图10所示,该第一存储模块64还包括筛选子模块101、确定子模块102和存储子模块103:

该筛选子模块101被配置为筛选出所述终端的手势信息与预设的存储文件格式对应的存储操作信息库中匹配度最高的存储操作信息;

该确定子模块102被配置为当所述匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定所述手势信息与所述存储操作信息相匹配;

该存储子模块103被配置为当所述手势信息与所述存储操作信息相匹配时,将所述文本信息按照所述预设的文件格式存储。

本公开的实施例提供的技术方案可以包括以下有益效果:排除匹配度过低的手势信息的干扰,可以提升终端的手势信息的准确度。

根据本公开实施例的第三方面,提供一种音频信息处理的装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,处理器被配置为:

接收输入的音频信息;

将所述音频信息转化为相应的文本信息;

实时监测终端接收到的手势信息;

判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

当匹配时,将所述文本信息按照所述预设的文件格式存储。

上述处理器还可被配置为:

所述接收输入的音频信息之前,所述方法还包括:

设置默认的文件格式;

所述将所述音频信息转化为相应的文本信息之后,所述方法还包括:

当未监测到所述手势信息时或者当所述接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将所述文本信息按照所述默认的文件格式存储。

所述实时监测终端接收到的手势信息,包括:

所述手势信息包括终端的运动状态信息和/或终端的触控状态信息;

实时监测所述终端的运动状态信息包括:实时通过所述终端中内置的重力传感器、陀螺仪中的任一者多者监测所述终端的运动状态信息;或者实时获取外部摄像头摄取到的所述终端的图像,对所述图像中的终端进行位置分析,根据分析结果确定所述终端的运动状态信息;或者实时监测外部回声定位装置得到的所述终端的回声定位信息,对所述终端的回声定位信息进行分析,根据分析结果确定所述终端的运动状态信息;

实时监测所述终端的触控状态信息包括:实时监测所述终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。

所述实时监测终端接收到的手势信息,包括:

实时获取终端接收到的手势信息;

判断所述接收到的手势信息是否满足预设启动条件;

当所述接收到的手势信息未满足预设启动条件时,舍弃所述接收到的手势信息;

当所述接收到的手势信息满足预设启动条件时,继续执行判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配的步骤

所述当所述接收到的手势信息与预设的文件格式对应的存储操作信息匹配时,将所述文本信息按照所述预设的文件格式存储,包括:

筛选出所述终端的手势信息与预设的存储文件格式对应的存储操作信息库中匹配度最高的存储操作信息;

当所述匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定所述手势信息与所述存储操作信息相匹配;

当所述手势信息与所述存储操作信息相匹配时,将所述文本信息按照所述预设的文件格式存储。

图11是根据一示例性实施例示出的一种用于音频信息处理的装置1200的框图,该装置适用于终端设备。例如,装置1200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图11,装置1200可以包括以下一个或多个组件:处理组件1202,存储器1204,电源组件1206,多媒体组件1208,音频组件1210,输入/输出(I/O)的接口1212,传感器组件1214,以及通信组件1216。

处理组件1202通常控制装置1200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1202可以包括一个或多个处理器1220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1202可以包括一个或多个模块,便于处理组件1202和其他组件之间的交互。例如,处理部件1202可以包括多媒体模块,以方便多媒体组件1208和处理组件1202之间的交互。

存储器1204被配置为存储各种类型的数据以支持在设备1200的操作。这些数据的示例包括用于在装置1200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件1206为装置1200的各种组件提供电力。电源组件1206可以包括电源管理系统,一个或多个电源,及其他与为装置1200生成、管理和分配电力相关联的组件。

多媒体组件1208包括在所述装置1200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还监测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1208包括一个前置摄像头和/或后置摄像头。当设备1200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1210被配置为输出和/或输入音频信号。例如,音频组件1210包括一个麦克风(MIC),当装置1200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1204或经由通信组件1216发送。在一些实施例中,音频组件1210还包括一个扬声器,用于输出音频信号。

I/O接口1212为处理组件1202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1214包括一个或多个传感器,用于为装置1200提供各个方面的状态评估。例如,传感器组件1214可以监测到设备1200的打开/关闭状态,组件的相对定位,例如所述组件为装置1200的显示器和小键盘,传感器组件1214还可以监测装置1200或装置1200一个组件的位置改变,用户与装置1200接触的存在或不存在,装置1200方位或加速/减速和装置1200的温度变化。传感器组件1214可以包括接近传感器,被配置用来在没有任何的物理接触时监测附近物体的存在。传感器组件1214还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件1216被配置为便于装置1200和其他设备之间有线或无线方式的通信。装置1200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1216还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置1200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1204,上述指令可由装置1200的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置1200的处理器执行时,使得装置1200能够执行图1所示的方法,所述方法包括:

接收输入的音频信息;

将所述音频信息转化为相应的文本信息;

实时监测终端接收到的手势信息;

判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配;

当匹配时,将所述文本信息按照所述预设的文件格式存储。

所述存储介质中的指令还可以包括:

所述接收输入的音频信息之前,所述方法还包括:

设置默认的文件格式;

所述将所述音频信息转化为相应的文本信息之后,所述方法还包括:

当未监测到所述手势信息时或者当所述接收到的手势信息与预设的文件格式对应的存储操作信息不匹配时,将所述文本信息按照所述默认的文件格式存储。

所述实时监测终端接收到的手势信息,包括:

所述手势信息包括终端的运动状态信息和/或终端的触控状态信息;

实时监测所述终端的运动状态信息包括:实时通过所述终端中内置的重力传感器、陀螺仪中的任一者多者监测所述终端的运动状态信息;或者实时获取外部摄像头摄取到的所述终端的图像,对所述图像中的终端进行位置分析,根据分析结果确定所述终端的运动状态信息;或者实时监测外部回声定位装置得到的所述终端的回声定位信息,对所述终端的回声定位信息进行分析,根据分析结果确定所述终端的运动状态信息;

实时监测所述终端的触控状态信息包括:实时监测所述终端的预设按键、触摸屏幕中的任一者或多者的触控状态信息。

所述实时监测终端接收到的手势信息,包括:

实时获取终端接收到的手势信息;

判断所述接收到的手势信息是否满足预设启动条件;

当所述接收到的手势信息未满足预设启动条件时,舍弃所述接收到的手势信息;

当所述接收到的手势信息满足预设启动条件时,继续执行判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配的步骤。

所述判断所述接收到的手势信息与预设的文件格式对应的存储操作信息是否匹配,包括:

筛选出所述终端的手势信息与预设的存储操作格式对应的存储操作信息库中匹配度最高的存储操作信息;

当所述匹配度最高的存储操作信息的匹配度的数值大于预设的匹配度阈值时,确定所述手势信息与所述存储操作信息相匹配;

当所述手势信息与所述存储操作信息相匹配时,将所述文本信息按照所述预设的文件格式存储。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1