一种文本消息提取方法及系统与流程

文档序号:15969817发布日期:2018-11-16 23:24阅读:211来源:国知局

本申请涉及通信技术领域,特别涉及一种文本消息提取方法及系统。

背景技术

现今移动互联网用户对于im(instantmessage,即时通信)功能的使用场景越来越广泛,越来越多的app都具有自己的im模块。早期的im系统主要应用富文本作为信息载体,包括文本、艺术字、表情及图片等。而随着网络的快速发展,带宽和网速的提高,伴随着微信的出现,语音信息逐渐走入用户的视野。发送语音消息相对于打字的便利快捷,令语音消息得到了快速的普及,逐渐成为了im的主流。但相对于发送语音消息的方便快捷,收听语音却可能存在诸多不便,如,接收端用户收到信息时,其可能在多种场景下,比如会议中、在电影院或各类型公交上面,不方便进行语音播放,但可以阅读文本信息。因此,催生出了识别语音消息,并将其转化为文本显示给用户的需求。

但,如何识别语音信息,并将语音信息转化为文本成为问题。



技术实现要素:

为解决上述技术问题,本申请实施例提供一种文本消息提取方法及系统,以达到将文本消息转换为文本消息的目的,技术方案如下:

一种文本消息提取方法,包括:

系统本地语音识别器获取语音识别请求;

所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址;

所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息。

优选的,所述系统本地语音识别器获取语音识别请求之前,还包括:

处理器获取所述系统本地语音识别器及系统本地麦克风的使用权限;

所述处理器初始化所述系统本地语音识别器、音频引擎及音频录制的配置信息;

所述处理器接收语音消息,并获取所述语音消息的本地消息索引地址;

所述处理器将所述语音消息的本地消息索引地址封装进语音识别请求,并发送所述语音识别请求至所述系统本地语音识别器。

优选的,所述方法还包括:

所述系统本地语音识别器输出并展示所述文本消息。

优选的,所述本地消息索引地址为本地url地址。

一种文本消息提取系统,包括:系统本地语音识别器,用于获取语音识别请求,及从所述语音识别请求中解析出本地消息索引地址,及将所述本地消息索引地址对应的目标语音消息转换为文本消息。

优选的,所述系统还包括:

处理器,用于获取所述系统本地语音识别器及系统本地麦克风的使用权限,及初始化所述系统本地语音识别器、音频引擎及音频录制的配置信息,及接收语音消息,并获取所述语音消息的本地消息索引地址,及将所述语音消息的本地消息索引地址封装进语音识别请求,并发送所述语音识别请求至所述系统本地语音识别器。

优选的,所述系统本地语音识别器,还用于输出并展示所述文本消息。

优选的,所述本地消息索引地址为本地url地址。

与现有技术相比,本申请的有益效果为:

在本申请中,通过系统本地语音识别器获取语音识别请求,及所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址,及所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息,可以实现将语音消息转换为文本消息。

进一步地,采用系统本地语音识别器将语音消息转化为文本消息,相比于采用第三方语音识别或云端服务将语音消息转化为文本消息,可以提高转换的稳定性,以及避免处理第三方软件的更新维护问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请提供的文本消息提取方法的一种流程图;

图2是本申请提供的文本消息提取方法的另一种流程图;

图3是本申请提供的文本消息提取方法的再一种流程图;

图4是本申请提供的文本消息提取系统的一种逻辑结构示意图;

图5是本申请提供的文本消息提取系统的另一种逻辑结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例公开了一种文本消息提取方法,包括:系统本地语音识别器获取语音识别请求;所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址;所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息。在本申请中,可以实现将语音消息转化为文本消息。

接下来对本申请实施例公开的文本消息提取方法进行介绍,请参见图1,可以包括:

步骤s11、系统本地语音识别器获取语音识别请求。

系统本地语音识别器可以理解为:系统本身自带的语音识别器,而非之后安装的语音识别器。

步骤s12、所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址。

本地消息索引地址,用于指示本地音频文件的位置。

步骤s13、所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息。

在本申请中,通过系统本地语音识别器获取语音识别请求,及所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址,及所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息,可以实现将语音消息转换为文本消息。

进一步地,采用系统本地语音识别器将语音消息转化为文本消息,相比于采用第三方语音识别或云端服务将语音消息转化为文本消息,可以提高转换的稳定性,以及避免处理第三方软件的更新维护问题。

在本申请的另一个实施例中,介绍另外一种文本消息提取方法,请参见图2,可以包括:

步骤s21、处理器获取系统本地语音识别器及系统本地麦克风的使用权限。

步骤s22、所述处理器初始化所述系统本地语音识别器、音频引擎及音频录制的配置信息。

本实施例中,音频引擎用于音频输入。

音频录制的配置信息,可以用于指示如何进行音频录制。现举例对音频录制的配置信息进行说明,如,向系统说明app使用音频的模式(比如是播放还是录音,是否支持蓝牙播放,是否支持后台播放);为app选择音频的输入输出设备(比如输入用的麦克风,输出是耳机、手机功放或者airplay);协助管理多个音源需要播放时的行为(例如同时使用多个音乐播放app,或者突然有电话接入)

步骤s23、所述处理器接收语音消息,并获取所述语音消息的本地消息索引地址。

步骤s24、所述处理器将所述语音消息的本地消息索引地址封装进语音识别请求,并发送所述语音识别请求至所述系统本地语音识别器。

步骤s25、所述系统本地语音识别器获取语音识别请求。

步骤s26、所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址。

步骤s27、所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息。

步骤s25-s27与前述实施例中的步骤s11-s13相同,步骤s25-s27的详细过程可以参见步骤s11-s13的相关介绍,在此不再赘述。

需要说明的是,步骤s21-s27是基于系统官方语言识别框架而执行的。系统官方语言识别框架可以理解为:系统本身自带的语音识别框架,而非之后安装的语音识别框架。

本实施例中,系统官方语音识别框架可以为但不局限于:ios系统官方语音识别框架。优选的,ios系统官方语音识别框架可以为:speechkit框架。

若ios系统官方语音识别框架为:speechkit框架,则将所述语音消息的本地消息索引地址封装进语音识别请求的过程,具体可以包括:

调用recognitiontaskwithrequest方法,将所述语音消息的本地消息索引地址封装进语音识别请求。

需要说明的是,recognitiontaskwithrequest方法为speechkit框架本身自带的方法,而非之后安装的方法。

相应地,若ios系统官方语音识别框架为:speechkit框架,则所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息的过程具体可以包括:系统本地语音识别器调用recognitiontaskwithrequest方法,将所述本地消息索引地址对应的目标语音消息转换为文本消息。

在本申请的另一个实施例中,介绍另外一种文本消息提取方法,请参见图3,可以包括:

步骤s31、系统本地语音识别器获取语音识别请求。

步骤s32、所述系统本地语音识别器从所述语音识别请求中解析出本地消息索引地址。

步骤s33、所述系统本地语音识别器将所述本地消息索引地址对应的目标语音消息转换为文本消息。

步骤s31-s33与前述实施例中的步骤s11-s13相同,步骤s31-s33的详细过程可以参见步骤s11-s13的相关介绍,在此不再赘述。

步骤s34、所述系统本地语音识别器输出并展示所述文本消息。

在本实施例中,所述系统本地语音识别器输出并展示所述文本消息,可以满足接收端用户收到信息时,其可能在多种场景下,比如会议中、在电影院或各类型公交上面,不方便进行语音播放,但可以阅读文本信息的需求。

若ios系统官方语音识别框架为:speechkit框架,则所述系统本地语音识别器输出并展示所述文本消息的过程可以包括:系统本地语音识别器将文本消息调用resulthandler方法,执行resulthandler方法,输出并展示所述文本消息。

需要说明的是,resulthandler方法为speechkit框架本身自带的方法,而非之后安装的方法。

在本申请的另一个实施例中,对所述本地消息索引地址进行介绍,具体如下:

所述本地消息索引地址可以为但不局限于本地url(统一资源定位符,uniformresourcelocator)地址。

可以理解的是,能够指示本地音频文件的位置的地址均可以作为本地消息索引地址,并不局限于本地url地址。

接下来对本申请提供的文本消息提取系统进行介绍,下文介绍的文本消息提取系统与上文介绍的文本消息提取方法可相互对应参照。

请参见图4,其示出了本申请提供的文本消息提取系统的一种逻辑结构示意图,文本消息提取系统包括:系统本地语音识别器11。

系统本地语音识别器11,用于获取语音识别请求,及从所述语音识别请求中解析出本地消息索引地址,及将所述本地消息索引地址对应的目标语音消息转换为文本消息。

在本实施例中,文本消息提取系统还可以包括:处理器12,如图5所示。

处理器12,用于获取所述系统本地语音识别器11及系统本地麦克风的使用权限,及初始化所述系统本地语音识别器11、音频引擎及音频录制的配置信息,及接收语音消息,并获取所述语音消息的本地消息索引地址,及将所述语音消息的本地消息索引地址封装进语音识别请求,并发送所述语音识别请求至所述系统本地语音识别器11。

本实施例中,所述系统本地语音识别器11,还可以用于输出并展示所述文本消息。

本实施例中,所述本地消息索引地址可以为本地url地址。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

以上对本申请所提供的一种文本消息提取方法及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1