一种语音即时通讯方法及装置的制造方法

文档序号:8413614阅读:338来源:国知局
一种语音即时通讯方法及装置的制造方法
【技术领域】
[0001]本发明涉及即时通讯技术领域,尤其涉及一种语音即时通讯方法及装置。
【背景技术】
[0002]目前即时通讯工具的应用越来越广泛,用户可以通过即时通讯工具和其他用户进行即时通信,发送/接收文字、语音等信息。
[0003]目前的即时通讯工具在采用语音形式进行即时通讯时,通常采用的方式是直接发送和接收音频,如图1所示,例如用户采用语音形式即时通讯时,点击即时通信应用界面上的按钮开始录制声音,录制过程中长按按钮,录制完后释放按钮并发送到接收方。录制完成并发送音频信息后,即时通信应用界面上显示一个按钮,按钮的长度和音频长度成正比,并在按钮旁边显示音频的时长、录制时刻等信息。接收方接收到音频信息后获取该音频信息的音频长度及接收时刻等信息,在即时通信应用界面上显示按钮,同样按钮的长度和音频长度成正比,并在按钮旁边显示音频的时长、录制时刻等信息,确定用户点击该按钮时通过播放器开始播放该段音频信息,因此用户就能收听这段音频信息。
[0004]对于以直接发送和接收音频信息的方式进行语音通讯时,接收方接收到音频信息后,要想获取音频信息,仅可以通过选择音频播放的形式获取,该方式具有以下技术缺陷:
[0005]I)在环境嘈杂的情况下播放音频信息时,所播放的音频信息受环境影响,导致用户难以听清楚,从而用户无法正确获取到音频信息,如果想获取正确的音频信息,需要在私密的场合下播放音频信息;
[0006]2)在需要回溯信息的时候,用户需要重新点击按钮重新播放音频信息,听的速度本身就比较慢,而且在有大量对话的情况下,通过重新播放音频信息的方式查找需要的信息就很麻烦。

【发明内容】

[0007]本发明实施例提供一种语音即时通讯方法及装置,以克服现有语音即时通讯方法仅通过听的方式获取音频信息所存在的音频信息受环境影响、回溯信息较麻烦的问题。
[0008]第一方面,提供一种语音即时通讯方法,包括:
[0009]收到音频信息时,在即时通信应用的界面上显示与所述音频信息对应的语音播放图标;
[0010]利用语音识别模块对所述音频信息进行语音识别,得到所述音频信息对应的文字信息,并在所述即时通信应用的界面上显示所述音频信息对应的文字信息。
[0011]结合第一方面,第一种可能的实现方式,该方法还包括:
[0012]在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时,在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
[0013]结合第一方面,第一方面第一种可能的实现方式中,该方法还包括:
[0014]将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块,以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
[0015]结合第一方面,第二种可能的实现方式,在利用语音识别模块对所述音频信息进行语音识别之前,所述方法还包括:
[0016]通过所述即时通信应用界面提示用户是否需要语音识别,在确定需要语音识别时,执行利用语音识别模块对所述音频信息进行语音识别的步骤。
[0017]结合第一方面,第三种可能的实现方式,所述语音播放图标为与音频信息的时长成正比的播放按钮,所述音频信息对应的文字信息以气泡文本框的形式与所述播放按钮衔接显示,或者所述音频信息对应的文字信息在所述语音播放图标上面显示。
[0018]第二方面,本发明实施例还提供一种语音即时通讯方法,包括:
[0019]通过语音采集模块获取用户录入的音频信息;
[0020]利用语音识别模块对获取的音频信息进行语音识别,得到所述音频信息对应的文字信息;
[0021]将获取的音频信息及对应的文字信息发送到即时通信的对端,并在即时通信应用的界面上显示与所述音频信息对应的语音播放图标及文字信息。
[0022]结合第二方面,第一种可能的实施方式,该方法还包括:
[0023]在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时,在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
[0024]结合第二方面,第二方面第一种可能的实施方式中,该方法还包括:
[0025]将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块,以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
[0026]第三方面,本发明实施例提供一种语音即时通讯装置,包括:
[0027]播放显示单元,用于收到音频信息时,在即时通信应用的界面上显示与所述音频信息对应的语音播放图标;
[0028]文字显示单元,用于利用语音识别模块对所述音频信息进行语音识别,得到所述音频信息对应的文字信息,并在所述即时通信应用的界面上显示所述音频信息对应的文字信息。
[0029]结合第三方面,第一种可能的实施方式,所述文字显示单元还用于:
[0030]在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时,在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
[0031]结合第三方面,第三方面第一种可能的实施方式中,还包括:
[0032]样本发送单元,用于将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块,以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
[0033]结合第三方面,第二种可能的实施方式,文字显示单元还用于,在利用语音识别模块对所述音频信息进行语音识别之前,通过所述即时通信应用界面提示用户是否需要语音识别,在确定需要语音识别时,执行利用语音识别模块对所述音频信息进行语音识别的步骤。
[0034]结合第三方面,第三种可能的实施方式,所述播放显示单元显示的语音播放图标为与音频信息的时长成正比的播放按钮,所述音频信息对应的文字信息以气泡文本框的形式与所述播放按钮衔接显示,或者所述音频信息对应的文字信息在所述语音播放图标上面显不O
[0035]第四方面,本发明实施例还提供一种语音即时通讯装置,包括:
[0036]音频获取单元,用于通过语音采集模块获取用户录入的音频信息;
[0037]文字获取单元,用于利用语音识别模块对获取的音频信息进行语音识别,得到所述音频信息对应的文字信息;
[0038]发送显示单元,用于将获取的音频信息及对应的文字信息发送到即时通信的对端,并在即时通信应用的界面上显示与所述音频信息对应的语音播放图标及文字信息。
[0039]第四方面,第一种可能的实施方式,发送显示单元还用于:
[0040]在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时,在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
[0041]结合第四方面,第四方面第一种可能的实施方式中,还包括:
[0042]样本发送单元,将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块,以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
[0043]利用本发明提供的语音即时通讯方法及装置,具有以下有益效果:让用户能够通过看的方式,获取语音信息的内容,在不适合听语音的环境下,用户可以看到语音内容对应的文字来获取信息;在有大量对话的情况下,用户回溯信息时可以看到对应的文字,大大加快了回溯查找信息的速度
【附图说明】
[0044]图1为现有的语音即时通讯方法对应的应用界面示意图;
[0045]图2为本发明实施例提供的一种语音即时通讯方法流程图;
[0046]图3为本发明实施例提供的另一种发送方的语音即时通讯方法流程图;
[0047]图4为本发明实施例1中的语音即时通讯方法流程图;
[0048]如图5所示本发明实施例1中即时通讯方法对应的应用界面示意图;
[0049]图6为本发明实施例提供的作为接收方的一种语音识别装置结构图;
[0050]图7为本发明实施例提供的作为接收方的另一种语音识别装置结构图;
[0051]图8为本发明实施例提供的作为发送方的一种语音识别装置结构图;
[0052]图9为本发明实施例提供的作为发送方的另一种语音识别装置结构图。
【具体实施方式】
[0053]下面结合附图和实施例对本发明提供的语音即时通讯方法及装置进行更详细地说明。
[0054]申请人研究发现,目前的即时通讯工具在采用语音形式进行即时通讯时,另一种方式是通过语音识别技术发送和接收文字信息,具体为在发送方通过音频采集设备如话筒采集用户的语音获得音频信息,通过本地或远端的语音识别软件对音频信息进行语音识另|J,获得对应的文字结果发送给接收方。如果是在发送方采用语音识别软件进行语音识别,通常将文字结果显示在发送方的发送文字输入框内,用户对识别有错的地方进行修改后,将文字信息发出。<
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1