一种语音即时通讯方法及装置的制造方法_4

文档序号：8413614阅读：来源：国知局

频信息及对应的文字信息发送到即时通信的对端，并在即时通信应用的界面上显示与所述音频信息对应的语音播放图标及文字信息。
[0136]应理解，在本发明实施例中，该处理器910可以是中央处理单元(CentralProcessing Unit，简称为“CPU”)，该处理器900还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0137]该存储器920可以包括只读存储器和随机存取存储器，并向处理器710提供指令和数据。存储器920的一部分还可以包括非易失性随机存取存储器。例如，存储器920还可以存储设备类型的信息。
[0138]该总线系统930除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线系统930。
[0139]在实现过程中，上述方法的各步骤可以通过处理器910中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器920，处理器910读取存储器920中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。
[0140]上述即时通讯工具可以具有通讯软件的各种手持设备或者PC等，另外，很多笔记类软件也可以保存文字、语音信息。展现语音信息的方式也和IM软件相同。这类软件也可以使用本专利中的语音信息展现方式。
[0141]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0142]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0143]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0144]尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0145]显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种语音即时通讯方法，其特征在于，包括: 收到音频信息时，在即时通信应用的界面上显示与所述音频信息对应的语音播放图标；利用语音识别模块对所述音频信息进行语音识别，得到所述音频信息对应的文字信息，并在所述即时通信应用的界面上显示所述音频信息对应的文字信息。
2.如权利要求1所述的方法，其特征在于，还包括: 在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时，在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
3.如权利要求2所述的方法，其特征在于，还包括: 将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块，以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
4.如权利要求1所述的方法，其特征在于，在利用语音识别模块对所述音频信息进行语音识别之前，所述方法还包括: 通过所述即时通信应用界面提示用户是否需要语音识别，在确定需要语音识别时，执行利用语音识别模块对所述音频信息进行语音识别的步骤。
5.如权利要求1所述的方法，其特征在于，所述语音播放图标为与音频信息的时长成正比的播放按钮，所述音频信息对应的文字信息以气泡文本框的形式与所述播放按钮衔接显示，或者所述音频信息对应的文字信息在所述语音播放图标上面显示。
6.一种语音即时通讯方法，其特征在于，包括: 通过语音采集模块获取用户录入的音频信息；利用语音识别模块对获取的音频信息进行语音识别，得到所述音频信息对应的文字信息；将获取的音频信息及对应的文字信息发送到即时通信的对端，并在即时通信应用的界面上显示与所述音频信息对应的语音播放图标及文字信息。
7.如权利要求6所述的方法，其特征在于，还包括: 在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时，在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
8.如权利要求7所述的方法，其特征在于，还包括: 将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块，以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
9.一种语音即时通讯装置，其特征在于，包括: 播放显示单元，用于收到音频信息时，在即时通信应用的界面上显示与所述音频信息对应的语音播放图标；文字显示单元，用于利用语音识别模块对所述音频信息进行语音识别，得到所述音频信息对应的文字信息，并在所述即时通信应用的界面上显示所述音频信息对应的文字信肩、O
10.如权利要求9所述的装置，其特征在于，所述文字显示单元还用于: 在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时，在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
11.如权利要求10所述的装置，其特征在于，还包括: 样本发送单元，用于将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块，以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
12.如权利要求9所述的装置，其特征在于，文字显示单元还用于，在利用语音识别模块对所述音频信息进行语音识别之前，通过所述即时通信应用界面提示用户是否需要语音识别，在确定需要语音识别时，执行利用语音识别模块对所述音频信息进行语音识别的步骤。
13.如权利要求9所述的装置，其特征在于，所述播放显示单元显示的语音播放图标为与音频信息的时长成正比的播放按钮，所述音频信息对应的文字信息以气泡文本框的形式与所述播放按钮衔接显示，或者所述音频信息对应的文字信息在所述语音播放图标上面显/Jn ο
14.一种语音即时通讯装置，其特征在于，包括: 音频获取单元，用于通过语音采集模块获取用户录入的音频信息；文字获取单元，用于利用语音识别模块对获取的音频信息进行语音识别，得到所述音频信息对应的文字信息；发送显示单元，用于将获取的音频信息及对应的文字信息发送到即时通信的对端，并在即时通信应用的界面上显示与所述音频信息对应的语音播放图标及文字信息。
15.如权利要求14所述的装置，其特征在于，发送显示单元还用于: 在显示在所述即时通信应用的界面上的所述音频信息对应的文字信息被修改时，在所述即时通信应用的界面上显示修改后的所述音频信息对应的文字信息。
16.如权利要求15所述的装置，其特征在于，还包括: 样本发送单元，用于将所述音频信息以及修改后的所述音频信息对应的文字信息反馈给所述语音识别模块，以使得所述音频信息以及修改后的所述音频信息对应的文字信息作为所述语音识别模块的语音识别训练样本使用。
【专利摘要】本发明实施例提供一种语音即时通讯方法及装置，该方法包括：收到音频信息时，在即时通信应用的界面上显示与所述音频信息对应的语音播放图标；利用语音识别模块对所述音频信息进行语音识别，得到所述音频信息对应的文字信息，并在所述即时通信应用的界面上显示所述音频信息对应的文字信息。本发明在不适合听语音的环境下，用户可以看到语音内容对应的文字来获取信息；在有大量对话的情况下，用户回溯信息时可以看到对应的文字，大大加快了回溯查找信息的速度。
【IPC分类】G10L15-26, H04L12-58
【公开号】CN104732975
【申请号】CN201310719376
【发明人】薛松
【申请人】华为技术有限公司
【公开日】2015年6月24日
【申请日】2013年12月20日

完整全部详细技术资料下载

当前第4页1 2 3 4