语音通信方法、装置、计算机设备及存储介质与流程

文档序号：14124536阅读：214来源：国知局

本发明涉及互联网技术领域，特别是涉及一种语音通信方法、装置、计算机设备及存储介质。

背景技术：

在现有的即时通讯聊天工具中，语音消息是比较常见的一种沟通方式。目前市场上比较知名的即时通信聊天工具，比如微信、qq等都会使用到语音消息。但是在即时通讯聊天工具中使用语音消息进行沟通时，通过即时通讯聊天工具进行聊天时，若语音消息较多而用户想要快速知晓语音消息中的内容时，则需要逐条播放来获取语音消息的内容，操作步骤更为繁琐，增加了时间的耗损。

技术实现要素：

基于此，有必要针对上述技术问题，提供一种能节省用户操作时间成本的语音通信方法、装置、计算机设备及存储介质。

一种语音通信方法，所述方法包括：

获取第一终端通过即时通信聊天界面发送的语音消息，所述语音消息包括语音数据和文字信息，所述语音数据由所述第一终端通过即时通信聊天界面触发语音采集得到，所述文字信息由所述语音数据转换得到；

将所述语音消息发送至第二终端，以使所述第二终端在即时通信聊天界面中显示所述语音消息。

在其中一个实施例中，将所述语音消息发送至第二终端，包括：

将所述语音消息对应的元数据和文字信息发送至第二终端，其中，所述元数据包括所述语音消息标识与所述语音数据对应的时长。

在其中一个实施例中，将所述语音消息发送至第二终端之后，还包括：

获取所述第一终端通过即时通信聊天界面触发的文字纠正指令，所述文字纠正指令携带所述语音消息中纠正后的文字信息；

将包含所述语音数据和所述纠正后的文字信息的语音消息发送至第二终端，以使所述第二终端在即时通信聊天界面中显示再次发送的语音消息。

在其中一个实施例中，所述将所述语音消息发送至第二终端，包括：

将所述文字信息中包含的词语与所述即时通信聊天界面对应的用户名称进行匹配，得到与所述词语匹配的用户名称；

将所述文字信息中与用户名称匹配的词语替换成所述用户名称；

将包含所述语音数据和替换成所述用户名称后的文字信息的语音消息发送至所述第二终端，以使所述第二终端在即时通信聊天界面中显示所述语音消息。

在其中一个实施例中，所述语音通信方法还包括：

对所述文字信息中包含的词语与所述第二终端在即时通信聊天界面对应的用户名称进行匹配；

若匹配成功，则对所述语音消息进行标记，和/或，发送提示消息至所述第二终端。

在其中一个实施例中，所述语音通信方法还包括：

对所述文字信息中包含的词语与即时通信聊天界面对应的群组中包含的应用名称进行匹配；

若匹配成功，则发送应用提示消息至所述第二终端。

一种语音通信方法，所述方法包括：

在即时通信聊天界面触发语音采集，采集语音数据；

将所述语音数据转化成文字信息；

根据所述语音数据和文字信息生成语音消息；

发送所述语音消息。

在其中一个实施例中，所述获取服务器返回的发送语音消息的指令，根据所述发送语音消息的指令显示所述语音消息之后，还包括：

通过所述即时通信聊天界面触发文字纠正请求；

根据所述文字纠正请求进入文字纠正操作界面，通过所述文字纠正操作界面对所述消息中的文字信息进行纠正；

根据所述语音数据和纠正后文字信息再次生成语音消息；

发送再次生成的语音消息。

在其中一个实施例中，所述发送再次生成的语音消息，包括：

撤回纠正之前在所述即时通信聊天界面中显示的语音消息。

在其中一个实施例中，所述根据所述语音数据和文字信息生成语音消息，包括：

将所述文字信息中包含的词语与所述即时通信聊天界面对应的用户名称进行匹配，得到与所述词语匹配的用户名称；

将所述文字信息中与用户名称匹配的词语替换成所述用户名称；

根据所述语音数据和替换用户名称后的文字信息生成语音消息。

一种语音通信装置，所述装置包括：

获取模块，用于获取第一终端通过即时通信聊天界面发送的语音消息，所述语音消息包括语音数据和文字信息，所述语音数据由所述第一终端通过即时通信聊天界面触发语音采集得到，所述文字信息由所述语音数据转换得到；

发送模块，用于将所述语音消息发送至第二终端，以使所述第二终端在即时通信聊天界面中显示所述语音消息。

一种语音通信装置，所述装置包括：

语音数据采集模块，用于在即时通信聊天界面触发语音采集，采集语音数据；

语音数据转化模块，用于将所述语音数据转化成文字信息；

语音消息生成模块，用于根据所述语音数据和文字信息生成语音消息；

语音消息发送模块，用于发送所述语音消息。

一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

将所述语音消息发送至第二终端，以使所述第二终端在即时通信聊天界面中显示所述语音消息。

一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

在即时通信聊天界面触发语音采集，采集语音数据；

将所述语音数据转化成文字信息；

根据所述语音数据和文字信息生成语音消息；

发送所述语音消息。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

将所述语音消息发送至第二终端，以使所述第二终端在即时通信聊天界面中显示所述语音消息。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

在即时通信聊天界面触发语音采集，采集语音数据；

将所述语音数据转化成文字信息；

根据所述语音数据和文字信息生成语音消息；

发送所述语音消息。

上述语音通信方法、装置、计算机设备及存储介质，通过获取第一终端通过即时通信聊天界面发送的语音消息，语音消息包括语音数据和文字信息，语音数据由第一终端通过即时通信聊天界面触发语音采集得到，文字信息由语音数据转换得到，再将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。这种在将语音消息发送至第二终端时，也将语音消息中包含的文字信息发送的方法，使得第二终端在接收到这条语音消息时无需播放语音消息就能直观的通过查看文字信息获知语音消息要表述的内容，而不需要通过逐条点击播放每一条语音消息才能获知语音消息中的内容，从而节省了操作步骤，节省了用户操作的时间成本。

附图说明

图1为一个实施例中语音通信方法的应用环境图；

图2为一个实施例中语音通信方法的流程示意图；

图3为一个实施例中撤回已纠正语音消息对应原始语音消息的界面示意图；

图4为另一个实施例中语音通信方法的流程示意图；

图5为一个实施例中纠正语音消息中的文字信息的界面示意图；

图6为一个实施例中第二终端接收到相关消息时的界面示意图；

图7为一个实施例中语音通信方法的流程示意图；

图8为一个实施例中纠正语音消息的流程示意图；

图9为一个实施例中文字纠正的操作界面图；

图10为一个实施例中语音通信装置的结构框图；

图11为一个实施例中语音通信装置的结构框图；

图12为一个实施例中计算机设备的内部结构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

图1示出了一个实施例中语音通信方法的应用环境图。参照图1，该语音通信方法可应用于语音通信的实现系统中，该系统包括终端110、服务器120以及终端130终端110与终端130均通过网络与服务器120连接。终端110和终端130可以是但不限于各种能运行即时通信应用的个人计算机、笔记本电脑、个人数字助理、智能手机、平板电脑等。服务器120可以是实现单一功能的服务器，也可以是实现多种功能的服务器，具体可以是独立的物理服务器，也可以是物理服务器集群。终端110上可通过特定的应用显示即时通信的聊天界面，在即时通信聊天界面触发语音采集，采集到语音数据后，将语音数据转化成文字信息；再根据语音数据和文字信息生成语音消息；再通过服务器120向终端130发送语音消息。服务器120则在获取到终端110通过即时通信聊天界面发送的语音消息后，将语音消息发送至终端130上。

如图2所示，在一个实施例中，提供了一种语音通信方法，该方法以应用于如图1中所示的终端中进行举例说明。包括：

步骤202，获取第一终端通过即时通信聊天界面发送的语音消息，语音消息包括语音数据和文字信息，语音数据由第一终端通过即时通信聊天界面触发语音采集得到，文字信息由语音数据转换得到。

服务器获取第一终端的登录请求后，返回登录成功的通知至第一终端使得第一终端实现登录。服务器获取第一终端通过即时通信聊天界面发送的语音消息，其中，语音消息包括第一终端通过即时通信聊天界面触发语音采集得到的语音数据，以及根据语音数据转化得到的文字信息。

将语音数据转化得到文字信息是通过语音识别模块处理的，语音识别模块可放置在客户端的配置文件中，也可放置在服务器的文件中。服务器在获取到第一终端通过即时通信聊天界面触发语音采集得到的语音数据时，可依据当前的网络状态选择一种识别方式。比如在无线网络或是4g网络时，可选择在服务器上识别；而在网络为3g或者2g网络状态下时，则可选择在客户端上识别。在服务器上进行的识别是在线识别，而客户端上进行的识别是一个本地识别，相比较而言，服务器的识别率一般情况下是优于客户端识别的。对于识别采集得到的语音数据来说，可根据系统开发者或者基于用户习惯的考虑去采取设置对应的识别方式。

步骤204，将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

服务器可将包含语音数据和由语音数据转换得到的文字信息的语音消息发送至第二终端，第二终端在接收到这条语音消息时，也包含了语音数据和由语音数据转换得到的文字信息，因此第二终端在即时通信聊天界面中显示语音消息时可同时显示语音数据和由语音数据转换得到的文字信息。

服务器通过将第一终端采集到的语音数据和根据语音数据转化得到的文字信息共同发送至第二终端，使得第二终端在收到消息时，不仅收到语音数据，还能收到与语音数据对应的文字信息。第二终端在阅读这条消息时，可在不点开播放语音数据的情况下，直接通过阅读文字信息就可直观的获取语音数据里要表达的内容。尤其是在消息较多的情况下，更能节省点开播放的操作，从而节省了用户操作的时间成本。

在一个实施例中，步骤204包括，将语音消息对应的元数据和文字信息发送至第二终端，其中，元数据包括语音消息标识与语音数据对应的时长。

服务器将发送语音消息发送至第二终端时，实际上是将包括语音消息标识和语音数据时长的元数据及文字信息发送至第二终端。因此第二终端在接收到此条语音消息时，其实并没有接收到第一终端采集的语音音频，即语音数据。而是在第二终端通过即时通信聊天界面触发了对应的语音消息后，服务器接收第二终端通过触发语音消息产生的语音读取指令，语音读取指令中包含了语音消息标识(譬如语音消息id)，服务器根据该语音消息标识返回对应的通知至第二终端，第二终端在接收到服务器返回的通知后正常的将语音数据下载完成，才能实现语音数据的播放。

第二终端在接收到包含元数据的语音消息时，该语音消息对应的语音数据实际上还处于未下载的状态，需要第二终端触发对应的操作才会将语音数据下载下来，因为对于第二终端而言，接收到包含元数据的语音消息并不会消耗太多流量，当第二终端通过直观的阅读语音消息中的文字信息获知到语音数据中要表达的内容时，第二终端可以选择不下载对应的语音数据。这种设计方式大幅度的减少了流量的耗损，由于语音数据不会自动下载到客户端也有效的减少了无用的语音数据对客户端内存的占用。

在一个实施例中，上述步骤204，包括：将文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，得到与词语匹配的用户名称；将文字信息中与用户名称匹配的词语替换成用户名称；将包含语音数据和替换成用户名称后的文字信息的语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

服务器在将语音消息发送至第二终端时，会先对语音消息中包含的文字信息进行分析。当文字信息中包含的词语与即时通信聊天界面对应的用户名称匹配成功时，服务器就会自动将文字信息中与用户名称匹配的词语替换成用户名称，然后再将包含该替换过的文字信息与语音数据的语音消息发送至第二终端。这种自动匹配的方式，减少了由于语音分析导致的“叫错”人名的情况发生，也减少了需要用户手动修改的操作，节约了沟通成本。

在一个实施例中，在步骤204之后，还包括：获取第一终端通过即时通信聊天界面触发的文字纠正指令，文字纠正指令携带语音消息中纠正后的文字信息；将包含语音数据和纠正后的文字信息的语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示再次发送的语音消息。

服务器在将包含采集到的语音数据和根据语音数据转化得到的文字信息的语音消息发送至第二终端后，获取第一终端通过即时通信聊天界面触发的文字纠正指令，文字纠正指令携带语音消息中纠正后的文字信息。第一终端通过即时通信聊天界面触发的文字纠正指令，比如通过触发即时通信聊天界面上想要纠正的文字信息，或触发纠正按钮，这种触发操作可根据系统开发者或者基于用户习惯的考虑去采取对应的触发方式。第一终端触发文字纠正指令后，会根据个人需要对文字信息进行相应的纠正，纠正后的文字信息会被临时保存下来与语音数据一同发送至第二终端，即再次发送至第二终端的语音消息中包含有语音数据以及纠正后的文字信息。第二终端在接收到的包含有语音数据以及纠正后的文字信息的语音消息后，会将这条消息显示在即时通信聊天界面中。

作为发送方的第一终端，在发送完语音消息后，若发现语音消息中包含的文字信息与语音数据中的文字不符或有错别字等问题，可以通过即时通信聊天界面触发文字纠正指令，从而对语音消息中的文字信息进行编辑纠正，再将纠正后的文字信息与语音数据发送至第二终端，当第二终端再次收到包含语音数据和纠正后的文字信息的语音消息时，就可以直接通过阅读纠正后的文字信息获取到第一终端要表述的正确内容。第一终端可以通过这种对已发送语音消息中包含的文字信息进行纠正的方式，及时改正文字信息中的不准确内容或有异议的内容，而不需要重新再采集语音数据。而且，虽然对文字信息进行纠正后语音数据也会同时再次发送，但其实语音数据是保存在服务器的，再次发送并不会再次耗费语音数据部分的流量，发送的数据中更新的其实只有纠正后的文字信息，因此重新发送并不会带来流量耗损严重的问题。

进一步的，在一个实施例中，在发送完包含语音数据和纠正后的文字信息的语音消息后，可将此条已纠正的语音消息对应的原始语音消息撤回。

在发送完包含语音数据和纠正后的文字信息的语音消息后，服务器会根据再次发送的语音消息的标识查找到此语音消息对应的原始语音消息，并将原始语音消息撤回，在第一终端和第一终端上都不会再显示那条未纠正语音消息。在撤回未纠正的原始语音消息时，可显示对应的提示文本提示第一终端，比如显示文本“你已修改语音自动识别内容”，第一终端即可获知消息已纠正成功，如图3所示。

当既有未纠正的原始语音消息，又有纠正后再次发送的语音消息时，对于第二终端来说，难以辨别重要的消息以及哪一条才是正确表述的消息。对于第二终端而言，将未纠正的原始语音消息撤回，能够减少无效消息的重复阅读，也不需要在即时通信聊天界面上显示的众多消息中耗费时间去分辨哪些是第一终端已经纠正的消息。

在一个实施例中，上述语音通信方法还包括：对文字信息中包含的词语与第二终端在即时通信聊天界面对应的用户名称进行匹配；若匹配成功，则对语音消息进行标记，和/或，发送提示消息至第二终端。

在通过即时通信聊天界面聊天时，每个参与聊天的用户都会有各自的用户名称，这个用户名称可以是用户自行修改后的真实姓名，也可能是用户基于个人考虑而使用的社交昵称，如果是在群组聊天中，用户名称也可能是这个用户针对这个群组设置的群内备注名称。当第一终端将包含语音数据和文字信息的语音消息发送至第二终端时，服务器会对语音消息中包含的文字信息进行智能分析，将文字信息中包含的词语与第二终端的用户名称进行匹配。若匹配成功，就对语音消息进行标记，或者发送提示消息至第二终端，或者既对语音消息进行标记又发送提示消息至第二终端。

通过即时通信聊天界面聊天时，当收到的消息(譬如语音信息或文字信息)较多时，往往无法立即找出与自己相关的消息，则需要逐条查看每一条消息才能获知与自己相关的内容。但采用这种一旦分析到与自己在聊天时使用的用户名称匹配时，就对该条消息进行标记提示或者发送提示消息提示与我相关时，则可以快速查看到相关内容，节省了过滤不必要信息的时间。

在一个实施例中，上述语音通信方法还包括：对文字信息中包含的词语与即时通信聊天界面对应的群组中包含的应用名称进行匹配；若匹配成功，则发送应用提示消息至第二终端。

在通过即时通信聊天界面进行群组聊天时，群组内会包含群成员添加的应用或者群组内自定义预先配置的应用，一般情况下，将群组内包含的应用称为轻应用。当第一终端将包含语音数据和文字信息的语音消息发送至第二终端时，服务器会对语音消息中包含的文字信息进行智能分析，将文字信息中包含的词语与当前进行聊天的聊天群组中包含应用的应用名称进行匹配。若匹配成功，则会发送应用提示消息至第二终端，提示群组内的成员有关于群内应用的消息。

对应用提示消息添加标记或多发送一条提示消息，快速的知会接收者消息中存在有与应用相关的消息，尤其是当群组内需要通过某一个特定的轻应用发起群组活动时，那么群成员则可立即通过有标记的应用消息获知，从而对此消息进行相应的处理，节省了过滤众多消息的时间，从而能快速获取重要的消息。

在一个实施例中，如图4所示，提供的一种语音通信方法，该方法以应用于如图1中所示的终端中进行举例说明。包括：

步骤402，获取第一终端通过即时通信聊天界面发送的语音消息，语音消息包括语音数据和文字信息，语音数据由第一终端通过即时通信聊天界面触发语音采集得到，文字信息由语音数据转换得到。

在通过即时通信聊天界面发送语音消息时，第一终端可以通过点击即时通信聊天界面上的语音按钮触发录音功能。录下一段语音数据后，可在终端上将语音数据转化为文字信息，也可将语音数据上传至服务器，由服务器对语音数据进行转化，得到相应的文字信息。一般情况下，客户端识别还是服务器识别是不由用户选择的，即时通信聊天工具会根据当前用户的网络状况、识别率要求等自动判断。比如网络状况好或者识别率要求比较高时采用服务器识别，网络状况较差或识别率要求不高时则采用客户端识别。或也可以设计为根据应用场景来选择采用哪种识别方案，具体的识别方案可根据开发者或用户需求而定。客户端识别的优点是不依赖网络，不消耗流量，识别快，而服务器识别的优点是识别率比较高，且不依赖本地识别库可减少对客户端的内存占用。

步骤404，检测是否获取到第一终端通过即时通信聊天界面触发的文字纠正指令，若是，则执行步骤406；若否，则执行步骤408。

在第一终端向第二终端发送完包含语音数据和对应的文字信息的语音消息后，在第一终端上显示该条语音消息时，第一终端可以通过点击文字信息触发对应的文字纠正指令。对于第一终端，可以在未纠正的原始语音消息上显示标记提示第一终端可对该语音消息的文字信息进行纠正，比如显示“点击纠正”的标记，当第一终端触发“点击纠正”按钮对文字信息进行编辑后，可在纠正后再次发送的语音消息上显示标记提示第一终端此条消息是已经纠正过的，比如显示文本“已纠正”，如图5所示。

步骤406，获取语音数据和纠正指令上携带的纠正后的文字信息。

当获取到第一终端通过即时通信聊天界面触发的文字纠正指令时，会根据文字纠正指令中携带的语音消息标识查找到对应的原始语音消息，并将文字纠正指令中携带的纠正后的文字信息与原始语音消息中的文字信息替换。由于服务器在获取到第一终端触发的文字纠正指令时，可根据指令中携带的消息标识查找到原始语音消息，即可查找到原始语音消息中包含的语音数据，那么当第一终端在将对文字信息进行了纠正后的语音消息再次发送至第二终端时，并不需要再次上传语音数据。而服务器在发送进行了纠正后的语音消息至第二终端时，也可只对纠正的文字信息进行更新，由于文字的字节较少，因此再次发送进行纠正了的语音消息所耗费的流量也基本上可以忽略不计。

步骤408，对文字信息进行智能分析。

步骤410，当文字信息中包含的词语与第二终端在即时通信聊天界面对应的用户名称匹配成功时，则执行步骤412。

步骤412，将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息，并对语音消息进行标记，和/或，再发送一条提示消息至第二终端。

无论是否第一终端是否有对语音消息进行纠正，在服务器将语音消息发送至第二终端时，都有一个智能分析的过程。服务器会获取并分析语音消息中包含的文字信息，当分析到文字信息中包含有疑似人名的词语时，会将此词语与即时通信聊天界面对应的用户名称进行匹配。匹配时可进行汉字精确匹配或者将名词转换成拼音后模糊匹配，分析出文字信息中是否存在人名。若存在，即匹配成功，则会提示与该词语匹配成功的用户名称对应的用户，提示方式为在发送语音消息时对这条语音消息进行标记，比如显示红点或显示文本“有人@你”等标记提示与该词语匹配成功的用户名称对应的用户。又或者，匹配成功后，在发送语音消息后，再发送一条提示消息至第二终端，提示消息可以是系统消息，也可以是普通的文本消息，如图6所示。

步骤414，当文字信息中包含的词语与即时通信聊天界面对应的群组中包含的应用名称匹配成功时，则执行步骤416。

步骤416，将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息，并再发送一条应用提示消息至第二终端。

与步骤410一致，服务器会获取并分析语音消息中包含的文字信息。在服务器分析文字信息中是否包含有疑似人名的词语时，也会分析文字信息中是否包含有与群组轻应用名称匹配的词语。匹配方式可为汉字精确匹配或者将名词转换成拼音后模糊匹配，若匹配成功，则在将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息后，会再发送一条应用提示消息至第二终端，提示消息可以是系统消息或者普通文本消息。第二终端在接收到包含轻应用名称的语音消息时，轻应用的名称可以为高亮状态，第二终端点击轻应用的名称可进入对应的轻应用操作界面对轻应用进行相关操作。

在发送语音消息时，能够将文字信息一同发送至接收方，使得接收方能够直接通过阅读文字信息而不需要下载播放语音数据的情况下获知语音数据中要表述的内容。进一步地，在群组聊天中，由于语音数据并不能直观的表达是否与群内某一个特定成员相关，而通过对文字信息的匹配，如果与群内某个成员匹配成功则会在该匹配的成员接收到语音消息时，在该匹配的成员的即时通信聊天界面上显示语音消息时，该语音消息会带有提示标记的语音消息，用来提示该匹配成员这与自己相关，或与应用匹配成功的语音消息一样，会另外收到一条提示消息。因此，第二终端在接收到语音消息时，也能快速获知语音消息中包含的语音数据中要表述的内容，也能够及时获取到与自己相关的消息，减少了消息过滤的过程。无需下载播放语音数据也减少了流量的耗损，也减少了每次播放语音数据导致语音数据会缓存到客户端带来的内存占用。而对于第一终端而言，可以对已发送的语音消息中的文字信息进行编辑纠正，也能够及时纠正发送的消息中的错误，再将纠正后的消息再次发送也能及时更正要表述的内容，减少沟通上产生的不必要纷争。

如图7所示，在一个实施例中，提供了一种语音通信方法，该方法以应用于如图1中所示的终端中进行举例说明。包括：

步骤702，在即时通信聊天界面触发语音采集，采集语音数据。

第一终端在触发登录请求成功实现登录后，可通过即时通信聊天界面与不同的终端进行即时通信。在进行即时通信时，一般都可进行语音通信或文字通信。当选择语音通信时，可在聊天界面上触发语音采集功能，采集语音数据。

步骤704，将语音数据转化成文字信息。

当采集到语音数据后，可通过语音识别功能将语音数据转化成文字信息。在客户端存储的应用包中，已经集成了离线语音识别包，因此语音识别既可在客户端进行也可在服务器进行。

步骤706，根据语音数据和文字信息生成语音消息。

步骤708，发送语音消息。

将语音数据和根据语音数据转化得到的文字信息生成语音消息，再将语音消息通过服务器发送至第二终端，因此第二终端在接收到此语音消息时，会同时收到语音数据和语音数据转化得到的文字信息。

第二终端在收到第一终端发送的语音消息时，可在不点开播放语音消息中包含的语音数据的情况下，通过直接阅读语音消息中包含的文字信息获知语音数据中要传达的内容，这种语音通信方式能够减少作为接收方的第二终端接收和播放语音数据带来的流量损耗，另无需播放语音数据也降低了对网络质量的要求。

在一个实施例中，在步骤708之后，还包括对发送的语音消息中的文字进行纠正的步骤。如图8所示，该步骤包括：

步骤802，通过即时通信聊天界面触发文字纠正请求。

步骤804，根据文字纠正请求进入文字纠正操作界面，通过文字纠正操作界面对消息中的文字信息进行纠正。

步骤806，根据语音数据和纠正后文字信息再次生成语音消息。

步骤808，发送再次生成的语音消息。

第一终端在通过即时通信聊天界面向第二终端发送了包含语音数据和根据语音数据转化得到的文字信息的语音消息后，若发现转化得到的文字信息与语音数据中表述的意思有出入，或出于其他考虑需要对语音消息中的文字信息进行编辑纠正时，第一终端可通过即时通信聊天界面触发文字纠正请求。触发文字纠正请求后，会进入如图9所示的文字纠正操作界面。第一终端可通过文字纠正操作界面对文字信息进行编辑纠正，当确认编辑纠正后，第一终端会将原始语音消息中包含的语音数据与进行编辑纠正后的文字信息再次生成一条新的语音消息，并通过服务器发送至第二终端。第一终端在发现语音消息中有错误时，可及时对文字信息进行纠正，增强了语音消息的准确性。

在一个实施例中，上述步骤808包括：撤回纠正之前在所述即时通信聊天界面中显示的语音消息。

当第一终端将纠正后的语音消息再次发送至第二终端时，会撤回纠正之前发送的原始语音消息，即未纠正的语音消息，在第一终端与第二终端的即时通信聊天界面中均不会显示该条未纠正的语音消息。撤回纠正前的语音消息能够减少界面上出现过多无效的消息，第二终端在阅读消息时也能减少对无用的垃圾消息的过滤，节约获取有用消息的时间。

在一个实施例中，上述的步骤806包括：将文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，得到与词语匹配的用户名称；将文字信息中与用户名称匹配的词语替换成用户名称；根据语音数据和替换用户名称后的文字信息生成语音消息。

根据语音数据和文字信息生成语音消息时，客户端上集成的离线语音识别包会对文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，匹配过程可分为两个阶段，首先，会根据中文语法对文字信息进行基本的语法纠正，类似英语语法纠正系统，对于常用语、主谓宾等明显的识别错误进行纠正。其次，离线语音识别包会分析出识别结果中疑似人名的名词，在群组成员名称的数据中进行匹配，可进行汉字精确匹配或者将名词转换成拼音后模糊匹配，匹配成功后对人名进行纠正，防止识别结果中出现同音不同字的人名。比如分析到文字信息中包含周节，而即时通信聊天界面对应的用户名称中存在有用户名称为周杰，那么就会对“周节”进行自动纠正，纠正为“周杰”。即将文字信息中与用户名称匹配的词语替换成用户名称，然后根据语音数据和替换用户名称后的文字信息再次生成新的语音消息，这种纠正方式能大幅度的减少错别字的发生，也较大程度避免了在沟通过程中出现叫错人名的情况，减少了不必要的对语音消息的再次纠正。

在一个实施例中，提供了一种语音通信装置，如图10所示，装置包括：

获取模块1002，用于获取第一终端通过即时通信聊天界面发送的语音消息，语音消息包括语音数据和文字信息，语音数据由第一终端通过即时通信聊天界面触发语音采集得到，文字信息由语音数据转换得到；

发送模块1004，用于将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

在一个实施例中，发送模块1004还用于，将语音消息对应的元数据和文字信息发送至第二终端，其中，元数据包括语音消息标识与语音数据对应的时长。

在一个实施例中，上述语音通信装置还包括：纠正指令获取模块，用于获取第一终端通过即时通信聊天界面触发的文字纠正指令，文字纠正指令携带语音消息中纠正后的文字信息；发送模块804还用于将包含语音数据和纠正后的文字信息的语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示再次发送的语音消息。

在一个实施例中，上述发送模块1004包括匹配模块和替换模块，匹配模块用于将文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，得到与词语匹配的用户名称；替换模块用于将文字信息中与用户名称匹配的词语替换成用户名称，将包含语音数据和替换成用户名称后的文字信息的语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

在一个实施例中，上述语音通信装置还包括用户名称匹配模块，用于对文字信息中包含的词语与第二终端在即时通信聊天界面对应的用户名称进行匹配；若匹配成功，则对语音消息进行标记，和/或，发送提示消息至第二终端。

在一个实施例中，上述语音通信装置还包括应用名称匹配模块，用于对文字信息中包含的词语与即时通信聊天界面对应的群组中包含的应用名称进行匹配；若匹配成功，则发送应用提示消息至第二终端。

在一个实施例中，还提供了一种语音通信装置，如图11所示，该装置包括：

语音数据采集模块1102，用于在即时通信聊天界面触发语音采集，采集语音数据；

语音数据转化模块1104，用于将语音数据转化成文字信息；

语音消息生成模块1106，用于根据语音数据和文字信息生成语音消息；

语音消息发送模块1108，用于发送语音消息。

在一个实施例中，语音消息生成模块1106还用于将文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，得到与词语匹配的用户名称；将文字信息中与用户名称匹配的词语替换成用户名称；根据语音数据和替换用户名称后的文字信息生成语音消息。

在一个实施例中，上述语音通信装置还包括文字纠正模块，用于通过即时通信聊天界面触发文字纠正请求；根据文字纠正请求进入文字纠正操作界面，通过文字纠正操作界面对消息中的文字信息进行纠正；根据语音数据和纠正后文字信息再次生成语音消息；发送再次生成的语音消息。

在一个实施例中，上述语音通信装置还包括撤回模块，用于在根据语音数据和纠正后文字信息再次生成语音消息时，撤回纠正之前在即时通信聊天界面中显示的语音消息。

图12为一个实施例中计算机设备的内部结构示意图。参照图12，该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器、显示器和网络接口。其中，该计算机设备的非易失性存储介质可存储操作系统和实现语音通信装置的计算机程序，该计算机程序被执行时，可使得处理器执行一种语音通信方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该内存储器中可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行语音通信的方法。计算机设备的网络接口用于进行网络通信。显示屏用于显示应用界面等，例如，显示即时通信聊天界面或文字纠正的操作界面等。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，计算机设备的输入装置可以是显示屏上覆盖的触摸屏，也可以是计算机设备外壳上设备的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。触摸层与显示屏构成触控屏。

本领域技术人员可以理解，图12中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的终端的限定，具体的终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，上述处理器执行上述计算机程序时包括以下步骤：获取第一终端通过即时通信聊天界面发送的语音消息，语音消息包括语音数据和文字信息，语音数据由第一终端通过即时通信聊天界面触发语音采集得到，文字信息由语音数据转换得到；将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

在另一个实施例中，上述处理器执行上述计算机程序时包括以下步骤：在即时通信聊天界面触发语音采集，采集语音数据；将语音数据转化成文字信息；根据语音数据和文字信息生成语音消息；发送语音消息。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取第一终端通过即时通信聊天界面发送的语音消息，语音消息包括语音数据和文字信息，语音数据由第一终端通过即时通信聊天界面触发语音采集得到，文字信息由语音数据转换得到；将语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

在一个实施例中，计算机程序被处理器执行将语音消息发送至第二终端的步骤之后，还包括：获取第一终端通过即时通信聊天界面触发的文字纠正指令，文字纠正指令携带语音消息中纠正后的文字信息；将包含语音数据和纠正后的文字信息的语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示再次发送的语音消息。

在一个实施例中，计算机程序被处理器执行将语音消息发送至第二终端的步骤时，包括：将语音消息对应的元数据和文字信息发送至第二终端，其中，元数据包括语音消息标识与语音数据对应的时长。

在一个实施例中，计算机程序被处理器执行时还包括以下步骤：对文字信息中包含的词语与第二终端在即时通信聊天界面对应的用户名称进行匹配；若匹配成功，则对语音消息进行标记，和/或，发送提示消息至第二终端。

在一个实施例中，计算机程序被处理器执行将语音消息发送至第二终端的步骤时，包括：将文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，得到与词语匹配的用户名称；将文字信息中与用户名称匹配的词语替换成用户名称；将包含语音数据和替换成用户名称后的文字信息的语音消息发送至第二终端，以使第二终端在即时通信聊天界面中显示语音消息。

在一个实施例中，计算机程序被处理器执行时还包括以下步骤：对文字信息中包含的词语与即时通信聊天界面对应的群组中包含的应用名称进行匹配；若匹配成功，则发送应用提示消息至第二终端。

在一个实施例中，还提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：在即时通信聊天界面触发语音采集，采集语音数据；将语音数据转化成文字信息；根据语音数据和文字信息生成语音消息；发送语音消息。

在一个实施例中，计算机程序被处理器执行上述发送语音消息的步骤之后，还包括：通过即时通信聊天界面触发文字纠正请求；根据文字纠正请求进入文字纠正操作界面，通过文字纠正操作界面对消息中的文字信息进行纠正；根据语音数据和纠正后文字信息再次生成语音消息；发送再次生成的语音消息。

在一个实施例中，计算机程序被处理器执行上述发送再次生成的语音消息的步骤，包括：撤回纠正之前在即时通信聊天界面中显示的语音消息。

在一个实施例中，计算机程序被处理器执行上述根据语音数据和文字信息生成语音消息的步骤，包括：将文字信息中包含的词语与即时通信聊天界面对应的用户名称进行匹配，得到与词语匹配的用户名称；将文字信息中与用户名称匹配的词语替换成用户名称；根据语音数据和替换用户名称后的文字信息生成语音消息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory，rom)等非易失性存储介质，或随机存储记忆体(randomaccessmemory，ram)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：关华;李杨晶;钟伟杰;钟华健
技术所有人：深圳云之家网络有限公司
我是此专利的发明人

上一篇：一种与空气对流换热的多通道相变蓄能装置的制作方法
上一篇：一种带有折回管的螺旋管式相变储热器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。