基于云端服务器的实时语音识别纠错系统及识别纠错方法与流程

文档序号：11234523阅读：830来源：国知局

本发明涉及语音即时通信领域和云计算语音识别领域，尤其涉及一种基于云端服务器的实时语音识别纠错系统及识别纠错方法。

背景技术：

现阶段的即时通信形式主要有文本和语音，基于移动端的语音通信发展比较迅速，给人们的沟通带来了便利，但是单纯的语音通信有其弊端，有些时候人们不方便接听语音，同时回看信息时更加的不方便，所以语音通信需要新的升级，同时现在语音识别技术飞速的发展，将语音转换成文本的精度不断的提高，但是，语音识别还是有些错误，会影响用户体验。

技术实现要素：

本发明的目的：提供一种基于云端服务器的实时语音识别纠错系统及识别纠错方法，能在语音即时通信时进行语音识别和纠错，并根据文本纠错更新语音识别系统，有效改善用户的体验。

为了实现上述目的，本发明的技术方案是：

一种基于云端服务器的实时语音识别纠错系统，包括第一客户端、第二客户端、云端服务器、语音发送按钮、时长显示区域、文本编辑按钮、发送者文本文件显示区域、发送者头像显示区域、接收者文本文件显示区域及接收者头像显示区域；所述的第一客户端及第二客户端分别与所述的云端服务器双向连接，所述的语音发送按钮、时长显示区域分别设置在所述的第一客户端及第二客户端上；所述的文本编辑按钮、发送者文本文件显示区域及发送者头像显示区域分别设置在所述的第一客户端上，所述的接收者文本文件显示区域及接收者头像显示区域分别设置在所述的第二客户端上。

一种基于云端服务器的实时语音识别纠错系统的识别纠错方法，该方法至少包括如下步骤：

步骤1：点击语音发送按钮，第一客户端接受语音并记录为语音文件，松开语音发送按钮，第一客户端发送语音文件到云端服务器。

步骤2：云端服务器将语音文件解析为文本文件，云端服务器将文本文件发送到第一客户端，云端服务器将语音文件和文本文件发送到第二客户端。

步骤3：发送者检查文本文件有无错误，若文本文件有错误，点击文本编辑按钮并根据文本文件进行纠错，纠错后的文本文件会在发送者文本显示区域显示，并将纠错后的文本文件发送到云端服务器。

步骤4：云端服务器根据纠错后的文本文件更新语音识别系统，并将更新后的文本文件发送到第二客户端，完成一次通信。

步骤5：单击接收者文本文件显示区域，第二客户端播放语音文件，

上述的基于云端服务器的实时语音识别纠错系统的识别纠错方法，其中，在所述的步骤2中，所述的第一客户端的发送者文本文件显示区域显示云端服务器传回的文本文件，单击发送者文本文件显示区域，第一客户端自动播放语音文件，所述的第二客户端收到文本文件后，文本文件会在所述的接收者文本文件显示区域显示。

上述的基于云端服务器的实时语音识别纠错系统的识别纠错方法，其中，在所述的步骤3中，在发送纠错后的文本文件后，所述的文本编辑按钮自动隐藏。

上述的基于云端服务器的实时语音识别纠错系统的识别纠错方法，其中，在所述的步骤4中，第二客户端接收到纠错后的文本文件后，纠错后的文本文件会在接收者文本文件显示区域显示。

上述的基于云端服务器的实时语音识别纠错系统的识别纠错方法，其中，所述的第一客户端和第二客户端会识别语音文件的时长，并显示在时长显示区域。

本发明使语音通信更加便捷，发送语音可以直接生成文字，并且发送者可以修改文本，同时云端服务器可以进行纠错，提高语音识别效率。

附图说明

图1是本发明基于云端服务器的实时语音识别纠错系统及识别纠错方法的原理图。

具体实施方式

以下结合附图进一步说明本发明的实施例。

请参见附图1所示，一种基于云端服务器的实时语音识别纠错系统，包括第一客户端1、第二客户端2、云端服务器3、语音发送按钮4、时长显示区域5、文本编辑按钮6、接收者头像显示区域7、发送者文本文件显示区域8、发送者头像显示区域9、接收者文本文件显示区域10；所述的第一客户端1及第二客户端2分别与所述的云端服务器3双向连接，所述的语音发送按钮4、时长显示区域5分别设置在所述的第一客户端1及第二客户端2上；所述的文本编辑按钮6、发送者文本文件显示区域8及发送者头像显示区域9分别设置在所述的第一客户端1上，所述的接收者文本文件显示区域10及接收者头像显示区域7分别设置在所述的第二客户端2上。

一种基于云端服务器的实时语音识别纠错系统的识别纠错方法，该方法至少包括如下步骤：

步骤1：点击语音发送按钮4，第一客户端1接受语音并记录为语音文件，松开语音发送按钮4，第一客户端1发送语音文件到云端服务器3。

步骤2：云端服务器3将语音文件解析为文本文件，云端服务器3将文本文件发送到第一客户端1，云端服务器3将语音文件和文本文件发送到第二客户端2。

步骤3：发送者检查文本文件有无错误，若文本文件有错误，点击文本编辑按钮6并根据文本文件进行纠错，纠正后的文本文件会在发送者文本显示区域显示，并将纠错后的文本文件发送到云端服务器3。

步骤4：云端服务器3根据纠错后的文本文件更新语音识别系统，并将更新后的文本文件发送到第二客户端2，完成一次通信。

步骤5：单击接收者文本文件显示区域10，第二客户端2播放语音文件。

在所述的步骤2中，所述的第一客户端1的发送者文本文件显示区域8显示云端服务器3传回的文本文件，单击发送者文本文件显示区域8，第一客户端1自动播放语音文件，第二客户端2收到文本文件后，文本文件会在接收者文本文件显示区域10显示。

在所述的步骤3中，在发送纠错后的文本文件后，所述的文本编辑按钮6自动隐藏。当云端服务器3的语音识别率比较高的时候，用户可以在后台设置将文本编辑按钮6隐藏，这样显示界面会更加简洁，当需要修改时可以长按或者双击发送者文本文件显示区域8，进行文本的编辑。

在所述的步骤4中，第二客户端2接收到纠错后的文本文件后，纠错后的文本文件会在接收者文本文件显示区域10显示。所述的第一客户端1和第二客户端2会识别语音文件的时长，并显示在时长显示区域5。

同样的，第二客户端2也可以发送语音到第一客户端1，进行双向的即时通信。

当第一客户端1或者第二客户端2发出一条语音信息，并接到云端服务器3传来的文本文件后，第二客户端2或者第一客户端1会有相对应的一组信息显示，包括：发送头像显示区域9、发送者文本文件显示区域8、时长显示区域5、文本编辑按钮6。

当第一客户端1或者第二客户端2收到云端服务器3发送的语音文件和文本文件后，会有对相应的一组信息显示，包括：接收者头像显示区域7、接收者文本文件显示区域10、时长显示区域5。

在本发明中，第一客户端1和第二客户端2处于同一聊天环境中，第一客户端1可以发送语音文件，并对传回语音识别后的文本文件进行修改，也可以接收别的客户端发送的语音文件和文本文件。第二客户端2可以接收别的客户端发送的语音文件和文本文件，可以发送语音文件，并对传回语音识别后的文本文件进行修改。

云端服务器3主要是接收客户端发来的语音文件，并将语音文件识别为文本文件，将文本文件发送到发送者的客户端，将语音文件和文本文件发送到接收者的客户端，并接收修改后的文本文件，并对语音识别进行升级。

按住语音发送按钮4可以接收语音，松开后停止接收语音，并将语音文件发送到云端服务器3；时长显示区域5主要显示语音文件的时间，通过数字显示；接收者可以在接收者文本文件显示区域10看到传回的文本文件，当需要收听语音文件时，只需单击接收者文本文件显示区域10，即可播放语音文件。

综上所述，本发明使语音通信更加便捷，发送语音可以直接生成文字，并且发送者可以修改文本，同时云端服务器可以进行纠错，提高语音识别效率。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书内容所作的等效结构变换，或直接或间接运用附属在其他相关产品的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡巨鹏
技术所有人：胡巨鹏
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。