语音处理方法及装置与流程

文档序号:12376808阅读:156来源:国知局
语音处理方法及装置与流程

本发明涉及语音处理技术领域,尤其涉及一种语音处理方法及装置。



背景技术:

在相关的语音处理技术中,客户端给服务器发送语音过程中,每次发送http请求都必须等待服务器返回http请求,才能发送下一条语音,出现网络波动或者不好的时候,等待过程可能很长,这样就导致整体过程非常慢。用户需要等待的时间很久,用户体验不佳。



技术实现要素:

本发明实施例提供一种语音处理方法及装置,用以实现快速处理接收到的语音信息,从而减少用户的等待时间,提升用户的使用体验。

根据本发明实施例的第一方面,提供一种语音处理方法,包括:

当检测到所述终端设备满足预设条件时,发送语音上传请求数据包至服务器,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

获取用户输入的语音内容,并按照预设时间间隔上传语音信息数据包至所述服务器,其中,每次发送的语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

当检测到上传完用户本次输入的所有语音内容后,发送上传结束请求数据包至所述服务器,其中,所述上传结束请求数据包中包括所述语音身份标识和所述终端设备按顺序分配的第三请求序列号;

接收所述服务器根据接收到的数据包返回的处理结果。

在该实施例中,一次语音上传请求可分为三个过程,首先,发送语音上传请求数据包至服务器,然后获取用户输入的语音内容,并且每隔预设时间间隔上传一次语音内容,如每隔300毫秒发送一次语音内容至服务器。这样,服务器可以边接收终端设备发送的数据包边进行处理,在终端设备发送完本次语音输入对应的所有语音内容之后,会发送上传结束请求数据包至服务器,从而方便服务器获知语音上传结束的状态,在服务器处理完本次语音的所有数据包之后,反馈处理结果给终端设备。这样,由终端设备并行上传数据包,并不需要等待服务器返回一条语音的处理结果后再发送下一条语音,而服务器也可以边接收边处理,处理速度更快,减少了用户的等待时间,提升了用户的使用体验。

在一个实施例中,所述预设条件包括:

所述终端设备的语音上传功能被唤醒或者所述终端设备检测到有语音输入。

在该实施例中,可以在终端设备的语音上传功能被唤醒或者所述终端设备检测到有语音输入,发送语音上传请求数据包至服务器,从而告知服务器即将上传语音信息数据包。

在一个实施例中,所述终端设备信息至少包括:终端设备的标识信息。

在该实施例中,终端设备信息至少包括终端设备的标识信息,即终端设备ID,这样,服务器在收到语音信息,并进行处理后,可以根据终端设备ID,为其返回处理结果。当然,终端涉笔信息处理包括终端设备的标识信息外,还可以包括一些配置参数,如用户选择的语音领域等。

根据本发明实施例的第二方面,提供一种语音处理方法,用于服务器,包括:

接收终端设备发送的语音上传请求数据包,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

接收所述终端设备在发送所述语音上传请求数据包之后,按照预设时间间隔上传的语音信息数据包,其中,每个语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

接收所述终端设备在上传完用户本次输入的所有语音内容后,发送的上传结束请求数据包其中,所述上传结束请求数据包中包括所述语音身份标识和所述终端设备按顺序分配的第三请求序列号;

按照接收到的各个数据包中包含的所述语音身份标识和请求序列号,顺序处理各个数据包;

当检测到所有包含所述语音身份标识的数据包均处理结束后,根据所述终端设备信息发送处理结果至所述终端设备。

在该实施例中,一次语音上传请求可分为三个过程,首先,发送语音上传请求数据包至服务器,然后获取用户输入的语音内容,并且每隔预设时间间隔上传一次语音内容,如每隔300毫秒发送一次语音内容至服务器。这样,服务器可以边接收终端设备发送的数据包边进行处理,在终端设备发送完本次语音输入对应的所有语音内容之后,会发送上传结束请求数据包至服务器,从而方便服务器获知语音上传结束的状态,在服务器处理完本次语音的所有数据包之后,反馈处理结果给终端设备。这样,由终端设备并行上传数据包,并不需要等待服务器返回一条语音的处理结果后再发送下一条语音,而服务器也可以边接收边处理,处理速度更快,减少了用户的等待时间,提升了用户的使用体验。

在一个实施例中,所述终端设备信息至少包括:终端设备的标识信息。

在该实施例中,终端设备信息至少包括终端设备的标识信息,即终端设备ID,这样,服务器在收到语音信息,并进行处理后,可以根据终端设备ID,为其返回处理结果。当然,终端涉笔信息处理包括终端设备的标识信息外,还可以包括一些配置参数,如用户选择的语音领域等。

根据本发明实施例的第三方面,提供一种语音处理装置,用于终端设备,包括:

第一发送模块,用于当检测到所述终端设备满足预设条件时,发送语音上传请求数据包至服务器,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

第二发送模块,用于获取用户输入的语音内容,并按照预设时间间隔上传语音信息数据包至所述服务器,其中,每次发送的语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

第三发送模块,用于当检测到上传完用户本次输入的所有语音内容后,发送上传结束请求数据包至所述服务器,其中,所述上传结束请求数据包中包括所述语音身份标识和所述终端设备按顺序分配的第三请求序列号;

接收模块,用于接收所述服务器根据接收到的数据包返回的处理结果。

在一个实施例中,所述预设条件包括:

所述终端设备的语音上传功能被唤醒或者所述终端设备检测到有语音输入。

在一个实施例中,所述终端设备信息至少包括:终端设备的标识信息。

根据本发明实施例的第四方面,提供一种语音处理装置,用于服务器,包括:

第一接收模块,用于接收终端设备发送的语音上传请求数据包,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

第二接收模块,用于接收所述终端设备在发送所述语音上传请求数据包之后,按照预设时间间隔上传的语音信息数据包,其中,每个语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

第三接收模块,用于接收所述终端设备在上传完用户本次输入的所有语音内容后,发送的上传结束请求数据包其中,所述上传结束请求数据包中包括所述语音身份标识和所述终端设备按顺序分配的第三请求序列号;

处理模块,用于按照接收到的各个数据包中包含的所述语音身份标识和请求序列号,顺序处理各个数据包;

发送模块,用于当检测到所有包含所述语音身份标识的数据包均处理结束后,根据所述终端设备信息发送处理结果至所述终端设备。

在一个实施例中,所述终端设备信息至少包括:终端设备的标识信息。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音处理方法的流程图。

图2是根据一示例性实施例示出的一种语音处理方法的流程图。

图3是根据一示例性实施例示出的一种语音处理装置的框图。

图4是根据一示例性实施例示出的一种语音处理装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种语音处理方法的流程图。该语音处理方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括步骤S101-S104:

在步骤S101中,当检测到所述终端设备满足预设条件时,发送语音上传请求数据包至服务器,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

其中,终端设备按照顺序分配请求序列号,同一条语音信息,对应的语言身份标识相同,而终端设备上传语音信息时,会为不同时间上传的数据包分配不同的序列号。在语音上传请求数据包中,不包含语音内容。

在步骤S102中,获取用户输入的语音内容,并按照预设时间间隔上传语音信息数据包至所述服务器,其中,每次发送的语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

在发送了语音上传请求数据包之后,终端设备获取用户输入的语音内容,并按照预设时间间隔上传语音信息数据包至服务器中,其中,语音信息数据包中也包含语音身份标识,同时,对于每个语音信息数据包,终端设备都会按顺序为其分配第二请求序列号。如预设时间间隔为300毫秒,则,终端每隔300毫秒发送一次语音信息数据包,每次发送的语音信息数据包的请求序列号逐个递增,例如,在发送语音上传请求数据包时,为其分配的请求序列号为1,则在发送第一个语音信息数据包时,为分配的请求序列号为2,在发送第二个语音信息数据包时,为其分配的请求序列号为3……以此类推,直到最后一个上传结束请求数据包。

在步骤S103中,当检测到上传完用户本次输入的所有语音内容后,发送上传结束请求数据包至服务器,其中,上传结束请求数据包中包括语音身份标识和终端设备按顺序分配的第三请求序列号;

在步骤S104中,接收服务器根据接收到的数据包返回的处理结果。

在该实施例中,一次语音上传请求可分为三个过程,首先,发送语音上传请求数据包至服务器,然后获取用户输入的语音内容,并且每隔预设时间间隔上传一次语音内容,如每隔300毫秒发送一次语音内容至服务器。这样,服务器可以边接收终端设备发送的数据包边进行处理,在终端设备发送完本次语音输入对应的所有语音内容之后,会发送上传结束请求数据包至服务器,从而方便服务器获知语音上传结束的状态,在服务器处理完本次语音的所有数据包之后,反馈处理结果给终端设备。这样,由终端设备并行上传数据包,并不需要等待服务器返回一条语音的处理结果后再发送下一条语音,而服务器也可以边接收边处理,处理速度更快,减少了用户的等待时间,提升了用户的使用体验。

在一个实施例中,预设条件包括:

终端设备的语音上传功能被唤醒或者终端设备检测到有语音输入。

在该实施例中,可以在终端设备的语音上传功能被唤醒或者终端设备检测到有语音输入,发送语音上传请求数据包至服务器,从而告知服务器即将上传语音信息数据包。

在一个实施例中,终端设备信息至少包括:终端设备的标识信息。

在该实施例中,终端设备信息至少包括终端设备的标识信息,即终端设备ID,这样,服务器在收到语音信息,并进行处理后,可以根据终端设备ID,为其返回处理结果。当然,终端涉笔信息处理包括终端设备的标识信息外,还可以包括一些配置参数,如用户选择的语音领域等。

图2是根据一示例性实施例示出的一种语音处理方法的流程图。该语音处理方法应用于服务器中。如图2所示,该方法包括步骤S201-S205:

在步骤S201中,接收终端设备发送的语音上传请求数据包,其中,语音上传请求数据包中包括终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

在步骤S202中,接收终端设备在发送语音上传请求数据包之后,按照预设时间间隔上传的语音信息数据包,其中,每个语音信息数据包中包括预设时间间隔对应的预设时间段内获取到的语音内容,语音身份标识和终端设备按顺序分配的第二请求序列号;

在步骤S203中,接收终端设备在上传完用户本次输入的所有语音内容后,发送的上传结束请求数据包其中,上传结束请求数据包中包括语音身份标识和终端设备按顺序分配的第三请求序列号;

在步骤S204中,按照接收到的各个数据包中包含的语音身份标识和请求序列号,顺序处理各个数据包;

服务器接收开始、传语音、结束的数据包。根据语音身份标识和请求序列号,顺序处理一个请求的各个数据包。如果先收到后面的数据包,则不做处理,等待前面的数据包。如果顺序收到数据包,则边接收边处理,直至结束,释放该请求的资源。一个请求的所有数据包处理结束后,向终端发送反馈。

在步骤S205中,当检测到所有包含语音身份标识的数据包均处理结束后,根据终端设备信息发送处理结果至终端设备。

在该实施例中,一次语音上传请求可分为三个过程,首先,发送语音上传请求数据包至服务器,然后获取用户输入的语音内容,并且每隔预设时间间隔上传一次语音内容,如每隔300毫秒发送一次语音内容至服务器。这样,服务器可以边接收终端设备发送的数据包边进行处理,在终端设备发送完本次语音输入对应的所有语音内容之后,会发送上传结束请求数据包至服务器,从而方便服务器获知语音上传结束的状态,在服务器处理完本次语音的所有数据包之后,反馈处理结果给终端设备。这样,由终端设备并行上传数据包,并不需要等待服务器返回一条语音的处理结果后再发送下一条语音,而服务器也可以边接收边处理,处理速度更快,减少了用户的等待时间,提升了用户的使用体验。

在一个实施例中,终端设备信息至少包括:终端设备的标识信息。

在该实施例中,终端设备信息至少包括终端设备的标识信息,即终端设备ID,这样,服务器在收到语音信息,并进行处理后,可以根据终端设备ID,为其返回处理结果。当然,终端涉笔信息处理包括终端设备的标识信息外,还可以包括一些配置参数,如用户选择的语音领域等。

下述为本发明装置实施例,可以用于执行本发明方法实施例。

图3是根据一示例性实施例示出的一种语音处理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图3所示,该语音处理装置包括:

第一发送模块31,用于当检测到所述终端设备满足预设条件时,发送语音上传请求数据包至服务器,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

第二发送模块32,用于获取用户输入的语音内容,并按照预设时间间隔上传语音信息数据包至所述服务器,其中,每次发送的语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

在发送了语音上传请求数据包之后,终端设备获取用户输入的语音内容,并按照预设时间间隔上传语音信息数据包至服务器中,其中,语音信息数据包中也包含语音身份标识,同时,对于每个语音信息数据包,终端设备都会按顺序为其分配第二请求序列号。如预设时间间隔为300毫秒,则,终端每隔300毫秒发送一次语音信息数据包,每次发送的语音信息数据包的请求序列号逐个递增,例如,在发送语音上传请求数据包时,为其分配的请求序列号为1,则在发送第一个语音信息数据包时,为分配的请求序列号为2,在发送第二个语音信息数据包时,为其分配的请求序列号为3……以此类推,直到最后一个上传结束请求数据包。

第三发送模块33,用于当检测到上传完用户本次输入的所有语音内容后,发送上传结束请求数据包至所述服务器,其中,所述上传结束请求数据包中包括所述语音身份标识和所述终端设备按顺序分配的第三请求序列号;

接收模块34,用于接收所述服务器根据接收到的数据包返回的处理结果。

在该实施例中,一次语音上传请求可分为三个过程,首先,发送语音上传请求数据包至服务器,然后获取用户输入的语音内容,并且每隔预设时间间隔上传一次语音内容,如每隔300毫秒发送一次语音内容至服务器。这样,服务器可以边接收终端设备发送的数据包边进行处理,在终端设备发送完本次语音输入对应的所有语音内容之后,会发送上传结束请求数据包至服务器,从而方便服务器获知语音上传结束的状态,在服务器处理完本次语音的所有数据包之后,反馈处理结果给终端设备。这样,由终端设备并行上传数据包,并不需要等待服务器返回一条语音的处理结果后再发送下一条语音,而服务器也可以边接收边处理,处理速度更快,减少了用户的等待时间,提升了用户的使用体验。

在一个实施例中,所述预设条件包括:

所述终端设备的语音上传功能被唤醒或者所述终端设备检测到有语音输入。

在该实施例中,可以在终端设备的语音上传功能被唤醒或者所述终端设备检测到有语音输入,发送语音上传请求数据包至服务器,从而告知服务器即将上传语音信息数据包。

在一个实施例中,所述终端设备信息至少包括:终端设备的标识信息。

在该实施例中,终端设备信息至少包括终端设备的标识信息,即终端设备ID,这样,服务器在收到语音信息,并进行处理后,可以根据终端设备ID,为其返回处理结果。当然,终端涉笔信息处理包括终端设备的标识信息外,还可以包括一些配置参数,如用户选择的语音领域等。

图4是根据一示例性实施例示出的一种语音处理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。如图4所示,该语音处理装置包括:

第一接收模块41,用于接收终端设备发送的语音上传请求数据包,其中,所述语音上传请求数据包中包括所述终端设备为本次请求分配的语音身份标识和第一请求序列号,以及终端设备信息;

第二接收模块42,用于接收所述终端设备在发送所述语音上传请求数据包之后,按照预设时间间隔上传的语音信息数据包,其中,每个语音信息数据包中包括所述预设时间间隔对应的预设时间段内获取到的语音内容,所述语音身份标识和所述终端设备按顺序分配的第二请求序列号;

第三接收模块43,用于接收所述终端设备在上传完用户本次输入的所有语音内容后,发送的上传结束请求数据包其中,所述上传结束请求数据包中包括所述语音身份标识和所述终端设备按顺序分配的第三请求序列号;

处理模块44,用于按照接收到的各个数据包中包含的所述语音身份标识和请求序列号,顺序处理各个数据包;

服务器接收开始、传语音、结束的数据包。根据语音身份标识和请求序列号,顺序处理一个请求的各个数据包。如果先收到后面的数据包,则不做处理,等待前面的数据包。如果顺序收到数据包,则边接收边处理,直至结束,释放该请求的资源。一个请求的所有数据包处理结束后,向终端发送反馈。

发送模块45,用于当检测到所有包含所述语音身份标识的数据包均处理结束后,根据所述终端设备信息发送处理结果至所述终端设备。

在该实施例中,一次语音上传请求可分为三个过程,首先,发送语音上传请求数据包至服务器,然后获取用户输入的语音内容,并且每隔预设时间间隔上传一次语音内容,如每隔300毫秒发送一次语音内容至服务器。这样,服务器可以边接收终端设备发送的数据包边进行处理,在终端设备发送完本次语音输入对应的所有语音内容之后,会发送上传结束请求数据包至服务器,从而方便服务器获知语音上传结束的状态,在服务器处理完本次语音的所有数据包之后,反馈处理结果给终端设备。这样,由终端设备并行上传数据包,并不需要等待服务器返回一条语音的处理结果后再发送下一条语音,而服务器也可以边接收边处理,处理速度更快,减少了用户的等待时间,提升了用户的使用体验。

在一个实施例中,所述终端设备信息至少包括:终端设备的标识信息。

在该实施例中,终端设备信息至少包括终端设备的标识信息,即终端设备ID,这样,服务器在收到语音信息,并进行处理后,可以根据终端设备ID,为其返回处理结果。当然,终端涉笔信息处理包括终端设备的标识信息外,还可以包括一些配置参数,如用户选择的语音领域等。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1