播放语速管理方法及装置的制造方法

文档序号:10727051阅读:297来源:国知局
播放语速管理方法及装置的制造方法
【专利摘要】本发明是关于一种播放语速管理方法及装置,其中,方法包括:获取待播放的TTS播放文本;判断所述TTS播放文本所属的目标领域;确定与所述目标领域对应目标播放语速;按照所述目标播放语速播放所述TTS播放文本。通过该技术方案,获取待播放的TTS播放文本,并根据TTS播放文本所属的目标领域为其确定对应的目标播放语速,从而按照目标播放语速播放TTS播放文本,这样,不同的领域采用不同的语速播放,可以有针对性的进行播放,而不是所有文本都采用一种语速播放,从而保证用户在任何场景下都可以听清楚播放文本播放的内容,提升用户的使用体验。
【专利说明】
播放语速管理方法及装置
技术领域
[0001 ]本发明涉及语音处理技术领域,尤其涉及一种播放语速管理方法及装置。
【背景技术】
[0002] TTS是Text To Speech的缩写,8卩"从文本到语音",是人机对话的一部分,让机器 能够说话。
[0003] 它是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网 络的设计,把文字智能地转化为自然语音流。TTS技术对文本文件进行实时转换,转换时间 之短可以秒计算。在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在 听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。
[0004] TTS是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转 换成自然语音输出。TTS不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文 档的可读性。现在的TTS应用包括语音驱动的邮件以及声音敏感系统,并常与声音识别程序 一起使用。

【发明内容】

[0005] 本发明实施例提供一种播放语速管理方法及装置,用以实现智能化地管理TTS语 音反馈的语速。
[0006] 根据本发明实施例的第一方面,提供一种播放语速管理方法,包括:
[0007] 获取待播放的TTS播放文本;
[0008] 判断所述TTS播放文本所属的目标领域;
[0009] 确定与所述目标领域对应目标播放语速;
[0010] 按照所述目标播放语速播放所述TTS播放文本。
[0011] 在该实施例中,获取待播放的TTS播放文本,并根据TTS播放文本所属的目标领域 为其确定对应的目标播放语速,从而按照目标播放语速播放TTS播放文本,这样,不同的领 域采用不同的语速播放,可以有针对性的进行播放,而不是所有文本都采用一种语速播放, 从而保证用户在任何场景下都可以听清楚播放文本播放的内容,提升用户的使用体验。
[0012] 例如,当用户驾驶汽车时,遇到有关【安全】的语音提示时,将使用【安全】领域的 TTS语速,较慢。
[0013] 当用户收听音乐,遇到【提醒】的语音提示时,将使用【提醒】领域的TTS语速,较快。
[0014] 当用户收到语音口播的【广告】语音提示时,将使用【广告】领域的TTS语速,特别 快。
[0015] 当用户收到【普通】操作语音提示时,将使用【普通】领域的默认TTS语速,标准速 度。
[0016] 在一个实施例中,所述判断所述TTS播放文本所属的目标领域,包括:
[0017] 获取所述TTS播放文本中包含的关键字标签;
[0018] 根据所述关键字标签,确定所述TTS播放文本所属的目标领域。
[0019] 在该实施例中,在每个TTS播放文本中,可以预设关键字标签,以表示该TTS播放文 本所属的领域,这样,方便根据关键字标签,确定TTS播放文本所属的领域。
[0020] 例如,一个TTS播放文本其属于安全领域,则可以为其预设关键字标签【安全】,从 而方便快速的确定TTS播放文本的领域。
[0021 ]在一个实施例中,所述确定与所述目标领域对应目标播放语速,包括:
[0022]根据预设的领域与预设的播放语速之间的对应关系,确定与所述目标领域对应目 标播放语速。
[0023]在该实施例中,用户或者厂商可以预设多个领域,以及每个领域对应的播放语速。 如设置领域包括【安全】、【提醒】、【广告】、【普通】等领域,其中,【安全】领域对应的语速为 120-180字每分钟,【普通】领域对应的语速为180-240字每分钟,【提醒】领域对应的语速为 240-300字每分钟,【广告】领域对应的语速为300-360字每分钟。这样,可以根据预设的领域 与预设的播放语速之间的对应关系,确定与目标领域对应目标播放语速。
[0024]在一个实施例中,所述方法还包括:
[0025]接收输入的设置命令;
[0026] 根据所述设置命令,设置预设的领域,以及与每个领域对应的播放语速。
[0027] 在该实施例中,用户或者厂商可以预设多个领域,以及每个领域对应的播放语速。 如设置领域包括【安全】、【提醒】、【广告】、【普通】等领域,其中,【安全】领域对应的语速为 120-180字每分钟,【普通】领域对应的语速为180-240字每分钟,【提醒】领域对应的语速为 240-300字每分钟,【广告】领域对应的语速为300-360字每分钟。
[0028]在一个实施例中,所述方法还包括:
[0029] 当接收到用户输入的语音命令时,确定与所述语音命令对应的待播放的TTS播放 文本。
[0030] 在该实施例中,可以根据用户输入的语音命令,确定应该反馈的TTS播放文本。从 而满足用户的播放需求。
[0031] 根据本发明实施例的第二方面,提供一种播放语速管理装置,包括:
[0032] 获取模块,用于获取待播放的TTS播放文本;
[0033]判断模块,用于判断所述TTS播放文本所属的目标领域;
[0034]第一确定模块,用于确定与所述目标领域对应目标播放语速;
[0035] 播放模块,用于按照所述目标播放语速播放所述TTS播放文本。
[0036] 在一个实施例中,所述判断模块包括:
[0037] 获取子模块,用于获取所述TTS播放文本中包含的关键字标签;
[0038] 领域确定子模块,用于根据所述关键字标签,确定所述TTS播放文本所属的目标领 域。
[0039] 在一个实施例中,所述第一确定模块包括:
[0040] 语速确定子模块,用于根据预设的领域与预设的播放语速之间的对应关系,确定 与所述目标领域对应目标播放语速。
[0041 ] 在一个实施例中,所述装置还包括:
[0042]接收模块,用于接收输入的设置命令;
[0043] 设置模块,用于根据所述设置命令,设置预设的领域,以及与每个领域对应的播放 语速。
[0044] 在一个实施例中,所述装置还包括:
[0045] 第二确定模块,用于当接收到用户输入的语音命令时,确定与所述语音命令对应 的待播放的TTS播放文本。
[0046] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本发明。
[0047] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0048] 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
【附图说明】
[0049] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。
[0050] 图1是根据一示例性实施例示出的一种播放语速管理方法的流程图。
[0051] 图2是根据一示例性实施例示出的一种播放语速管理方法中步骤S102的流程图。 [0052]图3是根据一示例性实施例示出的一种播放语速管理方法中步骤S103的流程图。 [0053]图4是根据一示例性实施例示出的另一种播放语速管理方法的流程图。
[0054]图5是根据一示例性实施例示出的另一种播放语速管理方法的流程图。
[0055] 图6是根据一示例性实施例示出的一种播放语速管理装置的框图。
[0056] 图7是根据一示例性实施例示出的一种播放语速管理装置中判断模块的框图。
[0057] 图8是根据一示例性实施例示出的一种播放语速管理装置中第一确定模块的框 图。
[0058]图9是根据一示例性实施例示出的又一种播放语速管理装置的框图。
[0059]图10是根据一示例性实施例示出的又一种播放语速管理装置的框图。
【具体实施方式】
[0060] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0061] 图1是根据一示例性实施例示出的一种播放语速管理方法的流程图。该播放语速 管理可应用于播放设备中,该播放设备可以是移动电话,计算机,数字广播终端,消息收发 设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理、车载播放器等任一具有 语音播放功能的设备。如图1所示,该方法包括步骤S101-S104:
[0062]在步骤S101中,获取待播放的TTS播放文本;
[0063]在步骤S102中,判断所述TTS播放文本所属的目标领域;
[0064]在步骤S103中,确定与所述目标领域对应目标播放语速;
[0065] 在步骤S104中,按照所述目标播放语速播放所述TTS播放文本。
[0066] 在该实施例中,获取待播放的TTS播放文本,并根据TTS播放文本所属的目标领域 为其确定对应的目标播放语速,从而按照目标播放语速播放TTS播放文本,这样,不同的领 域采用不同的语速播放,可以有针对性的进行播放,而不是所有文本都采用一种语速播放, 从而保证用户在任何场景下都可以听清楚播放文本播放的内容,提升用户的使用体验。
[0067] 例如,当用户驾驶汽车时,遇到有关【安全】的语音提示时,将使用【安全】领域的 TTS语速,较慢。
[0068] 当用户收听音乐,遇到【提醒】的语音提示时,将使用【提醒】领域的TTS语速,较快。
[0069] 当用户收到语音口播的【广告】语音提示时,将使用【广告】领域的TTS语速,特别 快。
[0070] 当用户收到【普通】操作语音提示时,将使用【普通】领域的默认TTS语速,标准速 度。
[0071] 图2是根据一示例性实施例示出的一种播放语速管理方法中步骤S102的流程图。 [0072] 如图2所示,在一个实施例中,上述步骤S102可以包括步骤S201-S202:
[0073]在步骤S201中,获取所述TTS播放文本中包含的关键字标签;
[0074]在步骤S202中,根据所述关键字标签,确定所述TTS播放文本所属的目标领域。
[0075] 在该实施例中,在每个TTS播放文本中,可以预设关键字标签,以表示该TTS播放文 本所属的领域,这样,方便根据关键字标签,确定TTS播放文本所属的领域。
[0076] 例如,一个TTS播放文本其属于安全领域,则可以为其预设关键字标签【安全】,从 而方便快速的确定TTS播放文本的领域。
[0077]图3是根据一示例性实施例示出的一种播放语速管理方法中步骤S103的流程图。 [0078] 如图3所示,在一个实施例中,上述步骤S103可以包括步骤S301:
[0079] 在步骤S301中,根据预设的领域与预设的播放语速之间的对应关系,确定与所述 目标领域对应目标播放语速。
[0080] 在该实施例中,用户或者厂商可以预设多个领域,以及每个领域对应的播放语速。 如设置领域包括【安全】、【提醒】、【广告】、【普通】等领域,其中,【安全】领域对应的语速为 120-180字每分钟,【普通】领域对应的语速为180-240字每分钟,【提醒】领域对应的语速为 240-300字每分钟,【广告】领域对应的语速为300-360字每分钟。这样,可以根据预设的领域 与预设的播放语速之间的对应关系,确定与目标领域对应目标播放语速。
[0081 ]图4是根据一示例性实施例示出的另一种播放语速管理方法的流程图。
[0082] 如图4所示,在一个实施例中,上述方法还包括步骤S401-S402:
[0083]在步骤S401中,接收输入的设置命令;
[0084]在步骤S402中,根据所述设置命令,设置预设的领域,以及与每个领域对应的播放 语速。
[0085] 在该实施例中,用户或者厂商可以预设多个领域,以及每个领域对应的播放语速。 例如,如表1所示,设置领域包括【安全】、【提醒】、【广告】、【普通】等领域,其中,【安全】领域 对应的语速为120-180字每分钟,【普通】领域对应的语速为180-240字每分钟,【提醒】领域 对应的语速为240-300字每分钟,【广告】领域对应的语速为300-360字每分钟。
[0086] 表 1
[0088]图5是根据一示例性实施例示出的另一种播放语速管理方法的流程图。
[0089]如图5所示,在一个实施例中,在步骤S101之前,上述方法还包括步骤S501:
[0090]在步骤S501中,当接收到用户输入的语音命令时,确定与所述语音命令对应的待 播放的TTS播放文本。
[0091] 在该实施例中,可以根据用户输入的语音命令,确定应该反馈的TTS播放文本。从 而满足用户的播放需求。
[0092] 下述为本发明装置实施例,可以用于执行本发明方法实施例。
[0093] 图6是根据一示例性实施例示出的一种播放语速管理装置的框图,该装置可以通 过软件、硬件或者两者的结合实现成为播放设备的部分或者全部。如图6所示,该播放语速 管理装置包括:
[0094]获取模块61,用于为获取待播放的TTS播放文本;
[0095] 判断模块62,用于为判断所述TTS播放文本所属的目标领域;
[0096] 第一确定模块63,用于为确定与所述目标领域对应目标播放语速;
[0097]播放模块64,用于为按照所述目标播放语速播放所述TTS播放文本。
[0098] 在该实施例中,获取待播放的TTS播放文本,并根据TTS播放文本所属的目标领域 为其确定对应的目标播放语速,从而按照目标播放语速播放TTS播放文本,这样,不同的领 域采用不同的语速播放,可以有针对性的进行播放,而不是所有文本都采用一种语速播放, 从而保证用户在任何场景下都可以听清楚播放文本播放的内容,提升用户的使用体验。
[0099] 例如,当用户驾驶汽车时,遇到有关【安全】的语音提示时,将使用【安全】领域的 TTS语速,较慢。
[0100] 当用户收听音乐,遇到【提醒】的语音提示时,将使用【提醒】领域的TTS语速,较快。
[0101] 当用户收到语音口播的【广告】语音提示时,将使用【广告】领域的TTS语速,特别 快。
[0102] 当用户收到【普通】操作语音提示时,将使用【普通】领域的默认TTS语速,标准速 度。
[0103] 图7是根据一示例性实施例示出的一种播放语速管理装置中判断模块的框图。
[0104] 如图7所示,在一个实施例中,所述判断模块62包括:
[0105] 获取子模块71,用于获取所述TTS播放文本中包含的关键字标签;
[0106] 领域确定子模块72,用于根据所述关键字标签,确定所述TTS播放文本所属的目标 领域。
[0107] 在该实施例中,在每个TTS播放文本中,可以预设关键字标签,以表示该TTS播放文 本所属的领域,这样,方便根据关键字标签,确定TTS播放文本所属的领域。
[0108] 例如,一个TTS播放文本其属于安全领域,则可以为其预设关键字标签【安全】,从 而方便快速的确定TTS播放文本的领域。
[0109] 图8是根据一示例性实施例示出的一种播放语速管理装置中第一确定模块的框 图。
[0110] 如图8所示,在一个实施例中,所述第一确定模块63包括:
[0111] 语速确定子模块81,用于根据预设的领域与预设的播放语速之间的对应关系,确 定与所述目标领域对应目标播放语速。
[0112] 在该实施例中,用户或者厂商可以预设多个领域,以及每个领域对应的播放语速。 如设置领域包括【安全】、【提醒】、【广告】、【普通】等领域,其中,【安全】领域对应的语速为 120-180字每分钟,【普通】领域对应的语速为180-240字每分钟,【提醒】领域对应的语速为 240-300字每分钟,【广告】领域对应的语速为300-360字每分钟。这样,可以根据预设的领域 与预设的播放语速之间的对应关系,确定与目标领域对应目标播放语速。
[0113] 图9是根据一示例性实施例示出的又一种播放语速管理装置的框图。
[0114] 如图9所示,在一个实施例中,上述装置还包括:
[0115] 接收模块91,用于接收输入的设置命令;
[0116] 设置模块92,用于根据所述设置命令,设置预设的领域,以及与每个领域对应的播 放语速。
[0117] 在该实施例中,用户或者厂商可以预设多个领域,以及每个领域对应的播放语速。 如设置领域包括【安全】、【提醒】、【广告】、【普通】等领域,其中,【安全】领域对应的语速为 120-180字每分钟,【普通】领域对应的语速为180-240字每分钟,【提醒】领域对应的语速为 240-300字每分钟,【广告】领域对应的语速为300-360字每分钟。
[0118] 图10是根据一示例性实施例示出的又一种播放语速管理装置的框图。
[0119] 如图10所示,在一个实施例中,上述装置还包括:
[0120]第二确定模块1001,用于当接收到用户输入的语音命令时,确定与所述语音命令 对应的待播放的TTS播放文本。
[0121] 在该实施例中,可以根据用户输入的语音命令,确定应该反馈的TTS播放文本。从 而满足用户的播放需求。
[0122] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形 式。
[0123] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序 指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产 生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实 现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0124] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0125] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。
[0126] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1. 一种播放语速管理方法,其特征在于,包括: 获取待播放的TTS播放文本; 判断所述TTS播放文本所属的目标领域; 确定与所述目标领域对应目标播放语速; 按照所述目标播放语速播放所述TTS播放文本。2. 根据权利要求1所述的方法,其特征在于,所述判断所述TTS播放文本所属的目标领 域,包括: 获取所述TTS播放文本中包含的关键字标签; 根据所述关键字标签,确定所述TTS播放文本所属的目标领域。3. 根据权利要求1所述的方法,其特征在于,所述确定与所述目标领域对应目标播放语 速,包括: 根据预设的领域与预设的播放语速之间的对应关系,确定与所述目标领域对应目标播 放语速。4. 根据权利要求3所述的方法,其特征在于,所述方法还包括: 接收输入的设置命令; 根据所述设置命令,设置预设的领域,以及与每个领域对应的播放语速。5. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 当接收到用户输入的语音命令时,确定与所述语音命令对应的待播放的TTS播放文本。6. -种播放语速管理装置,其特征在于,包括: 获取模块,用于获取待播放的TTS播放文本; 判断模块,用于判断所述TTS播放文本所属的目标领域; 第一确定模块,用于确定与所述目标领域对应目标播放语速; 播放模块,用于按照所述目标播放语速播放所述TTS播放文本。7. 根据权利要求6所述的装置,其特征在于,所述判断模块包括: 获取子模块,用于获取所述TTS播放文本中包含的关键字标签; 领域确定子模块,用于根据所述关键字标签,确定所述TTS播放文本所属的目标领域。8. 根据权利要求6所述的装置,其特征在于,所述第一确定模块包括: 语速确定子模块,用于根据预设的领域与预设的播放语速之间的对应关系,确定与所 述目标领域对应目标播放语速。9. 根据权利要求8所述的装置,其特征在于,所述装置还包括: 接收模块,用于接收输入的设置命令; 设置模块,用于根据所述设置命令,设置预设的领域,以及与每个领域对应的播放语 速。10. 根据权利要求6所述的装置,其特征在于,所述装置还包括: 第二确定模块,用于当接收到用户输入的语音命令时,确定与所述语音命令对应的待 播放的TTS播放文本。
【文档编号】G10L13/033GK106098057SQ201610412991
【公开日】2016年11月9日
【申请日】2016年6月13日 公开号201610412991.3, CN 106098057 A, CN 106098057A, CN 201610412991, CN-A-106098057, CN106098057 A, CN106098057A, CN201610412991, CN201610412991.3
【发明人】周海
【申请人】北京云知声信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1