一种自适应智能语音装置及方法

文档序号：2825476阅读：193来源：国知局

一种自适应智能语音装置及方法
【专利摘要】本发明提供了一种自适应智能语音装置及方法，其中所述装置包括语音识别模块、识别结果处理模块、语音播报模块以及播报语音参数生成模块，该播报语音参数生成模块，用于从所述语音识别模块获取提取的语音参数，并根据该提取的语音参数以及预设策略生成播报语音参数，并将该播报语音参数输入至所述语音播报模块，本发明使得播报语音更加匹配用户语音。
【专利说明】一种自适应智能语音装置及方法
【技术领域】
[0001]本发明涉及智能语音领域，尤其涉及一种自适应智能语音装置及方法。
【背景技术】
[0002]随着移动通信技术和手机制造技术的发展，相对于功能简单的功能机，智能手机以较高的性能、支持多种业务以及不断下降的成本受到越来越多的消费者的青睐。
[0003]随着智能手机硬件性能的提高和操作系统功能的强大，越来越多的智能应用能够得以实现，其中包括智能语音业务。相对于传统的手动式人机交互，智能语音由于其更人性化和便捷性的交互方式受到越来越多用户的喜爱，并且在apple和android等智能手机平台上都相继出现了诸如siri等一系列智能语音应用程序。
[0004]现有的智能语音应用主要包括三个功能模块:语音识别模块、识别结果处理模块以及语音播报模块:
[0005]其中，语音识别模块，用于提取表征人类语音的参数，根据该语音参数将人类语音中的词汇内容转换为机器语言文件，如二级制代码文件等，并将该机器语言文件发送至识别结果处理模块；表征人类语音的参数主要包括共振峰(频率、带宽、幅度)和基音频率等。
[0006]识别结果处理模块，用于根据机器语言文件执行相应的操作，并将操作结果发送至语音播报模块；如接收到的机器语言文件表示的词汇内容为“我在哪里”，识别结果处理模块会从定位模块中获取用户当前的位置，并将该位置信息发送至语音播报模块；
[0007]语音播报模块，用于结合播报语音参数将识别结果处理模块发送的操作结果转换为音频文件进行播报。
[0008]现有技术中，播报语音参数要么是给出选项让用户自己选择确定的，要么是在产品出厂时固化在语音播报模块中的。针对前者，由于用户的差异，不同用户在使用时可能需要重新设置语音播报语音参数的数值，给用户带来了使用上的复杂性和繁琐性；对于后者，由于对所有用户均采用相同的语音进行播报，从而造成了用户体验上的单一和枯燥。

【发明内容】

[0009]本发明提供了一种自适应地智能语音装置及方法，以解决如何使播报语音更加匹配用户语音的技术问题。
[0010]为解决上述技术问题，本发明提供了一种自适应智能语音装置，所述装置包括语音识别模块、识别结果处理模块以及语音播报模块，所述装置还包括播报语音参数生成模块，
[0011]所述播报语音参数生成模块，用于从所述语音识别模块获取提取的语音参数，并根据该提取的语音参数以及预设策略生成播报语音参数，并将该播报语音参数输入至所述语音播报模块。
[0012]进一步地，
[0013]所述播报语音参数生成模块，用于在接收到特定的触发信号后或在所述装置上电时，从所述语音识别模块获取提取的语音参数。
[0014]进一步地，
[0015]所述预设策略包含了所述提取的语音参数与所述播报语音参数的对应关系。
[0016]进一步地，
[0017]所述播报语音参数生成模块，用于根据该提取的语音参数以及预设策略生成播报语音参数进一步包括:
[0018]所述播报语音参数生成模块，用于获得提取的语音参数的数值，通过所述预设策略确定与所述提取的语音参数的数值对应的播报语音参数的数值。
[0019]为解决上述技术问题，本发明还提供了一种自适应智能语音方法，所述方法包括:
[0020]通过语音识别从声音中提取语音参数后，根据提取的语音参数以及预设策略生成播报语音参数；
[0021]以该播报语音参数生成播报语音。
[0022]进一步地，
[0023]当接收到特定的触发信号后或上电时根据提取的语音参数以及预设策略生成播报语音参数。
[0024]进一步地，
[0025]所述预设策略包含了所述提取的语音参数与所述播报语音参数的对应关系。
[0026]进一步地，根据提取的语音参数以及预设策略生成播报语音参数包括:
[0027]获得提取的语音参数的数值，通过所述预设策略确定与所述提取的语音参数的数值对应的播报语音参数的数值。
[0028]上述技术方案通过预设策略建立了播报语音参数与用户输入语音参数的联系，避免了播报语音参数不考虑用户语音特征而采用固定数据造成的不足；另外上述技术方案生成播报语音参数的动作不需要人工参与，给用户带来了使用上的便利。
【专利附图】

【附图说明】
[0029]图1为本实施例的自适应智能语音装置模块图；
[0030]图2为本实施例的自适应智能语首方法流程图。
【具体实施方式】
[0031]为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。
[0032]图1为本实施例的自适应智能语音装置模块图。
[0033]该装置模块包括语音识别模块、识别结果处理模块、语音播报模块以及播报语音参数生成模块，其中语音识别模块、识别结果处理模块、语音播报模块同现有技术，播报语音参数生成模块为本实施例相对于现有技术新增的一个功能模块；
[0034]播报语音参数生成模块，用于从所述语音识别模块获取提取的语音参数，并根据该提取的语音参数以及预设策略生成播报语音参数，并将该播报语音参数输入至所述语音播报模块；
[0035]所述预设策略给出了一种输入参数与输出参数的对应关系，其中输入参数为提取的语音参数，输出参数为播报语音参数；该对应关系可以为简单的数值对应关系，也可以为复杂的算法运算；
[0036]播报语音参数生成模块在获得提取的语音参数的数值后，通过该预设策略确定与提取的语音参数的数值对应的播报语音参数的数值，进而得到播报语音参数；
[0037]所述预设策略可以为:当输入的提取的语音参数表征的是男性声音时，输出的播报语音参数表征为女性声音；
[0038]当输入的提取的语音参数表征的是童声时，输出的播报语音参数表征为童声；
[0039]输出的播报语音参数表征的声音速度与输入的提取的语音参数表征的声音速度处于相同的等级；
[0040]输出的播报语音参数表征的声音响度与输入的提取的语音参数表征的声音响度处于相同等级；
[0041]该播报语音参数生成模块可以在接收到特定的触发信号后(如接收到来自用户的开启自适应智能语音指示信号)或在所述装置上电时，从所述语音识别模块获取提取的
语音参数。
[0042]上述实施例通过在现有的智能语音装置中设置播报语音参数生成模块，使得播报语音时采用的语音参数考虑了用户输入的语音参数，实现了根据差异化的用户声音特征自适应地改变播报声音的效果，相对现有技术，既减少了不同用户频繁对语音播报进行设置的复杂性，也提高了语音播报的灵活性和生动性，能够极大提高用户人机交互体验的舒适度。
[0043]图2为本实施例的自适应智能语首方法流程图。
[0044]S201通过语音识别从声音中提取语音参数；
[0045]S202根据提取的语音参数以及预设策略生成播报语音参数；
[0046]可以在接收到特定的触发信号后(如接收到来自用户的开启自适应智能语音指示信号)或上电时根据提取的语音参数以及预设策略生成播报语音参数；
[0047]所述预设策略包含了所述提取的语音参数与所述播报语音参数的对应关系:其中输入参数为提取的语音参数，输出参数为播报语音参数；该对应关系可以为简单的数值对应关系，也可以为复杂的算法运算；
[0048]在获得提取的语音参数的数值后，通过该预设策略确定与提取的语音参数的数值对应的播报语音参数的数值，进而得到播报语音参数；
[0049]所述预设策略可以为:当输入的提取的语音参数表征的是男性声音时，输出的播报语音参数表征为女性声音；
[0050]当输入的提取的语音参数表征的是童声时，输出的播报语音参数表征为童声；
[0051]输出的播报语音参数表征的声音速度与输入的提取的语音参数表征的声音速度处于相同的等级；
[0052]输出的播报语音参数表征的声音响度与输入的提取的语音参数表征的声音响度处于相同等级；
[0053]S203以该播报语音参数生成播报语音。[0054]本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现，相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
[0055]需要说明的是，本发明还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
【权利要求】
1.一种自适应智能语音装置，所述装置包括语音识别模块、识别结果处理模块以及语音播报模块，其特征在于，所述装置还包括播报语音参数生成模块，所述播报语音参数生成模块，用于从所述语音识别模块获取提取的语音参数，并根据该提取的语音参数以及预设策略生成播报语音参数，并将该播报语音参数输入至所述语音播报模块。
2.如权利要求1所述的装置，其特征在于，所述装置进一步包括: 所述播报语音参数生成模块，用于在接收到特定的触发信号后或在所述装置上电时，从所述语音识别模块获取提取的语音参数。
3.如权利要求1或2所述的装置，其特征在于，所述预设策略包含了所述提取的语音参数与所述播报语音参数的对应关系。
4.如权利要求3所述的装置，其特征在于，所述播报语音参数生成模块，用于根据该提取的语音参数以及预设策略生成播报语音参数进一步包括: 所述播报语音参数生成模块，用于获得提取的语音参数的数值，通过所述预设策略确定与所述提取的语音参数的数值对应的播报语音参数的数值。
5.一种自适应智能语音方法，其特征在于，所述方法包括: 通过语音识别从声音中提取语音参数后，根据提取的语音参数以及预设策略生成播报语音参数；以该播报语音参数生成播报语音。
6.如权利要求5所述的方法，其特征在于，所述方法进一步包括: 当接收到特定的触发信号后或上电时根据提取的语音参数以及预设策略生成播报语音参数。
7.如权利要求5或6所述的方法，其特征在于，所述预设策略包含了所述提取的语音参数与所述播报语音参数的对应关系。
8.如权利要求7所述的方法，其特征在于，所述根据提取的语音参数以及预设策略生成播报语音参数进一步包括: 获得提取的语音参数的数值，通过所述预设策略确定与所述提取的语音参数的数值对应的播报语音参数的数值。
【文档编号】G10L15/26GK103730117SQ201210385273
【公开日】2014年4月16日申请日期:2012年10月12日优先权日:2012年10月12日
【发明者】李向阳申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李向阳
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：语音质量评估的方法和装置制造方法
上一篇：语音信号采集方法和移动终端的制作方法