语音识别方法及装置的制造方法

文档序号：9930278阅读：474来源：国知局

语音识别方法及装置的制造方法
【技术领域】
[0001]本申请涉及语音识别技术领域，尤其涉及一种语音识别方法及装置。
【背景技术】
[0002]随着移动互联网的发展，大屏幕手机成主流，无论键盘还是手写，均有各种限制。语音输入法将成为主流输入法，更受欢迎。由于语音输入更自然，学习成本更低，慢慢被更多用户所接受。无论是孩子还是老人，都能够快速的学会使用，并习惯使用这种输入方式。
[0003]现有的语音识别技术使用了大量的生活场景数据用于训练，以识别不同场景下输入的语音，从而针对有些定制场景识别精度过低，针对有些定制场景无法识别，浪费了处理资源，降低了处理效率。

【发明内容】

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此，本申请的第一个目的在于提出一种语音识别方法，该方法实现了根据与语音输入场景对应的识别资源进行语音识别，提高了识别精度和处理效率。
[0006]本申请的第二个目的在于提出一种语音识别装置。
[0007]为达上述目的，本申请第一方面实施例提出了一种语音识别方法，包括:配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源；建立包括所述专有识别资源和所述通用识别资源的语音识别库，以根据语音信息的输入场景，采用所述语音识别库识别所述语音信息。
[0008]本申请实施例的语音识别方法，通过配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源;建立包括所述专有识别资源和所述通用识别资源的语音识别库，以根据语音信息的输入场景，采用所述语音识别库识别所述语音信息。由此，实现了根据与语音输入场景对应的识别资源进行语音识别，提高了识别精度和处理效率。
[0009]为达上述目的，本申请第二方面实施例提出了一种语音识别装置，包括:配置模块，用于配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源;建立模块，用于建立包括所述专有识别资源和所述通用识别资源的语音识别库，以根据语音信息的输入场景，采用所述语音识别库识别所述语音信息。
[0010]本申请实施例的语音识别装置，通过配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源;建立包括所述专有识别资源和所述通用识别资源的语音识别库，以根据语音信息的输入场景，采用所述语音识别库识别所述语音信息。由此，实现了根据与语音输入场景对应的识别资源进行语音识别，提高了识别精度和处理效率。
【附图说明】
[0011]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中:
[0012]图1是本申请一个实施例的语音识别方法的流程图；
[0013]图2是本申请另一个实施例的语音识别方法的流程图；
[0014]图3是本申请另一个实施例的语音识别方法的流程图；
[0015]图4是本申请一个实施例的语音识别装置的结构示意图；
[0016]图5是本申请另一个实施例的语音识别装置的结构示意图。
【具体实施方式】
[0017]下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。
[0018]下面参考附图描述本申请实施例的语音识别方法及装置。
[0019]图1是本申请一个实施例的语音识别方法的流程图。
[0020]如图1所示，该语音识别方法包括:
[0021 ]步骤101，配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源。
[0022]具体地，本发明实施例提供的语音识别方法应用于具有语音输入功能的终端设备中。一般情况下，终端设备通过人机语音交互接口实现语音输入功能，具体的语音输入接口可以为麦克风等设备。
[0023]需要说明的是，终端设备可以通过能够访问人机语音交互接口的应用来为用户提供语音输入服务，该应用可以根据实际需要进行选择，例如:具有语音输入功能的导航应用、搜索引擎等，本实施例对此不作限制。
[0024]当用户需要进行语音输入时，向人机语音输入接口输入语音信息，然后对用户输入的语音信息进行识别，以便基于识别结果进行相应的处理。不同的语音输入应用，基于识别结果进行相应处理的过程不同。例如:
[0025]针对语音搜索应用，对用户输入的语音信息进行识别后，根据识别结果向用户反馈搜索结果;或者，
[0026]针对即时通信应用，对用户输入的语音信息进行识别后，根据识别结果转换成文字信息显示在输入框中。
[0027]针对不同场景下输入的语音信息，为了提高语音识别的精度和处理性能，本实施例提供的语音识别模型首先配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源。
[0028]需要说明的是，定制语音场景的类型有很多，不同的定制语音场景对应不同的专有识别资源，具体内容可以根据不同应用场景的需要进行设置和选择，本实施例对此不做限制，例如可以包括:
[0029]针对地图导航的语音场景，对应的专有识别资源为地名识别资源;或者，
[0030]针对电商平台的语音场景，对应的专有识别资源为电商商品名称识别资源;或者，
[0031]针对电影搜索的语音场景，对应的专有识别资源为电影名称识别资源。
[0032]步骤102，建立包括所述专有识别资源和所述通用识别资源的语音识别库，以根据语音信息的输入场景，采用所述语音识别库识别所述语音信息。
[0033]具体地，根据预先配置的与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源，建立包括所述专有识别资源和所述通用识别资源的语音识别库。
[0034]进而，当接收到用户输入的语音信息时，确定语音信息的输入场景，并确定语音信息的输入场景的类型，即输入场景是定制语音场景还是通用语音场景，从而从语音识别库获取与输入场景类型对应的识别资源对输入的语音信息进行识别。
[0035]本申请实施例的语音识别方法，通过配置与定制语音场景对应的专有识别资源，以及与通用语音场景对应的通用识别资源;建立包括所述专有识别资源和所述通用识别资源的语音识别库，以根据语音信息的输入场景，采用所述语音识别库识别所述语音信息。由此，实现了为不同的垂类场景进行识别环境的定制，根据与语音输入场景对应的识别资源进行语音识别，提高了识别精度和处理效率。
[0036]图2是本申请另一个实施例的语音识别方法的流程图。
[0037]如图2所示，在步骤102之后，还可以包括以下步骤:
[0038]步骤201，接收输入的语音信息。
[0039]步骤202，根据预设的场景获取策略确定与所述语音信息的输入场景。
[0040]具体地，接收用户输入的语音信息，根据预设的场景获取策略确定与当前接收的语音信息对应的输入场景。
[0041]需要说明的是，可以根据实际应用需要预先设置不同的场景获取策略，本实施例对此不

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：穆向禹;张东栋;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种声纹采集和处理系统及其采集和处理方法
上一篇：个性化无人车交互方法及无人车的制作方法