一种通过建立资源库提高语音识别精度的方法与流程

文档序号:16906430发布日期:2019-02-19 18:22阅读:218来源:国知局
一种通过建立资源库提高语音识别精度的方法与流程

本申请属于语音识别技术领域,尤其涉及一种通过建立资源库提高语音识别精度的方法。



背景技术:

随着移动互联网的发展,大屏幕手机成主流,无论键盘还是手写,均有各种限制。语音输入法将成为主流输入法,更受欢迎。由于语音输入更自然,学习成本更低,慢慢被更多用户所接受。无论是孩子还是老人,都能够快速的学会使用,并习惯使用这种输入方式。

现有的语音识别技术使用了大量的生活场景数据用于训练,以识别不同场景下输入的语音,从而针对有些定制场景识别精度过低,针对有些定制场景无法识别,浪费了处理资源,降低了处理效率。



技术实现要素:

为了克服现有技术存在的问题,本发明的目的是提供一种通过建立资源库提高语音识别精度的方法,实现了根据与语音输入场景对应的识别资源进行语音识别,提高了识别精度和处理效率。

本发明的目的通过以下技术方案实现:

一种通过建立资源库提高语音识别精度的方法,其特征在于包括以下步骤:

步骤101,配置与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源;

步骤102,建立包括所述专有识别资源和所述通用识别资源的语音识别库,以根据语音信息的输入场景,采用所述语音识别库识别所述语音信息。

步骤101具体是:当用户需要进行语音输入时,向人机语音输入接口输入语音信息,然后对用户输入的语音信息进行识别,以便基于识别结果进行相应的处理;不同的语音输入应用,基于识别结果进行相应处理的过程不同;

针对语音搜索应用,对用户输入的语音信息进行识别后,根据识别结果向用户反馈搜索结果;或者,针对即时通信应用,对用户输入的语音信息进行识别后,根据识别结果转换成文字信息显示在输入框中;

针对不同场景下输入的语音信息,配置与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源;

步骤102具体是:根据预先配置的与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源,建立包括所述专有识别资源和所述通用识别资源的语音识别库;当接收到用户输入的语音信息时,确定语音信息的输入场景,并确定语音信息的输入场景的类型,即输入场景是定制语音场景还是通用语音场景,从而从语音识别库获取与输入场景类型对应的识别资源对输入的语音信息进行识别。

本发明实现了根据与语音输入场景对应的识别资源进行语音识别,提高了识别精度和处理效率。

附图说明

图1是本发明的流程图;

图2另一个实施例的语音识别方法的流程图。

图3另一个实施例的语音识别方法的流程图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

一种通过建立资源库提高语音识别精度的方法,如图1所示,该语音识别方法包括:

步骤101,配置与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源。具体地,本发明实施例提供的语音识别方法应用于具有语音输入功能的终端设备中。一般情况下,终端设备通过人机语音交互接口实现语音输入功能,具体的语音输入接口可以为麦克风等设备。

需要说明的是,终端设备可以通过能够访问人机语音交互接口的应用来为用户提供语音输入服务,该应用可以根据实际需要进行选择,例如:具有语音输入功能的导航应用、搜索引擎等,本实施例对此不作限制。当用户需要进行语音输入时,向人机语音输入接口输入语音信息,然后对用户输入的语音信息进行识别,以便基于识别结果进行相应的处理。不同的语音输入应用,基于识别结果进行相应处理的过程不同。例如:

针对语音搜索应用,对用户输入的语音信息进行识别后,根据识别结果向用户反馈搜索结果;或者,针对即时通信应用,对用户输入的语音信息进行识别后,根据识别结果转换成文字信息显示在输入框中。

针对不同场景下输入的语音信息,为了提高语音识别的精度和处理性能,本实施例提供的语音识别模型首先配置与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源。

需要说明的是,定制语音场景的类型有很多,不同的定制语音场景对应不同的专有识别资源,具体内容可以根据不同应用场景的需要进行设置和选择,本实施例对此不做限制,例如可以包括:

针对地图导航的语音场景,对应的专有识别资源为地名识别资源;或者,针对电商平台的语音场景,对应的专有识别资源为电商商品名称识别资源;或者针对电影搜索的语音场景,对应的专有识别资源为电影名称识别资源。

步骤102,建立包括所述专有识别资源和所述通用识别资源的语音识别库,以根据语音信息的输入场景,采用所述语音识别库识别所述语音信息。具体地,根据预先配置的与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源,建立包括所述专有识别资源和所述通用识别资源的语音识别库。进而,当接收到用户输入的语音信息时,确定语音信息的输入场景,并确定语音信息的输入场景的类型,即输入场景是定制语音场景还是通用语音场景,从而从语音识别库获取与输入场景类型对应的识别资源对输入的语音信息进行识别。

本申请实施例的语音识别方法,通过配置与定制语音场景对应的专有识别资源,以及与通用语音场景对应的通用识别资源;建立包括所述专有识别资源和所述通用识别资源的语音识别库,以根据语音信息的输入场景,采用所述语音识别库识别所述语音信息。由此,实现了为不同的垂类场景进行识别环境的定制,根据与语音输入场景对应的识别资源进行语音识别,提高了识别精度和处理效率。

图2是本申请另一个实施例的语音识别方法的流程图。如图2所示,在步骤102之后,还可以包括以下步骤:

步骤201,接收输入的语音信息。

步骤202,根据预设的场景获取策略确定与所述语音信息的输入场景。

具体地,接收用户输入的语音信息,根据预设的场景获取策略确定与当前接收的语音信息对应的输入场景。需要说明的是,可以根据实际应用需要预先设置不同的场景获取策略,本实施例对此不作限制,例如可以包括:

示例一:根据应用程序确定所述语音信息的输入场景;

具体来说,根据用户当前进行语音输入的应用程序确定所述语音信息的输入场景。例如:用户向地图导航应用输入语音信息,则确定所述语音信息的输入场景为地图导航。

示例二:根据上下文确定所述语音信息的输入场景;

具体来说,根据用户与其他用户对话记录的上下文确定所述语音信息的输入场景。例如:在即时通信应用中,用户与其他用户之前的对话内容为旅游方便的内容,则所述语音信息的输入场景为旅游场景。

示例三:根据地理位置信息确定所述语音信息的输入场景。

具体来说,通过终端设备的gps信息获取用户当前的地理位置信息,进而根据用户当前的地理位置信息确定所述语音信息的输入场景。例如:当通过终端设备的gps信息获取用户当前的地理位置信息为影院时,则所述语音信息的输入场景为电影场景。

步骤203,根据所述输入场景和所述语音识别库对输入的语音信息进行识别。

具体地,根据当前语音信息的输入场景,以及预先建立的语音识别库对输入的语音信息进行识别,具体包括:

若当前语音的输入场景为预先的定制语音场景,则从语音识别库中获取与所述定制语音场景对应的专有识别资源,并应用专有识别资源对所述语音信息进行识别;

若当前语音的输入场景不为预先的定制语音场景,从语音识别库中获取通用识别资源,并应用专有识别资源对所述语音信息进行识别。

基于图1所示实施例,本申请实施例的语音识别方法,进一步地通过接收输入的语音信息,根据预设的场景获取策略确定与所述语音信息的输入场景,根据所述输入场景和所述语音识别库对输入的语音信息进行识别。由此,实现了根据与语音输入场景对应的识别资源进行语音识别,提高了识别精度和处理效率。

图3是本申请另一个实施例的语音识别方法的流程图,参见图3,具体说明如下:

步骤1:当接收语音信息后,判断是否能够根据预设的场景获取策略确定与所述语音信息的输入场景。

步骤2:若不能够确定语音信息的输入场景,则应用所述通用识别资源对所述语音信息进行识别。

步骤3:若能够确定语音信息的输入场景,则判断是否为预先定制的语音场景。

步骤4:若所述输入场景为预先定制语音场景,则应用所述语音识别库中与所述定制语音场景对应的专有识别资源,对所述语音信息进行识别;

步骤5:若所述输入场景不为定制语音场景,则应用所述语音识别库中的所述通用识别资源,对所述语音信息进行识别。

基于图1所示实施例,本申请实施例的语音识别方法,进一步地通过接收输入的语音信息,根据预设的场景获取策略确定与所述语音信息的输入场景,根据所述输入场景和所述语音识别库对输入的语音信息进行识别。由此,实现了根据与语音输入场景对应的识别资源进行语音识别,提高了识别精度和处理效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1