1.本技术涉及计算机技术领域,具体涉及一种针对模型的调参方法、装置、电子设备及存储设备。本技术同时涉及一种语音识别模型的获得方法、装置、电子设备及存储设备。本技术还涉及一种语音识别方法、装置、电子设备及存储设备。
背景技术:
2.随着深度学习(dl,deep learning)技术的不断发展,将训练获得的模型应用于不同的应用场景中,可以较好的方便人们生活。例如,将训练获得的模型应用于语音识别、语义理解、语音合成或者搜索推荐等应用中,可以方便的满足人们的各种需求。
3.目前在训练模型时,针对模型中的超参数(hyperparameter),一般是通过人工手动调整超参数的方法来训练获得不同的模型,例如,针对初始的待训练基础模型,一般是由人工设定第一超参数组合信息后,通过训练数据训练获得与第一超参数组合信息对应的目标模型;之后,再由人工设定第二超参数组合信息,并训练获得与第二超参数组合对应的目标模型;如此经过多次手动调整并获得至少一个目标模型之后,从这至少一个目标模型中选取满足性能需求的模型以供使用。当然,目前也有针对模型的自动调参方法,该方法一般是通过计算设备模拟人工调参,即,在获得针对初始基础模型的多个超参数组合信息后,由计算设备串行或并行的获得与不同超参数组合信息对应的至少一个目标模型,并从这至少一个目标模型中选取满足性能需求的模型以供使用。
4.然而,随着深度学习技术的不断发展,模型的训练通常会占用较多的计算资源,并且单轮训练的耗时也在不断增长,因此,现有技术在对模型进行调参时,通常由于其流程比较固定,存在耗时大量增加的问题,进而导致将训练获得的目标模型或者超参数组合应用到线上时,最新上线的模型的性能效果反而不如线上经过实际数据不断训练获得的模型的效果。由此可知,目前针对模型的自动调参方法存在灵活度低以及准确度相对较低的问题。
技术实现要素:
5.本技术实施例提供一种针对模型的调参方法,以解决现有技术存在的灵活度低以及准确度低的问题。
6.本技术实施例提供一种针对模型的调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
7.可选的,还包括:获得与所述第一目标模型对应的第一性能信息;根据所述第一性能信息,判断所述第一目标模型中是否存在满足所述预设性能条件的目标模型。
8.可选的,所述根据所述第一性能信息,判断所述第一目标模型中是否包括满足所
述预设性能条件的所述目标模型,包括:如果所述第一性能信息中存在不小于预设性能阈值的性能信息,则判定所述第一目标模型中存在所述目标模型。
9.可选的,还包括:根据所述第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型,获得所述目标模型。
10.可选的,所述根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,包括:从所述原始超参数组合信息中,获得所述第二超参数组合信息,其中,所述第二超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一目标模型中,选取满足预设模型筛选条件的模型;根据所述满足预设模型筛选条件的模型,获得所述第二待训练基础模型。
11.可选的,所述从所述原始超参数组合信息中,获得所述第二超参数组合信息,包括:从所述原始超参数组合信息中,获得第二初始超参数组合信息,其中,所述第二初始超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息;根据所述第二初始超参数组合信息和所述满足预设超参数筛选条件的超参数组合信息,获得所述第二超参数组合信息。
12.可选的,所述从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第一数值条件的性能信息;根据所述第一超参数组合信息中与满足所述预设第一数值条件的性能信息对应的超参数组合信息,获得满足所述预设超参数筛选条件的超参数组合信息。
13.可选的,所述从所述第一目标模型中,选取满足预设模型筛选条件的模型,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述第一目标模型中与满足所述预设第二数值条件的性能信息对应的模型,获得满足所述预设模型筛选条件的模型。
14.可选的,所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息训练所述第二待训练基础模型,获得第二目标模型;如果所述第二目标模型中存在满足所述预设性能条件的模型,则根据所述满足所述预设性能条件的模型,获得所述目标模型。
15.可选的,所述第一待训练基础模型包括由用户配置的初始待训练基础模型。
16.可选的,还包括:获得初始待训练基础模型;如果所述原始超参数组合信息不满足预设的分组训练条件,则根据所述原始超参数组合信息训练所述初始待训练基础模型,获得用于表征训练获得的模型的性能的性能信息;从所述性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述原始超参数组合信息中、与满足所述预设第二数值条件的性能信息对应的超参数组合信息,获得目标经验超参数组合信息,其中,所述目标经验超参数组合信息用于作为持续优化所述初始待训练基础模型时的经验超参数。
17.可选的,还包括:获取原始训练数据,所述使用所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,包括:根据所述第一超参数组合信息和所述原始训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组
合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息和所述原始训练数据训练所述第二待训练基础模型,获得所述目标模型。
18.可选的,如果所述原始训练数据满足预设的数据拆分条件,则所述方法还包括:根据所述预设的数据拆分条件,对所述原始训练数据进行拆分处理,获取至少一组原始分组训练数据;所述根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,还包括:从所述至少一组原始分组训练数据中,获取任意一组原始分组训练数据作为第一训练数据;根据所述第一超参数组合信息和所述第一训练数据训练所述第一待训练基础模型,获得所述第一目标模型;
19.可选的,所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:从所述至少一组原始分组训练数据中,获取第二训练数据;根据所述第二超参数组合信息和所述第二训练数据训练所述第二待训练基础模型,获得所述目标模型,其中,所述第二训练数据是所述至少一组原始分组训练数据中,除所述第一训练数据以外的任意一组原始分组训练数据。
20.可选的,如果所述原始训练数据的数量不小于预设的训练数据阈值,则判定所述原始训练数据满足所述预设的数据拆分条件。
21.可选的,还包括:获得与第一目标模型对应的第一性能信息,以及,获得与所述目标模型对应的第二性能信息;根据所述第一性能信息和所述第二性能信息,获得与所述原始超参数组合信息对应的性能变化信息。
22.可选的,所述方法还包括:获取用于表征启动调参操作的触发操作;响应于所述触发操作,执行从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息步骤。
23.可选的,所述原始超参数组合信息包括以下至少一种超参数组合的信息:由所述用户配置的与所述初始待训练基础模型对应的超参数组合、从与所述初始待训练基础模型对应的历史超参数组合中获得的超参数组合。
24.本技术实施例还提供一种语音识别模型的获得方法,包括:从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
25.本技术实施例还提供一种语音识别方法,包括:获取待识别语音信息;将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
26.可选的,所述方法应用于服务端,所述方法还包括:将所述目标识别信息提供给客户端。
27.可选的,还包括:获取与所述目标识别信息对应的服务内容信息;将所述服务内容信息提供给所述客户端。
28.可选的,所述方法应用于客户端,所述方法还包括:获取所述目标识别信息;展示
或播放所述目标识别信息。
29.可选的,还包括:获取与所述目标识别信息对应的服务内容信息;展示或播放所述服务内容信息。
30.可选的,所述客户端包括通过边缘计算提供最近端服务的计算设备。
31.可选的,所述计算设备包括以下至少一种计算设备:智能音箱设备、车载导航设备、翻译设备。
32.本技术实施例还提供一种针对模型的调参装置,包括:第一信息获得单元,用于从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;第一目标模型获得单元,用于根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;第二信息获得单元,用于判断所述第一目标模型中是否存在满足预设性能条件的目标模型,如果不存在,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;目标模型获得单元,用于根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
33.本技术实施例还提供一种电子设备,包括:
34.处理器;
35.存储器,用于存储针对模型的调参方法的程序,该设备通电并通过所述处理器运行所述针对模型的调参方法的程序后,执行下述步骤:
36.从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
37.本技术实施例还提供一种存储设备,存储有针对模型的调参方法的程序,该程序被处理器运行,执行下述步骤:
38.从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
39.本技术实施例还提供一种语音识别模型的获得装置,包括:第一语音信息获得单元,用于从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;第一目标语音识别模型获得单元,用于根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;第二语音信息获得单元,用于判断所述第一目标语音识别模型中是否不存在满足预设性能条件的目标语音识别模型,如果不存在,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;目标语音识别模型获得单元,用于根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
40.本技术实施例还提供一种电子设备,包括:
41.处理器;
42.存储器,用于存储语音识别模型的获得方法的程序,该设备通电并通过所述处理器运行所述语音识别模型的获得方法的程序后,执行下述步骤:
43.从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
44.本技术实施例还提供一种存储设备,存储有语音识别模型的获得方法的程序,该程序被处理器运行,执行下述步骤:
45.从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
46.本技术实施例还提供一种语音识别装置,包括:获取单元,用于获取待识别语音信息;识别单元,用于将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
47.本技术实施例还提供一种电子设备,包括:
48.处理器;
49.存储器,用于存储语音识别方法的程序,该设备通电并通过所述处理器运行所述语音识别方法的程序后,执行下述步骤:
50.获取待识别语音信息;将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
51.本技术实施例还提供一种存储设备,存储有语音识别方法的程序,该程序被处理器运行,执行下述步骤:
52.获取待识别语音信息;将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
53.与现有技术相比,本技术具有以下优点:
54.本技术实施例提供一种针对模型的自动调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不包括满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。所述方法相较于现有的自动调参方法,在通过第一超参数组
合信息训练获得第一目标模型之后,如果判断第一目标模型中不包括目标模型,则根据原始超参数组合信息和上轮训练获得的第一目标模型,获得第二超参数组合信息,以及获得与第二超参数组合信息对应的第二待训练基础模型,即,在上轮训练的基础上,获得用于进行第二轮训练的超参数组合信息和待训练基础模型,从而可以灵活、快速的实现模型的持续迭代,并且,由于第二轮训练中使用的第二待训练基础模型是根据第一轮训练得到的第一目标模型获得的模型,因此还可以实现模型的持续优化,增加目标模型的准确度。
55.本技术实施例还提供一种语音识别模型的获得方法,包括:从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。所述方法可以灵活、快速的实现对待训练语音识别模型的持续迭代,进而获得准确度较高的目标语音识别模型。
56.本技术实施例还提供一种语音识别方法,包括:获取待识别语音信息;将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用语音识别模型的获得方法获得的模型。所述方法可以增加对待识别语音信息的识别准确度。
附图说明
57.图1-a是本技术第一实施例提供的一种针对模型的调参方法的第一应用场景示意图。
58.图1-b是本技术第一实施例提供的一种针对模型的调参方法的第二应用场景示意图。
59.图2是本技术第一实施例提供的现有技术中存在的针对模型的调参方法的框架示意图。
60.图3是本技术第一实施例提供的一种针对模型的调参方法的流程图。
61.图4是本技术第一实施例提供的一种针对模型的调参方法的框架示意图。
62.图5是本技术第二实施例提供的一种语音识别模型的获得方法的流程图。
63.图6是本技术第三实施例提供的一种语音识别方法的流程图。
64.图7是本技术第四实施例提供的一种针对模型的调参装置的示意图。
65.图8是本技术第五实施例提供的一种电子设备的示意图。
66.图9是本技术第七实施例提供的一种语音识别模型的获得装置的示意图。
67.图10是本技术第十实施例提供的一种语音识别装置的示意图。
具体实施方式
68.在下面的描述中阐述了很多具体细节以便于充分理解本技术。但是本技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本技术内涵的情况下做类似推广,因此本技术不受下面公开的具体实施的限制。
69.为了使本领域的技术人员更好的理解本技术方案,下面基于本技术提供的针对模型的调参方法,对其实施例的具体应用场景进行详细描述。本技术第一实施例提供的针对模型的调参方法可以应用于客户端与服务端的交互场景中,如图1-a所示,其为本技术第一实施例提供的一种针对模型的调参方法的第一应用场景示意图。
70.在具体实施时,所述方法一般是在用户需要训练获得用于处理某个应用数据的模型或者是用于进一步优化该模型的性能时,预先获取针对该模型的超参数组合,并将该超参数组合设置到该模型中,从而获得与该超参数组合对应的优化完成的目标模型,其中,所述用于处理某个应用数据的模型可以是语音识别模型、语义理解模型、语音合成模型或搜索推荐模型等模型。具体来讲,在客户端接受用户配置的原始超参数组合信息,并获取到用于表征启动调参操作的触发操作之后,响应于该触发操作,客户端将该原始超参数组合信息发送给服务端,服务端获得与待训练的模型对应的原始超参数组合信息,从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息,并根据所述第一超参数组合信息训练与待训练的模型对应的第一待训练基础模型,获得第一目标模型;之后,如果所述第一目标模型中不存在满足预设性能条件的目标模型,则服务端根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,并根据所述第二超参数组合信息和所述第二待训练基础模型,获得满足所述预设性能条件的目标模型;在获得目标模型之后,服务端可以将该目标模型提供给客户端,或者,也可以在该目标模型的基础上,使用与该目标模型对应的训练数据训练并优化该目标模型的权重参数,从而实现模型的性能优化,提高模型处理结果的准确度。
71.如图1-b所示,其为本技术第一实施例提供的一种针对模型的调参方法的第二应用场景示意图。如图1-b所示,在语音识别场景中,例如,用户与智能音箱设备的交互场景、用户与导航设备的交互场景或者用户与即时翻译设备的交互场景中,可以是在客户端获得待识别语音信息之后,由客户端将待识别语音信息发送给服务端,服务端在获得待识别语音信息之后,将待识别语音信息输入到预先训练获得的目标语音识别模型中,并通过该目标语音识别模型,获得与待识别语音信息对应的目标识别信息,其中,该目标语音识别模型可以预先由服务端通过以下步骤获得:从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
72.当然,随着技术的不断进步,所述方法也可以单独应用于客户端或服务端中,例如,直接将所述方法部署在客户端中,在该客户端获得用户配置的超参数组合信息以及获取到用于启动调参操作的触发操作后,直接使用所述方法对用户配置的初始基础模型进行调参操作,以获得并输出该目标模型,其中,该触发操作可以是用户实时手动触发的操作,也可以是用户预先设置好的在预定时间内执行的操作。另外,也可以在实施所述方法的过程中,加入与用户交互的步骤,例如,在获得第一目标模型之后,可以进一步获取用户配置信息,并根据用户配置信息、原始超参数组合信息和第一目标模型,获得第二超参数组合信息和第二待训练基础模型。
73.所述客户端可以是移动终端设备,如手机、平板电脑等,也可以是常用的计算机设备。所述服务端一般是指服务器,该服务器可以是物理服务器,也可以是云端服务器,此处不做特殊限定。
74.所述原始超参数组合信息,是与待训练的模型对应的至少一个超参数组合的信息,该信息可以是用于唯一标识某一超参数组合的标识,其中,超参数组合中包括与待训练的模型对应的至少一个超参数的数值。在深度学习中,针对模型进行训练时,需要预先设置模型的超参数(hyperparameter),例如,模型的学习率(learning rate)、正则项系数(regularization parameter),丢弃率(dropout),权重衰减(weight decay),卷积尺寸(kernel size)等;在针对待训练的模型进行训练,以获得目标模型时,需要根据模型的特性,预先由用户配置与待训练的模型对应的至少一个超参数组合,并且该超参数组合中需要包括至少一个超参数。
75.需要说明的是,以上应用场景仅仅是本技术第一实施例提供的针对模型的调参方法的具体实施例,提供上述应用场景的目的是便于理解所述方法,而并非用于限定所述方法。
76.在具体介绍本技术第一实施例提供的所述方法之前,首先对现有技术中针对模型的调参方法进行简单介绍,如图2所示,其为本技术第一实施例提供的现有技术中存在的针对模型的调参方法的框架示意图。
77.根据图2内容可知,现有技术中针对模型的调参方法,包括:“用户配置”,即,由用户配置初始数据,例如,调参策略、模型训练脚本命令、至少一组的原始超参数组合信息、流程结束条件以及并行任务数据配置等,其中,调参策略一般包括:贝叶斯优化(bayesian optimization)、网格搜索(grid search)和随机搜索(random search)等策略;模型训练脚本命令,是用于在用户配置的初始数据上进行自动化调参的指令;原始超参数组合信息,是与待训练的模型对应的至少一个超参数的组合信息;并行任务数据配置,是指在具体实施时,通常将原始超参数组合信息拆分为若干组,并并行的使用拆分后的分组训练待训练的模型;在用户通过配置发起针对模型的调参任务后,所述方法内的“调度处理器”通过调参策略选择,从用户配置的原始超参数组合信息中筛选出多个超参数组合信息,其中,每一超参数组合信息对应的超参数组合被用于输入到用户配置的模型训练脚本命令中,由模型训练脚本命令并行发起训练任务;“训练任务管理”通过调用计算资源对待训练的模型进行训练,并获得与每一超参数组合信息对应的中间目标模型以及该中间目标模型的性能信息,并将该中间目标模型和对应的性能信息返回到“调度处理器”,其中,计算资源是指中央处理器(cpu,central processing unit)、图形处理器(gpu,graphics processing unit)等资源;之后,调度处理器根据获得的性能信息判断是否已获得满足性能条件的目标模型,如果没有,则根据调参策略选择下一超参数组合信息,并继续进行对应的训练;通过循环优化,获得满足性能条件的目标模型,以及与该目标模型对应的超参数组合信息。
78.根据上述介绍可知,现有技术中针对模型的调参方法获得的目标模型以及对应的超参数组合信息仅仅是一次迭代的输出结果,即,是从每一超参数组合信息获得的中间目标模型中,筛选出目标模型和该目标模型对应的超参数组合信息;并且,随着深度学习的发展,该目标模型的获取过程耗时较长,使用上述方法获得的目标模型的性能效果反而低于线上经过不断训练调优(tuning)后的模型的性能效果,即,其准确度反而不如线上运行的
模型。因此,上述方法获得的目标模型往往很少能投入实际使用,仅能将获得的目标模型对应的超参数组合作为之后用于训练优化线上运行的实际模型的经验超参数;也就是说,现有技术中的上述方法在针对模型进行调参时,存在灵活度低以及准确度低的问题。
79.本技术第一实施例提供的针对模型的调参方法对现有技术中的上述方法进行改进以解决上述问题,如图3、图4所示,其分别为本技术第一实施例提供的一种针对模型的调参方法的流程图、以及其框架示意图。以下结合图3、图4对本技术第一实施例提供的所述方法予以介绍。
80.步骤s301,从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息。
81.如图4所示,在具体实施本技术第一实施例所述方法时,同样需要用户配置模块配置初始数据,例如,调参策略、模型训练脚本命令、至少一组的原始超参数组合信息、第一流程结束条件、第二流程结束条件以及并行任务数据配置等。
82.在获得用户配置的原始超参数组合信息之后,为了节省计算资源以及灵活的调整进行模型训练时的训练数据的数量,可以将原始超参数组合信息拆分为至少一组的超参数组合信息,之后,将任意一组超参数组合信息作为待进行后续处理的第一超参数组合信息。
83.需要说明的是,本技术第一实施例中的原始超参数组合信息,既可以是与待训练的初始基础模型对应的至少一个超参数组合的信息,也可以是从与待训练的初始基础模型对应的历史超参数组合中获得的超参数组合的信息;另外,所述第一超参数组合信息以及后续处理中的第二超参数组合信息中的“第一”、“第二”为泛称,是用于区分不同的超参数组合信息,例如,原始超参数组合信息为100种组合,并将这100中组合拆分为10组,则在处理第二组超参数组合信息时,第一组超参数组合信息相当于为第一超参数组合信息,第二组超参数组合信息为第二超参数组合信息;而在处理第三组超参数组合信息时,第二组超参数组合信息相当于为第一超参数组合信息,第三组超参数组合信息相当于为第二超参数组合信息。另外,在本技术第一实施例中,以待进行调参的模型为用于进行语音识别的语音识别模型,以原始超参数组合信息为与语音识别模型对应的原始语音超参数组合信息为例进行介绍;当然,所述方法也可用于为其它模型进行调参,例如,用于为语义理解模型、语音合成模型或者搜索推荐模型等模型。
84.步骤s302,根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型。
85.在本技术第一实施例提供的所述方法中,在获得一组超参数组合信息和对应的待训练基础模型之后,是通过将现有技术中所述的针对模型的调参方法作为本技术第一实施例所述方法的子任务,具体见图4所示的“子任务系统”。所述根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,是通过图4所示的“第一调度处理器”根据“子任务运行前配置”,选择与第一超参数组合信息对应的训练数据以及对应的第一待训练基础模型,并将获取到的上述数据作为“子任务系统”的入参(input parameter),通过子任务系统获得第一目标模型。
86.需要说明的是,所述第一待训练基础模型包括由用户配置的初始待训练基础模型,其中,所述初始待训练基础模型是指在用户配置模块中,由用户配置的初始的模型,也就是说,在本技术第一实施例所述方法初次运行时,与第一超参数组合信息对应的第一待
训练基础模型为所述初始待训练基础模型。
87.例如,在针对语音识别模型进行调参时,与该语音识别模型对应的原始超参数组合信息为100种组合,并将该100种组合拆分为十组,则在以第一组超参数组合信息为初始的第一超参数组合信息训练第一待训练基础模型时,所述第一待训练基础模型在“子任务运行前配置”中被配置为待训练的初始语音识别模型。
88.需要说明的是,以上仅为本技术第一实施例提供的一种具体实施例,在具体实施时,也可以通过其它方法根据所述第一超参数组合信息训练第一待训练基础模型,此处不再赘述。
89.在步骤s302之后,执行步骤s303,如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型。
90.在上述步骤中,获得到与第一超参数组合信息对应的第一目标模型,即,获得了与某一组超参数组合信息中的至少一个超参数组合信息对应的至少一个中间目标模型;在本技术第一实施例提供的所述方法中,每当“子任务系统”结束并返回至少一个中间目标模型时,需要根据用户配置的第一流程结束条件判断是否已获得满足用户需求的目标模型。其中,所述第一流程结束条件可以为用户预设性能条件,例如,可以为与语音识别模型的识别准确度对应的一个准确度阈值。
91.在本技术第一实施例中,提供一种判断第一目标模型中是否存在满足预设性能条件的目标模型的方法,具体包括:获得与所述第一目标模型对应的第一性能信息;根据所述第一性能信息,判断所述第一目标模型中是否存在满足所述预设性能条件的目标模型。
92.所述第一性能信息,与第一目标模型对应、是与通过每一组超参数组合信息训练获得的至少一个中间目标模型分别对应的信息,具体可用于表征训练获得的中间目标模型的性能效果,例如,针对语音识别模型,其对应的性能信息一般可以为表征该模型处理结果的准确程度的准确度数值,或者,也可以是用于表征该模型处理速度快慢的响应速度数值,又或者,可以是用于表征该模型的综合性能效果的统计数值,例如,可以是根据准确度数值、响应速度数值等数值进行加权平均后获得的、用于从多维度表征该模型的性能效果的统计数值。
93.具体来讲,所述根据所述第一性能信息,判断所述第一目标模型中是否包括满足所述预设性能条件的所述目标模型,包括:如果所述第一性能信息中存在不小于预设性能阈值的性能信息,则判定所述第一目标模型中存在所述目标模型。也就是说,如果所述第一性能信息中存在不小于预设性能阈值的性能信息,则认为已经获得满足用户需求的目标模型,达到流程结束条件,因此,可以根据所述第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型,获得所述目标模型。例如,直接将第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型作为目标模型。需要说明的是,有关预设性能条件、预设性能阈值的设置,可以根据实际情况进行设置,此处不做特殊限定。
94.当然,如果第一目标模型中不存在满足预设性能条件的模型,则可以在第一目标模型的基础上,根据原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,以下予以介绍。
95.所述根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信
息和第二待训练基础模型,包括:从所述原始超参数组合信息中,获得所述第二超参数组合信息,其中,所述第二超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一目标模型中,选取满足预设模型筛选条件的模型;根据所述满足预设模型筛选条件的模型,获得所述第二待训练基础模型。
96.请参看图4所示的“子任务结果处理”,相对于现有技术中的每一轮训练都是针对用户配置的初始待训练基础模型进行训练,为了增加获得的目标模型的准确度,本技术第一实施例提供一种获得第二超参数组合信息和第二待训练基础模型的方法,具体是在每结束一轮训练时,可以在上一轮训练的基础上获得下一轮训练中的“子任务系统”的入参。
97.具体来讲,所述从所述原始超参数组合信息中,获得所述第二超参数组合信息,包括:从所述原始超参数组合信息中,获得第二初始超参数组合信息,其中,所述第二初始超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息;根据所述第二初始超参数组合信息和所述满足预设超参数筛选条件的超参数组合信息,获得所述第二超参数组合信息。
98.如图4所示的“超参筛选”,即,为了提高训练获得的目标模型的准确度,在通过第一超参数组合信息中的至少一个超参数组合信息,训练获得至少一个中间目标模型之后,在获取第二超参数组合信息时,通过“超参筛选”,可以将第一超参数组合信息中,训练获得的模型的性能效果较好的超参数组合信息,也作为第二超参数组合信息中的数据,从而使得所述方法可以在遗传上一轮训练获得的结果的基础上,进一步的对本轮的待训练模型进行训练,使得所述方法中的每轮训练之间可以紧密结合,而不是彼此相互独立。
99.其中,所述从第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第一数值条件的性能信息;根据所述第一超参数组合信息中与满足所述预设第一数值条件的性能信息对应的超参数组合信息,获得满足所述预设超参数筛选条件的超参数组合信息。
100.在本技术第一实施例中,所述获得数值满足预设第一数值条件的性能信息,可以是获得所述第一性能信息中的最大数值的若干个性能信息,即,从第一性能信息中,选取top-k个优选的、性能效果相对较好的性能信息。
101.例如,在针对语音识别模型进行调参时,与语音识别模型对应的原始语音超参数组合信息为100种组合,并将该100种组合拆分为十组,第一超参数组合信息为第一组超参数组合信息,如为(paragroup1,
…
,paragroup10),同时,与第一超参数组合信息对应的第一目标模型的第一性能信息为用于表征模型性能效果的一个评估分值,如为(score1,
…
,score10);在获得第二超参数组合信息时,可以将第二组超参数组合信息作为第二初始超参数组合信息,如为(paragroup11,
…
,paragroup20),以及,选取第一性能信息中的top-k个最大值的性能信息对应的第一超参数组合信息,例如,选取第一性能信息中的top-2个最大值,如,为score3和score6,那么,与其对应的第一超参数组合信息分别为paragroup3和paragroup6;那么,第二超参数组合信息可以为(paragroup3,paragroup6,paragroup11,
…
,paragroup20)。
102.与之相对应的,为了进一步提高获得的目标模型的准确度,相较于现有技术中的
方法在每轮训练中都是针对用户配置的初始基础模型进行训练,本技术第一实施例提供的所述方法在每轮训练中,待训练的基础模型可以是从上轮训练获得的中间目标模型中筛选出满足预设模型筛选条件的模型作为本轮的待训练基础模型,也即是说,所述从所述第一目标模型中,选取满足预设模型筛选条件的模型,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述第一目标模型中与满足所述预设第二数值条件的性能信息对应的模型,获得满足所述预设模型筛选条件的模型。其中,所述预设第二数值条件,可以为第一性能信息中数值的最大值,即,在进行本轮训练时,通过图4所示的“初始模型设置”将上一轮训练获得的中间目标模型中性能较佳的模型,作为本轮中待训练的第二待训练基础模型。
103.需要说明的是,在具体实施时,所述预设模型筛选条件、所述预设超参数筛选条件、所述预设第一数值条件以及所述预设第二数值条件可以根据实际情况进行设置,此处不做特殊限定。
104.以上,详细介绍了当第一目标模型中不存在满足预设性能条件的目标模型时,如何根据原始超参数组合信息和第一目标模型,获得第二超参数组合信息和第二待训练基础模型。
105.在步骤s303之后,执行步骤s304,根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
106.在上一轮训练的基础上,获得了本轮待进行训练的第二超参数组合信息和第二待训练基础模型之后,即可根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
107.具体来讲,所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息训练所述第二待训练基础模型,获得第二目标模型;如果所述第二目标模型中存在满足所述预设性能条件的模型,则根据所述满足所述预设性能条件的模型,获得所述目标模型。
108.即,在上一轮训练的基础上,继续在“子任务系统”中,根据第二超参数组合信息训练第二待训练基础模型,并判断获得的第二目标模型中是否存在满足预设性能条件的目标模型,如果不存在,则可以在本轮的基础上,继续迭代直至获得满足预设性能条件的目标模型。
109.另外,需要说明的是,所述方法还包括:获得初始待训练基础模型;如果所述原始超参数组合信息不满足预设的分组训练条件,则根据所述原始超参数组合信息训练所述初始待训练基础模型,获得用于表征训练获得的模型的性能的性能信息;从所述性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述原始超参数组合信息中,与满足所述预设数值条件的性能信息对应的超参数组合信息,获得目标经验超参数组合信息,其中,所述目标经验超参数组合信息用于作为持续优化所述初始待训练基础模型时的经验超参数。
110.也就是说,在使用本技术第一实施例提供的所述方法针对用户配置的初始待训练基础模型进行调参时,如果与该初始待训练基础模型对应的超参数的参数空间较小,即超参数的组合的数量较小时,通常通过一轮训练即可完成训练,那么,此时是存在获取不到满足预设性能条件的目标模型的情况的。针对该情况,在具体实施所述方法时,可以根据与获
得的中间目标模型对应的性能信息,选取性能效果较佳的超参数组合信息,作为以后用于持续优化该模型的经验超参数,即,获得在日常训练中用于调整并优化初始待训练基础模型的经验超参数。
111.本技术第一实施例提供的所述方法在具体实施时,可以在每轮循环中都使用相同数量的训练数据用于训练待训练的基础模型,即,所述方法还包括:获取原始训练数据;所述使用所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,包括:根据所述第一超参数组合信息和所述原始训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息和所述原始训练数据训练所述第二待训练基础模型,获得所述目标模型。
112.请参看如图4所示的“训练数据筛选”,针对现有技术中的方法存在耗时较长、不够灵活的问题,本技术第一实施例提供一种灵活的实施方法,具体来讲,如果所述原始训练数据满足预设的数据拆分条件,则所述方法还包括:根据所述预设的数据拆分条件,对所述原始训练数据进行拆分处理,获取至少一组原始分组训练数据;所述根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,还包括:从所述至少一组原始分组训练数据中,获取任意一组原始分组训练数据作为第一训练数据;根据所述第一超参数组合信息和所述第一训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:从所述至少一组原始分组训练数据中,获取第二训练数据;根据所述第二超参数组合信息和所述第二训练数据训练所述第二待训练基础模型,获得所述目标模型,其中,所述第二训练数据是所述至少一组原始分组训练数据中,除所述第一训练数据以外的任意一组原始分组训练数据。其中,如果所述原始训练数据的数量不小于预设的训练数据阈值,则判定所述原始训练数据满足所述预设的数据拆分条件
113.即,在具体实施时,如果原始训练数据满足预设的数据拆分条件,例如,原始训练数据的数量不小于预设的训练数据阈值,那么,可以按照预设的数据拆分方法对原始训练数据进行拆分处理,例如,将原始训练数据拆分与原始超参数组合信息相同数值的分组;之后,在每轮训练时,每组超参数组合信息可以分别使用对应的分组训练数据,对待训练基础模型进行训练。
114.例如,在针对语音识别模型进行调参时,与语音识别模型对应的原始语音超参数组合信息为100种组合,并将该100种组合拆分为十组,即,在每轮训练时,训练10个超参数组合;如果有5000万条原始训练数据,如果每轮训练都使用者5000万条原始训练数据进行训练,那么训练耗时将会极高;为了减少训练耗时,可以将这5000万条原始训练数据页拆分为10组;这样,在每轮训练时,可以仅使用500万条训练数据,这样,整体迭代下来,同样可以应用到这5000万条原始训练数据;而如果在某次迭代中已经获得了满足预设性能条件的目标模型,则可以提取终止训练,进而可以减少训练耗时。
115.需要说明的是,以上仅是本技术第一实施例提供的具体实施例,在具体实施时,所述预设的数据拆分条件、所述预设的训练数据阈值以及具体每轮训练时训练数据的选择可以根据实际情况进行设置,此处不做特殊限定。
116.根据上述描述可知,通过本技术第一实施例所述方法获得目标模型的过程中,可
以获得与不同的中间目标模型对应的性能信息,例如,与第一目标模型对应的第一性能信息、与第二目标模型对应的第二性能信息等。因此,在获得目标模型之后,还可以通过与每一超参数组合信息对应的性能信息,获得与原始超参数组合信息中的每一超参数组合信息对应的性能变化信息,以在以后实际对模型进行训练时,可以参考该性能变化信息设置模型的超参数组合,以进一步方便的对模型进行人工调优、增加模型处理结果的准确度。因此,本技术第一实施例提供的所述方法还包括:获得与第一目标模型对应的第一性能信息,以及,获得与所述目标模型对应的第二性能信息;根据所述第一性能信息和所述第二性能信息,获得与所述原始超参数组合信息对应的性能变化信息。
117.综上所述,本技术第一实施例提供的所述针对模型的调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不包括满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。所述方法相较于现有的自动调参方法,在通过第一超参数组合信息训练获得第一目标模型之后,如果判断第一目标模型中不包括目标模型,则根据原始超参数组合信息和上轮训练获得的第一目标模型,获得第二超参数组合信息,以及获得与第二超参数组合信息对应的第二待训练基础模型,即,在上轮训练的基础上,获得用于进行第二轮训练的超参数组合信息和待训练基础模型,从而可以灵活、快速的实现模型的持续迭代,并且,由于第二轮训练中使用的第二待训练基础模型是根据第一轮训练得到的第一目标模型获得的模型,因此还可以实现模型的持续优化,增加目标模型的准确度。
118.与本技术第一实施例提供的针对模型的调参方法相对应,本技术第二实施例还提供一种语音识别模型的获得方法,请参看图5所示,其为本技术第二实施例提供的一种语音识别模型的获得方法的流程图,其中部分步骤在本技术第一实施例中已经详细描述,所以此处描述的比较简单,相关之处参见本技术第一实施例中的部分说明即可,下述描述的处理过程仅是示意性的。
119.步骤s501,从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息。
120.步骤s502,根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型。
121.步骤s503,如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型。
122.步骤s504,根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
123.与本技术第一、第二实施例提供的方法相对应,本技术第三实施例还提供一种语音识别方法,请参看图6所示,其为本技术第三实施例提供的一种语音识别方法的流程图,其中部分步骤在本技术第一实施例、第二实施例中已经详细描述,所以此处描述的比较简单,相关之处参见本技术第一实施例、第二实施例中的部分说明即可,下述描述的处理过程
仅是示意性的。
124.步骤s601,获取待识别语音信息。
125.步骤s602,将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用所述语音识别模型的获得方法获得的模型。
126.在具体实施时,当该方法应用于服务端时,在服务端获得与客户端发送的待识别语音信息对应的目标识别信息之后,还可以将该目标识别信息提供给客户端,以供客户端展示该目标识别信息;或者,服务端还可以获得与待识别语音信息对应的服务内容信息,并将该服务内容信息提供给客户端,以供客户端根据该服务内容信息,通过展示或播放该服务内容信息的方式向用户提供服务。
127.例如,在智能家居环境中,用户可以向智能音箱设备发出待识别语音信息“请播放今日天气”,智能音箱设备接收到该待识别语音信息后,将该待识别语音信息发送给与其连接的云端服务器,云端服务器使用通过上述语音识别模型的获得方法获得到的目标语音识别模型识别该待识别语音信息,获得对应的目标识别信息,并根据该目标识别信息的内容,通过搜索获得今日天气相关的服务内容信息“晴天,微风,当前温度20度”,并将该服务内容信息提供给该智能音箱设备,该智能音箱设备在获得云端服务器发送的该服务内容信息后,可以直接在其显示屏幕上展示该服务内容信息,或者也可以直接播放该服务内容信息,从而可以快速准确向用户提供服务,提升用户体验。
128.另外,为了进一步增加客户端计算设备的响应速度,该方法也可以单独应用于通过边缘计算(edge computing)向用户提供最近端服务的计算设备中,例如,可以将通过上述语音识别模型的获得方法获得到的目标语音识别模型单独部署在直接与用户进行交互的智能音箱设备、导航设备或者翻译设备等计算设备中,以使的客户端在获得用户发出的待识别语音信息之后,通过其内置的目标语音识别模型快速的对待识别语音信息进行识别,以向用户展示获取到的目标识别信息,或者直接获取与目标识别信息对应的服务内容信息,并通过展示或播放的方式将该服务内容信息提供给用户,以向用户快速的提供最近端服务。例如,可以将通过上述语音识别模型的获得方法获得到的目标语音识别模型单独部署在车载导航设备中,当用户发出“导航到xxx目的地”的待识别语音信息后,该车载导航设备识别该语音信息,并通过其内置的导航路径计算模块获取与该语音信息对应的导航路径,并将获得到的导航路径展示给用户,以供用户选择合适的导航路径。
129.需要说明的是,此处是以智能音箱设备和车载导航设备分别举例说明本技术第三实施例提供的语音识别方法,在具体实施时,该方法当然也可以根据需要应用于即时翻译设备、信息查询设备等其它提供不同服务内容的计算设备中,此处不再赘述。
130.与本技术第一实施例提供的一种针对模型的调参方法相对应,本技术第四实施例还提供一种针对模型的调参装置,请参看图7,其为本技术第四实施例提供的一种针对模型的调参装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本技术第四实施例提供的一种针对模型的调参装置包括如下部分:
131.第一信息获得单元701,用于从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息。
132.第一目标模型获得单元702,用于根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型。
133.第二信息获得单元703,用于判断所述第一目标模型中是否存在满足预设性能条件的目标模型,如果不存在,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型。
134.目标模型获得单元704,用于根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
135.可选的,所述装置还包括性能信息获得单元,具体用于获得与所述第一目标模型对应的第一性能信息;根据所述第一性能信息,判断所述第一目标模型中是否存在满足所述预设性能条件的目标模型。
136.可选的,所述性能信息获得单元包括判定子单元,用于判定所述第一性能信息中是否存在不小于预设性能阈值的性能信息,如果存在,则判定所述第一目标模型中存在所述目标模型。
137.可选的,所述性能信息获得单元还包括目标模型获得子单元,用于根据所述第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型,获得所述目标模型。
138.可选的,所述根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,包括:从所述原始超参数组合信息中,获得所述第二超参数组合信息,其中,所述第二超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一目标模型中,选取满足预设模型筛选条件的模型;根据所述满足预设模型筛选条件的模型,获得所述第二待训练基础模型。
139.可选的,所述从所述原始超参数组合信息中,获得所述第二超参数组合信息,包括:从所述原始超参数组合信息中,获得第二初始超参数组合信息,其中,所述第二初始超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息;根据所述第二初始超参数组合信息和所述满足预设超参数筛选条件的超参数组合信息,获得所述第二超参数组合信息。
140.可选的,所述从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第一数值条件的性能信息;根据所述第一超参数组合信息中与满足所述预设第一数值条件的性能信息对应的超参数组合信息,获得满足所述预设超参数筛选条件的超参数组合信息。
141.可选的,所述从所述第一目标模型中,选取满足预设模型筛选条件的模型,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述第一目标模型中与满足所述预设第二数值条件的性能信息对应的模型,获得满足所述预设模型筛选条件的模型。
142.可选的,所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息训练所述第二待训练基础模型,获得第二目标模型;如果所述第二目标模型中存在满足所述预设性能条件的模型,则根据所述满足
所述预设性能条件的模型,获得所述目标模型。
143.可选的,所述第一待训练基础模型包括由用户配置的初始待训练基础模型。
144.可选的,所述装置还包括目标经验超参数组合信息获得单元,用于获得初始待训练基础模型;如果所述原始超参数组合信息不满足预设的分组训练条件,则根据所述原始超参数组合信息训练所述初始待训练基础模型,获得用于表征训练获得的模型的性能的性能信息;从所述性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述原始超参数组合信息中、与满足所述预设第二数值条件的性能信息对应的超参数组合信息,获得目标经验超参数组合信息,其中,所述目标经验超参数组合信息用于作为持续优化所述初始待训练基础模型时的经验超参数。
145.可选的,所述使用所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,包括:根据所述第一超参数组合信息和所述原始训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息和所述原始训练数据训练所述第二待训练基础模型,获得所述目标模型。
146.可选的,如果所述原始训练数据满足预设的数据拆分条件,则所述装置还包括拆分训练单元,用于根据所述预设的数据拆分条件,对所述原始训练数据进行拆分处理,获取至少一组原始分组训练数据;所述根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,还包括:从所述至少一组原始分组训练数据中,获取任意一组原始分组训练数据作为第一训练数据;根据所述第一超参数组合信息和所述第一训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:从所述至少一组原始分组训练数据中,获取第二训练数据;根据所述第二超参数组合信息和所述第二训练数据训练所述第二待训练基础模型,获得所述目标模型,其中,所述第二训练数据是所述至少一组原始分组训练数据中,除所述第一训练数据以外的任意一组原始分组训练数据。
147.可选的,如果所述原始训练数据的数量不小于预设的训练数据阈值,则判定所述原始训练数据满足所述预设的数据拆分条件。
148.可选的,所述装置还包括性能变化信息获得单元,用于获得与第一目标模型对应的第一性能信息,以及,获得与所述目标模型对应的第二性能信息;根据所述第一性能信息和所述第二性能信息,获得与所述原始超参数组合信息对应的性能变化信息。
149.与本技术第一实施例提供的一种针对模型的调参方法相对应,本技术第五实施例还提供一种电子设备,请参看图8,其为本技术第五实施例提供的一种电子设备的示意图,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本技术第五实施例提供的一种电子设备包括:
150.处理器801;
151.存储器802,用于存储针对模型的调参方法的程序,该设备通电并通过所述处理器运行所述针对模型的调参方法的程序后,执行下述步骤:
152.从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述
第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
153.与本技术第一实施例提供的一种针对模型的调参方法相对应,本技术第六实施例还提供一种存储设备,由于存储设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的存储设备实施例仅仅是示意性的。本技术第六实施例提供的一种存储设备,存储有针对模型的调参方法的程序,该程序被处理器运行,执行下述步骤:
154.从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
155.与本技术第二实施例提供的一种语音识别模型的获得方法相对应,本技术第七实施例还提供一种语音识别模型的获得装置,请参看图9,其为本技术第七实施例提供的语音识别模型的获得装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本技术第七实施例提供的一种语音识别模型的获得装置包括如下部分:
156.第一语音信息获得单元901,用于从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息。
157.第一目标语音识别模型获得单元902,用于根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型。
158.第二语音信息获得单元903,用于判断所述第一目标语音识别模型中是否不存在满足预设性能条件的目标语音识别模型,如果不存在,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型。
159.目标语音识别模型获得单元904,用于根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
160.与本技术第二实施例提供的一种语音识别模型的获得方法相对应,本技术第八实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本技术第八实施例提供的一种电子设备包括:
161.处理器;
162.存储器,用于存储语音识别模型的获得方法的程序,该设备通电并通过所述处理器运行所述语音识别模型的获得方法的程序后,执行下述步骤:
163.从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述
第二待训练语音识别模型,获得所述目标语音识别模型。
164.与本技术第二实施例提供的一种语音识别模型的获得方法相对应,本技术第九实施例还提供一种存储设备,由于存储设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的存储设备实施例仅仅是示意性的。本技术第九实施例提供的一种存储设备,存储有语音识别模型的获得方法的程序,该程序被处理器运行,执行下述步骤:
165.从与语音识别模型对应的原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练语音识别模型,获得第一目标语音识别模型;如果所述第一目标语音识别模型中不存在满足预设性能条件的目标语音识别模型,则根据所述原始超参数组合信息和所述第一目标语音识别模型,获得第二超参数组合信息和第二待训练语音识别模型;根据所述第二超参数组合信息和所述第二待训练语音识别模型,获得所述目标语音识别模型。
166.与本技术第三实施例提供的一种语音识别方法相对应,本技术第十实施例还提供一种语音识别装置,请参看图10,其为本技术第十实施例提供的语音识别装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本技术第十实施例提供的一种语音识别装置包括如下部分:
167.获取单元1001,用于获取待识别语音信息。
168.识别单元1002,用于将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
169.与本技术第三实施例提供的一种语音识别方法相对应,本技术第十一实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本技术第十一实施例提供的一种电子设备包括:
170.处理器;
171.存储器,用于存储语音识别方法的程序,该设备通电并通过所述处理器运行所述语音识别方法的程序后,执行下述步骤:
172.获取待识别语音信息;将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
173.与本技术第三实施例提供的一种语音识别方法相对应,本技术第十二实施例还提供一种存储设备,由于存储设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的存储设备实施例仅仅是示意性的。本技术第十二实施例提供的一种存储设备,存储有语音识别方法的程序,该程序被处理器运行,执行下述步骤:
174.获取待识别语音信息;将所述待识别语音信息输入到目标语音识别模型中,获得与所述待识别语音信息对应的目标识别信息,其中,所述目标语音识别模型是使用上述语音识别模型的获得方法获得的模型。
175.本技术虽然以较佳实施例公开如上,但其并不是用来限定本技术,任何本领域技术人员在不脱离本技术的精神和范围内,都可以做出可能的变动和修改,因此本技术的保护范围应当以本技术权利要求所界定的范围为准。
176.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
177.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
178.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
179.本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。