模型的生成方法及装置、重要度获取方法及装置的制造方法

文档序号:8258692阅读:274来源:国知局
模型的生成方法及装置、重要度获取方法及装置的制造方法
【专利说明】模型的生成方法及装置、重要度获取方法及装置 【技术领域】
[0001] 本发明涉及计算机应用技术领域,尤其涉及一种模型的生成方法及装置、重要度 获取方法及装置。 【【背景技术】】
[0002] 对于给定的文本,准确地计算出其中每个词条的重要度,进而可以应用于后续的 搜索或者语义分析等。例如,搜索场景下,用户输入查询文本时,该查询文本中包含若干词 条,其中会存在冗余词条,如果用真个查询文本进行搜索,会影响搜索效率以及降低搜索结 果的质量。因此,需要对查询文本中的词条进行重要度计算,然后利用其中重要度较高的一 些词条去进行搜索,去掉其中的冗余词条。
[0003] 现有技术中,有能够依据给定的词条输出重要度或者重要度排序的模型,这些模 型能够保证输出的词条的重要度的数值的准确性,或者能够保证属于同一个文本的两个词 条之间的重要度排序的准确性。然而,如果既需要获得词条的重要度的数值,同时还需要词 条的重要度排序,那么目前的模型都无法满足,另外,也不能够获得词条的重要度的其他信 息,如词条的重要度之间的区分度、重要度的取值范围等,因此,目前用于获取词条的重要 度信息的模型的可靠性比较低。 【
【发明内容】

[0004] 有鉴于此,本发明实施例提供了一种模型的生成方法及装置、重要度获取方法及 装置,可以解决现有技术中获得词条的重要度信息的模型的可靠性比较低的问题。
[0005] 本发明实施例的一方面,提供一种模型的生成方法,包括:
[0006] 依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准 确率中至少一个,构建M个候选模型,M为大于0的整数;
[0007] 利用所述M个候选模型,获得所述词条的M个归一化的候选模型输出值;
[0008] 利用评估模型对所述M个归一化的候选模型输出值进行评估,以获得目标模型输 出值,将所述目标模型输出值所对应的候选模型作为目标模型。
[0009] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据获 得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一 个,构建M个候选模型之前,所述方法还包括:
[0010] 利用初始模型,获得所述词条的初始模型输出值;
[0011] 依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型 输出值,获得所述词条的归一化的初始模型输出值;
[0012] 依据所述词条的归一化的初始模型输出值,获得所述词条的重要度准确率;和/ 或,依据所述词条的归一化的初始模型输出值或者所述词条的初始模型输出值,获得所述 词条之间的排序准确率;和/或,依据所述词条的归一化的初始模型输出值,获得所述词条 之间的区分度准确率。
[0013] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述词条的 重要度准确率的数目为N个,所述词条之间的排序准确率的数目为P个,词条之间的区分度 准确率的数目为Q个,N、P和Q均为正整数,且不同时为0,且N、P和Q中至少一个大于或 者等于2,所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分 度准确率中至少一个,构建M个候选模型,包括:
[0014] 依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区 分度准确率中至少一个,获得K个目标准确率,K为大于1且小于或等于的整数;
[0015] 依据所述K个目标准确率,对初始模型的第一模型参数进行调整,以获得M个第二 模型参数;
[0016] 依据所述M个第二模型参数,构建所述M个候选模型。
[0017] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据所 述K个目标准确率,对初始模型的第一模型参数进行调整,以获得M个第二模型参数,包 括:
[0018] 依据所述K个目标准确率以及预设的准确率阈值,获得大于或者等于所述准确率 阈值的M个目标准确率;
[0019] 对所述M个目标准确率中的每个所述目标准确率分别进行求导运算,以获得M个 梯度值;
[0020] 依据所述M个梯度值中每个所述梯度值,分别对所述初始模型的第一模型参数进 行调整,以获得M个第二模型参数。
[0021] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用所 述M个候选模型,获得所述词条的M个归一化的候选模型输出值,包括:
[0022] 利用所述M个候选模型,获得所述词条的M个候选模型输出值;
[0023] 依据所述词条的每个候选模型输出值、所述词条所在文本中其他词条的候选模型 输出值,获得所述词条的M个归一化的候选模型输出值。
[0024] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述评估模 型包括所述词条所在文本中所有词条的标准输出值,所述利用评估模型对所述M个归一化 的候选模型输出值进行评估,以获得目标模型输出值,包括:
[0025] 针对每个所述候选模型,确定所述文本中归一化的候选模型输出值最高的K个词 条;
[0026] 确定所述文本中所述标准输出值最高的R个词条,R为大于K的整数;
[0027] 依据所述文本中归一化的候选模型输出值最高的K个词条、所述文本中所述标准 输出值最高的R个词条,获得每个所述归一化的候选模型输出值的评估结果;
[0028] 依据所述评估结果,从所述M个归一化的候选模型输出值中选出一个归一化的候 选模型输出值,以作为所述目标模型输出值。
[0029] 本发明实施例的一方面,提供一种重要度获取方法,包括:
[0030] 获得待处理文本;
[0031] 对所述待处理文本进行切词处理,以获得至少一个词条;
[0032] 利用目标模型,获得所述至少一个词条中每个所述词条的目标模型输出值,以作 为每个所述词条的重要度;
[0033] 其中,所述目标模型为利用权利要求1至6中任一权利要求所述的模型的生成方 法生成的。
[0034] 本发明实施例的一方面,提供一种模型的生成装置,包括:
[0035] 构建单元,用于依据获得的词条的重要度准确率、词条之间的排序准确率和词条 之间的区分度准确率中至少一个,构建M个候选模型,M为大于0的整数;
[0036] 第一获取单元,用于利用所述M个候选模型,获得所述词条的M个归一化的候选模 型输出值;
[0037] 评估单元,用于利用评估模型对所述M个归一化的候选模型输出值进行评估,以 获得目标模型输出值,将所述目标模型输出值所对应的候选模型作为目标模型。
[0038] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还 包括:
[0039] 第二获取单元,用于利用初始模型,获得所述词条的初始模型输出值;以及,用于 依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型输出值,获 得所述词条的归一化的初始模型输出值;以及,用于依据所述词条的归一化的初始模型输 出值,获得所述词条的重要度准确率;和/或,依据所述词条的归一化的初始模型输出值或 者所述词条的初始模型输出值,获得所述词条之间的排序准确率;和/或,依据所述词条的 归一化的初始模型输出值,获得所述词条之间的区分度准确率。
[0040] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述词条的 重要度准确率的数目为N个,所述词条之间的排序准确率的数目为P个,词条之间的区分度 准确率的数目为Q个,N、P和Q均为正整数,且不同时为0,且N、P和Q中至少一个大于或 者等于2,所述构建单元,具体用于:
[0041] 依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区 分度准确率中至少一个,获得K个目标准确率,K为大于1且小于或等于的整数;
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1