模型的生成方法及装置、重要度获取方法及装置的制造方法

文档序号：8258692阅读：274来源：国知局

模型的生成方法及装置、重要度获取方法及装置的制造方法
【专利说明】模型的生成方法及装置、重要度获取方法及装置【技术领域】
[0001] 本发明涉及计算机应用技术领域，尤其涉及一种模型的生成方法及装置、重要度获取方法及装置。【【背景技术】】
[0002] 对于给定的文本，准确地计算出其中每个词条的重要度，进而可以应用于后续的搜索或者语义分析等。例如，搜索场景下，用户输入查询文本时，该查询文本中包含若干词条，其中会存在冗余词条，如果用真个查询文本进行搜索，会影响搜索效率以及降低搜索结果的质量。因此，需要对查询文本中的词条进行重要度计算，然后利用其中重要度较高的一些词条去进行搜索，去掉其中的冗余词条。
[0003] 现有技术中，有能够依据给定的词条输出重要度或者重要度排序的模型，这些模型能够保证输出的词条的重要度的数值的准确性，或者能够保证属于同一个文本的两个词条之间的重要度排序的准确性。然而，如果既需要获得词条的重要度的数值，同时还需要词条的重要度排序，那么目前的模型都无法满足，另外，也不能够获得词条的重要度的其他信息，如词条的重要度之间的区分度、重要度的取值范围等，因此，目前用于获取词条的重要度信息的模型的可靠性比较低。【
【发明内容】
】
[0004] 有鉴于此，本发明实施例提供了一种模型的生成方法及装置、重要度获取方法及装置，可以解决现有技术中获得词条的重要度信息的模型的可靠性比较低的问题。
[0005] 本发明实施例的一方面，提供一种模型的生成方法，包括：
[0006] 依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；
[0007] 利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；
[0008] 利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，将所述目标模型输出值所对应的候选模型作为目标模型。
[0009] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型之前，所述方法还包括：
[0010] 利用初始模型，获得所述词条的初始模型输出值；
[0011] 依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型输出值，获得所述词条的归一化的初始模型输出值；
[0012] 依据所述词条的归一化的初始模型输出值，获得所述词条的重要度准确率；和/ 或，依据所述词条的归一化的初始模型输出值或者所述词条的初始模型输出值，获得所述词条之间的排序准确率；和/或，依据所述词条的归一化的初始模型输出值，获得所述词条之间的区分度准确率。
[0013] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述词条的重要度准确率的数目为N个，所述词条之间的排序准确率的数目为P个，词条之间的区分度准确率的数目为Q个，N、P和Q均为正整数，且不同时为0,且N、P和Q中至少一个大于或者等于2,所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，包括：
[0014] 依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区分度准确率中至少一个，获得K个目标准确率，K为大于1且小于或等于的整数；
[0015] 依据所述K个目标准确率，对初始模型的第一模型参数进行调整，以获得M个第二模型参数；
[0016] 依据所述M个第二模型参数，构建所述M个候选模型。
[0017] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述依据所述K个目标准确率，对初始模型的第一模型参数进行调整，以获得M个第二模型参数，包括：
[0018] 依据所述K个目标准确率以及预设的准确率阈值，获得大于或者等于所述准确率阈值的M个目标准确率；
[0019] 对所述M个目标准确率中的每个所述目标准确率分别进行求导运算，以获得M个梯度值；
[0020] 依据所述M个梯度值中每个所述梯度值，分别对所述初始模型的第一模型参数进行调整，以获得M个第二模型参数。
[0021] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值，包括：
[0022] 利用所述M个候选模型，获得所述词条的M个候选模型输出值；
[0023] 依据所述词条的每个候选模型输出值、所述词条所在文本中其他词条的候选模型输出值，获得所述词条的M个归一化的候选模型输出值。
[0024] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述评估模型包括所述词条所在文本中所有词条的标准输出值，所述利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，包括：
[0025] 针对每个所述候选模型，确定所述文本中归一化的候选模型输出值最高的K个词条；
[0026] 确定所述文本中所述标准输出值最高的R个词条，R为大于K的整数；
[0027] 依据所述文本中归一化的候选模型输出值最高的K个词条、所述文本中所述标准输出值最高的R个词条，获得每个所述归一化的候选模型输出值的评估结果；
[0028] 依据所述评估结果，从所述M个归一化的候选模型输出值中选出一个归一化的候选模型输出值，以作为所述目标模型输出值。
[0029] 本发明实施例的一方面，提供一种重要度获取方法，包括：
[0030] 获得待处理文本；
[0031] 对所述待处理文本进行切词处理，以获得至少一个词条；
[0032] 利用目标模型，获得所述至少一个词条中每个所述词条的目标模型输出值，以作为每个所述词条的重要度；
[0033] 其中，所述目标模型为利用权利要求1至6中任一权利要求所述的模型的生成方法生成的。
[0034] 本发明实施例的一方面，提供一种模型的生成装置，包括：
[0035] 构建单元，用于依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；
[0036] 第一获取单元，用于利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；
[0037] 评估单元，用于利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，将所述目标模型输出值所对应的候选模型作为目标模型。
[0038] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述装置还包括：
[0039] 第二获取单元，用于利用初始模型，获得所述词条的初始模型输出值；以及，用于依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型输出值，获得所述词条的归一化的初始模型输出值；以及，用于依据所述词条的归一化的初始模型输出值，获得所述词条的重要度准确率；和/或，依据所述词条的归一化的初始模型输出值或者所述词条的初始模型输出值，获得所述词条之间的排序准确率；和/或，依据所述词条的归一化的初始模型输出值，获得所述词条之间的区分度准确率。
[0040] 如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述词条的重要度准确率的数目为N个，所述词条之间的排序准确率的数目为P个，词条之间的区分度准确率的数目为Q个，N、P和Q均为正整数，且不同时为0,且N、P和Q中至少一个大于或者等于2,所述构建单元，具体用于：
[0041] 依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区分度准确率中至少一个，获得K个目标准确率，K为大于1且小于或等于的整数；

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：石磊;连荣忠;张鹏;
技术所有人：百度在线网络技术(北京)有限公司;
我是此专利的发明人

上一篇：一种文件处理方法及装置的制造方法
上一篇：一种垃圾数据的清理方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。