文本摘要生成方法、装置、设备和存储介质与流程

文档序号：26750642发布日期：2021-09-25 02:23阅读：来源：国知局

技术特征：
1.一种文本摘要生成方法，其特征在于，所述方法包括：获取训练样本集，所述训练样本集包括使用样本摘要标注过的样本文本；利用所述训练样本集对当前预训练bert模型进行训练；判断所述当前预训练bert模型是否不为检测模型且不满足预设的训练终止条件；若所述当前预训练bert模型为检测模型，和/或，所述当前预训练bert模型满足预设的训练终止条件，则对所述当前预训练bert模型进行能力检测，得到能力检测结果；根据所述能力检测结果判断是否执行训练节点回退操作；若执行训练节点回退操作，则根据回退规则确定下一预训练bert模型，将所述下一预训练bert模型作为当前预训练bert模型，返回执行所述利用所述训练样本集对当前预训练bert模型进行训练的步骤；若不执行训练节点回退操作且所述当前预训练bert模型不满足预设的训练终止条件，则根据所述当前预训练bert模型确定下一预训练bert模型，将所述下一预训练bert模型作为当前预训练bert模型，返回执行所述利用所述训练样本集对当前预训练bert模型进行训练的步骤；若不执行训练节点回退操作且所述当前预训练bert模型满足预设的训练终止条件，则得到摘要生成模型；若所述当前预训练bert模型不为检测模型且不满足预设的训练终止条件，则根据所述当前预训练bert模型确定下一预训练bert模型，将所述下一预训练bert模型作为当前预训练bert模型，返回执行所述利用所述训练样本集对当前预训练bert模型进行训练的步骤；将摘要待提取文本输入至所述摘要生成模型，得到目标摘要。2.根据权利要求1所述的方法，其特征在于，在所述获取训练样本集之前，所述方法还包括：获取样本文件中每两个样本文本对应的两个样本摘要的摘要相似度；将摘要相似度大于等于预设相似度所对应的两个样本文本的标签设为相同样本摘要，或，将摘要相似度大于等于预设相似度的两个样本摘要进行合并处理后作为对应的两个样本文本的共同样本摘要；根据所有样本文本的权重比，复制样本文本、并复制对应的样本摘要作为样本文本副本的标签，使不同样本文本之间的数量之比为权重之比。3.根据权利要求1所述的方法，其特征在于，在所述判断所述当前预训练bert模型是否不为检测模型且不满足预设的训练终止条件之前，所述方法还包括：根据获取到的所述当前预训练bert模型对应的训练数据更新训练记录表，所述训练记录表包括每个历史训练节点对应的历史预训练bert模型的历史模型参数、训练完成时刻、是否满足预设的训练终止条件；所述若执行训练节点回退操作，则根据回退规则确定下一预训练bert模型，包括：若执行训练节点回退操作，则根据所述训练记录表和所述回退规则，将训练节点从所述当前预训练bert模型对应的当前训练节点回退至目标历史训练节点，根据所述目标历史训练节点对应的目标历史预训练bert模型确定下一预训练bert模型。4.根据权利要求3所述的方法，其特征在于，在所述对当前预训练bert模型进行能力检
测，得到能力检测结果之后，所述方法还包括：根据所述当前预训练bert模型的能力检测结果更新所述训练记录表，所述训练记录表还包括：每个历史检测模型的能力检测结果；所述根据所述训练记录表和所述回退规则，将训练节点从所述当前预训练bert模型对应的当前训练节点回退至目标历史训练节点，包括：根据所述训练记录表和回退规则获取当前预训练bert模型之前且表现指标满足预设标准的目标历史预训练bert模型，将训练节点从所述当前预训练bert模型对应的当前训练节点回退至所述目标历史预训练bert模型对应的目标历史训练节点。5.根据权利要求1所述的方法，其特征在于，所述对所述当前预训练bert模型进行能力检测，得到能力检测结果，包括：获取测试样本集；利用所述测试样本集对所述当前预训练bert模型进行模型功能检测，以获取表现指标；根据所述表现指标与预设标准得到能力检测结果。6.根据权利要求1所述的方法，其特征在于，在所述利用所述训练样本集对当前预训练bert模型进行训练之前，所述方法还包括：对每个样本文本进行分句处理，得到每个样本文本对应的样本语段集，所述样本语段集包括至少一个样本语段；对所述样本语段进行文本聚类，以对属于冗余词库中的冗余语句的样本语段进行截取操作，得到截取后的样本文本。7.根据权利要求1所述的方法，其特征在于，所述利用所述训练样本集对当前预训练bert模型进行训练包括：对每个所述样本文本进行分句处理，得到每个所述样本文本对应的样本语段集；对每个所述样本语段集中的每个样本语段进行分词处理，得到每个所述样本语段对应的包含至少一个词的第一序列；获取每个词的语义标签；将所述样本语段集对应的第一序列集合输入至特征提取器，以提取所述样本语段集的第一特征信息，所述第一特征信息包括所述样本语段集中每个词的词编码、位置编码；根据所述词的语义标签生成每个词对应的语义编码；将同一个词的词编码、位置编码和语义编码进行拼接处理，以得到每个所述样本语段集的第二特征信息；将训练样本集中样本文本的第二特征信息输入至当前预训练bert模型得到对应样本文本的预测摘要；根据所述当前预训练bert模型得到的样本文本的预测摘要和样本摘要，确定当前预训练bert模型是否满足预设的训练终止条件。8.一种文本摘要生成装置，其特征在于，所述装置包括：样本获取模块，用于获取训练样本集，所述训练样本集包括使用样本摘要标注过的样本文本；训练模块，用于利用所述训练样本集对当前预训练bert模型进行训练；
第一判断模块，用于判断所述当前预训练bert模型是否不为检测模型且不满足预设的训练终止条件；检测模块，用于若所述当前预训练bert模型为检测模型，和/或，当前预训练bert模型满足预设的训练终止条件，则对所述当前预训练bert模型进行能力检测，得到能力检测结果；第二判断模块，用于根据所述能力检测结果判断是否执行训练节点回退操作；第一循环模块，用于若执行训练节点回退操作，则根据回退规则确定下一预训练bert模型，将所述下一预训练bert模型作为当前预训练bert模型，返回至所述训练模块；第二循环模块，用于若不执行训练节点回退操作且所述当前预训练bert模型不满足预设的训练终止条件，则根据所述当前预训练bert模型确定下一预训练bert模型，将所述下一预训练bert模型作为当前预训练bert模型，返回至所述训练模块；训练停止模块，用于若不执行训练节点回退操作且所述当前预训练bert模型满足预设的训练终止条件，则得到摘要生成模型；第三循环模块，用于若所述当前预训练bert模型不为检测模型且不满足预设的训练终止条件，则根据所述当前预训练bert模型确定下一预训练bert模型，将所述下一预训练bert模型作为当前预训练bert模型，返回至所述训练模块；摘要生成模块，用于将摘要待提取文本输入至所述摘要生成模型，得到目标摘要。9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时执行如权利要求1
‑
7任一项所述的文本摘要生成方法的步骤。10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时，使得所述处理器执行如权利要求1
‑
7任一项所述的文本摘要生成方法的步骤。

技术总结
本申请提出一种文本摘要生成方法、装置、设备和存储介质，本申请利用被样本摘要标注的样本文本对预训练Bert模型进行模型训练，并通过抽检的方式对训练过程中的检测模型进行能力检测，以及时将训练节点从糟糕的训练节点回退至较好的历史训练节点，进而通过回退操作纠正训练方向直至训练完成。本申请有效提升Bert在摘要模型上的表现能力的同时，尽量避免Bert模型在训练微调过程中发生灾难性遗忘等其他丧失本身基本功能的问题，保证了最后得到的已训练的摘要生成模型既保留了Bert模型原本的各种强大功能，也具有较好的摘要生成功能，进而保证生成的摘要具有较高的准确性和可读性。而保证生成的摘要具有较高的准确性和可读性。而保证生成的摘要具有较高的准确性和可读性。

技术研发人员：王改吴少康
受保护的技术使用者：平安国际智慧城市科技股份有限公司
技术研发日：2021.06.24
技术公布日：2021/9/24

完整全部详细技术资料下载

当前第2页1 2