一种纪要生成方法、装置、设备及存储介质与流程

文档序号:29440389发布日期:2022-03-30 10:02阅读:来源:国知局

技术特征:
1.一种纪要生成方法,其特征在于,包括:获取待生成纪要的文本,作为目标文本;获取所述目标文本的词级信息、句级信息和话题级信息,其中,所述词级信息包括所述目标文本中词的上下文信息和所述目标文本的关键词信息,所述句级信息包括所述目标文本中句子的上下文信息和所述目标文本的重点句信息,所述话题级信息包括所述目标文本的话题分割信息;根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要。2.根据权利要求1所述的纪要生成方法,其特征在于,所述获取所述目标文本的词级信息、句级信息和话题级信息,以及,所述根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要,包括:利用纪要生成模块的文本理解部分,获取所述目标文本的词级信息、句级信息以及话题级信息;利用所述纪要生成模块的纪要生成部分,以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要。3.根据权利要求2所述的纪要生成方法,其特征在于,获取所述目标文本的词级信息和句级信息,包括:获取所述目标文本包含的每个句子中每个词对应的融合有上下文信息的词特征,并以获取的词特征为依据,预测所述目标文本包含的每个句子中每个词为关键词的概率;获取所述目标文本中每个句子对应的融合有上下文信息的句特征,并以获取的句特征为依据,预测所述目标文本包含的每个句子为重点句的概率;所述目标文本包含的每个句子中每个词对应的词特征和每个句子中每个词为关键词的概率作为所述目标文本的词级信息,所述目标文本中每个句子对应的句特征和每个句子为重点句的概率作为所述目标文本的句级信息。4.根据权利要求3所述的纪要生成方法,其特征在于,获取所述目标文本的词级信息和句级信息,还包括:针对所述目标文本中的每个句子:根据该句子中每个词为关键词的概率和该句子为重点句的概率,确定联合该句子为重点句的概率后,该句子中的每个词为关键词的概率,作为该句子中每个词对应的联合重点句概率后的关键词概率;根据该句子中每个词为关键词的概率和该句子为重点句的概率,确定联合该句子中每个词为关键词的概率后,该句子为重点句的概率,作为该句子对应的联合关键词概率后的重点句概率;所述目标文本包含的每个句子中每个词对应的词特征和每个句子中每个词对应的联合重点句概率后的关键词概率作为所述目标文本的词级信息,所述目标文本中每个句子对应的句特征和每个句子对应的联合关键词概率后的重点句概率,作为所述目标文本的句级信息。5.根据权利要求4所述的纪要生成方法,其特征在于,获取所述目标文本的话题级信息,包括:
根据所述目标文本的句级信息,对所述目标文本进行话题分割,得到话题分割结果,作为所述目标文本的话题级信息。6.根据权利要求5所述的纪要生成方法,其特征在于,所述根据所述目标文本的句级信息,对所述目标文本进行话题分割,得到话题分割结果,包括:针对所述目标文本中的每个句子,根据该句子对应的句特征和该句子对应的联合关键词概率后的重点句概率,确定该句子对应的联合关键词概率后的句特征,并以该句子对应的联合关键词概率后的句特征为依据,预测该句子为话题结束句的概率;根据所述目标文本中的每个句子为话题结束句的概率,确定话题分割结果。7.根据权利要求2所述的纪要生成方法,其特征在于,所述以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要,包括:在每个解码时刻:根据当前解码时刻的状态向量、所述目标文本的词级信息和句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,其中,当前解码时刻的状态向量为表示已解码结果信息的状态向量;根据当前解码时刻的状态向量、所述目标文本的话题级信息,确定所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量;根据当前解码时刻的状态向量、所述目标文本的所有句子在当前解码时刻对应的上下文向量和所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量,确定当前解码时刻的纪要生成结果。8.根据权利要求7所述的纪要生成方法,其特征在于,所述根据当前解码时刻的状态向量、所述目标文本的词级信息和句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,包括:根据当前解码时刻的状态向量和所述目标文本的词级信息,确定所述目标文本包含的每个句子的所有词在当前解码时刻对应的上下文向量;根据当前解码时刻的状态向量、所述目标文本包含的每个句子的所有词在当前解码时刻对应的上下文向量和所述目标文本的句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量。9.根据权利要求8所述的纪要生成方法,其特征在于,所述目标文本的句级信息包括所述目标文本包含的每个句子对应的句特征和每个句子对应的联合关键词概率后的重点句概率;所述根据当前解码时刻的状态向量、所述目标文本包含的每个句子的所有词在当前解码时刻对应的上下文向量和所述目标文本的句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,包括:针对所述目标文本中的每个句子,根据当前解码时刻的状态向量、该句子的所有词在当前解码时刻对应的上下文向量、该句子对应的句特征和该句子对应的联合关键词概率后的重点句概率,确定该句子在当前解码时刻对应的权重;根据所述目标文本包含的每个句子在当前解码时刻对应的权重、每个句子对应的句特征和每个句子的所有词在当前解码时刻对应的上下文向量,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量。
10.根据权利要求7所述的纪要生成方法,其特征在于,所述根据当前解码时刻的状态向量、所述目标文本的话题级信息,确定所述目标文本的所有话题在当前解码时刻对应的上下文向量,包括:根据所述目标文本的话题级信息,确定所述目标文本涉及的每个话题包含的句子;针对所述目标文本涉及的每个话题,根据该话题包含的每个句子对应的句特征和该话题包含的每个句子的所有词在当前解码时刻对应的上下文向量,确定该话题在当前解码时刻的表示向量;根据当前解码时刻的状态向量和所述目标文本涉及的每个话题在当前解码时刻的表示向量,确定所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量。11.根据权利要求2~10中任一项所述的纪要生成方法,其特征在于,所述纪要生成模块为纪要生成模型,所述纪要生成模型采用标注有关键词、重点句、话题结束句的训练文本以及所述训练文本对应的纪要训练得到,所述纪要生成模型的训练过程包括:利用纪要生成模型的文本理解部分,预测所述训练文本包含的每个句子中每个词为关键词的概率、每个句子为重点句的概率以及每个句子为话题结束句的概率,以得关键词预测结果、重点句预测结果和话题结束句预测结果;利用纪要生成模型的纪要生成部分,以所述训练文本的词级信息、句级信息和话题级信息为依据,预测所述训练文本对应的纪要,得到纪要预测结果,其中,所述训练文本的词级信息、句级信息和话题级信息基于所述纪要生成模型的文本理解部分获得;根据所述关键词预测结果、所述重点句预测结果、所述话题结束句预测结果、所述纪要预测结果,以及所述训练文本标注的关键词、重点句、话题结束句和所述训练文本对应的纪要确定预测损失,并根据所述预测损失对纪要生成模型进行参数更新。12.一种纪要生成装置,其特征在于,包括:文本获取模块和文本处理模块;所述文本获取模块,用于获取待生成纪要的文本,作为目标文本;所述文本处理模块,用于获取所述目标文本的词级信息、句级信息和话题级信息,并根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要;其中,所述词级信息包括所述目标文本中词的上下文信息和所述目标文本的关键词信息,所述句级信息包括所述目标文本中句子的上下文信息和所述目标文本的重点句信息,所述话题级信息包括所述目标文本的话题分割信息。13.根据权利要求12所述的纪要生成装置,其特征在于,所述文本处理模块,具体用于:利用纪要生成模块的文本理解部分,获取所述目标文本的词级信息、句级信息以及话题级信息;利用所述纪要生成模块的纪要生成部分,以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要。14.一种纪要生成设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现如权利要求1~11中任一项所述的纪要生成方法的各个步骤。15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~11中任一项所述的纪要生成方法的各个步骤。

技术总结
本申请提供了一种纪要生成方法、装置、设备及存储介质,其中,方法包括:获取待生成纪要的文本,作为目标文本;获取目标文本的词级信息、句级信息和话题级信息,其中,词级信息包括目标文本中词的上下文信息和目标文本的关键词信息,句级信息包括目标文本中句子的上下文信息和目标文本的重点句信息,话题级信息包括目标文本的话题分割信息;根据目标文本的词级信息、句级信息和话题级信息,生成目标文本对应的纪要。本申请提供的纪要生成方法可自动生成目标文本对应的纪要。成目标文本对应的纪要。成目标文本对应的纪要。


技术研发人员:戚婷 万根顺 王智国 高建清 刘聪 胡国平
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2021.12.21
技术公布日:2022/3/29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1