一种摘要生成方法、装置、电子设备及存储介质与流程

文档序号:30340878发布日期:2022-06-08 07:59阅读:59来源:国知局
一种摘要生成方法、装置、电子设备及存储介质与流程

1.本技术涉及信息处理技术领域,特别是涉及一种摘要生成方法、装置、电子设备及存储介质。


背景技术:

2.随着互联网的不断发展,网络中的文本数据呈爆发式增长,为了向用户提供更多适应用户的信息,通常会向用户进行推送,从而建立稳定的用户预期和反馈机制,摘要是连接用户和文本的桥梁,摘要可以直接引导用户阅读文本的内容,但是若摘要与文本的内容的描述不一致,进而降低用户体验。


技术实现要素:

3.鉴于上述问题,本发明实施例提供了一种摘要生成方法、装置、电子设备及存储介质,以便提高摘要与文本的内容的一致性。
4.本发明实施例的第一方面,提供了一种摘要生成方法,所述方法包括:
5.获取待处理文本;
6.对所述待处理文本中至少两个句子进行组合,生成多个候选摘要;
7.通过预先训练的摘要识别模型,分别确定所述多个候选摘要与所述待处理文本的一致度,并根据所述多个候选摘要各自对应的一致度,从所述多个候选摘要中识别出所述待处理文本的摘要;
8.其中,预先训练的摘要识别模型是根据文本样本与其参考摘要样本之间的一致度,以及,所述文本样本与其每个候选摘要样本之间的一致度,对预设模型进行对比学习训练得到的。
9.可选地,在对所述待处理文本中至少两个句子进行组合,生成多个候选摘要之前,还包括对所述待处理文本进行以下至少一种预处理:
10.对所述待处理文本中包含于另一句子的句子进行去重;
11.对所述待处理文本中的任意两个句子进行预组合,在参与预组合的两个句子的相同文本与单句的长度之比大于预设比例时,在执行生成多个候选摘要的步骤中,放弃对所述参与预组合的两个句子进行组合;
12.针对所述待处理文本中顺序排列且首尾包含相同文本的两个句子,对所述两个句子中一个句子包含的相同文本进行去重;
13.对所述待处理文本中至少两个句子进行组合,生成多个候选摘要,包括:
14.对所述待处理文本中经预处理后的至少两个句子进行组合,生成多个候选摘要。
15.可选地,所述摘要识别模型是按照以下步骤训练得到的:
16.获取文本样本、所述文本样本的参考摘要样本、以及所述文本样本的多个候选摘要样本,并输入预设模型;
17.通过所述预设模型确定所述文本样本与其每个候选摘要样本之间的文本-候选摘
要一致度,并确定所述文本样本与其参考摘要样本之间的文本-参考摘要一致度;
18.将经过所述第一对比学习和所述第二对比学习之后的预设模型,确定为所述摘要识别模型;
19.其中,所述第一对比学习为所述预设模型根据所述文本-参考摘要一致度与每个候选摘要样本对应的文本-候选摘要一致度,进行的所述文本样本的参考摘要样本分别与每个候选摘要样本之间的对比学习;
20.所述第二对比学习为所述预设模型根据所述多个候选摘要样本各自对应的文本-候选摘要一致度,进行的所述文本样本的每两个候选摘要样本之间的对比学习。
21.可选地,还包括:
22.确定所述多个候选摘要样本分别与所述参考摘要样本之间的文本相似度;
23.按照文本相似度由大到小的顺序,为所述多个候选摘要样本分别添加对应的序号;
24.所述第二对比学习的损失值是按照以下步骤确定的:
25.在序号在前的文本-候选摘要的一致度小于序号在后的文本-候选摘要的一致度时,确定损失值;
26.或,在序号在前的文本-候选摘要的一致度大于序号在后的一致度,且两者一致度的差值小于标定阈值时,确定损失值,其中,所述标定阈值与序号差的绝对值呈正比;
27.对确定出的损失值进行累计,得到所述第二对比学习的损失值。
28.可选地,确定所述多个候选摘要样本分别与所述参考摘要样本之间的文本相似度,包括:
29.针对每个候选摘要样本,根据该候选摘要样本以及所述参考摘要样本各自包含的词组数量、两者的相同文本包含的词组数量,以及预设长度调控因子,确定所述多个候选摘要样本分别与所述参考摘要样本之间的文本相似度。
30.可选地,所述文本样本与其参考摘要样本之间的一致度是按照以下步骤确定的:
31.通过所述预设模型确定所述文本样本与其参考摘要样本各自的向量表示;
32.通过所述预设模型确定所述文本样本与其参考摘要样本各自的向量表示之间的余弦相似度,将该余弦相似度确定为所述文本样本与其参考摘要样本之间的一致度;
33.文本样本与其每个候选摘要样本之间的一致度是按照以下步骤确定的:
34.通过所述预设模型确定所述文本样本与每个候选摘要样本各自的向量表示;
35.通过所述预设模型确定所述文本样本与每个候选摘要样本各自的向量表示之间的余弦相似度,将该余弦相似度确定为所述文本样本与每个候选摘要样本之间的一致度。
36.本发明实施例的第二方面,提供了一种摘要生成装置,所述装置包括:
37.获取模块,用于获取待处理文本;
38.生成模块,用于对所述待处理文本中至少两个句子进行组合,生成多个候选摘要;
39.识别模块,用于通过预先训练的摘要识别模型,分别确定所述多个候选摘要与所述待处理文本的一致度,并根据所述多个候选摘要各自对应的一致度,从所述多个候选摘要中识别出所述待处理文本的摘要;
40.其中,预先训练的摘要识别模型是根据文本样本与其参考摘要样本之间的一致度,以及,所述文本样本与其每个候选摘要样本之间的一致度,对预设模型进行对比学习训
练得到的。
41.本发明实施例的第三方面,提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例第一方面所述的摘要生成方法。
42.本发明实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例第一方面所述的摘要生成方法的步骤。
43.本发明实施例包括以下优点:
44.本实施例中,在获取待处理文本后,对待处理文本中至少两个句子进行组合,生成多个候选摘要,然后利用预先训练的摘要识别模型,分别确定多个候选摘要与待处理文本的一致度,并根据多个候选摘要各自对应的一致度,从多个候选摘要中识别出待处理文本的摘要;而预先训练的摘要识别模型是根据文本样本与其参考摘要样本之间的一致度,以及,文本样本与其每个候选摘要样本之间的一致度,对预设模型进行对比学习训练得到的。
45.通过将待处理文本中的至少两个句子组合得到候选摘要,再对候选摘要与文本的内容的一致度进行处理分析,与分析一个句子作为摘要的概率然后进行组合的方法不同,本方案将摘要从句子级别转换为摘要级别,避免了信息冗余以及遗漏含有关键信息的句子的问题;摘要识别模型在训练时,同时考虑了文本样本与参考摘要样本之间的一致度,以及每个候选摘要样本与文本样本之间一致度,进而可以更加准确地识别出与待处理文本的内容一致度的候选摘要。采用本技术的技术方案可以提高摘要与文本的内容的一致性,使得生成的摘要可以更好地表征待处理文本的内容。
附图说明
46.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
47.图1是本发明实施例中一种摘要生成方法的步骤流程图;
48.图2是本发明实施例中一种训练摘要识别模型的步骤流程图;
49.图3是本发明实施例中一种摘要生成装置的结构示意图。
具体实施方式
50.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术作进一步详细的说明。
51.需要说明的是,本技术中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
52.为了解决摘要与文本一致性的问题,本技术提出了一种摘要生成方法,可以提高摘要与文本的内容一致性,使生成的摘要可以更好地表征待处理文本的内容。
53.参照图1所示,示出了本发明实施例中一种摘要生成方法的步骤流程图,如图1所示,该摘要生成方法具体可以包括以下步骤:
54.s101、获取待处理文本。
55.待处理文本指的是没有携带发表者制作的摘要的文本,或者发表者制作的摘要的文本不符合要求的文本。
56.s102、对所述待处理文本中至少两个句子进行组合,生成多个候选摘要。
57.在本实施例的一种可行的实施方式中,可以采用规则分句的方法,将待处理文本中的句子按照规则分割,用滑动窗口拼接不合理短句,从而生成最终的多个分句。
58.然后对多个分割后的句子进行组合,组合指的是将不同的句子组合在一起作为候选摘要样本,组合时至少对两个句子进行组合,对于组合中句子的数量可以自定义设置,也可以使用贪心算法确定组合中的句子数量。为了阐述方便,本实施例中,组合中的句子数量确定为两句。
59.组合时可以是对按照文本顺序排列的两个句子进行组合,也可以是对随机的两个句子进行组合,进而得到多个候选摘要。
60.在一种可行的实施方式中,在对所述待处理文本中至少两个句子进行组合,生成多个候选摘要之前,还包括对所述待处理文本进行以下至少一种预处理:
61.a1:对所述待处理文本中包含于另一句子的句子进行去重。
62.待处理文本中有些句子是重复的,因此对分割完成的多个句子进行去重,一种具体的去重方式为:对包含于另一个句子中句子进行去重。
63.a2:对所述待处理文本中的任意两个句子进行预组合,在参与预组合的两个句子的相同文本与单句的长度之比大于预设比例时,在执行生成多个候选摘要的步骤中,放弃对所述参与预组合的两个句子进行组合。
64.对任意两个句子的预组合进行枚举,然后查找两个句子中含有的相同文本的长度,若相同文本的长度大于一定比例,例如大于两个句子中任何一个句子的长度的50%时,可以表征两个句子所描述的含义差不多,则放弃参与预组合的两个句子进行组合。
65.a3:针对所述待处理文本中顺序排列且首尾包含相同文本的两个句子,对所述两个句子中一个句子包含的相同文本进行去重。
66.对于顺利排列的两个句子,若前列在前的句子的句尾和排列在后的句子的句首包含有相同文本,则对两个句子中一个句子包含的相同文本进行去重。
67.在生成多个候选摘要时,对所述待处理文本中经预处理后的至少两个句子进行组合,可以减少含义重复或者无效的句子或文本,使得生成候选摘要的组合中的句子能够更好或更多的涵盖待处理文本的内容。
68.s103、通过预先训练的摘要识别模型,分别确定所述多个候选摘要与所述待处理文本的一致度,并根据所述多个候选摘要各自对应的一致度,从所述多个候选摘要中识别出所述待处理文本的摘要。
69.其中,预先训练的摘要识别模型是根据文本样本与其参考摘要样本之间的一致度,以及,所述文本样本与其每个候选摘要样本之间的一致度,对预设模型进行对比学习训练得到的。
70.文本样本包括历史发表的携带有发表者制作的摘要的文本,其摘要即为参考摘要样本,文本样本也可以是历史发表的未携带有摘要的文本,在对摘要识别模型进行训练时,对这些未携带有摘要的文本,人工根据文本的内容编写摘要作为该文本样本的参考摘要样
本,通常认为根据文本的内容编写的摘要与文本的一致性最高。
71.摘要识别模型以参考摘要样本和文本样本的一致度,对各个候选摘要的一致度进行识别,进而可以识别出多个候选摘要中一致性最优的候选摘要,通过摘要识别模型可以快速准确地从多个候选摘要中识别出所述待处理文本的摘要。
72.在实际实施时,将多个候选摘要输入摘要识别模型,摘要识别模型可以确定出每个候选摘要与待处理文本的一致度,并根据多个候选摘要各自的一致度,从多个候选摘要中选出待处理文本的摘要。
73.本方法通过将待处理文本中的至少两个句子组合得到候选摘要,再对候选摘要与文本的内容的一致度进行处理分析,与分析一个句子作为摘要的概率然后进行组合的方法不同,本方案将摘要从句子级别转换为摘要级别,避免了信息冗余以及遗漏含有关键信息的句子的问题;摘要识别模型在训练时,同时考虑了文本样本与参考摘要样本之间的一致度,以及每个候选摘要样本与文本样本之间一致度,进而可以更加准确地识别出与待处理文本的内容一致度的候选摘要。采用本技术的技术方案可以提高摘要与文本的内容的一致性,使得生成的摘要可以更好地表征待处理文本的内容。
74.参照图2,示出了本发明实施例中一种摘要识别模型的训练方法的步骤流程图,如图2所示,所述训练方法具体可以包括以下步骤:
75.s201:获取文本样本、所述文本样本的参考摘要样本、以及所述文本样本的多个候选摘要样本。
76.本实施例中,获取文本样本后,人工根据文本样本的内容编写对应的参考摘要样本,或者直接获取携带有发表者制作的摘要的文本作为文本样本,其携带的摘要作为参考摘要样本,参考摘要样本与文本样本的一致性默认为最高。
77.针对文本样本,确定候选摘要样本的过程包括分句以及组合,其中分句与组合的方法与步骤s102中的分句与组合的方法一致,因此此处不再赘述。
78.s202:确定所述多个候选摘要样本分别与所述参考摘要样本之间的文本相似度,按照文本相似度由大到小的顺序,为所述多个候选摘要样本分别添加对应的序号。
79.在训练阶段,生成多个候选摘要样本后,还需要对多个候选摘要样本按照和参考摘要样本的相似度进行排序,才能训练出可以区分候选摘要样本优劣的模型。
80.在一种可行的实施方式中,采用自动摘要和翻译领域常用的相似度指标 rouge(ecall-oriented understudy for gistingevaluation)来度量多个候选摘要样本与参考摘要样本之间的相似度。
81.rouge-f是通过统计候选摘要样本和参考摘要样本之间相同的元组占各自本身元组个数的比例来计算其相似度,即rouge-f类似机器学习中的 f值(f-measure),f值是精度和召回率的加权调和平均,本实施例中相同元组占候选摘要样本元组的比例是精度,占参考摘要样本元组的比例是召回率,具体的:
[0082][0083]
其中:
representation from transformers,预训练的语言表征模型)网络获取向量表示,本实施方式中所采用的孪生网络包含两个结构相同且共享参数的子网络,分别用于提取文本样本、参考摘要样本以及多个候选摘要样本各自的向量表示。
[0103]
因为孪生bert网络输出的embedding向量中的cls位置通常代表了整体向量表示,因此本实施例中将文本样本的embedding向量的cls位置作为文本样本的向量表示;将多个候选摘要样本各自的embedding向量的cls 位置作为多个候选摘要样本各自的向量表示,将参考摘要样本的embedding 向量的cls位置作为参考摘要样本的向量表示。
[0104]
本实施方式中,采用向量空间的余弦相似度来度量一致度,示例地,参考摘要样本或候选摘要样本与文本样本之间的一致度可以表示为:
[0105][0106]
式中,文本即文本样本,摘要可以是该文本样本对应的参考摘要样本,也可以是根据该文本样本生成的候选摘要样本。
[0107]
通过设置目标损失阈值,可以对预设进行多次训练,从而保证预设模型得到的一致度的精确度;根据文本样本与其每个候选摘要样本之间的文本
‑ꢀ
候选摘要一致度,与文本样本与其参考摘要样本之间的文本-参考摘要一致度,对预设模型进行对比学习训练,以得到摘要识别模型。
[0108]
在对比学习的过程中,如果有n个候选摘要样本,参与学习的参量应该有n+1个,包括:
[0109]
cos(cls
参考摘要
,cls
文本
)、cos(cls
候选摘要1
,cls
文本
)、
……
、cos(cls
候选摘要n
,cls
文本
)
[0110]
s205:进行第一对比学习,所述第一对比学习为所述预设模型根据所述文本-参考摘要一致度与每个候选摘要样本对应的文本-候选摘要一致度,进行的所述文本样本的参考摘要样本分别与每个候选摘要样本之间的对比学习。
[0111]
s206:进行第二对比学习,所述第二对比学习为所述预设模型根据所述多个候选摘要样本各自对应的文本-候选摘要一致度,进行的所述文本样本的每两个候选摘要样本之间的对比学习。
[0112]
对比学习是机器学习领域热门的自监督学习方式,对比学习的主要目的是学习区分不同类别的样本,例如在很多段文本中找到和特定文本属于同一类的文本。
[0113]
本技术实施例中,参考摘要样本与文本样本的一致性最高,因此需是预设模型首先要区分出参考摘要文本和候选摘要文本,也就是预设模型进行第一对比学习;此外,与参考摘要样本更接近的候选摘要样本的内容一致性应该更高,且这个差异正比于候选摘要样本和参考摘要样本的相近的差距,进而对预设模型进行第二对比学习,以使得模型可以用来训练区分不同的候选摘要样本。
[0114]
第一对比学习,即基于每个候选摘要样本和参考摘要样本之间进行对比学习,预设模型的输入为文本-参考摘要一致度,以及多个不同的文本-候选摘要的一致度,训练过程中第一损失值l1公式如下:
[0115][0116]
其中,cos(cls
参考摘要
,cls
文本
)是用余弦相似度表示的文本-参考摘要一致度;cos(cls
候选摘要i
,cls
文本
)是用余弦相似度表示的第i个候选摘要样本摘要样本的文本-候选摘要的一致度和内容向量的余弦相似度值。γ1代表 cos(cls
参考摘要
,cls
文本
)必须比cos(cls
候选摘要i
,cls
文本
)大。
[0117]
由于参考摘要样本和文本样本一致性最好,也就是对应的向量余弦值最大,如果cos(cls
候选摘要i
,cls
文本
)-cos(cls
参考摘要
,cls
文本
)+γ1>0,则表示模型没有很好的区分“文本-参考摘要”与“文本-候选摘要”二者的关系,因此会产生损失值。反之则不会产生损失值。最终通过训练,预设模型可以识别出参考摘要样本和文本样本一致性最高,即参考摘要样本的向量和文本样本的向量最接近。
[0118]
第二对比学习,即基于不同候选摘要样本之间进行对比学习,预设模型的输入为多个不同的文本-候选摘要的一致度。
[0119]
多个候选摘要样本在之前已经进行了排序,序号在前的候选摘要样本对应的一致度应该大于序号在后的候选摘要样本对应的一致度,且两个候选摘要样本的序号之间的差值的绝对值越大,这两个候选摘要样本对应的文本
‑ꢀ
候选摘要一致度之差应该也越大。
[0120]
因此,在进行学习时,在序号在前的文本-候选摘要的一致度小于序号在后的文本-候选摘要的一致度时,确定损失值;
[0121]
或,在序号在前的文本-候选摘要的一致度大于序号在后的一致度,且两者一致度的差值小于标定阈值时,确定损失值,其中,所述标定阈值与序号差的绝对值呈正比。
[0122]
对确定出的损失值进行累计,得到所述第二对比学习的损失值。具体地,训练过程中第二损失值l2公式如下:
[0123][0124]
其中,γ2代表和参考摘要样本的相似度差别越大,则两个候选摘要样本之间的差别越大;由于预先按照和参考摘要样本的相似度对候选摘要样本进行了排序,编号较小的候选摘要样本比编号大的候选摘要样本更接近参考摘要样本,因此,若cos(cls
候选摘要j
,cls
文本
)-cos(cls
候选摘要i
,cls
文本
)+(j-i)*γ2>0,代表模型没有区分出第i个候选摘要样本和第j个候选摘要样本和内容一致性的强弱,会产生损失值,对多个损失值进行累计,即得到第二对比学习的损失值。反之则不会产生损失。最终通过训练,预设模型可以识别出不同候选摘要样本和文本样本之间的一致性的差别。
[0125]
s207:将经过所述第一对比学习和所述第二对比学习之后的预设模型,确定为所述摘要识别模型。
[0126]
通过第一对比学习和第二对比学习,对这两个对比学习得到的损失值进行相加,作为最终损失值对模型进行训练,以得到摘要识别模型。
[0127]
本技术的实施例提出了显式建模摘要与文本的一致性,然后通过第一对比学习和第二对比学习的训练方式,训练得到摘要识别模型;需要对待处理文本生成摘要时,利用预先训练的摘要识别模型,对待处理文本中至少两个句子进行组合生成多个候选摘要,确定
多个候选摘要各自的向量表示以及待处理文本的向量表示,再确定多个候选摘要各自的向量表示分别与待处理文本的向量表示的余弦相似度,进而可以从多个候选摘要中识别出待处理文本的摘要,选出来摘要与待处理文本的一致性最好。
[0128]
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0129]
图3是本发明实施例的一种摘要生成装置的结构示意图,如图3所示,一种摘要生成装置,本发明实施例的第二方面,提供了一种摘要生成装置,所述装置包括:
[0130]
获取模块100,用于获取待处理文本;
[0131]
生成模块200,用于对所述待处理文本中至少两个句子进行组合,生成多个候选摘要;
[0132]
识别模块300,用于通过预先训练的摘要识别模型,分别确定所述多个候选摘要与所述待处理文本的一致度,并根据所述多个候选摘要各自对应的一致度,从所述多个候选摘要中识别出所述待处理文本的摘要;
[0133]
其中,预先训练的摘要识别模型是根据文本样本与其参考摘要样本之间的一致度,以及,所述文本样本与其每个候选摘要样本之间的一致度,对预设模型进行对比学习训练得到的。
[0134]
可选地,所述装置至少还包括以下一个模块:
[0135]
第一预处理模块,用于对所述待处理文本中包含于另一句子的句子进行去重;
[0136]
第二预处理模块,用于对所述待处理文本中的任意两个句子进行预组合,在参与预组合的两个句子的相同文本与单句的长度之比大于预设比例时,在执行生成多个候选摘要的步骤中,放弃对所述参与预组合的两个句子进行组合;
[0137]
第三预处理模块,用于针对所述待处理文本中顺序排列且首尾包含相同文本的两个句子,对所述两个句子中一个句子包含的相同文本进行去重。
[0138]
可选地,所述装置包括:
[0139]
样本获取模块,用于获取文本样本、所述文本样本的参考摘要样本、以及所述文本样本的多个候选摘要样本,并输入预设模型;
[0140]
样本处理模块,用于通过所述预设模型确定所述文本样本与其每个候选摘要样本之间的文本-候选摘要一致度,并确定所述文本样本与其参考摘要样本之间的文本-参考摘要一致度;
[0141]
模型确定模块,用于将经过所述第一对比学习和所述第二对比学习之后的预设模型,确定为所述摘要识别模型;
[0142]
其中,所述第一对比学习为所述预设模型根据所述文本-参考摘要一致度与每个候选摘要样本对应的文本-候选摘要一致度,进行的所述文本样本的参考摘要样本分别与每个候选摘要样本之间的对比学习;
[0143]
所述第二对比学习为所述预设模型根据所述多个候选摘要样本各自对应的文本-候选摘要一致度,进行的所述文本样本的每两个候选摘要样本之间的对比学习。
[0144]
可选地,所述装置还包括:
[0145]
相似度确定模块,用于确定所述多个候选摘要样本分别与所述参考摘要样本之间的文本相似度;
[0146]
排序模块,用于按照文本相似度由大到小的顺序,为所述多个候选摘要样本分别添加对应的序号;
[0147]
所述第二对比学习模块包括:
[0148]
损失值确定单元,用于在序号在前的文本-候选摘要的一致度小于序号在后的文本-候选摘要的一致度时,确定损失值;或,在序号在前的文本-候选摘要的一致度大于序号在后的一致度,且两者一致度的差值小于标定阈值时,确定损失值,其中,所述标定阈值与序号差的绝对值呈正比;
[0149]
损失值累计单元,用于对确定出的损失值进行累计,得到所述第二对比学习的损失值。
[0150]
可选地,所述相似度确定模块包括:
[0151]
相似度确定单元,用于针对每个候选摘要样本,根据该候选摘要样本以及所述参考摘要样本各自包含的词组数量、两者的相同文本包含的词组数量,以及预设长度调控因子,确定所述多个候选摘要样本分别与所述参考摘要样本之间的文本相似度。
[0152]
可选地,所述样本处理模块包括:
[0153]
第一生成单元,用于通过所述预设模型确定所述文本样本与其参考摘要样本各自的向量表示;
[0154]
第一确定单元,用于通过所述预设模型确定所述文本样本与其参考摘要样本各自的向量表示之间的余弦相似度,将该余弦相似度确定为所述文本样本与其参考摘要样本之间的一致度;
[0155]
第二生成单元,用于通过所述预设模型确定所述文本样本与每个候选摘要样本各自的向量表示;
[0156]
第二确定单元,用于通过所述预设模型确定所述文本样本与每个候选摘要样本各自的向量表示之间的余弦相似度,将该余弦相似度确定为所述文本样本与每个候选摘要样本之间的一致度。
[0157]
需要说明的是,装置实施例与方法实施例相近,故描述的较为简单,相关之处参见方法实施例即可。
[0158]
本发明实施例还提供了提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例第一方面所述的摘要生成方法。
[0159]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例第一方面所述的摘要生成方法的步骤。
[0160]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0161]
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可
用程序代码的计算机可用存储介质 (包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0162]
本发明实施例是参照根据本发明实施例的方法、装置、电子设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0163]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0164]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0165]
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0166]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0167]
以上对本技术所提供的一种摘要生成方法、装置、电子设备及存储介质,进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1