摘要生成方法、装置、电子设备、存储介质及程序产品与流程

文档序号:37020059发布日期:2024-02-09 13:13阅读:13来源:国知局
摘要生成方法、装置、电子设备、存储介质及程序产品与流程

本申请涉及人工智能技术,尤其涉及一种基于人工智能的摘要生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

2、自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向,能实现人与计算机之间用自然语言进行有效通信。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,该领域将涉及自然语言,即人们日常使用的语言,所以它与语言学有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

3、摘要生成系统是自然语言处理领域的重要应用之一,摘要生成系统是指将文本所包含的核心事件以精炼的语言进行概括描述,生成对应文本的摘要。摘要生成系统在搜索系统、推荐系统等中都有广泛的应用,即摘要生成系统是这些复杂系统的基础组件。

4、但是,相关技术中的摘要生成系统生成的摘要的准确性低,即事件摘要不通顺、且不能精确表达文本所包含的核心事件。


技术实现思路

1、本申请实施例提供一种基于人工智能的摘要生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够精确地抽取文本信息的智能摘要。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种基于人工智能的摘要生成方法,包括:

4、对至少一个文本信息进行分句处理,得到多个分句;

5、对所述多个分句进行编码处理,得到每个所述分句的编码向量;

6、基于每个所述分句的编码向量,对所述多个分句进行基于权重的文本排序处理,得到每个所述分句的加权排序得分;

7、将所述多个分句之间的相关度作为惩罚因子,对每个所述分句的加权排序得分进行基于惩罚因子的修正处理,得到每个所述分句的修正得分;

8、基于每个所述分句的修正得分,对所述多个分句中的部分分句进行组合处理,得到所述至少一个文本信息的智能摘要。

9、本申请实施例提供一种基于人工智能的摘要生成装置,包括:

10、分句模块,用于对至少一个文本信息进行分句处理,得到多个分句;

11、编码模块,用于对所述多个分句进行编码处理,得到每个所述分句的编码向量;

12、文本排序模块,用于基于每个所述分句的编码向量,对所述多个分句进行基于权重的文本排序处理,得到每个所述分句的加权排序得分;

13、修正模块,用于将所述多个分句之间的相关度作为惩罚因子,对每个所述分句的加权排序得分进行基于惩罚因子的修正处理,得到每个所述分句的修正得分;

14、组合模块,用于基于每个所述分句的修正得分,对所述多个分句中的部分分句进行组合处理,得到所述至少一个文本信息的智能摘要。

15、本申请实施例提供一种电子设备,所述电子设备包括:

16、存储器,用于存储计算机程序或计算机可执行指令;

17、处理器,用于执行所述存储器中存储的计算机程序或计算机可执行指令时,实现本申请实施例提供的基于人工智能的摘要生成方法。

18、本申请实施例提供一种计算机可读存储介质,存储有计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时实现本申请实施例提供的基于人工智能的摘要生成方法。

19、本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时实现本申请实施例提供的基于人工智能的摘要生成方法。

20、本申请实施例具有以下有益效果:

21、通过对至少一个文本信息的多个分句进行基于权重的文本排序处理,得到每个分句的加权排序得分,由于不同分句对至少一个文本信息的影响不同,因此在对分句进行文本排序的过程中考虑到分句的权重,使得分句的加权排序得分更加准确,从而提高智能摘要的准确性;通过将多个分句之间的相关度作为惩罚因子,对每个分句的加权排序得分进行基于惩罚因子的修正处理,得到每个分句的修正得分,由于将分句之间的相关度作为惩罚因子,因此在对分句的加权排序得分进行修正的过程中考虑到惩罚因子,使得智能摘要所包括的分句能够保证多样性,从而提高智能摘要所表达的信息量。



技术特征:

1.一种基于人工智能的摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述多个分句进行编码处理,得到每个所述分句的编码向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述多个词语进行编码处理,得到每个所述词语的编码向量,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于每个所述分句的编码向量,对所述多个分句进行基于权重的文本排序处理,得到每个所述分句的加权排序得分,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述多个分句之间的相关度,对每个所述分句在上一次迭代的加权排序值进行文本排序处理,得到每个所述分句在当前迭代的排序值,包括:

6.根据权利要求4所述的方法,其特征在于,所述基于每个所述分句的权重,对每个所述分句在当前迭代的排序值进行加权处理,得到每个所述分句在当前迭代的加权排序值之前,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,所述将所述第k次迭代的选中句子集中的分句与所述多个待修正分句之间的相似度作为所述第k次迭代的惩罚因子,对所述多个待修正分句的加权排序得分进行基于惩罚因子的修正处理,得到所述第k次迭代中的待修正分句的修正得分,包括:

9.根据权利要求8所述的方法,其特征在于,所述基于针对所述待修正分句的惩罚因子,对所述待修正分句的加权排序得分进行基于惩罚因子的修正处理,得到所述待修正分句的修正得分,包括:

10.根据权利要求8所述的方法,其特征在于,所述基于针对所述待修正分句的惩罚因子,对所述待修正分句的加权排序得分进行基于惩罚因子的修正处理,得到所述待修正分句的修正得分,包括:

11.根据权利要求7所述的方法,其特征在于,

12.一种基于人工智能的摘要生成装置,其特征在于,所述装置包括:

13.一种电子设备,其特征在于,所述电子设备包括:

14.一种计算机可读存储介质,其特征在于,存储有计算机程序或者计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时实现权利要求1至11任一项所述的基于人工智能的摘要生成方法。

15.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时实现权利要求1至11任一项所述的基于人工智能的摘要生成方法。


技术总结
本申请提供了一种基于人工智能的摘要生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;涉及人工智能技术;方法包括:对至少一个文本信息进行分句处理,得到多个分句;对多个分句进行编码处理,得到每个分句的编码向量;基于每个分句的编码向量,对多个分句进行基于权重的文本排序处理,得到每个分句的加权排序得分;将多个分句之间的相关度作为惩罚因子,对每个分句的加权排序得分进行基于惩罚因子的修正处理,得到每个分句的修正得分;基于每个分句的修正得分,对多个分句中的部分分句进行组合处理,得到至少一个文本信息的智能摘要。

技术研发人员:姚勋元
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/2/8
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1