基于类别关键词的句子填充方法、装置、设备及存储介质与流程

文档序号:34028730发布日期:2023-05-05 10:20阅读:29来源:国知局
基于类别关键词的句子填充方法、装置、设备及存储介质与流程

本申请涉及计算机,尤其涉及一种基于类别关键词的句子填充方法、装置、设备及存储介质。


背景技术:

1、随着互联网技术的不断发展,用户希望从各种数据信息中,提取并整合出有效价值高的信息,例如,从电商数据中提取出消费者需求信息,从新闻数据中提取出舆情信息等。但由于数据信息往往多而且散乱,导致提取的信息有效价值不高或者提取信息不合理,因此,如何从散乱的数据信息中得到有效价值高且合理的信息,已成为本领域技术人员亟待解决的技术问题。


技术实现思路

1、鉴于以上内容,本申请提供一种基于类别关键词的句子填充方法、装置、设备及存储介质,其目的在于解决上述技术问题。

2、第一方面,本申请提供一种基于类别关键词的句子填充方法,所述方法包括:

3、获取待处理文本,提取所述待处理文本中的多个属性关键词;

4、对所述多个属性关键词执行聚类操作得到至少一个聚类簇,分别为每个所述聚类簇分配对应的类别关键词;

5、计算每个所述类别关键词之间的属性关键词的关联度,基于所述关联度从每个所述类别关键词对应的属性关键词中选取出目标关键词;

6、将所述目标关键词填充至预设的语句模板,得到填充后的目标语句。

7、第二方面,本申请提供一种基于类别关键词的句子填充装置,所述装置包括:

8、提取模块:用于获取待处理文本,提取所述待处理文本中的多个属性关键词;

9、聚类模块:用于对所述多个属性关键词执行聚类操作得到至少一个聚类簇,分别为每个所述聚类簇分配对应的类别关键词;

10、选取模块:用于计算每个所述类别关键词之间的属性关键词的关联度,基于所述关联度从每个所述类别关键词对应的属性关键词中选取出目标关键词;

11、填充模块:用于将所述目标关键词填充至预设的语句模板,得到填充后的目标语句。

12、第三方面,本申请提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

13、存储器,用于存放计算机程序;

14、处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的基于类别关键词的句子填充方法。

15、第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的基于类别关键词的句子填充方法。

16、本申请实施例提供的上述技术方案与现有技术相比具有如下优点:

17、本申请通过提取待处理文本中的多个属性关键词,对多个属性关键词执行聚类操作得到聚类簇后为每个聚类簇分配对应的类别关键词,由于聚类簇表征的是具有共性的属性关键词,为每个聚类簇分配对应的类别关键词可以用类别关键词将属性关键词进行归类,计算每个类别关键词之间的属性关键词的关联度,根据关联度从每个类别关键词对应的属性关键词中选取出目标关键词,再将目标关键词填充至预设的语句模板得到填充后的目标语句。由于目标关键词属于不同类别关键词的属性关键词中关联度较高的词,因此利用目标关键词填充得到的目标语句具有较高的可解释性及合理性,且目标语句的有效价值高。



技术特征:

1.一种基于类别关键词的句子填充方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于类别关键词的句子填充方法,其特征在于,所述提取所述待处理文本中的多个属性关键词,包括:

3.如权利要求1所述的基于类别关键词的句子填充方法,其特征在于,所述对所述多个属性关键词执行聚类操作得到至少一个聚类簇,包括:

4.如权利要求1所述的基于类别关键词的句子填充方法,其特征在于,所述计算每个所述类别关键词之间的属性关键词的关联度,基于所述关联度从每个所述类别关键词对应的属性关键词中选取出目标关键词,包括:

5.如权利要求4所述的基于类别关键词的句子填充方法,其特征在于,所述关联度的计算公式包括:

6.如权利要求4所述的基于类别关键词的句子填充方法,其特征在于,所述基于所述关联度从所述其它类别关键词对应的属性关键词中选取出预设数量的目标关键词,包括:

7.如权利要求1至6中任意一项所述的基于类别关键词的句子填充方法,其特征在于,所述获取待处理文本,包括:

8.一种基于类别关键词的句子填充装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于类别关键词的句子填充方法。


技术总结
本申请涉及一种基于类别关键词的句子填充方法、装置、设备及存储介质。所述方法包括:获取待处理文本,提取待处理文本中的多个属性关键词,对所述多个属性关键词执行聚类操作得到至少一个聚类簇,分别为每个所述聚类簇分配对应的类别关键词,计算每个所述类别关键词之间的属性关键词的关联度,基于所述关联度从每个所述类别关键词对应的属性关键词中选取出目标关键词,将目标关键词填充至预设的语句模板,得到填充后的目标语句。本申请可以从散乱的数据信息中得到有效价值高且合理的目标语句。

技术研发人员:李礼,吕博文,何维华
受保护的技术使用者:深圳视界信息技术有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1