文本主要内容的确定方法、装置、存储介质及计算机设备与流程

文档序号:22931317发布日期:2020-11-13 16:30阅读:来源:国知局

技术特征:

1.一种文本主要内容的确定方法,其特征在于,包括:

识别待识别文本中的各个实体;

根据所述各个实体在所述待识别文本的不同语句中的所属语义成分,确定所述各个实体在所述不同语句中的权重值;

根据所述各个实体在所述不同语句中的权重值,计算所述各个实体对应的重要度评分;

根据计算的重要度评分对所述各个实体进行排序,并根据排序结果确定所述待识别文本对应的主要内容。

2.根据权利要求1所述的方法,其特征在于,所述根据所述各个实体在所述不同语句中的权重值,计算所述各个实体对应的重要度评分,具体包括:

根据所述各个实体及其在所述不同语句中的权重值,构建预设实体权重表;

将所述预设实体权重表输入至预设重要度评分模型进行评分,得到所述各个实体对象对应的重要度评分。

3.根据权利要求2所述的方法,其特征在于,所述将所述预设实体权重表输入至预设重要度评分模型进行评分,得到所述各个实体对象对应的重要度评分,具体包括:

根据所述各个实体在所述待识别文本中出现的次数,计算所述各个实体对应的初始评分;

将计算的初始评分和所述预设实体权重表输入至预设重要度评分模型进行评分,得到所述各个实体对应的重要度评分。

4.根据权利要求1所述的方法,其特征在于,在所述根据所述各个实体在所述不同语句中的权重值,计算所述各个实体对应的重要度评分之后,所述方法还包括:

对所述各个实体进行分类处理,确定不同类别下的各个实体;

根据所述各个实体所属类别以及所述各个实体在所述待识别文本中的位置,对所述不同类别下的各个实体对应的重要度评分进行调整;

所述根据计算的重要度评分对所述各个实体进行排序,并根据排序结果确定所述待识别文本对应的主要内容,具体包括:

根据调整后的重要度评分分别对所述不同类别下的各个实体进行排序,得到不同类别下的实体排序结果;

根据所述不同类别下的实体排序结果,确定所述待识别文本对应的主要内容。

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

从所述各个实体中筛选出各个对象和各个层面描述;

将所述各个对象中的任一对象与所述各个层面描述中的任一层面描述进行组合,得到所述各个对象和所述各个层面描述之间的多个组合;

确定各个组合中的对象和层面描述在不同语句中的关联性权重值;

根据确定的关联性权重值,计算所述各个组合中对象和层面描述之间的关联性评分;

基于计算的关联性评分,对所述各个组合进行排序,根据排序结果确定所述各个对象中的任一对象与所述各个层面描述中的任一层面描述之间的关联关系。

6.根据权利要求5所述的方法,其特征在于,针对所述不同语句中的目标语句,所述确定各个组合中的对象和层面描述在不同语句中的关联性权重值,具体包括:

判断所述各个组合中目标组合的对象和层面描述在所述目标语句中的间隔词数是否大于或者等于预设间隔词数;

若大于或者等于预设间隔词数,则确定所述目标组合的对象和层面描述在所述目标语句中的关联性权重值为第一预设关联性权重值;

若小于预设间隔词数,则确定所述目标组合的对象和层面描述在所述目标语句中的关联性权重值为第二预设关联性权重值。

7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述各个实体在所述待识别文本的不同语句中的所属语义成分,确定所述各个实体在所述不同语句中的权重值,具体包括:

将所述待识别文本拆分成各个语句,并利用预设语义分析算法对所述各个语句进行语义分析,确定所述各个语句对应的语义组成;

根据所述各个语句对应的语义组成,确定所述各个实体在不同语句中的所属语义成分;

根据确定的所属语义成分,确定所述各个实体在所述不同语句中的权重值。

8.一种文本主要内容的确定装置,其特征在于,包括:

识别单元,用于识别待识别文本中的各个实体;

确定单元,用于根据所述各个实体在所述待识别文本的不同语句中的所属语义成分,确定所述各个实体在所述不同语句中的权重值;

计算单元,用于根据所述各个实体在所述不同语句中的权重值,计算所述各个实体对应的重要度评分;

排序单元,用于根据计算的重要度评分对所述各个实体进行排序,并根据排序结果确定所述待识别文本对应的主要内容。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。


技术总结
本发明公开了一种文本主要内容的确定方法、装置、存储介质及计算机设备,涉及信息技术领域,主要在于能够提高用户解读文本的效率,节省用户的阅读时间,满足用户对阅读量的需求,同时能够保证用户所解读的文本内容的准确性。其中方法包括:识别待识别文本中的各个实体;根据所述各个实体在所述待识别文本的不同语句中的所属语义成分,确定所述各个实体在所述不同语句中的权重值;根据所述各个实体在所述不同语句中的权重值,计算所述各个实体对应的重要度评分;根据计算的重要度评分对所述各个实体进行排序,并根据排序结果确定所述待识别文本对应的主要内容。本发明适用于确定文本的主要内容。

技术研发人员:朱鑫
受保护的技术使用者:北京新联财通咨询有限公司
技术研发日:2020.07.03
技术公布日:2020.11.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1