语句压缩方法、装置、电子设备及可读存储介质与流程

文档序号:24132302发布日期:2021-03-02 18:43阅读:来源:国知局

技术特征:
1.一种语句压缩方法,其特征在于,所述方法包括:解析用户基于客户端发出的语句压缩请求,获取所述请求携带的待压缩语句,对所述待压缩语句执行去口语化处理,得到目标语句集,判断所述目标语句集中的句子数量是否大于第一阈值;当判断所述目标语句集中的句子数量大于第一阈值时,将所述目标语句集中的句子进行重要度排序,基于排序结果抽取关键语句,判断所述关键语句的句长是否大于第二阈值;当判断所述关键语句的句长大于第二阈值时,抽取所述关键语句的主干词语,拼接所述主干词语,得到目标语句。2.如权利要求1所述的语句压缩方法,其特征在于,所述对所述待压缩语句执行去口语化处理,包括:从第一数据库中获取口语语句词典,将所述待压缩语句中的每个第一子句与所述口语语句词典进行比对,若某一指定第一子句与所述口语语句词典中的一个语句匹配,则删除所述指定第一子句,得到初始语句集;对所述初始语句集中的句子执行分词处理,得到第一词语序列;基于口语词语识别模型识别所述第一词语序列中的口语词语,删除所述口语词语,得到第二词语序列;按照各个词语在所述待压缩语句中的位置将所述第二词语序列中的词语拼接得到多个第二子句,将所述多个第二子句的集合作为目标语句集。3.如权利要求1所述的语句压缩方法,其特征在于,所述将所述目标语句集中的句子进行重要度排序,基于排序结果抽取关键语句,包括:将所述目标语句集中的各个句子分别与其它的句子两两组合,得到多个组合对;计算所述多个组合对中每个组合对的两个句子的相似度值,基于所述相似度值确定所述目标语句集对应的相似度矩阵;基于所述相似度矩阵计算所述目标语句集中各个句子的重要度分值,按照重要度分值从高到低的顺序对所述目标语句集中的句子进行排序,将排序最前的句子作为关键语句。4.如权利要求1所述的语句压缩方法,其特征在于,在判断所述目标语句集中的句子数量是否大于第一阈值之后,所述方法还包括:若判断所述目标语句集中的句子数量小于或等于第一阈值,则确定所述待压缩语句的语句类型,从第二数据库中获取所述语句类型对应的抽取规则,基于所述抽取规则从所述目标语句集中抽取语句,将抽取的语句拼接,得到关键语句。5.如权利要求1所述的语句压缩方法,其特征在于,所述抽取所述关键语句的主干词语包括:对所述关键语句执行分词处理,得到第三词语序列;依次识别所述第三词语序列中每个词语的词性,基于所述词性及预设句法分析策略确定所述第三词语序列的句法结构,基于所述句法结构提取所述第三词语序列中的主干词语。6.如权利要求1-5任一项所述的语句压缩方法,其特征在于,在判断所述关键语句的句长是否大于第二阈值之后,所述方法还包括:若判断所述关键语句的句长小于或等于第二阈值,则将所述关键语句作为目标语句。
7.一种语句压缩装置,其特征在于,所述装置包括:解析模块,用于解析用户基于客户端发出的语句压缩请求,获取所述请求携带的待压缩语句,对所述待压缩语句执行去口语化处理,得到目标语句集,判断所述目标语句集中的句子数量是否大于第一阈值;排序模块,用于当判断所述目标语句集中的句子数量大于第一阈值时,将所述目标语句集中的句子进行重要度排序,基于排序结果抽取关键语句,判断所述关键语句的句长是否大于第二阈值;抽取模块,用于当判断所述关键语句的句长大于第二阈值时,抽取所述关键语句的主干词语,拼接所述主干词语,得到目标语句。8.如权利要求7所述的语句压缩装置,其特征在于,所述将所述目标语句集中的句子进行重要度排序,基于排序结果抽取关键语句,包括:将所述目标语句集中的各个句子分别与其它的句子两两组合,得到多个组合对;计算所述多个组合对中每个组合对的两个句子的相似度值,基于所述相似度值确定所述目标语句集对应的相似度矩阵;基于所述相似度矩阵计算所述目标语句集中各个句子的重要度分值,按照重要度分值从高到低的顺序对所述目标语句集中的句子进行排序,将排序最前的句子作为关键语句。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的语句压缩程序,所述语句压缩程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任一项所述的语句压缩方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语句压缩程序,所述语句压缩程序可被一个或者多个处理器执行,以实现如权利要求1至6任一项所述的语句压缩方法。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1