基于庭审音频的关联度挖掘方法、装置、设备及存储介质与流程

文档序号:35465013发布日期:2023-09-16 03:56阅读:29来源:国知局
基于庭审音频的关联度挖掘方法、装置、设备及存储介质与流程

本发明涉及音频检测领域,尤其涉及一种基于庭审音频的关联度挖掘方法、装置、设备及存储介质。


背景技术:

1、随着经济的快速发展和人们生活水平的提升,日常生活中人们之间的经济和社会交往等日益紧密。以此同时,不可避免产生一部分人之间各种各样的纠纷,导致法院需要受理的民事诉讼案件数量越来越多。为了提高相关民事诉讼案件的处理效率和人们对案件处理的满意度,除了采用传统线下法庭的方式进行审判外,还采用线上法庭的形式,降低了法庭审判的门槛和进一步的提高审判效率。

2、现今,线上法庭通过实时记录庭审各方人员的辩护数据,以及结合庭审各方人员在系统上上传的多种庭审证据,处理得到对应的庭审案件的特征数据来生成相应辅助审判信息。但是这种线上辅助审判的方式只是简单提取相关陈述和证据中的案件特征,并未对相关陈述和证据的数据进行进一步的挖掘,以致最终的审判可能缺乏案件整体之间的关联性,即现有的线上法庭对相关庭审数据处理缺乏关联性,以致最终生成的辅助审判结果的适用法规不够准确。


技术实现思路

1、本发明的主要目的在于解决现有的线上法庭对相关庭审数据处理缺乏关联性,以致最终生成的辅助审判结果的适用法规不够准确的问题。

2、本发明第一方面提供了一种基于庭审音频的关联度挖掘方法,所述基于庭审音频的关联度挖掘方法包括:获取待审判案件的庭审音频数据,并基于所述待审判案件中各方审判人员,对所述庭审音频数据进行音源清洗和音频分离,得到音频分离结果;提取所述音频分离结果中各方审判人员的多个案件陈述特征,并基于所述案件陈述特征,对各方审判人员进行多维庭审文本类型的分析,得到多维庭审文本标识;确定所述庭审文本标识中各方审判人员对应的至少一个陈述主题,并基于所述陈述主题,构建各所述庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。

3、可选的,在本发明第一方面的第一种实现方式中,所述基于所述待审判案件中各方审判人员,对所述庭审音频数据进行音源清洗和音频分离,得到音频分离结果,包括:对所述庭审音频数据进行音频预处理,得到预处理后的庭审音频数据,并基于所述待审判案件对应的多个庭审时刻,计算出所述预处理后的庭审音频数据的多个音频时频特征;选取所述音频时频特征对应的分离指标值,并基于所述分离指标值和所述待审判案件中各方审判人员,分离所述庭审音频数据在各庭审时刻时至少一路声源音频信号;对各所述声源音频信号进行音频文本转换和文本清洗,得到音频分离结果。

4、可选的,在本发明第一方面的第二种实现方式中,所述提取所述音频分离结果中各方审判人员的多个案件陈述特征,包括:基于所述待审判案件的案件类型,提取所述音频分离结果中多个陈述关键词;基于各方审判人员,计算出各所述陈述关键词之间的语义关联度,并基于所述语义关联度,对各所述陈述关键词进行陈述上下文的特征标记,得到多个案件陈述特征。

5、可选的,在本发明第一方面的第三种实现方式中,所述多维庭审文本标识包括文本维度的庭审文本标识和情感维度的庭审文本标识,所述基于所述案件陈述特征,对各方审判人员进行多维庭审文本类型的分析,得到多维庭审文本标识,包括:基于各所述审判人员,对所述案件陈述特征进行对应审判文本类型的分类和文本标记,得到文本维度的庭审文本标识;利用预设情感特征模型,分别识别各方审判人员在不同庭审时刻中案件陈述特征对应的情感极性,并对情感识别的结果进行情感标记,得到情感维度的庭审文本标识。

6、可选的,在本发明第一方面的第四种实现方式中,所述确定所述庭审文本标识中各方审判人员对应的至少一个陈述主题,包括:计算出所述文本维度的庭审文本标识和所述情感维度的庭审文本标识中案件陈述特征对应词语的频次,并基于频次计算的结果,构建各方审判人员对应的词频次矩阵;利用预设主题生成模型对所述词频次矩阵进行庭审陈述主题的匹配,得到各方审判人员在不同庭审时刻对应的至少一个陈述主题。

7、可选的,在本发明第一方面的第五种实现方式中,所述基于所述陈述主题,构建各所述庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果,包括:基于所述陈述主题和所述待审判案件的辅助审判信息,检测各所述审判人员在不同庭审时刻的辩护真实性,得到真实性检测结果;基于所述真实性检测结果,分别计算出各所述庭审文本标识的标识聚类距离;基于所述标识聚类距离,构建出各方审判人员对应庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。

8、可选的,在本发明第一方面的第六种实现方式中,在所述基于所述陈述主题,构建各所述庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果之后,还包括:基于所述陈述关联度,提取各方审判人员在不同庭审时刻中的多个关键庭审特征;基于所述关键庭审特征,匹配所述待审判案件的多个法规特征,并基于所述法规特征,生成对应审判人员的辅助审判结果。

9、本发明第二方面提供了一种基于庭审音频的关联度挖掘装置,所述基于庭审音频的关联度挖掘装置包括:音频分离模块,用于获取待审判案件的庭审音频数据,并基于所述待审判案件中各方审判人员,对所述庭审音频数据进行音源清洗和音频分离,得到音频分离结果;类型分析模块,用于提取所述音频分离结果中各方审判人员的多个案件陈述特征,并基于所述案件陈述特征,对各方审判人员进行多维庭审文本类型的分析,得到多维庭审文本标识;关联度挖掘模块,用于确定所述庭审文本标识中各方审判人员对应的至少一个陈述主题,并基于所述陈述主题,构建各所述庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。

10、可选的,在本发明第二方面的第一种实现方式中,所述音频分离模块包括:特征提取单元,用于对所述庭审音频数据进行音频预处理,得到预处理后的庭审音频数据,并基于所特征述待审判案件对应的多个庭审时刻,计算出所述预处理后的庭审音频数据的多个音频时频特征;指标计算单元,用于选取所述音频时频特征对应的分离指标值,并基于所述分离指标值和所述待审判案件中各方审判人员,分离所述庭审音频数据在各庭审时刻时至少一路声源音频信号;文本转换单元,用于对各所述声源音频信号进行音频文本转换和文本清洗,得到音频分离结果。

11、可选的,在本发明第二方面的第二种实现方式中,所述类型分析模块包括:关键词提取单元,用于基于所述待审判案件的案件类型,提取所述音频分离结果中多个陈述关键词;特征标记单元,用于基于各方审判人员,计算出各所述陈述关键词之间的语义关联度,并基于所述语义关联度,对各所述陈述关键词进行陈述上下文的特征标记,得到多个案件陈述特征。

12、可选的,在本发明第二方面的第三种实现方式中,所述类型分析模块还包括:文本标记单元,用于基于各所述审判人员,对所述案件陈述特征进行对应审判文本类型的分类和文本标记,得到文本维度的庭审文本标识;情感标记单元,用于利用预设情感特征模型,分别识别各方审判人员在不同庭审时刻中案件陈述特征对应的情感极性,并对情感识别的结果进行情感标记,得到情感维度的庭审文本标识。

13、可选的,在本发明第二方面的第四种实现方式中,所述关联度挖掘模块包括:频次计算单元,用于计算出所述文本维度的庭审文本标识和所述情感维度的庭审文本标识中案件陈述特征对应词语的频次,并基于频次计算的结果,构建各方审判人员对应的词频次矩阵;主题匹配单元,用于利用预设主题生成模型对所述词频次矩阵进行庭审陈述主题的匹配,得到各方审判人员在不同庭审时刻对应的至少一个陈述主题。

14、可选的,在本发明第二方面的第五种实现方式中,所述关联度挖掘模块还包括:真实性检测单元,用于基于所述陈述主题和所述待审判案件的辅助审判信息,检测各所述审判人员在不同庭审时刻的辩护真实性,得到真实性检测结果;标识聚类单元,用于基于所述真实性检测结果,分别计算出各所述庭审文本标识的标识聚类距离;关联度构建单元,用于基于所述标识聚类距离,构建出各方审判人员对应庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。

15、可选的,在本发明第二方面的第六种实现方式中,在所述关联度挖掘模块之后,还包括法规匹配模块,所述法规匹配模块包括:关键提取单元,用于基于所述陈述关联度,提取各方审判人员在不同庭审时刻中的多个关键庭审特征;法规匹配单元,用于基于所述关键庭审特征,匹配所述待审判案件的多个法规特征,并基于所述法规特征,生成对应审判人员的辅助审判结果。

16、本发明第三方面提供了一种基于庭审音频的关联度挖掘设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于庭审音频的关联度挖掘设备执行上述的基于庭审音频的关联度挖掘方法的各个步骤。

17、本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于庭审音频的关联度挖掘方法的各个步骤。

18、本发明提供的技术方案中,通过获取待审判案件的庭审音频数据,并基于待审判案件中各方审判人员,对庭审音频数据进行音源清洗和音频分离,得到音频分离结果;提取音频分离结果中各方审判人员的多个案件陈述特征,并基于案件陈述特征,对各方审判人员进行多维庭审文本类型的分析,得到多维庭审文本标识;确定庭审文本标识中各方审判人员对应的至少一个陈述主题,并基于陈述主题,构建各庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。相比于现有技术,本技术通过待审判案件的庭审音频数据进行多种音频预处理,并提取音频分离结果中对应审判人员的多个案件陈述特征,进而利用案件陈述特征,分析出多维庭审文本标识,并基于各方审判人员对应的至少一个陈述主题,构建出各庭审文本标识之间的陈述关联度,生成案件庭审音频数据之间关联度的挖掘结果,实现了对线上法庭中相关庭审音频数据之间关联度的挖掘,从而提高了最终生成的辅助审判结果的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1