一种基于语音识别的法庭庭审音频文件实时标引系统的制作方法

文档序号：6754361阅读：160来源：国知局

专利名称：一种基于语音识别的法庭庭审音频文件实时标引系统的制作方法
技术领域：
本发明属于音频处理技术领域，具体涉及一种基于语音识别的法庭庭审音频文件实时标引系统。
背景技术：
法院的法庭审理过程需要进行现场录音，庭审现场录音对于提高庭审效率和案件审理质量是非常重要的。法庭的审理要求全面、真实、客观、公正，如果有音像资料作以佐证的话就更能直观、有效的印证案件审理的真实过程，从而为后续的监督检查以及庭审资料调用提供方便。而且，音像资料的保存作为一种真实历史的记录，可以为未来法庭庭审工作的发展提供借鉴和参考。法庭的庭审过程一般都比较长，短则2 3个小时，长的可以花费半天甚至一天的时间，而庭审的现场录音是一个连续的过程，将最终形成一段时间很长的音频文件法庭的审理都存在着一套比较规范的程序，我国的法庭审理过程一般包括如下步骤宣布开庭一核实当事人身份并告知权利义务一法庭调查一举证质证一法庭辩论一法庭调解一宣判一闭庭。在进行庭审音频的听取过程中，如果希望针对其中的某个环节听取录音，在音频文件通过音频播放软件播放时，可以通过改变播放进度的形式来选择相应的音频片段，这是目前所有播放软件都支持的功能。但是，这种改变播放进度的形式一般只能以时间作为参考依据，收听者首先要估计希望听取的片段在什么时间点，然后再根据时间点进行查找，这样就会比较繁琐，特别是在音频文件比较长的情况下查找的效率相对较低。由于法庭审理有着较规范的程序，因此，目前有一种做法是在庭审过程录制完成后，由工作人员再从头至尾浏览一遍整个音频文件，并对庭审的每一个步骤加入音频标引，从而为后续的录音提取提供方便。但这种方式不仅增加了工作人员的劳动强度，而且，耗时较长，工作效率比较低下。

发明内容
本发明的目的在于针对现有技术的缺陷，提供一种基于语音识别的法庭庭审音频文件实时标引系统，按庭审环节将长时间的庭审录音文件进行实时标引，以方便后续听取录音片段的快速定位。本发明的技术方案如下一种基于语音识别的法庭庭审音频文件实时标引系统，包括-数字化录音装置，用于对整个庭审过程进行不间断的连续录音，形成音频文件；-音频服务器，与数字化录音装置连接，用于存储音频文件，并对音频文件进行处理；-语音识别装置，与音频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别；-实时标引模块，设置在音频服务器内，用于根据语音识别装置的识别结果触发标引操作，对音频文件的对应音频帧进行标引关联。进一步，如上所述的基于语音识别的法庭庭审音频文件实时标引系统，其中，该系统还包括语音信息检测模块，设置在音频服务器内，用于对语音识别装置输入的语音识别结果信息进行重复性检测，避免重复标弓I。进一步，如上所述的基于语音识别的法庭庭审音频文件实时标引系统，其中，所述的语音识别装置与法官席麦克风相连接，直接识别法官的特定语句。进一步，如上所述的基于语音识别的法庭庭审音频文件实时标引系统，其中，所述的语音识别装置包括用于接收模拟语音信息的语音接收单元，语音接收单元与模数转换单元连接，模数转换单元与特定语音信息识别单元连接，特定语音信息识别单元连接语音信息输出单元。进一步，如上所述的基于语音识别的法庭庭审音频文件实时标引系统，其中，所述的实时标引模块中设有一个XML文件，XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，便将当前音频帧与XML文件的当前节点内容相对应，实现标引关联。进一步，如上所述的基于语音识别的法庭庭审音频文件实时标引系统，其中，该系统还包括音频文件打包模块，用于将起标引作用的XML文件与数字化录音装置生成的音频文件整体打包。本发明的有益效果如下本发明通过语音识别装置对法官说出的特定语句进行识别，从而了解法庭审理的进程，确定每一个规定环节的开始时刻，通过信号触发实时标引模块对庭审录音进行实时标引，最终形成一个带有庭审环节标签的音频文件。通过在音频播放器上设计一个简单的插件，用于读取标引信息，就可以将庭审的环节标签显示在播放器的进度栏，从而为庭审录音的后续收听定位提供了极大的方便。本发明原理简单，易于实现，非常有助于庭审音频文件的处理，并能够减轻工作人员劳动强度，提高音频文件的处理效率。

图1为本发明的系统结构组成示意图；图2为语音识别装置的结构组成示意图；图3为实时标引模块的原理图。
具体实施例方式下面结合附图和具体实施例对本发明进行详细的描述。本发明所提供的基于语音识别的法庭庭审音频文件实时标引系统，用于庭审录音现场当中，其主要功能是对法庭庭审的数字化音频文件进行实时的环节标引，以便于后续收听中的快速定位，该系统的结构如图1所示，包括-数字化录音装置，用于对整个庭审过程进行不间断的连续录音，形成音频文件，并将文件实时发送存储在音频服务器的存储器中；-音频服务器，与数字化录音装置连接，用于存储音频文件，并对音频文件进行处理；
-语音识别装置，与音频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别，语音识别装置直接连接在法官席的麦克风上，从而更准确的获取法官的语音信号；-语音信息检测模块，设置在音频服务器内，与语音识别装置连接，用于对语音识别装置输入的语音识别结果信息进行重复性检测，避免重复标引；-实时标引模块，设置在音频服务器内，与语音信息检测模块连接，用于根据检测合格的语音识别装置的识别结果触发标引操作，对音频文件的对应音频帧进行标引关联。本发明的语音识别装置并不是对法官的所有话语都进行识别，而是只针对特定语音信息进行识别。由于庭审一般都有着比较规范的程序，在每个程序开始的时候，规定法官都要用标准语句进行宣读以表明现在进入相应程序，例如，开庭时法官宣读“现在开庭”，法庭辩论环节开始时法官宣读“现在进行法庭辩论”。这样，语音识别装置可以预先设定好需要识别的特定语音信息是什么，只有当捕捉到这些规定好的特定语音信息之后，才进行语音信息的输出。结合以上特点，语音识别装置的结构如图2所示，包括用于接收模拟语音信息的语音接收单元，语音接收单元与将模拟信号转换为数字信号的模数转换单元连接，模数转换单元与特定语音信息识别单元连接，特定语音信息识别单元连接语音信息输出单元。在特定语音信息识别单元中判断当前输入的语音是否是需要输出的语音信号，如果是，再进行语音信号的输出。另外，在具体的庭审过程中，由于某些不太规范的人为因素，特定语音信息识别单元很可能会捕捉到多次同一特定语音信息，并将该信息进行了多次输出。因此，有必要在视频服务器内设置一个语音信息检测模块，该语音信息检测模块对语音识别装置输入的语音识别结果信息进行重复性检测，如果发现有重复的语音信号又一次被输入时，将该信号截断，不发送给实时标引模块，这样就保证了在一次庭审录制过程中对于一个规定环节只标引一次。实时标引模块根据语音信息检测模块检测合格的语音识别装置的识别结果触发标引操作，对音频文件的对应音频帧进行标引关联。本发明中，将特定的语音信息作为标引的触发机制，实时标引模块事先已经定义了需要标引的具体内容，即每个庭审环节的名称，一种具体的实施方式是，在实时标引模块中设置一个XML文件，XML即为可扩展的标记语言 (extensible Markup Language)，是一套定义语义标记的规则，这些标记可以将文档分成许多部件并对这些部件加以标识。如图3所示，本发明的XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，即触发了相应的标引操作，系统便将音频文件中当前音频帧与XML文件的当前节点内容相对应，实现标引关联。下一个语音识别结果信号来到时，再将这一时刻的音频帧与依次排列的另一个节点内容相对应，实现下一个环节的标引关联。这一技术原理简单，对于本领域的技术人员来说非常容易实现。针对上述标引方式，在音频服务器中，还设有一个音频文件打包模块，用于将起标引作用的XML文件与数字化录音装置生成的音频文件整体打包。这样，就形成了一个可以实际被媒体播放器读取播放的完整的音频文件。对于音频播放器软件来说，应该针对上述标引关联专门设计一个播放插件，通过该插件，可以将庭审的环节标签显示在播放器的进度栏，这样，在听取音频文件的时候，可
5以非常直观的找到庭审的某个环节的音频片段，便于观看的迅速定位。例如，收听者希望听一下法庭辩论环节的情况，就可以拖动进度栏游标，将之放于“法庭辩论”的标识处，播放软件便可以迅速的根据该标引信息，找到对应的片段起点音频帧，从该音频帧开始播放，非常方便实用。上述功能插件的设计对于本领域的技术人员来说是现有技术，此处不再进行过多的描述。本发明所述的系统并不限于具体实施方式
中所述的实施例，本领域技术人员根据本发明的技术方案得出其他的实施方式，同样属于本发明的技术创新范围。
权利要求
一种基于语音识别的法庭庭审音频文件实时标引系统，包括-数字化录音装置，用于对整个庭审过程进行不间断的连续录音，形成音频文件；-音频服务器，与数字化录音装置连接，用于存储音频文件，并对音频文件进行处理；-语音识别装置，与音频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别；-实时标引模块，设置在音频服务器内，用于根据语音识别装置的识别结果触发标引操作，对音频文件的对应音频帧进行标引关联。
2.如权利要求1所述的基于语音识别的法庭庭审音频文件实时标引系统，其特征在于该系统还包括语音信息检测模块，设置在音频服务器内，用于对语音识别装置输入的语音识别结果信息进行重复性检测，避免重复标引。
3.如权利要求1或2所述的基于语音识别的法庭庭审音频文件实时标引系统，其特征在于所述的语音识别装置与法官席麦克风相连接，直接识别法官的特定语句。
4.如权利要求3所述的基于语音识别的法庭庭审音频文件实时标引系统，其特征在于所述的语音识别装置包括用于接收模拟语音信息的语音接收单元，语音接收单元与模数转换单元连接，模数转换单元与特定语音信息识别单元连接，特定语音信息识别单元连接语音信息输出单元。
5.如权利要求1所述的基于语音识别的法庭庭审音频文件实时标引系统，其特征在于所述的实时标引模块中设有一个XML文件，XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，便将当前音频帧与XML文件的当前节点内容相对应，实现标引关联。
6.如权利要求5所述的基于语音识别的法庭庭审音频文件实时标引系统，其特征在于该系统还包括音频文件打包模块，用于将起标引作用的XML文件与数字化录音装置生成的音频文件整体打包。
全文摘要
本发明属于音频处理技术领域，具体涉及一种基于语音识别的法庭庭审音频文件实时标引系统。该系统包括数字化录音装置，用于对整个庭审过程进行不间断的连续录音，形成音频文件；音频服务器，与数字化录音装置连接，用于存储音频文件，并对音频文件进行处理；语音识别装置，与音频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别；实时标引模块，设置在音频服务器内，用于根据语音识别装置的识别结果触发标引操作，对音频文件的对应音频帧进行标引关联。本发明能够按庭审环节将长时间的庭审录音进行实时标引，以方便后续听取录音片段的快速定位，并能够减轻工作人员劳动强度，提高音频文件的处理效率。
文档编号G11B27/10GK101833980SQ20091007982
公开日2010年9月15日申请日期2009年3月12日优先权日2009年3月12日
发明者商文彬, 羊文广, 羊美华, 黄琼申请人:新奥特硅谷视频技术有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：商文彬;羊美华;羊文广;黄琼
技术所有人：新奥特硅谷视频技术有限责任公司
我是此专利的发明人

上一篇：一种人工触发的法庭庭审音频文件实时标引系统的制作方法
上一篇：一种法庭庭审音频文件实时标引方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。