一种通过特定语音触发的法庭庭审音频文件实时标引方法

文档序号：2832087阅读：307来源：国知局

专利名称：一种通过特定语音触发的法庭庭审音频文件实时标引方法
技术领域：
本发明属于音频处理技术领域，具体涉及一种通过特定语音触发的法庭庭审音频文件实时标引方法。
背景技术：
法院的法庭审理过程需要进行现场录音，庭审现场录音对于提高庭审效率和案件审理质量是非常重要的。法庭的审理要求全面、真实、客观、公正，如果有音像资料作以佐证的话就更能直观、有效的印证案件审理的真实过程，从而为后续的监督检查以及庭审资料调用提供方便。而且，音像资料的保存作为一种真实历史的记录，可以为未来法庭庭审工作的发展提供借鉴和参考。法庭的庭审过程一般都比较长，短则2 3个小时，长的可以花费半天甚至一天的时间，而庭审的现场录音是一个连续的过程，将最终形成一段时间很长的音频文件法庭的审理都存在着一套比较规范的程序，我国的法庭审理过程一般包括如下步骤宣布开庭一核实当事人身份并告知权利义务一法庭调查一举证质证一法庭辩论一法庭调解一宣判一闭庭。在进行庭审音频的听取过程中，如果希望针对其中的某个环节听取录音，在音频文件通过音频播放软件播放时，可以通过改变播放进度的形式来选择相应的音频片段，这是目前所有播放软件都支持的功能。但是，这种改变播放进度的形式一般只能以时间作为参考依据，收听者首先要估计希望听取的片段在什么时间点，然后再根据时间点进行查找，这样就会比较繁琐，特别是在音频文件比较长的情况下查找的效率相对较低。由于法庭审理有着较规范的程序，因此，目前有一种做法是在庭审过程录制完成后，由工作人员再从头至尾浏览一遍整个音频文件，并对庭审的每一个步骤加入音频标引，从而为后续的录音提取提供方便。但这种方式不仅增加了工作人员的劳动强度，而且，耗时较长，工作效率比较低下。

发明内容
本发明的目的在于针对现有技术的缺陷，提供一种通过特定语音触发的法庭庭审音频文件实时标引方法，按庭审环节将长时间的庭审录音进行实时标引，以方便后续听取时音频片段的快速定位。本发明的技术方案如下一种通过特定语音触发的法庭庭审音频文件实时标引方法，包括如下步骤(1)根据法庭庭审的规定环节，确定每个环节开始时法官的标准语句；(2)在法庭现场音频的录制过程中，实时的捕捉法官所发出的语音信息；(3)语音识别装置识别法官的语音信息，当与每个环节开始时法官的标准语句相符时，输出语音识别结果信息；(4)通过语音识别结果信息触发标引操作，对音频文件的对应音频帧进行标引关联。
进一步，如上所述的通过特定语音触发的法庭庭审音频文件实时标引方法，在步骤(2)中使用数字化录音装置对整个庭审过程进行不间断的连续录音，形成音频文件，并将文件实时发送存储在音频服务器的存储器中。进一步，如上所述的通过特定语音触发的法庭庭审音频文件实时标引方法，在步骤(3)中，先将法官的语音信息由模拟信号转换为数字信号，然后进行特定语音信息的识别。进一步，如上所述的通过特定语音触发的法庭庭审音频文件实时标引方法，在步骤(4)中，首先对语音识别装置的语音识别结果信息进行重复性检测，通过检测的语音识别结果信息用于触发标弓I操作。进一步，如上所述的通过特定语音触发的法庭庭审音频文件实时标引方法，步骤 (4)中标引关联的具体方法为，建立一个XML文件，XML文件的内容节点以庭审的规定环节名称命名，当语音识别结果信息触发标引操作时，将当前音频帧与XML文件的当前节点内容相对应，实现标引关联。进一步，如上所述的通过特定语音触发的法庭庭审音频文件实时标引方法，其中，在音频录制结束后，将起标引作用的XML文件与音频文件整体打包。本发明的有益效果如下本发明通过对法官说出的特定语句进行语音识别，从而了解法庭审理的进程，确定每一个规定环节的开始时刻，通过信号触发实时标引的方式对庭审录音进行实时标引，最终形成一个带有庭审环节标签的音频文件。通过在音频播放器上设计一个简单的插件，用于读取标引信息，就可以将庭审的环节标签显示在播放器的进度栏，从而为庭审录音的后续收听定位提供了极大的方便。本发明原理简单，易于实现，非常有助于庭审音频文件的处理，并能够减轻工作人员劳动强度，提高音频文件的处理效率。

图1为本发明的方法流程图；图2为语音识别的流程图；图3为实时标引方式的原理图。
具体实施例方式下面结合附图和具体实施例对本发明进行详细的描述。本发明所提供的通过特定语音触发的法庭庭审音频文件实时标引方法，用于庭审录音现场当中，其主要功能是对法庭庭审的数字化音频文件进行实时的环节标引，以便于后续音频收听中的快速定位，该方法的流程如图1所示，包括如下步骤(1)根据法庭庭审的规定环节，确定每个环节开始时法官的标准语句，例如，开庭时法官宣读“现在开庭”，法庭辩论环节开始时法官宣读“现在进行法庭辩论”；(2)在法庭现场音频的录制过程中，实时的捕捉法官所发出的语音信息，本发明使用数字化录音装置对整个庭审过程进行不间断的连续录音，形成音频文件，并将文件实时发送存储在音频服务器的存储器中；(3)语音识别装置识别法官的语音信息并进行判断，当与每个环节开始时法官的标准语句相符时，输出语音识别结果信息；
4
(4)对语音识别装置的语音识别结果信息进行重复性检测，通过检测的语音识别结果信息用于触发标引操作，对音频文件的对应音频帧进行标引关联。本发明的语音识别装置并不是对法官的所有话语都进行识别，而是只针对特定语音信息进行识别。由于庭审一般都有着比较规范的程序，在每个程序开始的时候，规定法官都要用标准语句进行宣读以表明现在进入相应程序，例如，开庭时法官宣读“现在开庭”，法庭辩论环节开始时法官宣读“现在进行法庭辩论”。这样，语音识别装置可以预先设定好需要识别的特定语音信息是什么，只有当捕捉到这些规定好的特定语音信息之后，才进行语音信息的输出。结合以上特点，语音识别装置的语音识别流程如图2所示，首先通过语音接收单元接收模拟语音信息，然后通过模数转换单元将模拟信号转换为数字信号，接下来由特定语音信息识别单元判断语音信息是否为标准语句，如果是标准语句则通过语音信息输出单元进行输出。另外，在具体的庭审过程中，由于某些不太规范的人为因素，特定语音信息识别单元很可能会捕捉到多次同一特定语音信息，并将该信息进行了多次输出。因此，有必要对语音识别装置输出的语音识别结果信息进行重复性检测，如果发现有重复的语音信号又一次被输入时，将该信号截断，不发送给实时标引模块，这样就保证了在一次庭审录制过程中对于一个规定环节只标引一次。实时标引过程根据检测合格的语音识别装置的识别结果触发标引操作，对音频文件的对应音频帧进行标引关联。本发明中，将特定的语音信息作为标引的触发机制，音频服务器中设置实时标引模块，并在实时标引模块中事先已经定义了需要标引的具体内容，即每个庭审环节的名称，一种具体的实施方式是，在实时标引模块中设置一个XML文件，XML 即为可扩展的标记语言(eXtensibleMarkup Language)，是一套定义语义标记的规则，这些标记可以将文档分成许多部件并对这些部件加以标识。如图3所示，本发明的XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，即触发了相应的标引操作，系统便将音频文件中当前音频帧与XML文件的当前节点内容相对应，实现标引关联。下一个语音识别结果信号来到时，再将这一时刻的音频帧与依次排列的另一个节点内容相对应，实现下一个环节的标引关联。这一技术原理简单，对于本领域的技术人员来说非常容易实现。针对上述标引方式，在音频服务器中，还设有一个音频文件打包模块，用于将起标引作用的XML文件与数字化录音装置生成的音频文件整体打包。这样，就形成了一个可以实际被媒体播放器读取播放的完整的音频文件。对于音频播放器软件来说，应该针对上述标引关联专门设计一个播放插件，通过该插件，可以将庭审的环节标签显示在播放器的进度栏，这样，在听取音频文件的时候，可以非常直观的找到庭审的某个环节的音频片段，便于收听的迅速定位。例如，收听者希望听一下法庭辩论环节的情况，就可以拖动进度栏游标，将之放于“法庭辩论”的标识处，播放软件便可以迅速的根据该标引信息，找到对应的片段起点音频帧，从该音频帧开始播放，非常方便实用。上述功能插件的设计对于本领域的技术人员来说是现有技术，此处不再进行过多的描述。本发明所述的方法并不限于具体实施方式
中所述的实施例，本领域技术人员根据本发明的技术方案得出其他的实施方式，同样属于本发明的技术创新范围。
权利要求
一种通过特定语音触发的法庭庭审音频文件实时标引方法，包括如下步骤(1)根据法庭庭审的规定环节，确定每个环节开始时法官的标准语句；(2)在法庭现场音频的录制过程中，实时的捕捉法官所发出的语音信息；(3)语音识别装置识别法官的语音信息，当与每个环节开始时法官的标准语句相符时，输出语音识别结果信息；(4)通过语音识别结果信息触发标引操作，对音频文件的对应音频帧进行标引关联。
2.如权利要求1所述的通过特定语音触发的法庭庭审音频文件实时标引方法，其特征在于在步骤(2)中使用数字化录音装置对整个庭审过程进行不间断的连续录音，形成音频文件，并将文件实时发送存储在音频服务器的存储器中。
3.如权利要求1所述的通过特定语音触发的法庭庭审音频文件实时标引方法，其特征在于在步骤(3)中，先将法官的语音信息由模拟信号转换为数字信号，然后进行特定语音信息的识别。
4.如权利要求1所述的通过特定语音触发的法庭庭审音频文件实时标引方法，其特征在于在步骤(4)中，首先对语音识别装置的语音识别结果信息进行重复性检测，通过检测的语音识别结果信息用于触发标引操作。
5.如权利要求4所述的通过特定语音触发的法庭庭审音频文件实时标引方法，其特征在于步骤⑷中标引关联的具体方法为，建立一个XML文件，XML文件的内容节点以庭审的规定环节名称命名，当语音识别结果信息触发标引操作时，将当前音频帧与XML文件的当前节点内容相对应，实现标引关联。
6.如权利要求5所述的通过特定语音触发的法庭庭审音频文件实时标引方法，其特征在于在音频录制结束后，将起标引作用的XML文件与音频文件整体打包。
全文摘要
本发明属于音频处理技术领域，具体涉及一种通过特定语音触发的法庭庭审音频文件实时标引方法。该方法根据法庭庭审的规定环节，确定每个环节开始时法官的标准语句；在法庭现场音频的录制过程中，实时的捕捉法官所发出的语音信息；语音识别装置识别法官的语音信息，当与每个环节开始时法官的标准语句相符时，输出语音识别结果信息；通过语音识别结果信息触发标引操作，对音频文件的对应音频帧进行标引关联。本发明按庭审环节将长时间的庭审录音进行实时标引，以方便后续听取时音频片段的快速定位，并且能够减轻工作人员劳动强度，提高音频文件的处理效率。
文档编号G10L15/28GK101833982SQ20091007982
公开日2010年9月15日申请日期2009年3月12日优先权日2009年3月12日
发明者商文彬, 羊文广, 羊美华, 黄琼申请人:新奥特硅谷视频技术有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：商文彬;羊美华;羊文广;黄琼
技术所有人：新奥特硅谷视频技术有限责任公司
我是此专利的发明人

上一篇：一种基于声纹认证的监控系统的制作方法
上一篇：一种用于音频监控系统中的音频特征参数的提取方法