录音方法和装置与流程

文档序号：16636569发布日期：2019-01-16 07:04阅读：262来源：国知局

本发明涉及录音领域，具体而言，涉及一种录音方法和装置。

背景技术：

一次案件的庭审，少则花费十几分钟，多则长达四五个小时。目前庭审案件录音时都是建立一个录音文件，但是，对于花费较长时间的案件庭审进行录音，如果采取简单的技术实现，就是在开始庭审录音时，新建一个录音文件并打开，然后在庭审过程中不断地将音频数据流写入到该录音文件中，等到庭审结束时，关闭该录音文件。整个录音文件的生成，跟普通文件的生成，没什么差别。

现有的简单庭审录音实现方案，虽然可以满足庭审录音的需求，但是庭审时间越长，录音文件自然就越大，录音文件损坏的风险也越大。庭审没有结束，整个录音文件就不能关闭，在这一过程中，如果录音程序发生了未知异常，或计算机磁盘空间不够，最终的录音文件就不完整，导致录音文件无法进行播放。这样一来，整个庭审过程的音频数据，就面临无法还原的风险。

针对相关技术中庭审录音文件容易损坏无法还原的问题，目前尚未提出有效的解决方案。

技术实现要素：

本发明的主要目的在于提供一种录音方法和装置，以解决庭审录音文件容易损坏无法还原的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种录音方法，该方法包括：重复执行步骤s1至步骤s3直至接收到结束指令，其中，所述结束指令用于指示庭审结束：s1，建立录音文件并将所述录音文件作为目标录音文件；s2，将采集到的庭审过程中的音频数据写入所述目标录音文件并在开始写入时进行计时；s3，在计时时间达到预设时间的情况下，关闭所述目标录音文件并保存，得到第一录音文件；s4，在接收到所述结束指令时将所有保存的所述第一录音文件合并，得到第二录音文件。

进一步地，在步骤s3之前，所述方法还包括：在所述计时时间没有达到预设时间的情况下，判断是否接收到所述结束指令，其中，在没接收到所述结束指令时，执行步骤s3，在接收到所述结束指令时，关闭所述目标录音文件并保存，得到第三录音文件，执行步骤s4；其中，在得到所述第二录音文件之后，所述方法还包括：将所述第二录音文件与所述第三录音文件合并，得到第四录音文件。

进一步地，在得到所述第四录音文件之后，所述方法还包括：判断是否到达预设的文件上传时间；在到达所述预设的文件上传时间时，将所述第四录音文件上传到服务器。

进一步地，在将采集到的庭审过程中的音频数据写入所述目标录音文件并在开始写入时进行计时之前，所述方法还包括：通过windows音频会话api接口采集所述庭审过程中的音频数据；将所有保存的所述第一录音文件合并包括：通过ffmpeg将所有保存的所述第一录音文件合并，将所述第四录音文件上传到服务器包括：通过ftp将所述第四录音文件上传到服务器。

进一步地，在得到所述第一录音文件之后，所述方法还包括：根据录音时间对每个第一录音文件进行编号，得到每个第一录音文件的编号；将所有保存的所述第一录音文件合并包括：按照所述编号将所有保存的所述第一录音文件合并，得到所述第二录音文件。

为了实现上述目的，根据本发明的另一方面，还提供了一种录音装置，该装置包括：执行单元，用于重复执行步骤s1至步骤s3直至接收到结束指令，其中，所述结束指令用于指示庭审结束：s1，建立录音文件并将所述录音文件作为目标录音文件；s2，将采集到的庭审过程中的音频数据写入所述目标录音文件并在开始写入时进行计时；s3，在计时时间达到预设时间的情况下，关闭所述目标录音文件并保存，得到第一录音文件；合并单元，用于执行步骤s4，在接收到所述结束指令时将所有保存的所述第一录音文件合并，得到第二录音文件。

进一步地，所述装置还包括：第一判断单元，用于在步骤s3之前，在所述计时时间没有达到预设时间的情况下，判断是否接收到所述结束指令，其中，在没接收到所述结束指令时，执行步骤s3，在接收到所述结束指令时，关闭所述目标录音文件并保存，得到第三录音文件，执行步骤s4；其中，所述合并单元还用于在得到所述第二录音文件之后，将所述第二录音文件与所述第三录音文件合并，得到第四录音文件。

进一步地，所述装置还包括：第二判断单元，用于在得到所述第四录音文件之后，判断是否到达预设的文件上传时间；上传单元，用于在到达所述预设的文件上传时间时，将所述第四录音文件上传到服务器。

为了实现上述目的，根据本发明的另一方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行本发明的录音方法。

为了实现上述目的，根据本发明的另一方面，还提供了一种处理器，处理器用于运行程序，其中，所述程序运行时执行本发明的录音方法。

本发明通过建立录音文件并将录音文件作为目标录音文件，然后将采集到的的庭审过程中的录音数据写入目标录音文件并在开始写入时计时，在计时时间达到预设时间的情况下，关闭录音文件并保存，得到第一录音文件，由于将庭审录音文件分段采集后合并成一个文件，解决了庭审录音文件容易损坏无法还原的问题，进而达到了减少庭审录音文件整体损坏概率的效果。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明第一实施例的录音方法的流程图；

图2是根据本发明第二实施例的录音方法的流程图；以及

图3是根据本发明实施例的录音装置的示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了便于描述，以下对本申请实施例涉及的术语进行说明：

ffmpeg：是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。

本发明实施例提供了一种录音方法。

图1是根据本发明第一实施例的录音方法的流程图，如图1所示，该方法包括以下步骤：

重复执行步骤s1至步骤s3直至接收到结束指令，其中，结束指令用于指示庭审结束：s1，建立录音文件并将录音文件作为目标录音文件；s2，将采集到的庭审过程中的音频数据写入目标录音文件并在开始写入时进行计时；s3，在计时时间达到预设时间的情况下，关闭目标录音文件并保存，得到第一录音文件。

s4，在接收到结束指令时将所有保存的第一录音文件合并，得到第二录音文件。

本发明实施例的录音方法的改进在于按照一定时间间隔，将整个庭审过程分段录音存储，庭审结束之后在将分段存储的录音全部合并成一个文件，作为庭审过程的录音文件，可以防止在录音过程中的一段录音出现问题导致整个文件损坏无法恢复的问题，减少录音文件损坏无法恢复的概率。

结束指令可以是指示庭审结束的指令，结束指令可以是录音设备接收到工作人员触发预定的标识之后，发出的结束指令。预设时间可以是预先设定的时间，例如可以是15分钟，也可以是30分钟，在音频数据采集过程中，每隔预设时间段建立一个录音文件作为目标录音文件，将采集的音频数据写入目标录音文件，在开始写入时计时，当计时时间达到预设时间，关闭目标录音文件并保存，得到第一录音文件。然后重新开始一个循环，例如，庭审过程为60分钟，则一共得到四个第一录音文件，将四个第一录音文件拼接成一个录音文件，得到第二录音文件。

可选地，在步骤s3之前，在计时时间没有达到预设时间的情况下，判断是否接收到结束指令，其中，在没接收到结束指令时，执行步骤s3，继续判断计时时间是否达到预设时间，在接收到结束指令时，说明还没有到达一个完整的设定时间段庭审已结束，关闭目标录音文件并保存，得到第三录音文件，执行步骤s4；其中，在得到第二录音文件之后，将第二录音文件与第三录音文件合并，得到第四录音文件。

可选地，在每次庭审结束之后，将所有的录音文件合并成一个文件之后，可以将完整的庭审录音文件上传到预设的文件服务器中存储，以防止丢失，可以为文件上传设定时间，设定的时间可以是每天的非庭审时间，例如，设定的文件上传时间可以是每天晚上10点。在得到第四录音文件之后，判断是否到达预设的文件上传时间。文件上传可以是每天上传当天全部的庭审录音文件，也可以时每次庭审结束之后，上传刚结束的庭审录音文件。

可选地，在将采集到的庭审过程中的音频数据写入目标录音文件并在开始写入时进行计时之前，可以通过windows音频会话api接口(windowsaudiosessionapi，简称为wasapi)采集庭审过程中的音频数据；将所有保存的第一录音文件合并可以是通过ffmpeg将所有保存的第一录音文件合并，除了第一录音文件，第三录音文件也可以通过ffmpeg进行合并，将第四录音文件上传到服务器可以通过ftp将第四录音文件上传到服务器。

可选地，在得到第一录音文件之后，根据录音时间对每个第一录音文件进行编号，得到每个第一录音文件的编号；将所有保存的第一录音文件合并可以按照编号将所有保存的第一录音文件合并，得到第二录音文件。通过对得到的录音文件编号可以在拼接时准确拼接，防止拼接顺序错乱。

本发明实施例的录音方法可以有效地将庭审录音数据的损坏降低到最小，不管庭审时间多长，都能保证庭审音频数据的完整性，同时也不用过多担心计算机磁盘空间不足。

图2是根据本发明第二实施例的录音方法的流程图，该实施例可以作为上述第一实施例的优选实施方式，本发明实施例的技术方案主要包括三部分，1)分时段录音文件生成，2)分时段录音文件合成，3)录音文件定时打包上传至文件服务器。如图2所示，该录音方法包括：

步骤s201，新建录音文件。

步骤s202，写入音频数据。

在新建的录音文件中写入庭审过程中的音频数据。

步骤s203，判断是否到达一个时间分段。

判断开始写入到当前时间是否到达一个时间分段，时间分段可以是15分钟。如果判断结果为是，则执行步骤s205，判断结果为否，则执行步骤s204。

步骤s204，判断庭审是否结束。

判断庭审是否结束可以通过是否接收到结束指令来判断，如果判断庭审结束，则执行步骤s205，如果没有结束，则执行步骤s202。

步骤s205，关闭录音文件。

如果庭审结束，则关闭当前录音文件。

步骤s206，保存录音文件。

关闭当前录音文件之后保存当前录音文件。

步骤s207，判断庭审是否结束。

如果判断出庭审结束，则执行步骤s208，如果没有结束，则执行步骤s201，重新建立录音文件。

步骤s208，合并录音文件。

在庭审结束之后，将所有的录音文件合并成一个文件。

步骤s209，上传至文件服务器。

将合并后生成的文件上传至文件服务器存储。

整个流程为：在开始庭审后，程序就会新建一个录音文件，不断地写入音频数据，一个时间分段达到后(如15分钟，即按照每15分钟存储一个录音文件)就会关闭录音文件并保存，然后就会从头新建一个15分钟的录音文件进行音频数据的存储，直到庭审结束。

庭审结束后，程序会按照时间顺序，将所有的分时段录音文件(录音文件1，录音文件2，……，录音文件n)合成一个单一的大的录音文件。程序本身会有一个定时任务，在每天的非庭审时间，将已庭审的录音文件打包上传至文件服务器。

本发明实施例的技术方案可以应用在长时间的庭审过程中，按照一定的时间间隔将整个庭审过程，分时段进行录音存储，庭审结束时再将各个分时段录音文件进行无缝合成一个完整的大的录音文件。最后，定时将存储在本地的录音文件自动上传至文件服务器，释放本地计算机的磁盘空间资源。

在该实施例中，可以使用wasapi(全称是windowsaudiosessionapi即windows音频会话api)接口进行录音。使用ffmpeg进行录音文件的合并。使用ftp将录音文件上传至文件服务器。

本发明的技术方案主要应用在长时间庭审中，将整个庭审过程进行分割分段录音，这样每隔一定时间片段，就进行一次庭审录音文件的生成，使得庭审音频数据能够持续渐进的保存下来。每个分时段录音文件在时间上是连续的，在内容上又是相对独立，互不干扰的。即使后续某个时间段发生了异常，也只是影响到了该时间段的录音，其他时间段的音频数据仍能够正常保存下来，这样就把庭审录音数据的损坏范围缩小到较小的范围。如果整个庭审过程的录音，不进行分割存储，只简单地写入到一个大文件，一旦中间某个时刻录音程序发生异常，将可能导致整个录音文件的损坏。通过采用先分段录音，最终再合成的方式解决了长时间录音过程中出现异常时造成整个庭审录音文件损坏的问题。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本发明实施例提供了一种录音装置，该装置可以用于执行本发明实施例的录音方法。

图3是根据本发明实施例的录音装置的示意图，如图3所示，该装置包括：

执行单元10，用于重复执行步骤s1至步骤s3直至接收到结束指令，其中，结束指令用于指示庭审结束：s1，建立录音文件并将录音文件作为目标录音文件；s2，将采集到的庭审过程中的音频数据写入目标录音文件并在开始写入时进行计时；s3，在计时时间达到预设时间的情况下，关闭目标录音文件并保存，得到第一录音文件。

合并单元20，用于执行步骤s4，在接收到结束指令时将所有保存的第一录音文件合并，得到第二录音文件。

可选地，该装置还包括：第一判断单元，用于在步骤s3之前，在计时时间没有达到预设时间的情况下，判断是否接收到结束指令，其中，在没接收到结束指令时，执行步骤s3，在接收到结束指令时，关闭目标录音文件并保存，得到第三录音文件，执行步骤s4；其中，合并单元20还用于在得到第二录音文件之后，将第二录音文件与第三录音文件合并，得到第四录音文件。

可选地，该装置还包括：第二判断单元，用于在得到第四录音文件之后，判断是否到达预设的文件上传时间；上传单元，用于在到达预设的文件上传时间时，将第四录音文件上传到服务器。

该实施例采用执行单元10重复执行步骤s1至步骤s3直至接收到结束指令，其中，结束指令用于指示庭审结束：s1，建立录音文件并将录音文件作为目标录音文件；s2，将采集到的庭审过程中的音频数据写入目标录音文件并在开始写入时进行计时；s3，在计时时间达到预设时间的情况下，关闭目标录音文件并保存，得到第一录音文件，合并单元20在接收到结束指令时将所有保存的第一录音文件合并，得到第二录音文件，从而可以防止在录音过程中的一段录音出现问题导致整个文件损坏无法恢复的问题，减少录音文件损坏无法恢复的概率。

所述录音装置包括处理器和存储器，上述执行单元、合并单元、第一判断单元、第二判断单元和上传单元等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来减少录音文件损坏无法恢复的概率。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)，存储器包括至少一个存储芯片。

本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述录音方法。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述录音方法。

本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现以下步骤：

重复执行步骤s1至步骤s3直至接收到结束指令，其中，结束指令用于指示庭审结束：s1，建立录音文件并将录音文件作为目标录音文件；s2，将采集到的庭审过程中的音频数据写入目标录音文件并在开始写入时进行计时；s3，在计时时间达到预设时间的情况下，关闭目标录音文件并保存，得到第一录音文件；s4，在接收到结束指令时将所有保存的第一录音文件合并，得到第二录音文件。

在计时时间没有达到预设时间的情况下，判断是否接收到结束指令，其中，在没接收到结束指令时，执行步骤s3，在接收到结束指令时，关闭目标录音文件并保存，得到第三录音文件，执行步骤s4；在得到第二录音文件之后，将第二录音文件与第三录音文件合并，得到第四录音文件。

在得到第四录音文件之后，判断是否到达预设的文件上传时间；在到达预设的文件上传时间时，将第四录音文件上传到服务器。

在将采集到的庭审过程中的音频数据写入目标录音文件并在开始写入时进行计时之前，通过windows音频会话api接口采集庭审过程中的音频数据；通过ffmpeg将所有保存的第一录音文件合并，通过ftp将第四录音文件上传到服务器。

在得到第一录音文件之后，根据录音时间对每个第一录音文件进行编号，得到每个第一录音文件的编号；按照编号将所有保存的第一录音文件合并，得到第二录音文件。本文中的设备可以是服务器、pc、pad、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：

在得到第四录音文件之后，判断是否到达预设的文件上传时间；在到达预设的文件上传时间时，将第四录音文件上传到服务器。

在得到第一录音文件之后，根据录音时间对每个第一录音文件进行编号，得到每个第一录音文件的编号；按照编号将所有保存的第一录音文件合并，得到第二录音文件。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林建平
技术所有人：北京国双科技有限公司
我是此专利的发明人

上一篇：一种多人运动监测方法与流程
上一篇：阻尼器、风力发电机组以及风力发电机组的防振方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。