一种录音数据处理装置、移动终端及方法与流程

文档序号:12274084阅读:310来源:国知局
一种录音数据处理装置、移动终端及方法与流程

本发明涉及录音领域,更具体地说,涉及一种录音数据处理装置、移动终端及方法。



背景技术:

在进行一个会议时,会议记录员会将会议的重要内容记录下来,形成会议记录,由于录音工具的便携性强、且能随时随地重复播放,所以采用录音工具对会议进行录音是最常用的录音辅助手段。然而从录音时长较长的录音中提取出有用的会议信息,也是一项比较繁杂的工作,会耗费较多的时间和人力,用户体验较差。



技术实现要素:

本发明的主要目的在于提出一种录音数据处理装置、移动终端及方法,旨在解决现有技术中,从录音时长较长的录音中提取出有用的信息,会耗费较多的时间和人力的问题。

为解决上述技术问题,本发明提供一种录音数据处理装置,包括:

分割模块,用于将原录音数据按照预设方式进行分割,分割成多个连续的原数据段;

确定模块,用于将各个原数据段与预设关键数据进行比对,确定出与关键数据相匹配的至少一个目标数据段;

组合模块,用于将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据。

其中,分割模块用于将原录音数据进行断句分割,分割成多个连续的完整语句,作为原数据段。

其中,还包括:接收模块,用于接收用户输入的所述关键数据。

其中,组合模块用于将各目标数据段,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

可选地,本发明提供一种移动终端,包括上述的录音数据处理装置。

可选地,本发明提供一种录音数据处理方法,包括:

将原录音数据按照预设方式进行分割,分割成多个连续的原数据段;

将各个原数据段与预设关键数据进行比对,确定出与关键数据相匹配的至少一个目标数据段;

将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据。

其中,将原录音数据按照预设方式进行分割,分割成多个连续的原数据段包括:将原录音数据进行断句分割,分割成多个连续的完整语句,作为原数据段。

其中,目标数据段包括:原数据段,或者从原数据段中截取的与关键数据相匹配的子数据段。

其中,将各个原数据段与预设关键数据进行比对之前,还包括:接收用户输入的关键数据。

其中,将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据包括:

将各目标数据段,以断句的形式组合成新的录音数据;

或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据;

或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

有益效果

本发明提供了一种录音数据处理装置、方法及移动终端,该录音数据处理装置包括分割模块,用于将原录音数据按照预设方式进行分割,分割成多个连续的原数据段;确定模块,用于将各个原数据段与预设关键数据进行比对,确定出与关键数据相匹配的至少一个目标数据段;组合模块,用于将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据;采用上述方案,从原录音内容中提取出与预设关键数据相匹配的录音内容,并将其组合成新的录音,去掉了原录音内容中无用的信息,提高了录音内容中关键信息的密度,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间,为会议记录人员或者处理类似工作的人员提供了便利,提升用户体验。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图;

图2为本发明第一实施例提供的一种录音数据处理装置的示意图;

图3为本发明第二实施例提供的一种移动终端的示意图;

图4为本发明第三实施例提供的一种录音数据处理方法的流程图。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。

移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端,然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。

图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图。

移动终端100可以包括A/V(音频/视频)输入单元110、用户输入单元120、输出单元130、存储器140、控制器150和电源单元160等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件,可以替代地实施更多或更少的组件,将在下面详细描述移动终端的元件。

A/V输入单元110用于接收音频或视频信号。A/V输入单元110可以包括麦克风111,麦克风111可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风111接收声音(音频数据),并且能够将这样的声音处理为音频数据。麦克风111可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。

用户输入单元120可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元120允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示模块131上时,可以形成触摸屏。

输出单元130被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。

输出单元130可以包括显示模块131、音频输出模块132等。

显示模块131可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示模块131可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示模块131可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。

同时,当显示模块131和触摸板以层的形式彼此叠加以形成触摸屏时,显示模块131可以用作输入装置和输出装置。显示模块131可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示模块(或其它显示装置),例如,移动终端可以包括外部显示模块(未示出)和内部显示模块(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。

音频输出模块132可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块132可以包括扬声器、蜂鸣器等等。

存储器140可以存储由控制器150执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器140可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。

存储器140可以包括至少一种类型的存储介质,存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器140的存储功能的网络存储装置协作。

控制器150通常控制移动终端的总体操作。例如,控制器150执行与语音通话、数据通信、视频通话等等相关的控制和处理。控制器150可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。

电源单元160在控制器150的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。

这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器150中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器140中并且由控制器150执行。

至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。

基于上述移动终端硬件结构,以下通过具体实施例对本发明进行详细说明。

第一实施例

本实施例提供了一种录音数据处理装置,参见图2,图2为本发明第一实施例提供的录音数据处理装置的示意图,该录音数据处理装置包括:分割模块201、确定模块202、组合模块203,其中,

分割模块201,用于将原录音数据按照预设方式进行分割,分割成多个连续的原数据段。

其中,预设方式可以包括采用中文分词方法(例如基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法等)对原录音数据按照一句完整的语句进行分割;即分割模块201用于将原录音数据进行断句分割,分割成多个连续的完整语句,作为原数据段。

例如分割模块201将原录音数据分割成了N个连续的原数据段,第一个原数据段的起始时间点和结束时间点分别为t0、t1,第二个原数据段的起始时间点和结束时间点分别为t1、t2,第三个原数据段的起始时间点和结束时间点分别为t2、t3,以此类推,第N个原数据段的起始时间点和结束时间点分别为tN-1、tN。

该录音数据处理装置还包括:接收模块204,用于接收用户输入的关键数据。

关键数据可以根据用户需求进行设置。关键数据可以是一个字、一个词组、一个短句等,关键数据可以是一个,也可以是多个,例如当原录音数据的内容主要是关于如何整治景点A的旅游市场秩序,则关键数据可以是旅游、景点A、整治、市场秩序、旅游市场秩序、整治市场秩序、整治旅游市场秩序、诚信经营中的至少一个。

确定模块202,用于将各个原数据段与预设关键数据进行比对,确定出与关键数据相匹配的至少一个目标数据段。

当预设关键数据只有一个时,可以先将上述的第一个原数据段与预设关键数据进行比对,然后再将上述的第二个原数据段与预设关键数据进行比对,以此类推,直至比对完所有的原数据段。

当预设关键数据有多个时,可以先将上述的第一个原数据段与第一个预设关键数据进行比对,再将上述的第二个原数据段与第一个预设关键数据进行比对,以此类推,直至比对完所有的原数据段;然后将上述的第一个原数据段与第二个预设关键数据进行比对,再将上述的第二个原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的原数据段;以此类推,直至将所有的原数据段与所有的预设关键数据比对完。

还可以先将上述的第一个原数据段与第一个预设关键数据进行比对,再将该原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的预设关键数据;然后将上述的第二个原数据段与第一个预设关键数据进行比对,再将该原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的预设关键数据;以此类推,直至将所有的原数据段与所有的预设关键数据比对完。

各个原数据段与预设关键数据的比对可以综合人工智能方法以及统计学知识进行,如果某个原数据段与预设关键数据相关度达到某个设定阈值时,则认为该原数据段有相关性,则可以将该条原数据段的起始时间点、结束时间点进行记录。

目标数据段包括:原数据段,或者从原数据段中截取的与关键数据相匹配的子数据段。

为了提高录音内容中关键信息的密度,目标数据段可以包括从原数据段中截取的与关键数据相匹配的子数据段,例如一个原数据段的起始时间点和结束时间点分别为60秒、80秒,在72-74秒处是关键数据所在的时间段,则可以在60秒-80秒内截取出包含72-74秒的子数据段,例如可以是截取65秒-75秒的子数据段,也可以是截取70秒-80秒的子数据段。

组合模块203,用于将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据。

具体的,组合模块203用于将各目标数据段,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

组合模块203将匹配得出的各目标数据段以断句的形式组合成新的录音数据,例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为120秒、135秒,第三个目标数据段的起始时间点和结束时间点分别为160秒、180秒。

将不匹配的原数据段丢弃,在直接将匹配到的目标数据段进行组合后,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以断句的形式组合成新的录音数据,以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白为例。组合成的新的录音数据包括60秒-80秒、120秒-135秒、160秒-180秒以及两个前后两个目标数据段的衔接处各1秒,一共57秒的录音数据,即0-20秒为第一个目标数据段的录音数据,20秒-21秒为空白,表示停顿,21秒-36秒为第二个目标数据段的录音数据,36秒-37秒为空白,表示停顿,37秒-57秒为第三个目标数据段的录音数据。

通过上述将匹配得出的各目标数据段以断句的形式组合成新的录音数据,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间。

或者组合模块203将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为120秒、135秒,第三个目标数据段的起始时间点和结束时间点分别为160秒、180秒。

将不匹配的原数据段丢弃,在将匹配得到的目标数据段组合成的新的录音数据的过程中,为了用户能更清楚的知晓录音内容,可以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据,预设长度可以根据用户需求进行设置,也可以是默认设置,前预设长度和后预设长度可以相同,也可以不同。若直接将匹配到的目标数据段以及其前后预设长度内的数据进行组合,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白,且以前后预设长度均为10秒为例,组合成的新的录音数据包括50秒-90秒、110秒-145秒、150秒-190秒以及两个前后两个目标数据段的衔接处各1秒,一共117秒的录音数据,即0-40秒为包含第一个目标数据段的录音数据,40秒-41秒为空白,表示停顿,41秒-76秒为包含第二个目标数据段的录音数据,76秒-77秒为空白,表示停顿,77秒-117秒为包含第三个目标数据段的录音数据。

通过上述将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据,使用户更清楚的知晓录音内容,同时大大减小了录音内容的长度,节省了录音所需占用的存储空间。

或者,组合模块203用于将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为90秒、105秒,第三个目标数据段的起始时间点和结束时间点分别为130秒、145秒。

将不匹配的原数据段丢弃,在将匹配得到的目标数据段组合成的新的录音数据的过程中,为了用户能更清楚的知晓录音内容,可以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据,预设长度可以根据用户需求进行设置,也可以是默认设置,前预设长度和后预设长度可以相同,也可以不同。若直接将匹配到的目标数据段以及其前后预设长度内的数据进行组合,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白,且以前后预设长度均为10秒为例,组合成的录音数据包括50秒-90秒、80秒-115秒、120秒-150秒以及两个前后两个目标数据段的衔接处各1秒,一共107秒的录音数据,由于第一段录音数据50秒-90秒与第二段录音数据80秒-115秒有重复部分,所以对这两段录音数据进行去重处理,将其中一段录音数据的80秒-90秒部分去掉,即最后组合成的新的录音数据包括:0-40秒为包含第一个目标数据段的录音数据,40秒-41秒为空白,表示停顿,41秒-66秒为包含第二个目标数据段的录音数据,66秒-67秒为空白,表示停顿,67秒-97秒为包含第三个目标数据段的录音数据。或者最后组合成的新的录音数据包括:0-30秒为包含第一个目标数据段的录音数据,30秒-31秒为空白,表示停顿,31秒-66秒为包含第二个目标数据段的录音数据,66秒-67秒为空白,表示停顿,67秒-97秒为包含第三个目标数据段的录音数据。

通过上述将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据,使用户更清楚的知晓录音内容,且去除了重复的录音内容,同时大大减小了录音内容的长度,节省了录音所需占用的存储空间。

通过本实施的实施,从原录音内容中提取出与预设关键数据相匹配的录音内容,并将其组合成新的录音,去掉了原录音内容中无用的信息,提高了录音内容中关键信息的密度,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间,为会议记录人员或者处理类似工作的人员提供了便利,提升用户体验。

第二实施例

本实施例还提供一种移动终端,参见图3,图3为本实施例提供的一种移动终端的示意图,该移动终端包括第一实施例中的录音数据处理装置。上述录音数据处理装置的各功能模块执行的功能可通过图1中的部分硬件来实现,当然,各硬件执行的功能也可由上述功能模块实现。上述各功能模块的功能具体由如下硬件实现:

分割模块201、确定模块202、组合模块203的功能均可通过控制器150来实现。接收模块204的功能可通过用户输入单元120来实现,用户输入单元120可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。

在录音开始时,用户输入单元120接收用户输入的关键数据,关键数据可以根据用户需求进行设置。关键数据可以是一个字、一个词组、一个短句等,关键数据可以是一个,也可以是多个,例如当原录音数据的内容主要是关于如何整治景点A的旅游市场秩序,则关键数据可以是旅游、景点A、整治、市场秩序、旅游市场秩序、整治市场秩序、整治旅游市场秩序、诚信经营中的至少一个。

采用麦克风111来接收声音,并将这样的声音处理为音频数据,待麦克风111采集到原录音数据后,将其发送给控制器150。控制器150将原录音数据按照预设方式进行分割,分割成多个连续的原数据段。其中,预设方式可以包括采用中文分词方法(例如基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法等)对原录音数据按照一句完整的语句进行分割;即控制器150将原录音数据进行断句分割,分割成多个连续的完整语句,作为原数据段。

例如控制器150将原录音数据分割成了N个连续的原数据段,第一个原数据段的起始时间点和结束时间点分别为t0、t1,第二个原数据段的起始时间点和结束时间点分别为t1、t2,第三个原数据段的起始时间点和结束时间点分别为t2、t3,以此类推,第N个原数据段的起始时间点和结束时间点分别为tN-1、tN。

控制器150将各个原数据段与预设关键数据进行比对,确定出与关键数据相匹配的至少一个目标数据段。

当预设关键数据只有一个时,可以先将上述的第一个原数据段与预设关键数据进行比对,然后再将上述的第二个原数据段与预设关键数据进行比对,以此类推,直至比对完所有的原数据段。

当预设关键数据有多个时,可以先将上述的第一个原数据段与第一个预设关键数据进行比对,再将上述的第二个原数据段与第一个预设关键数据进行比对,以此类推,直至比对完所有的原数据段;然后将上述的第一个原数据段与第二个预设关键数据进行比对,再将上述的第二个原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的原数据段;以此类推,直至将所有的原数据段与所有的预设关键数据比对完。

还可以先将上述的第一个原数据段与第一个预设关键数据进行比对,再将该原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的预设关键数据;然后将上述的第二个原数据段与第一个预设关键数据进行比对,再将该原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的预设关键数据;以此类推,直至将所有的原数据段与所有的预设关键数据比对完。

各个原数据段与预设关键数据的比对可以综合人工智能方法以及统计学知识进行,如果某个原数据段与预设关键数据相关度达到某个设定阈值时,则认为该原数据段有相关性,则可以将该条原数据段的起始时间点、结束时间点进行记录。

目标数据段包括:原数据段,或者从原数据段中截取的与关键数据相匹配的子数据段。

为了提高录音内容中关键信息的密度,目标数据段可以包括从原数据段中截取的与关键数据相匹配的子数据段,例如一个原数据段的起始时间点和结束时间点分别为60秒、80秒,在72-74秒处是关键数据所在的时间段,则可以在60秒-80秒内截取出包含72-74秒的子数据段,例如可以是截取65秒-75秒的子数据段,也可以是截取70秒-80秒的子数据段。

控制器150将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据。

具体的,控制器150将各目标数据段,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

控制器150将匹配得出的各目标数据段以断句的形式组合成新的录音数据,例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为120秒、135秒,第三个目标数据段的起始时间点和结束时间点分别为160秒、180秒。

将不匹配的原数据段丢弃,在直接将匹配到的目标数据段进行组合后,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以断句的形式组合成新的录音数据,以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白为例。组合成的新的录音数据包括60秒-80秒、120秒-135秒、160秒-180秒以及两个前后两个目标数据段的衔接处各1秒,一共57秒的录音数据,即0-20秒为第一个目标数据段的录音数据,20秒-21秒为空白,表示停顿,21秒-36秒为第二个目标数据段的录音数据,36秒-37秒为空白,表示停顿,37秒-57秒为第三个目标数据段的录音数据。。并将上述组合成的新的录音数据保存到存储器140中。

通过上述将匹配得出的各目标数据段以断句的形式组合成新的录音数据,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间。

或者控制器150将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为120秒、135秒,第三个目标数据段的起始时间点和结束时间点分别为160秒、180秒。

将不匹配的原数据段丢弃,在将匹配得到的目标数据段组合成的新的录音数据的过程中,为了用户能更清楚的知晓录音内容,可以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据,预设长度可以根据用户需求进行设置,也可以是默认设置,前预设长度和后预设长度可以相同,也可以不同。若直接将匹配到的目标数据段以及其前后预设长度内的数据进行组合,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白,且以前后预设长度均为10秒为例,组合成的新的录音数据包括50秒-90秒、110秒-145秒、150秒-190秒以及两个前后两个目标数据段的衔接处各1秒,一共117秒的录音数据,即0-40秒为包含第一个目标数据段的录音数据,40秒-41秒为空白,表示停顿,41秒-76秒为包含第二个目标数据段的录音数据,76秒-77秒为空白,表示停顿,77秒-117秒为包含第三个目标数据段的录音数据。并将上述组合成的新的录音数据保存到存储器140中。

通过上述将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据,使用户更清楚的知晓录音内容,同时大大减小了录音内容的长度,节省了录音所需占用的存储空间。

或者,控制器150将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为90秒、105秒,第三个目标数据段的起始时间点和结束时间点分别为130秒、145秒。

将不匹配的原数据段丢弃,在将匹配得到的目标数据段组合成的新的录音数据的过程中,为了用户能更清楚的知晓录音内容,可以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据,预设长度可以根据用户需求进行设置,也可以是默认设置,前预设长度和后预设长度可以相同,也可以不同。若直接将匹配到的目标数据段以及其前后预设长度内的数据进行组合,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白,且以前后预设长度均为10秒为例,组合成的录音数据包括50秒-90秒、80秒-115秒、120秒-150秒以及两个前后两个目标数据段的衔接处各1秒,一共107秒的录音数据,由于第一段录音数据50秒-90秒与第二段录音数据80秒-115秒有重复部分,所以对这两段录音数据进行去重处理,将其中一段录音数据的80秒-90秒部分去掉,即最后组合成的新的录音数据包括:0-40秒为包含第一个目标数据段的录音数据,40秒-41秒为空白,表示停顿,41秒-66秒为包含第二个目标数据段的录音数据,66秒-67秒为空白,表示停顿,67秒-97秒为包含第三个目标数据段的录音数据。或者最后组合成的新的录音数据包括:0-30秒为包含第一个目标数据段的录音数据,30秒-31秒为空白,表示停顿,31秒-66秒为包含第二个目标数据段的录音数据,66秒-67秒为空白,表示停顿,67秒-97秒为包含第三个目标数据段的录音数据。并将上述组合成的新的录音数据保存到存储器140中。

通过上述将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据,使用户更清楚的知晓录音内容,且去除了重复的录音内容,同时大大减小了录音内容的长度,节省了录音所需占用的存储空间。

当用户需要播放组合成新的录音数据时,通过音频输出模块132进行播放,例如可以通过扬声器播放。

通过本实施例的实施,从原录音内容中提取出与预设关键数据相匹配的录音内容,并将其组合成新的录音,去掉了原录音内容中无用的信息,提高了录音内容中关键信息的密度,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间,为会议记录人员或者处理类似工作的人员提供了便利,提升用户体验。

第三实施例

本实施例提供了一种录音数据处理方法,参见图4,图4为本发明第三实施例提供的录音数据处理方法的流程图,该方法包括以下步骤:

S401:将原录音数据按照预设方式进行分割,分割成多个连续的原数据段。

其中,预设方式可以包括采用中文分词方法(例如基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法等)对原录音数据按照一句完整的语句进行分割;也即将原录音数据进行断句分割,分割成多个连续的完整语句,作为原数据段。

例如将原录音数据分割成了N个连续的原数据段,第一个原数据段的起始时间点和结束时间点分别为t0、t1,第二个原数据段的起始时间点和结束时间点分别为t1、t2,第三个原数据段的起始时间点和结束时间点分别为t2、t3,以此类推,第N个原数据段的起始时间点和结束时间点分别为tN-1、tN。

S402:将各个原数据段与预设关键数据进行比对,确定出与关键数据相匹配的至少一个目标数据段。

在将各个原数据段与预设关键数据进行比对之前,还包括:接收用户输入的关键数据。

关键数据可以根据用户需求进行设置。关键数据可以是一个字、一个词组、一个短句等,关键数据可以是一个,也可以是多个,例如当原录音数据的内容主要是关于如何整治景点A的旅游市场秩序,则关键数据可以是旅游、景点A、整治、市场秩序、旅游市场秩序、整治市场秩序、整治旅游市场秩序、诚信经营中的至少一个。

当预设关键数据只有一个时,可以先将上述的第一个原数据段与预设关键数据进行比对,然后再将上述的第二个原数据段与预设关键数据进行比对,以此类推,直至比对完所有的原数据段。

当预设关键数据有多个时,可以先将上述的第一个原数据段与第一个预设关键数据进行比对,再将上述的第二个原数据段与第一个预设关键数据进行比对,以此类推,直至比对完所有的原数据段;然后将上述的第一个原数据段与第二个预设关键数据进行比对,再将上述的第二个原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的原数据段;以此类推,直至将所有的原数据段与所有的预设关键数据比对完。

还可以先将上述的第一个原数据段与第一个预设关键数据进行比对,再将该原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的预设关键数据;然后将上述的第二个原数据段与第一个预设关键数据进行比对,再将该原数据段与第二个预设关键数据进行比对,以此类推,直至比对完所有的预设关键数据;以此类推,直至将所有的原数据段与所有的预设关键数据比对完。

各个原数据段与预设关键数据的比对可以综合人工智能方法以及统计学知识进行,如果某个原数据段与预设关键数据相关度达到某个设定阈值时,则认为该原数据段有相关性,则可以将该条原数据段的起始时间点、结束时间点进行记录。

目标数据段包括:原数据段,或者从原数据段中截取的与关键数据相匹配的子数据段。

为了提高录音内容中关键信息的密度,目标数据段可以包括从原数据段中截取的与关键数据相匹配的子数据段,例如一个原数据段的起始时间点和结束时间点分别为60秒、80秒,在72-74秒处是关键数据所在的时间段,则可以在60秒-80秒内截取出包含72-74秒的子数据段,例如可以是截取65秒-75秒的子数据段,也可以是截取70秒-80秒的子数据段。

S403:将各目标数据段,或将各目标数据段以及其前后预设长度内的数据,组合成新的录音数据。

具体的,将各目标数据段,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据;或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

将匹配得出的各目标数据段以断句的形式组合成新的录音数据,例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为120秒、135秒,第三个目标数据段的起始时间点和结束时间点分别为160秒、180秒。

将不匹配的原数据段丢弃,在直接将匹配到的目标数据段进行组合后,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以断句的形式组合成新的录音数据,以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白为例。组合成的新的录音数据包括60秒-80秒、120秒-135秒、160秒-180秒以及两个前后两个目标数据段的衔接处各1秒,一共57秒的录音数据,即0-20秒为第一个目标数据段的录音数据,20秒-21秒为空白,表示停顿,21秒-36秒为第二个目标数据段的录音数据,36秒-37秒为空白,表示停顿,37秒-57秒为第三个目标数据段的录音数据。

通过上述将匹配得出的各目标数据段以断句的形式组合成新的录音数据,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间。

或者将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为120秒、135秒,第三个目标数据段的起始时间点和结束时间点分别为160秒、180秒。

将不匹配的原数据段丢弃,在将匹配得到的目标数据段组合成的新的录音数据的过程中,为了用户能更清楚的知晓录音内容,可以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据,预设长度可以根据用户需求进行设置,也可以是默认设置,前预设长度和后预设长度可以相同,也可以不同。若直接将匹配到的目标数据段以及其前后预设长度内的数据进行组合,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白,且以前后预设长度均为10秒为例,组合成的新的录音数据包括50秒-90秒、110秒-145秒、150秒-190秒以及两个前后两个目标数据段的衔接处各1秒,一共117秒的录音数据,即0-40秒为包含第一个目标数据段的录音数据,40秒-41秒为空白,表示停顿,41秒-76秒为包含第二个目标数据段的录音数据,76秒-77秒为空白,表示停顿,77秒-117秒为包含第三个目标数据段的录音数据。

通过上述将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据,使用户更清楚的知晓录音内容,同时大大减小了录音内容的长度,节省了录音所需占用的存储空间。

或者,将各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据。

例如从所有的原数据段中匹配得到以下3个目标数据段:第一个目标数据段的起始时间点和结束时间点分别为60秒、80秒,第二个目标数据段的起始时间点和结束时间点分别为90秒、105秒,第三个目标数据段的起始时间点和结束时间点分别为130秒、145秒。

将不匹配的原数据段丢弃,在将匹配得到的目标数据段组合成的新的录音数据的过程中,为了用户能更清楚的知晓录音内容,可以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据,预设长度可以根据用户需求进行设置,也可以是默认设置,前预设长度和后预设长度可以相同,也可以不同。若直接将匹配到的目标数据段以及其前后预设长度内的数据进行组合,可能出现前后两个目标数据段的衔接处的录音内容没有停顿的情况,所以将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式组合成新的录音数据。

以断句的形式为在前后两个目标数据段的衔接处增加1秒的空白,且以前后预设长度均为10秒为例,组合成的录音数据包括50秒-90秒、80秒-115秒、120秒-150秒以及两个前后两个目标数据段的衔接处各1秒,一共107秒的录音数据,由于第一段录音数据50秒-90秒与第二段录音数据80秒-115秒有重复部分,所以对这两段录音数据进行去重处理,将其中一段录音数据的80秒-90秒部分去掉,即最后组合成的新的录音数据包括:0-40秒为包含第一个目标数据段的录音数据,40秒-41秒为空白,表示停顿,41秒-66秒为包含第二个目标数据段的录音数据,66秒-67秒为空白,表示停顿,67秒-97秒为包含第三个目标数据段的录音数据。或者最后组合成的新的录音数据包括:0-30秒为包含第一个目标数据段的录音数据,30秒-31秒为空白,表示停顿,31秒-66秒为包含第二个目标数据段的录音数据,66秒-67秒为空白,表示停顿,67秒-97秒为包含第三个目标数据段的录音数据。

通过上述将匹配得出的各目标数据段以及其前后预设长度内的数据,以断句的形式且进行去重处理后组合成新的录音数据,使用户更清楚的知晓录音内容,且去除了重复的录音内容,同时大大减小了录音内容的长度,节省了录音所需占用的存储空间。

通过本实施的实施,从原录音内容中提取出与预设关键数据相匹配的录音内容,并将其组合成新的录音,去掉了原录音内容中无用的信息,提高了录音内容中关键信息的密度,大大减小了录音内容的长度,同时还节省了录音所需占用的存储空间,为会议记录人员或者处理类似工作的人员提供了便利,提升用户体验。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1