一种录音文件索引的装置及方法

文档序号:9887828阅读:497来源:国知局
一种录音文件索引的装置及方法
【技术领域】
[0001]本发明涉及多媒体技术领域,尤其涉及一种录音文件索引的装置及方法。
【背景技术】
[0002]现在的移动终端已经可以很方便的进行录音工作,但涉及到时间较长的录音操作时,回放查看录音文件时,仍然需要使用滑条对有用的内容以预览的方式进行内容的检索,无法直接调整播放想要播放的内容,需要多次才能找到想要查看的内容,录音文件缺乏有效的索引方式导致录音文件的浏览效率会很低。

【发明内容】

[0003]本发明的主要目的在于提出一种录音文件索引的装置及方法,旨在实现对录音文件的快速索引。
[0004]为实现上述目的,本发明提出一种录音文件索引的装置,包括:
[0005]文件生成单元,用于开启录音和语音识别,获取录音文件和对应的语音识别文本;
[0006]时间映射单元,用于将所述录音文件的时间轴映射到所述语音识别文本中;
[0007]文本保存单元,用于将语音识别文本及其对应于时间轴中的时间对应保存为文本文件。
[0008]其中,所述文件生成单元,包括:
[0009]第一计时模块,用于开启录音,同时开启计时器用于记录录音过程中整句音频数据的起始时间和整句结束时间;
[0010]第二计时模块,用于将所述整句音频数据发送到语音识别服务器进行语音识别,并记录所述整句音频数据的发送时间和对应的语音识别文本的接收时间;
[0011]所述时间映射单元,包括:
[0012]时间修正模块,用于根据所述发送时间和接收时间的时间差对所述整句结束时间进行修正,得到所述整句音频数据的结束时间;
[0013]时间标记模块,用于根据所述起始时间和结束时间对所述整句音频数据对应的语音识别文本的起始时间点和结尾时间点进行标记。
[0014]其中,所述时间标记模块,包括:
[0015]字符统计子模块,用于统计所述整句音频数据对应的语音识别文本中的字符;
[0016]时长计算子模块,用于根据所述起始时间和结束时间计算出所述语音识别文本中每个字符的平均时长;
[0017]字符标记子模块,用于根据所述平均时长对每个字符进行时间轴标记,其中所述语音识别文本中的第一个字符标记起始时间点,最后一个字符标记为结尾时间点。
[0018]其中,所述装置,还包括:
[0019]文件播放单元,用于播放所述录音文件时,显示所述文本文件中记录的语音识别文本,并突出显示所述录音文件的时间轴当前对应的语音识别文本。
[0020]其中,所述装置,还包括:
[0021]索引切换单元,用于当显示的语音识别文本检测到索引指令时,将所述录音文件切换到所述索引指令指向的语音识别文本对应的时间。
[0022]另外,为实现上述目的,本发明还提出了一种录音文件索引的方法,包括:
[0023]开启录音和语音识别,获取录音文件和对应的语音识别文本;
[0024]将所述录音文件的时间轴映射到所述语音识别文本中;
[0025]将语音识别文本及其对应于时间轴中的时间对应保存为文本文件。
[0026]其中,所述开启录音和语音识别,获取录音文件和对应的语音识别文本,包括:
[0027]开启录音,同时开启计时器用于记录录音过程中整句音频数据的起始时间和整句结束时间;
[0028]将所述整句音频数据发送到语音识别服务器进行语音识别,并记录所述整句音频数据的发送时间和对应的语音识别文本的接收时间;
[0029]所述将所述录音文件的时间轴映射到所述语音识别文本中,包括:
[0030]根据所述发送时间和接收时间的时间差对所述整句结束时间进行修正,得到所述整句音频数据的结束时间;
[0031]根据所述起始时间和结束时间对所述整句音频数据对应的语音识别文本的起始时间点和结尾时间点进行标记。
[0032]其中,所述根据所述起始时间和结束时间对所述整句音频数据对应的语音识别文本的起始时间点和结尾时间点进行标记,包括:
[0033]统计所述整句音频数据对应的语音识别文本中的字符;
[0034]根据所述起始时间和结束时间计算出所述语音识别文本中每个字符的平均时长;
[0035]根据所述平均时长对每个字符进行时间轴标记,其中所述语音识别文本中的第一个字符标记起始时间点,最后一个字符标记为结尾时间点。
[0036]其中,所述将语音识别文本及其对应于时间轴中的时间对应保存为文本文件之后,还包括:
[0037]播放所述录音文件时,显示所述文本文件中记录的语音识别文本,并突出显示所述录音文件的时间轴当前对应的语音识别文本。
[0038]其中,所述播放所述录音文件时,显示所述文本文件中记录的语音识别文本,并突出显示所述录音文件的时间轴当前对应的语音识别文本之后,还包括:
[0039]当显示的语音识别文本检测到索引指令时,将所述录音文件切换到所述索引指令指向的语音识别文本对应的时间。
[0040]本发明所提出的录音文件索引的装置及方法,通过在录制录音文件时对录音进行语音识别,将录音文件中的时间轴映射到语音识别文件中,将语音识别文件及其对应于时间轴中的时间对应保存,建立文本和时间轴之间的关联,通过文本实现对录音文件的索引,实现了对录音文件中内容的快速查看和切换,提高了对录音文件的浏览的效率。
【附图说明】
[0041 ]图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图;
[0042]图2为如图1所示的移动终端的无线通信系统示意图;
[0043]图3为本发明的一种录音文件索引的方法第一实施例的方法流程图;
[0044]图4为本发明的一种录音文件索引的方法第二实施例的方法流程图;
[0045]图5为本发明的一种录音文件索引的装置第一实施例的结构方框图;
[0046]图6为本发明的一种录音文件索引的装置第二实施例的结构方框图。
[0047]本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0048]应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0049]现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
[0050]移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
[0051]图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图。
[0052]移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
[0053]无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
[0054]广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO?)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
[0055]移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
[0056]无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(W1-F
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1