语音到文本转换的方法及装置的制造方法

文档序号:8431777阅读:448来源:国知局
语音到文本转换的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及通信技术领域,尤其涉及一种语音到文本转换的方法及装置。
【背景技术】
[0002] 随着信息时代的迅速发展,信息输入/输出功能的重要性在电子设备中已经被加 强。人们可通过手机或录音笔(或其他具有录音功能的设备)进行录音,方便记录信息;在 录音过程中,还可以使用打点功能,如在听讲座时,可以一边听一边录音,对重要的内容在 录的时候事先标记上,最后生成录音文件,人们可在后续通过该录音文件继续回听以前的 讲座内容时,可直接从标记开始处听,而不需要整个录音听一遍;如在开会议时,可以一边 讨论一边录音,对重要的会议内容在录的时候事先标记上,最后生成录音文件,人们可在后 续通过该录音文件继续回听以前的会议内容时,可直接从标记开始处听,而不需要整个录 音听一遍。语音识别技术应用越来越广泛,现有技术中,已实现了将语音文件转换成文本文 件进行显示,但是,现有技术在将具有标记的语音文件转成文本文件时,对打点标记不进行 识别,而是直接将语音文件转换成文本文件,不方便人们对文本文件的读取、编辑,如人们 想看之前在语音文件中打点标记处的内容(了解记录的重点),不能快速找到,需要从文本 开始处慢慢找。
[0003] 上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技 术。

【发明内容】

[0004] 本发明的主要目的在于提供一种语音到文本转换的方法及装置,旨在对转换后的 文本进行标记,方便人们对文本进行查看、编辑等操作。
[0005] 为实现上述目的,本发明提供一种语音到文本转换的方法,该方法包括:
[0006] 获取音频文件;
[0007] 根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生 成第一文本信息;
[0008] 将所述音频文件中的录音打点标记转换为文本标记;
[0009] 将所述文本标记插入到所述第一文本信息中的对应位置,以生成第二文本信息。
[0010] 优选地,所述将所述音频文件中的录音打点标记转换为文本标记的步骤包括:
[0011] 获取所述音频文件中的录音打点标记;
[0012] 根据预设的录音打点标记与文本标记映射表,查找所述获取的录音打点标记对应 的文本标记。
[0013] 优选地,在将所述文本标记插入到所述第一文本信息中,以生成第二文本信息的 步骤之后,该方法还包括:
[0014] 将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出 显示,以生成第三文本信息。
[0015] 优选地,所述将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内 容进行突出显示,以生成第三文本信息的步骤包括:
[0016] 顺序读取所述第二文本信息;
[0017] 若当前读取到文本标记,则判断所述当前读取的文本标记是否与上一次读取的文 本标记相同;
[0018] 若所述当前读取的文本标记与上一次读取的文本标记相同,则将所述当前读取的 文本标记与上一次读取的文本标记之间的文字内容进行突出显示,以生成第三文本信息。
[0019] 优选地,所述则将所述当前读取的文本标记与上一次读取的文本标记之间的文字 内容进行突出显示,以生成第三文本信息的步骤包括:
[0020] 根据预设的文本标记与突出显示方式映射表,查找该当前读取的文本标记对应的 突出显示方式;
[0021] 将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容按照所述 查找的突出显示方式进行突出显示,以生成第三文本信息。
[0022] 此外,为实现上述目的,本发明还提供一种语音到文本转换的装置,包括:
[0023] 获取模块,用于获取音频文件;
[0024] 第一生成模块,用于根据所述音频文件的时间轴顺序将所述音频文件中含有的语 音转换为文本以生成第一文本信息;
[0025] 第一转换模块,用于将所述音频文件中的录音打点标记转换为文本标记;
[0026] 第二生成模块,用于将所述文本标记插入到所述第一文本信息中的对应位置,以 生成第二文本信息。
[0027] 优选地,所述第一转换模块包括:
[0028] 第一获取单元,用于获取所述音频文件中的录音打点标记;
[0029] 第一查找单元,用于根据预设的录音打点标记与文本标记映射表,查找所述获取 的录音打点标记对应的文本标记。
[0030] 优选地,该装置还包括:
[0031] 第三生成模块,用于将所述第二文本信息中的相同且相邻的两个文本标记之间的 文字内容进行突出显示,以生成第三文本信息。
[0032] 优选地,所述第三生成模块包括:
[0033] 读取单元,用于顺序读取所述第二文本信息;
[0034] 判断单元,用于在所述读取单元当前读取到文本标记时,判断所述当前读取的文 本标记是否与上一次读取的文本标记相同;
[0035] 突出显示单元,用于在所述当前读取的文本标记与上一次读取的文本标记相同 时,将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示, 以生成第二文本彳目息。
[0036] 优选地,所述突出显示单元包括:
[0037] 第二查找单元,用于在所述当前读取的文本标记与上一次读取的文本标记相同 时,根据预设的文本标记与突出显示方式映射表,查找该当前读取的文本标记对应的突出 显示方式;
[0038] 突出显示子单元,用于将所述当前读取的文本标记与上一次读取的文本标记之间 的文字内容按照所述第二查找单元查找的突出显示方式进行突出显示,以生成第三文本信 息。
[0039] 本发明通过获取音频文件;根据所述音频文件的时间轴顺序将所述音频文件中含 有的语音转换为文本以生成第一文本信息;将所述音频文件中的录音打点标记转换为文本 标记;将所述文本标记插入到所述第一文本信息中的对应位置,以生成第二文本信息。在将 音频文件转换为文本文件时,将音频文件中的录音打点标记转换成文本标记,并将该文本 标记插入到所述第一文本信息中的对应位置,以生成第二文本信息,可方便人们对转换后 的文本进行查看、编辑等操作。
【附图说明】
[0040] 图1为本发明语音到文本转换的方法第一实施例的流程示意图;
[0041] 图2为图1中步骤S30的细化流程示意图;
[0042] 图3为本发明语音到文本转换的方法第二实施例的流程示意图;
[0043] 图4为图3中步骤S50的细化流程示意图;
[0044] 图5为图4中步骤S53的细化流程示意图;
[0045] 图6为本发明语音到文本转换的装置第一实施例的功能模块示意图;
[0046] 图7为本发明语音到文本转换的装置第二实施例的功能模块示意图;
[0047] 图8为图7中第三生成模块的详细结构示意图。
[0048] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0049] 应当理解,此处所描述的具体实施例仅仅用以解释本发
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1