语音到文本转换的方法及装置的制造方法_2

文档序号：8431777阅读：来源：国知局

明，并不用于限定本发明。 [0050] 参照图1，图1为本发明语音到文本转换的方法第一实施例的流程示意图。
[0051] 本发明提供一种语音到文本转换的方法，包括
[0052] S10、获取音频文件。
[0053] 在该步骤S10中，可通过有线或无线的方式获取音频文件，如：可从网上下载获取音频文件，比如从网上下载了一份讲座音频文件。该音频文件包括录音打点标记。
[0054] S20、根据该音频文件的时间轴顺序将该音频文件中含有的语音转换为文本以生成第一文本信息。
[0055] 在该步骤S20中，通过语音至文本（SpeechToTest，STT)功能或算法将语音转换成文本，根据该音频文件的时间轴顺序，依次提取语音，并将提取的语音转换为文本，将转换生成的各文本合成第一文本信息。
[0056] S30、将该音频文件中的录音打点标记转换为文本标记。
[0057] 在该步骤S30中，将音频文件中的录音打点标记转换为文本标记，该文本标记样式多样，可以为各种颜色或各种形状的图案标记。
[0058] S40、将该文本标记插入到该第一文本信息中的对应位置，以生成第二文本信息。
[0059] 在该步骤S40中，根据该文本标记对应的录音打点标记在音频文件的位置，将文本标记插入到第一文本信息中的对应位置生成第二文本信息，使得该第二文本信息既包括由语音转换成的文本，又包括由录音打点标记转换成的文本标记。
[0060] 本发明实施例，在将语音到文本转换的过程中，将音频文件中含有的语音转换为文本以生成第一文本信息，将音频文件中的录音打点标记转换为文本标记，再将转换后的文本标记插入到该第一文本信息中的对应位置，以生成第二文本信息；即生成后的第二文本信息既包括由语音转换成的文本，又包括由录音打点标记转换成的文本标记。用户可方便的对第二文本信息进行查看、编辑等操作，如用户通过查看文本标记可在该第二文本信息中一目了然的找到之前做了录音打点标记处的地方，而不需要从第二文本信息的开始处依次查看。
[0061] 进一步的，如图2所示，该步骤S30包括：
[0062] S31、获取该音频文件中的录音打点标记。
[0063] S32、根据预设的录音打点标记与文本标记映射表，查找该获取的录音打点标记对应的文本标记。
[0064] 可根据实际需要预先设置该录音打点标记与文本标记的映射表，如表一所示。
[0065] 表一：
[0066]
【主权项】
1. 一种语音到文本转换的方法，其特征在于，该方法包括：获取音频文件；根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息；将所述音频文件中的录音打点标记转换为文本标记；将所述文本标记插入到所述第一文本信息中的对应位置，以生成第二文本信息。
2. 如权利要求1所述的语音到文本转换的方法，其特征在于，所述将所述音频文件中的录音打点标记转换为文本标记的步骤包括：获取所述音频文件中的录音打点标记；根据预设的录音打点标记与文本标记映射表，查找所述获取的录音打点标记对应的文本标记。
3. 如权利要求2所述的语音到文本转换的方法，其特征在于，在将所述文本标记插入到所述第一文本信息中，以生成第二文本信息的步骤之后，该方法还包括：将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示，以生成第二文本彳目息。
4. 如权利要求3所述的语音到文本转换的方法，其特征在于，所述将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示，以生成第三文本信息的步骤包括：顺序读取所述第二文本信息；若当前读取到文本标记，则判断所述当前读取的文本标记是否与上一次读取的文本标记相同；若所述当前读取的文本标记与上一次读取的文本标记相同，则将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示，以生成第三文本信息。
5. 如权利要求4所述的语音到文本转换的方法，其特征在于，所述则将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示，以生成第三文本信息的步骤包括：根据预设的文本标记与突出显示方式映射表，查找该当前读取的文本标记对应的突出显示方式；将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容按照所述查找的突出显示方式进行突出显示，以生成第三文本信息。
6. -种语音到文本转换的装置，其特征在于，包括：获取模块，用于获取音频文件；第一生成模块，用于根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息；第一转换模块，用于将所述音频文件中的录音打点标记转换为文本标记；第二生成模块，用于将所述文本标记插入到所述第一文本信息中的对应位置，以生成第二文本信息。
7. 如权利要求6所述的语音到文本转换的装置，其特征在于，所述第一转换模块包括：第一获取单元，用于获取所述音频文件中的录音打点标记；第一查找单元，用于根据预设的录音打点标记与文本标记映射表，查找所述获取的录音打点标记对应的文本标记。
8. 如权利要求7所述的语音到文本转换的装置，其特征在于，该装置还包括：第三生成模块，用于将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示，以生成第三文本信息。
9. 如权利要求8所述的语音到文本转换的装置，其特征在于，所述第三生成模块包括：读取单元，用于顺序读取所述第二文本信息；判断单元，用于在所述读取单元当前读取到文本标记时，判断所述当前读取的文本标记是否与上一次读取的文本标记相同；突出显示单元，用于在所述当前读取的文本标记与上一次读取的文本标记相同时，将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示，以生成第二文本彳目息。
10. 如权利要求9所述的语音到文本转换的装置，其特征在于，所述突出显示单元包括：第二查找单元，用于在所述当前读取的文本标记与上一次读取的文本标记相同时，根据预设的文本标记与突出显示方式映射表，查找该当前读取的文本标记对应的突出显示方式；突出显示子单元，用于将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容按照所述第二查找单元查找的突出显示方式进行突出显示，以生成第三文本信息。
【专利摘要】本发明公开了一种语音到文本转换的方法，该方法包括：获取音频文件；根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息；将所述音频文件中的录音打点标记转换为文本标记；将所述文本标记插入到所述第一文本信息中的对应位置，以生成第二文本信息。本发明还公开了一种语音到文本转换的装置。采用本发明的技术方案，对转换后的文本进行标记，方便人们对文本进行查看、编辑等操作。
【IPC分类】G10L15-30
【公开号】CN104751846
【申请号】CN201510126575
【发明人】王彦文
【申请人】努比亚技术有限公司
【公开日】2015年7月1日
【申请日】2015年3月20日

完整全部详细技术资料下载

当前第2页1 2