一种录音文稿生成方法、装置、设备及介质与流程

文档序号：30304648发布日期：2022-06-05 04:02阅读：188来源：国知局

1.本发明涉及录音技术领域，尤其涉及一种录音文稿生成方法、装置、设备及介质。

背景技术：

2.构建语音合成模型需要文本语音的对齐语料，而文本语音的对齐语料一般是通过配音人员根据录音文稿进行录音获取，因此，录音文稿的内容质量直接决定了文本语音的对齐语料的内容质量。录音文稿是用于指导配音人员进行录音的文本文件，包含需要录音的文字内容，但是，本发明人在对现有技术的研究中发现，现有技术中构建录音文稿的方法，或是构建录音文稿的文稿数量较多，或是需要专业写手来撰写录音文稿，成本较高，均不满足通过少量语料进行音库定制的需求。

技术实现要素：

3.本发明提供一种录音文稿生成方法、装置、设备及介质，能够减少构建语音合成模型所需的录音语料，降低音库定制的门槛。
4.为实现上述目的，本发明实施例提供了一种录音文稿生成方法，包括以下步骤：
5.获取自定义的拼音组合序列；其中，所述拼音组合序列包括多个拼音和每一所述拼音出现的次数；
6.基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列；其中，所述汉字组合序列包括多个汉字和每一所述汉字出现的次数；
7.将所述汉字组合序列输入到训练完成的文本生成模型中，得到初始录音文稿；
8.对所述初始录音文稿进行纠错，得到目标录音文稿。
9.作为其中一种可选的实施例，所述基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列，包括：
10.基于预设映射表中的拼音排列顺序，将所述拼音组合序列中的各拼音按照预设的顺序排序，得到排序后的拼音序列；
11.基于所述预设映射表，将排序后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到汉字组合序列。
12.作为其中一种可选的实施例，通过以下方式训练所述文本生成模型：
13.获取问答对语料；其中，所述问答对语料包括原始句子和问题句子；
14.将所述问答对语料输入到预设的文本生成模型中，对所述文本生成模型进行训练，得到训练完成的文本生成模型。
15.作为其中一种可选的实施例，通过以下方式获取问答对语料：
16.获取文本语料，并将所述文本语料按照预设的分句方法分成多个原始句子；
17.基于预设映射表，将所述文本语料中的每一所述原始句子转换为对应的拼音序列；
18.统计每一所述拼音序列中各拼音的出现次数，并根据所述出现次数将每一所述拼音序列中的各拼音按照预设的排列顺序进行排列，得到排序后的拼音序列；
19.基于预设映射表，将所述排列后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到每一所述原始句子对应的问题句子。
20.将每一原始句子和其对应的问题句子构成一组问答对，得到多组问答对语料。
21.作为其中一种可选的实施例，所述拼音组合序列还包括每一所述拼音的音调；
22.则，所述基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列，包括：
23.基于预设映射表中的拼音排列顺序，将所述拼音组合序列中的各拼音按照预设的顺序排序，得到排序后的拼音序列；
24.基于所述预设映射表，根据每一所述拼音的音调，将排序后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到汉字组合序列。
25.作为其中一种可选的实施例，所述预设映射表包括通用规范汉字表。
26.作为其中一种可选的实施例，所述文本生成模型包括gpt、gpt2、gpt3、laser tagger、lstm。
27.本发明实施例提供了一种录音文稿生成装置，包括：
28.拼音组合序列获取模块，用于获取自定义的拼音组合序列；其中，所述拼音组合序列包括多个拼音和每一所述拼音出现的次数；
29.汉字组合序列获取模块，用于基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列；其中，所述汉字组合序列包括多个汉字和每一所述汉字出现的次数；
30.初始录音文稿获取模块，用于将所述汉字组合序列输入到训练完成的文本生成模型中，得到初始录音文稿；
31.目标录音文稿获取模块，用于对所述初始录音文稿进行纠错，得到目标录音文稿。
32.本发明实施例提供了一种终端设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现上述实施例所述的录音文稿生成方法。
33.本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述实施例所述的车辆定位方法。
34.与现有技术相比，本发明实施例提供的一种录音文稿生成方法、装置、设备及介质，能够根据实际需求定制输入的拼音序列，生成文字数量少且包含全部拼音类型的录音文稿，从而进一步减少构建语音合成模型所需的录音语料，降低音库定制的门槛。
附图说明
35.图1是本发明实施例提供的一种录音文稿生成方法的流程示意图；
36.图2是本发明实施例提供的一种录音文稿生成装置的结构示意图；
37.图3是本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
38.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
39.本发明实施例提供了一种录音文稿生成方法，参见图1，是本发明实施例提供的一种录音文稿生成方法的流程示意图，所述方法包括步骤s11至步骤s14：
40.s11、获取自定义的拼音组合序列；其中，所述拼音组合序列包括多个拼音和每一所述拼音出现的次数。
41.需要说明的是，自定义的拼音组合序列是以句子为单位。
42.s12、基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列；其中，所述汉字组合序列包括多个汉字和每一所述汉字出现的次数。
43.s13、将所述汉字组合序列输入到训练完成的文本生成模型中，得到初始录音文稿。
44.s14、对所述初始录音文稿进行纠错，得到目标录音文稿。
45.需要说明的是，文本纠错方法包括不限于：基于统计的方法、基于词典的方法、基于神经网络的方法。在实际应用过程中，对录音文稿进行纠错的方法可以根据实际需求或者试验进行设定，在此不作限定。其中，可以理解的是，如果模型生成文本的本身没有错误，则文本纠错后的文本和原文一致。
46.另外，需要说明的是，文本生成又称为自然语言生成，自然语言生成系统可被定义为接受非语言形式的信息作为输入，生成可读的文字表述。本发明是通过用户指定拼音文本，然后生成汉字文本。例如用户制定qi3这个拼音出现1次，lai2出现1次等的需求，通过采用本发明实施例，得到类似“三月五栋加油笑起来”的汉字文本，纠错后即符合用户的预设条件。
47.进一步的，在现有技术中，构建录音文稿的方法一般包括：(1)选取人类撰写的若干文字作品作为录音文稿；例如从中小学课文、新闻资讯、散文、小说等作品中选取部分文章作为录音文稿；(2)从人类撰写的句子中筛选部分句子组合作为录音文稿；例如，把新闻资讯、散文、小说等文档切分为多个句子，然后设定规则从切分的句子中筛选若干句子，用筛选的句子构造录音文稿；(3)专业人士按照预设要求撰写录音文稿；例如，指定题材、字数、体裁等条件，由专业写手按照这些预设条件要求撰写文章，撰写的文章适当处理作为录音文稿。但是，上述方法存在以下问题：(1)选取人类撰写的若干文字作品作为录音文稿；这种方法构建的录音文稿文采较高、逻辑严谨、可读性强，但是拼音很多重复，信息冗余度大，导致覆盖全部拼音所需的文稿数量规模大，构建语音合成模型所需这类语料数量规模大，不利于少量资源定制音库；(2)从人类撰写的句子中筛选部分句子组合作为录音文稿；这种方法构建的文稿每个句子都逻辑通顺，可读性较强，但是高频拼音重复率高，导致覆盖全部拼音所需的文稿数量较多，不利于定制音库；(3)专业人士按照预设要求撰写录音文稿；这
种方法构建的文稿文采较高、逻辑性强、可读性强，但是对专业写手要求高，成本高，而且如果指定字数要求和拼音覆盖要求，则需要专业写手对拼音理解深刻，对专业写手要求更高，难以成功实施。
48.而与现有技术相比，本发明实施例提供的一种录音文稿生成方法，能够根据实际需求定制输入的拼音序列，生成文字数量少且包含全部拼音类型的录音文稿，从而进一步减少构建语音合成模型所需的录音语料，降低音库定制的门槛。另外，本发明采用自动的方式构建录音文稿，不需要耗费人力资源，从而进一步降低了撰写成本。
49.需要说明的是，采用本发明实施例，能够在包含全部拼音类型且每个拼音出现次数高于预设阈值的情况下，使得整个录音文稿字数更少，而不是针对单句拼音对应的字数少。例如从新闻文稿中抽取句子组成录音文稿，可能需要10万字，而该方案只需要1万字即可。
50.作为其中一种可选的实施例，所述步骤s12包括：
51.s121、基于预设映射表中的拼音排列顺序，将所述拼音组合序列中的各拼音按照预设的顺序排序，得到排序后的拼音序列；
52.s122、基于所述预设映射表，将排序后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到汉字组合序列。
53.在实际应用过程中，自定义的拼音组合序列可以为已经按照预设的顺序排序后的拼音组合序列，然后直接基于预设映射表进行转换，得到汉字组合序列，也可以为未经过顺序排序的拼音组合序列，在输入后再进行重新排序和转换，具体可以实际需求或试验进行设定，在此不作限定。
54.需要说明的是，自定义输入的拼音组合序列一般的组成结构为：拼音+音调对应的数字+出现次数，但是，在实际应用过程中，也可以使用拼音+出现次数的构成，具体的设定与用户具体要达到的效果有关，在此不作限定。
55.示例性的，自定义拼音输入来生成录音文稿的若干例子如下：
56.(1)若干拼音出现多次：
57.假设自定义输入的拼音及其出现次数为：dong 1 wu 1 jia 1qi 2 yue 2 san1 you 1lai 2 xiao 1，将这些拼音组合序列进行排序，得到qi 2 lai 2 yue 2 jia 1 san1 you 1 dong 1 wu 1 xiao 1，然后从《通用规范汉字表》中找到每个拼音对应的汉字中次序最前的一个字作为该拼音的专属汉字，转换为汉字组合序列为：企2来2月2家1三1游1动1武1效1；
58.(2)每个拼音只出现一次：
59.拼音及其出现次数为：qi3 1 lai2 1 yue4 1 jia1 1 san1 1 you2 1 dong4 1 wu3 1 xiao4 1。转换文输入模型的文本为：企1来1月1家1三1游1动1武1效1，文本生成模型输出的文本为：三月五栋加油笑起来，文本纠错后的录音文稿的文本为：三月五栋加油笑起来。
60.(3)单个拼音多次：
61.拼音及其出现次数为：qi3 4，转换文输入模型的文本为：企4，文本生成模型输出的文本为：起起起起，文本纠错后的录音文稿的文本为：起起起起。
62.(4)每个拼音都出现多次：
63.自定义输入的拼音及其出现次数为：qi3 4 lai2 4 yue4 4。转换文输入模型的文本为：企4来4月4，文本生成模型输出的文本为：月月跃起来，起来起来跃起来，文本纠错后的录音文稿的文本为：月月跃起来，起来起来跃起来。
64.需要说明的是，在实际应用过程中，预设的映射表可以根据实际需求或者试验进行设定，此处的通用规范汉字表的参考标准仅为举例说明，而不作限定。
65.作为其中一种可选的实施例，通过以下方式训练所述文本生成模型：
66.获取问答对语料；其中，所述问答对语料包括原始句子和问题句子；
67.将所述问答对语料输入到预设的文本生成模型中，对所述文本生成模型进行训练，得到训练完成的文本生成模型。
68.作为其中一种可选的实施例，通过以下方式获取问答对语料：
69.获取文本语料，并将所述文本语料按照预设的分句方法分成多个原始句子；
70.基于预设映射表，将所述文本语料中的每一所述原始句子转换为对应的拼音序列；
71.统计每一所述拼音序列中各拼音的出现次数，并根据所述出现次数将每一所述拼音序列中的各拼音按照预设的排列顺序进行排列，得到排序后的拼音序列；
72.基于预设映射表，将所述排列后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到每一所述原始句子对应的问题句子。
73.将每一原始句子和其对应的问题句子构成一组问答对，得到多组问答对语料。
74.需要说明的是，分句方法包括不限于：基于标点符号分句、用nlp预训练模型分句。
75.示例性的，获取或构建问答对语料的主要步骤包括：
76.1、收集大量多题材的文本语料；其中，收集文本语料的渠道包括但不限于：新闻资讯、网络文学、课本教材、散文小说、古代文学；收集文本语料的方法包括但不限于：网络爬虫、开源下载、ocr识别、语音识别；
77.2、将文本语料转换为问答对语料；
78.(1)用分句方法把语料分为以句子为单位的文本，构成句子列表；
79.(2)每个拼音用一个专属汉字表示，构成拼音汉字映射表；
80.3、对句子列表中的每个句子进行汉字转拼音操作，生成拼音序列；其中，汉字转拼音的方法包括但不限于：基于拼音词典的汉字转拼音、基于统计学习的汉字转拼音、基于自然语言处理预训练模型的汉字转拼音；
81.4、生成问答对的问题句子；
82.(1)统计每个句子转出的拼音序列的每个拼音出现次数。
83.(2)拼音按拼音出现次数降序排序，如果拼音出现次数相同，则按《通用规范汉字表》的次序升序排序。
84.(3)依据排序后的拼音序列，根据拼音汉字映射表转为汉字，每个汉字后面增加该汉字对应拼音出现的次数，形成问答对语料的问题句子；
85.例如：句子列表的原始句子为：加油，三月动起来，五月笑起来。
86.生成的问题句子为：企2来2月2家1三1游1动1武1效1。
87.5、生成问答对语料。
88.(1)用句子列表中的句子作为答案句子。
89.(2)用上步骤生成的问题句子和答案句子构成一个问答对。
90.(3)对句子列表的所有句子进行操作，生成问答对语料。
91.作为其中一种可选的实施例，所述拼音组合序列还包括每一所述拼音的音调；
92.则，所述基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列，包括：
93.基于预设映射表中的拼音排列顺序，将所述拼音组合序列中的各拼音按照预设的顺序排序，得到排序后的拼音序列；
94.基于所述预设映射表，根据每一所述拼音的音调，将排序后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到汉字组合序列。
95.示例性的，假设自定义输入的拼音及其出现次数为：dong4 1 wu3 1 jia1 1 qi3 2 yue4 2 san1 1 you2 1lai2 2 xiao4 1，将这些拼音组合序列进行排序，得到qi3 2 lai2 2 yue4 2jia1 1 san1 1 you2 1 dong4 1 wu3 1 xiao4 1，然后从《通用规范汉字表》中找到每个拼音对应的汉字中次序最前的一个字作为该拼音的专属汉字，转换为汉字组合序列为：企2来2月2家1三1游1动1武1效1。
96.需要说明的是，自定义输入的拼音组合序列一般的组成结构为：拼音+音调对应的数字+出现次数，但是，在实际应用过程中，也可以使用拼音+出现次数的构成，具体的设定与用户具体要达到的效果有关，在此不作限定。
97.作为其中一种可选的实施例，所述预设映射表包括通用规范汉字表。
98.作为其中一种可选的实施例，所述文本生成模型包括gpt、gpt2、gpt3、laser tagger、lstm。
99.需要说明的是，文本生成模型可用开源的预训练的模型作为基础模型，模型参数也可进行自由定制，包括不限于：根据训练语料数据量设置参数、根据经验设置参数，在此不作限定。
100.本发明实施例提供了一种录音文稿生成装置，参见图2，是本发明实施例提供的一种录音文稿生成装置20的结构示意图，包括：
101.拼音组合序列获取模块21，用于获取自定义的拼音组合序列；其中，所述拼音组合序列包括多个拼音和每一所述拼音出现的次数；
102.汉字组合序列获取模块22，用于基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列；其中，所述汉字组合序列包括多个汉字和每一所述汉字出现的次数；
103.初始录音文稿获取模块23，用于将所述汉字组合序列输入到训练完成的文本生成模型中，得到初始录音文稿；
104.目标录音文稿获取模块24，用于对所述初始录音文稿进行纠错，得到目标录音文稿。
105.与现有技术相比，本发明实施例提供的一种录音文稿生成装置，能够根据实际需求定制输入的拼音序列，生成文字数量少且包含全部拼音类型的录音文稿，从而进一步减少构建语音合成模型所需的录音语料，降低音库定制的门槛。
106.作为其中一种可选的实施例，所述汉字组合序列获取模块22具体用于：
107.基于预设映射表中的拼音排列顺序，将所述拼音组合序列中的各拼音按照预设的顺序排序，得到排序后的拼音序列；
108.基于所述预设映射表，将排序后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到汉字组合序列。
109.作为其中一种可选的实施例，通过以下方式训练所述文本生成模型：
110.获取问答对语料；其中，所述问答对语料包括原始句子和问题句子；
111.将所述问答对语料输入到预设的文本生成模型中，对所述文本生成模型进行训练，得到训练完成的文本生成模型。
112.作为其中一种可选的实施例，通过以下方式获取问答对语料：
113.获取文本语料，并将所述文本语料按照预设的分句方法分成多个原始句子；
114.基于预设映射表，将所述文本语料中的每一所述原始句子转换为对应的拼音序列；
115.统计每一所述拼音序列中各拼音的出现次数，并根据所述出现次数将每一所述拼音序列中的各拼音按照预设的排列顺序进行排列，得到排序后的拼音序列；
116.基于预设映射表，将所述排列后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到每一所述原始句子对应的问题句子。
117.将每一原始句子和其对应的问题句子构成一组问答对，得到多组问答对语料。
118.作为其中一种可选的实施例，所述拼音组合序列还包括每一所述拼音的音调；
119.则，所述基于拼音序列与汉字序列之间的预设映射关系，将所述拼音组合序列中的每一所述拼音转换为对应的汉字，得到汉字组合序列，包括：
120.基于预设映射表中的拼音排列顺序，将所述拼音组合序列中的各拼音按照预设的顺序排序，得到排序后的拼音序列；
121.基于所述预设映射表，根据每一所述拼音的音调，将排序后的拼音序列转换为对应的汉字序列，并在所述汉字序列中的每一汉字后增加该汉字对应拼音的出现次数，得到汉字组合序列。
122.作为其中一种可选的实施例，所述预设映射表包括通用规范汉字表。
123.作为其中一种可选的实施例，所述文本生成模型包括gpt、gpt2、gpt3、lasertagger、lstm。
124.另外，需要说明的是，本发明实施例提供的一种录音文稿生成装置的各实施例的具体实现方案和有益效果，与本发明实施例提供的一种录音文稿生成方法的各实施例的具体实现方案和有益效果对应相同，在此不作赘述。
125.本发明实施例提供了一种终端设备，参见图3，是本发明实施例提供的一种终端设备的结构示意图。该实施例的终端设备3包括：处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序。所述处理器30执行所述计算机程序时实现上述任一实施例所述的录音文稿生成方法。或者，所述处理器30执行所述计算机程序时实现上述各装置实施例中各模块的功能。
126.示例性的，所述计算机程序可以被分割成一个或多个模块，所述一个或者多个模
块被存储在所述存储器31中，并由所述处理器30执行，以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述终端设备3中的执行过程。
127.所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备3可包括，但不仅限于，处理器30、存储器31。本领域技术人员可以理解，所述示意图仅仅是终端设备的示例，并不构成对终端设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端设备3还可以包括输入输出设备、网络接入设备、总线等。
128.所称处理器30可以是中央处理单元(central processing unit，cpu)，还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器30是所述终端设备3的控制中心，利用各种接口和线路连接整个终端设备3的各个部分。
129.所述存储器31可用于存储所述计算机程序和/或模块，所述处理器30通过运行或执行存储在所述存储器31内的计算机程序和/或模块，以及调用存储在存储器31内的数据，实现所述终端设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器31可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(smart media card,smc)，安全数字(secure digital,sd)卡，闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
130.其中，所述终端设备3集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于计算机可读存储介质中，该计算机程序在被处理器30执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
131.需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的
需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
132.本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述所述的录音文稿生成方法。
133.本领域技术人员可以理解，可以对实施例中的装置中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个装置中。可以把实施例中的模块或单元组合成一个模块或单元，以及此外可以把它们分成多个子模块或子单元。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
134.应该注意的是，上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。
135.此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在本发明的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
136.以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐波
技术所有人：广东利为网络科技有限公司
我是此专利的发明人

上一篇：一种3D成像方法、装置、电子设备及存储介质与流程
上一篇：一种金属冶炼炉的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。