一种数据处理方法、装置、设备及介质与流程

文档序号:24725709发布日期:2021-04-16 15:58阅读:140来源:国知局
一种数据处理方法、装置、设备及介质与流程

1.本发明涉及人工智能技术领域,尤其涉及一种数据处理方法、装置、设备及介质。


背景技术:

2.现有技术中,一般是基于语音合成模型,实现将文本信息转化成语音信息的。为了获取到语音合成模型,一般需要大量的语音样本以及每个语音样本对应的标注数据,对原始语音合成模型进行训练。在相同模型结构下,基于海量优质的训练语音样本以及每个训练语音样本对应的标注数据,可以训练出高精度的语音合成模型。在对训练完成的语音合成模型的测试过程中,测试语音样本的数量、样本训练集与样本测试集的均衡度以及测试语音样本对应的标注数据的质量,对该训练完成的语音合成模型的测试结果影响非常大。基于此,语音样本(包括测试语音样本和训练语音样本)对应的标注数据的质量是影响语音合成模型的精度的重要因素之一,如何提高语音样本对应的标注数据的质量是近几年来人们日益关注的问题。
3.目前,语音样本的标注与质检工作主要是通过人工的方式完成的,虽然出现了一些标注工具,例如语音标注工具praat,以辅助人工进行标注,但是在质检语音样本对应的标注数据时,仍然需要依靠人工的方式进行,而人工质检是一项耗时、耗力、耗财的任务。在待质检的标注数据非常多的情况下,不仅质检人员的工作量会非常的大,最终所获取的质检结果也会不可避免的存在误差,影响标注数据的质检结果,使得人工质检的弊端尤为明显。因此,迫切的需要一种可以自动完成标注数据的质检的方法。


技术实现要素:

4.本发明实施例提供了一种数据处理方法、装置、设备及介质,用以解决无法通过电子设备对标注数据的质量进行质检的问题。
5.本发明实施例提供了一种数据处理方法,所述方法包括:
6.获取任一待质检的标注数据以及所述标注数据对应的音频数据,所述标注数据包括所述音频数据对应的文本数据及其第一文本特征;
7.基于所述标注数据和所述音频数据,通过语音合成模型的解码器,确定所述标注数据对应的质检数据,所述质检数据表征所述标注数据中的每个字符与所述音频数据中的每个音频帧的对应关系;
8.根据所述标注数据对应的质检数据,判断所述标注数据是否正确。
9.本发明实施例提供了一种数据处理装置,所述装置包括:
10.获取单元,用于获取任一待质检的标注数据以及所述标注数据对应的音频数据,所述标注数据包括所述音频数据对应的文本数据及其第一文本特征;
11.确定单元,用于基于所述标注数据和所述音频数据,通过语音合成模型的解码器,确定所述标注数据对应的质检数据,所述质检数据表征所述标注数据中的每个字符与所述音频数据中的每个音频帧的对应关系;
12.判断单元,用于根据所述标注数据对应的质检数据,判断所述标注数据是否正确。
13.本发明实施例提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述数据处理方法的步骤。
14.本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述数据处理方法的步骤。
15.在本发明实施例中,通过语音合成模型,基于待质检的标注数据以及该标注数据对应的音频数据,可以获取到该标注数据对应的质检数据,而该质检数据表征标注数据中的每个字符与该标注数据对应的音频数据中的每个音频帧的对应关系,根据该标注数据对应的质检数据,即可确定该标注数据是否正确,从而实现无需人工对待质检的标注数据进行质检,减少了质检人员的工作量,减小质检人员的工作能力对质检效率和准确性的影响,并且方便追溯与定位标注错误的标注数据。
附图说明
16.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例提供的一种数据处理过程示意图;
18.图2为本发明实施例提供的一种正确的标注数据的对齐图;
19.图3为本发明实施例提供的一种表示错误的标注数据的对齐图;
20.图4为本发明实施例提供的一种表示错误的标注数据的对齐图;
21.图5为本发明实施例提供的一种错误的标注数据的对齐图;
22.图6为本发明实施例提供的具体的数据处理流程示意图;
23.图7为本发明实施例提供的一种数据处理装置的结构示意图;
24.图8为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
25.下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
26.为了提高对待质检的标注数据进行质检的准确性和效率,本发明实施例提供了一种数据处理方法、装置、设备及介质。
27.实施例1:图1为本发明实施例提供的一种数据处理过程示意图,该过程包括:
28.s101:获取任一待质检的标注数据以及标注数据对应的音频数据,标注数据包括音频数据对应的文本数据及其第一文本特征。
29.本发明实施例提供的数据处理方法应用于电子设备,该电子设备可以为如机器人等智能设备,也可以是服务器。
30.在本发明实施例中,该音频数据对应的标注数据包括该音频数据对应的文本数据及文本数据的文本特征(为了方便描述,记为第一文本特征),该第一文本特征包括文本数据对应的声韵母序列,该声韵母序列中会包含文本数据中每个字符对应的声韵母及对应的
声调。比如,文本数据“今天”中的字符“今”对应的声韵母为“jin”以及对应的声调为一声,记为“1”,文本数据“今天”中的字符“天”对应的声韵母为“tian”以及对应的声调为一声,记为“1”,因此文本数据“今天”的第一文本特征,即文本数据“今天”的声韵母序列为“jin1tian1”。在本发明实施例中,可以通过人工标注的方式获取该音频数据对应的标注数据,也可以通过语音标注工具确定,具体实施过程中,根据实际需求进行灵活设置,在此不做具体限定。
31.具体的,获取任一音频数据以及该音频数据对应的标注数据,将当前获取的标注数据确定为待质检的标注数据。为了方便后续对该待质检的标注数据进行处理,可以对该待质检的标注数据进行处理,获取该标注数据对应的数字序列。具体的可以通过预先配置的字符与数字的对应关系,确定该标注数据中包含的每个字符所对应的目标数字,依次根据每个目标数字,确定该标注数据对应的数字序列,也可以直接通过模型,比如,bert模型,确定标注数据对应的数字序列。其中,可以预先获取该标注数据对应的数字序列,也可以是每当需要对某一标注数据进行质检时,获取该标注数据对应的数字序列。
32.需要说明的是,在通过预先配置的字符与数字的对应关系,确定标注数据对应的数字序列时,为了区分标注数据中所包含的每个字符,不同字符所对应的数字是不同的。
33.s102:基于标注数据和音频数据,通过语音合成模型的解码器,确定标注数据对应的质检数据,质检数据表征标注数据中的每个字符与音频数据中的每个音频帧的对应关系。
34.s103:根据标注数据对应的质检数据,判断标注数据是否正确。
35.当基于上述实施例获取到任一待质检的标注数据对应的数字序列、以及该标注数据对应的音频数据之后,基于该数字序列以及音频数据,进行相应的处理,从而确定该标注数据是否正确。
36.在实际应用过程中,语音合成模型不仅可以基于输入的标注数据对应的数字序列,生成该数字序列对应的合成音频数据的声学特征,还可以基于输入的标注数据对应的数字序列以及音频数据,确定该标注数据中的每个字符与该音频数据中的每个音频帧的对应关系并通过该语音合成模型中的解码器输出该对应关系,即针对该标注数据中所包含的每个字符,该字符与该音频数据所包含的哪几个音频帧是对应的。其中,标注数据中所包含的字符可以是文本数据中所包含的文字,也可以是第一文本特征中的声韵母。而根据该对应关系,可以一定程度上反映出当前标注数据与音频数据之间是否对齐。基于此,在本发明实施例中,为了方便确定每个音频数据对应的标注数据是否正确,可以将语音合成模型所确定的标注数据中的每个字符与该音频数据中的每个音频帧的对应关系,确定为该标注数据对应的质检数据。具体实施过程中,通过语音合成模型,基于获取到的某一标注数据对应的数字序列、以及该标注数据对应的音频数据,获取该标注数据对应的质检数据。
37.后续基于本发明实施例提供的方案,对获取的该标注数据对应的质检数据进行相应的处理,从而确定该标注数据是否正确。比如,若通过语音合成模型,确定出的标注数据中的每个字符与该音频数据中的每个音频帧的对应关系不准确,则确定该标注数据错误。
38.在本发明实施例中,通过语音合成模型,基于待质检的标注数据以及该标注数据对应的音频数据,可以获取到该标注数据对应的质检数据,而该质检数据表征标注数据中的每个字符与该标注数据对应的音频数据中的每个音频帧的对应关系,根据该标注数据对
应的质检数据,即可确定该标注数据是否正确,从而实现无需人工对待质检的标注数据进行质检,减少了质检人员的工作量,减小质检人员的工作能力对质检效率和准确性的影响,并且方便追溯与定位标注错误的标注数据。
39.实施例2:为了提高对待质检的标注数据进行质检的准确性和效率,在上述实施例的基础上,在本发明实施例中,根据标注数据对应的质检数据,判断标注数据是否正确,包括:
40.若确定标注数据对应的质检数据满足预先配置的质检要求,则确定标注数据正确;或者
41.若确定标注数据对应的质检数据不满足预先配置的质检要求,确定标注数据标注错误。
42.一般情况下,被标注正确的标注数据中所包含的每个字符分别对应该标注数据对应的音频数据中的至少一个音频帧,且该标注数据中所包含的最后一个字符一定对应该音频数据中的最后一个音频帧。基于此,为了方便确定标注数据是否正确,在本发明实施例中,预先配置了质检要求。当基于上述实施例获取到了该标注数据对应的质检数据之后,判断该质检数据是否满足预先配置的质检要求,从而确定该标注数据是否正确。
43.在一种可能的实施方式中,若确定当前获取的某一标注数据对应的质检数据满足预先配置的质检要求,说明该标注数据极有可能是正确的,则确定该标注数据正确。
44.在另一种可能的实施方式中,若确定当前获取的某一标注数据对应的质检数据不满足预先配置的质检要求,说明该标注数据极有可能是错误的,则确定该标注数据标注错误,需要工作人员对该标注数据进行后续的修改。
45.进一步地,为了提高对待质检的标注数据进行质检的准确性,根据如下至少一种方式确定标注数据对应的质检数据是否满足预先配置的质检要求,包括:
46.基于质检数据中包括的位置质检数据,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,以确定质检数据是否满足预先配置的第一质检要求,其中,位置质检数据用于标识标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系;其中,第二文本特征是通过语音合成模型中的编码器对标注数据进行编码后获得的;
47.基于质检数据中包括的音频数据对应的音频特征序列中包含的每个音频特征分别对应的概率向量,确定标注数据中文本数据包含的字符与音频数据对应的字符是否一致,以确定质检数据是否满足预先配置的第二质检要求,任一音频特征对应的概率向量中包含该音频特征分别对应标注数据对应的每个第二文本特征的概率值。
48.在本发明实施例中,语音合成模型为一种引入有注意力机制的编码

解码(encoder

decoder)结构的模型,比如tacotron模型,该语音合成模型可实现将标注数据到合成音频数据的声学特征的转化,在其运行过程中会确定标注数据中的每个字符和该标注数据对应的音频数据中的每个音频帧的对应关系。为了方便描述该对应关系,可以将该对应关系可视化为对齐图。图2为本发明实施例提供的一种正确的标注数据的对齐图。如图2所示,该对齐图的横坐标上的任一数值m表征在音频数据对应的音频特征序列中第m个音频特征,该音频特征序列可以为梅尔倒谱序列,比如,横坐标为10,表征在音频数据对应的梅尔倒谱序列中第10个音频特征,纵坐标上的任一数值n表征在标注数据对应的文本特征序
列中第n个文本特征(为了方便描述,记为第二文本特征),该第二文本特征是通过语音合成模型中的编码器对标注数据进行编码后获得的,在该对齐图中,正确的标注数据对应的每个第二文本特征与音频数据对应的每个音频特征的对应关系并不是一定要是一条斜线,还可以是从图2的左下角到图2的右上角的走向的曲线,它代表标注数据对应的每个第二文本特征与音频数据对应的每个音频特征之间的对应关系,而且对于在该曲线上的每个像素点,如果该像素点越亮,说明该第二文本特征与该音频特征越对应。因此,如果一个标注数据是正确的,该标注数据对应的对齐图中,表征该标注数据对应的每个第二文本特征与音频数据对应的每个音频特征之间的对应关系的曲线的走向应该是如图2所示的从对齐图的左下角到对齐图的右上角,而如果标注数据是错误的,则该标注数据对应的对齐图中,表征该标注数据对应的每个第二文本特征与音频数据对应的每个音频特征的对应关系的曲线的走向,会与如图2所示的曲线的走向有差异,因此,可根据标注数据对应的每个第二文本特征与该标注数据对应的音频数据对应的每个音频特征的对齐图,确定该标注数据是否标注错误。
49.在实际应用场景中,音频数据对应的标注数据中主要出现的问题有标注数据中文本数据包含的字符个数比音频数据对应的字符个数多,标注数据中文本数据包含的字符个数比音频数据对应的字符个数少、标注数据中文本数据包含的字符与音频数据对应的字符不一致等。其中,音频数据对应的字符是指该音频数据的内容所对应的文本数据包含的字符。基于此,为了提高对待质检的标注数据进行质检的准确性,在本发明实施例中,预先配置有第一质检要求和第二质检要求。其中,第一质检要求中要求标注数据中文本数据包含的字符个数比该标注数据对应的音频数据对应的字符个数相等。第二质检要求中要求标注数据中文本数据包含的字符与该标注数据对应的音频数据对应的字符一致。
50.在本发明实施例中,预先定义了标注数据错误的类型。例如,将标注数据中文本数据包含的字符个数比该标注数据对应的音频数据对应的字符个数多的问题,定义为第一错误类型;又如,将标注数据中文本数据包含的字符个数比该标注数据对应的音频数据对应的字符个数少的问题,定义为第二错误类型;再如,将标注数据中文本数据包含的字符与该标注数据对应的音频数据对应的字符不一致的问题,定义为第三错误类型。
51.具体实施中,在上述实施例的基础上,基于标注数据和音频数据,通过语音合成模型,获取到标注数据对应的质检数据之后,确定当前质检数据是否满足预先配置的质检要求,主要包括如下几种情况:
52.情况一、在本发明实施例中,通过语音合成模型,可以确定标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系,比如标注数据对应的文本特征序列中第37个第二文本特征、与音频数据对应的音频特征序列中的第127个音频特征存在对应关系等。因此,在本发明实施例中,预先配置的质检要求为第一质检要求,并且通过语音合成模型,基于标注数据和音频数据,获取到该标注数据对应的质检数据中包括位置质检数据。该位置质检数据用于标识标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系。基于该位置质检数据,可以确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,进而确定获取的质检数据是否满足预先配置的第一质检要求。
53.具体的,若基于位置质检数据,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,则确定当前获取的质检数据不满足预先配置的第一质检要求,即当前获取的质检数据不满足标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等的质检要求。
54.在一种可能的实施方式中,基于质检数据中包括的位置质检数据,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,以确定质检数据是否满足预先配置的第一质检要求,包括:
55.若位置质检数据中的第一文本位置与第二文本位置一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,并确定质检数据满足预先配置的第一质检要求;和/或
56.若位置质检数据中的第一音频位置与第二音频位置一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,并确定质检数据满足预先配置的第一质检要求;
57.其中,第一文本位置为文本特征序列中与音频特征序列中的音频特征存在对应关系的最后一个第二文本特征在文本特征序列中的位置,第二文本位置为文本特征序列中最后一个第二文本特征在文本特征序列中的位置。
58.在实际应用场景中,可能存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数多的问题,从而造成通过语音合成模型,确定标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系时,确定的与音频数据对应的音频特征序列中的音频特征存在对应关系的最后一个第二文本特征的位置(为了方便描述,记为第一文本位置),与该文本特征序列中最后一个第二文本特征的位置(为了方便说明,记为第二文本位置)不一致,即音频数据中的最后一个音频帧无法对应该标注数据中的最后一个字符。基于此,在本发明实施例中,通过位置质检数据中的第一文本位置,以及第二文本位置,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等。
59.具体的,当位置质检数据包括第一文本位置以及第二文本位置时,若确定该第一文本位置与第二文本位置不一致,说明可能存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数多的问题,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,确定该标注数据不满足预先配置的第一质检要求,进而确定该标注数据错误;若确定该第一文本位置与第二文本位置一致,说明不存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数多的问题,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,确定该标注数据满足预先配置的第一质检要求,进而确定该标注数据正确。
60.为了方便说明,将标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系进行可视化,图3为本发明实施例提供的一种表示错误的标注数据的对齐图。如图3所示,该对齐图的横坐标上的任一数值m表征在音频数据对应的音频特征序列中第m个音频特征,纵坐标上的任一数值n表征在标注数据对应的文本特征序列中第n个第二文本特征,在该对齐图中,001001(79,149)表示该标注数据对应的文本特征序列包含79个第二文本特征,音频数据对应的音频特
征序列包含有149个音频特征,即第二文本位置为79,图中曲线表示标注数据中的每个字符与音频数据中的每个音频帧的对应关系,图中竖直的虚线表示音频特征序列中最后一个音频特征的位置,图中水平的虚线表示文本特征序列中最后一个第二文本特征的位置,在该曲线与图中竖直的虚线所重叠的位置,表示第一文本位置,在第一文本位置处,与音频特征序列中第149个音频特征存在对应关系的第二文本特征为文本特征序列中的第37个,该第一文本位置为37,而图中水平的虚线与图中竖直的虚线的重叠位置不在图中的曲线上,说明该文本特征序列中最后一个第二文本特征并没有对应的音频特征。并且该图3中的曲线的走向并不是从图3的左下角到图3的右上角。因此,由于第一文本位置37与第二文本位置79不相等,说明标注数据中文本数据包含的字符个数比音频数据对应的字符个数多,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等。
61.同样的,还可能存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数少的问题,从而造成通过语音合成模型,确定标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系时,确定的第一文本位置与第二文本位置是一致的,但确定的与标注数据对应的文本特征序列中的第二文本特征存在对应关系的最后一个音频特征的位置(为了方便描述,记为第一音频位置),与该音频数据对应的音频特征序列中最后一个音频特征的位置(为了方便描述,记为第二音频位置)不一致,即标注数据中的最后一个字符无法对应该音频数据中的最后一个音频帧。基于此,在本发明实施例中,还可以通过位置质检数据中包括的第一音频位置以及第二音频位置,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等。
62.具体的,当位置质检数据包括第一音频位置以及第二音频位置时,若确定该第一音频位置与第二音频位置不一致,说明可能存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数少的问题,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,确定该标注数据不满足预先配置的第一质检要求,进而确定该标注数据错误;若确定该第一音频位置与第二音频位置一致,说明不存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数少的问题,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,确定该标注数据满足预先配置的第一质检要求,进而确定该标注数据正确。
63.为了方便说明,将标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系进行可视化,图4为本发明实施例提供的一种表示错误的标注数据的对齐图。如图4所示,该对齐图的横坐标上的任一数值m表征在音频数据对应的音频特征序列中第m个音频特征,纵坐标上的任一数值n表征在标注数据对应的文本特征序列中第n个第二文本特征,在该对齐图中,001014(31,181)表示该标注数据对应的文本特征序列包含31个第二文本特征,音频数据对应的音频特征序列包含有181个音频特征,即第二音频位置为181,图中曲线表示标注数据中的每个字符与音频数据中的每个音频帧的对应关系,图中竖直的虚线表示音频特征序列中最后一个音频特征的位置,图中水平的虚线表示文本特征序列中最后一个第二文本特征的位置,在该曲线与水平的虚线重叠的位置,表示第一音频位置,在第一音频位置处,与文本特征序列中第31个第二文本特征存在对应关系的音频特征为音频特征序列中的第125个,该第一音
频位置为125,图中水平的虚线与竖直的虚线的重叠位置不在图中的曲线上,说明文本特征序列中的最后一个第二文本特征与该音频特征序列中的最后一个音频特征不存在对应关系。并且该图4中的曲线的走向并不是从图4的左下角到图4的右上角。由于第一音频位置125与第二音频位置181不相等,说明标注数据中文本数据包含的字符个数比音频数据对应的字符个数少,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等。
64.当然,获取的位置质检数据中可以既包括第一文本位置以及第二文本位置,也包括第一音频位置以及第二音频位置,对于该位置质检数据中的第一文本位置以及第二文本位置,采用上述的确定方法,确定当前进行质检的标注数据是否存在标注数据中文本数据包含的字符个数比音频数据对应的字符个数多的问题,对于该位置质检数据中的第一音频位置以及第二音频位置,采用上述的确定方法,确定当前进行质检的标注数据是否标注数据中文本数据包含的字符个数比音频数据对应的字符个数少的问题。当确定该标注数据存在上述任一问题时,即确定第一文本位置与第二文本位置不一致,或第一音频位置与第二音频位置不一致时,便确定该标注数据对应的质检数据不满足预先配置的第一质检要求,确定标注数据错误;若确定第一文本位置与第二文本位置一致,且第一音频位置与第二音频位置一致,便确定该标注数据对应的质检数据满足预先配置的第一质检要求,确定标注数据正确。
65.作为一种可能的实现方式,基于质检数据中包括的位置质检数据,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,以确定质检数据是否满足预先配置的第一质检要求,包括:
66.若位置质检数据中的第一文本位置与第二文本位置一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,并确定质检数据满足第一质检要求;和/或
67.若位置质检数据中的第一音频位置与第二音频位置一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,并确定质检数据满足第一质检要求;
68.其中,第一文本位置为文本特征序列中与音频特征序列中的音频特征存在对应关系的最后一个第二文本特征在文本特征序列中的位置,第二文本位置为文本特征序列中最后一个第二文本特征在文本特征序列中的位置。
69.作为另一种可能的实现方式,基于质检数据中包括的位置质检数据,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,以确定质检数据是否满足预先配置的第一质检要求,还包括:
70.若位置质检数据的第一文本位置与第二文本位置不一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,并确定质检数据不满足第一质检要求;或者
71.若位置质检数据的第一音频位置与第二音频位置不一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,并确定质检数据不满足第一质检要求;
72.其中,第一音频位置为音频序列中与文本序列中的第二文本特征存在对应关系的
最后一个音频特征在音频特征序列中的位置;第二音频位置为音频特征序列中最后一个音频特征在音频特征序列中的第二音频位置。
73.情况二、在实际应用场景中,还可能出现标注数据中文本数据包含的字符与音频数据对应的字符不一致,即标注数据所标注的内容与音频数据中发出的内容不一致的情况,导致通过语音合成模型,在确定标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系时,标注数据对应的每个第二文本特征中,可能存在至少一个第二文本特征,在该音频数据对应的音频特征序列中没有对应的音频特征,即根据音频数据对应的音频特征序列中的某一音频特征对应的概率向量,无法在标注数据对应的文本特征序列中确定该音频特征对应的第二文本特征,标注数据中文本数据包含的字符与音频数据对应的字符不一致。该情况下,预先配置的质检要求为第二质检要求,且通过语音合成模型,获取到的质检数据中包括音频数据对应的音频特征序列中包含的每个音频特征分别对应的概率向量,基于每个音频特征分别对应的概率向量中包含的每个概率值的大小,可以确定标注数据中文本数据包含的字符与音频数据对应的字符是否一致,进而确定获取的质检数据是否满足预先配置的第二质检要求。
74.其中,任一音频特征对应的概率向量中包含该音频特征分别对应标注数据对应的每个第二文本特征的概率值,文本特征序列、音频特征序列的含义已在上述实施例中进行阐述,重复之处不做赘述。
75.在一种可能的实施方式中,基于质检数据中包括的音频数据对应的音频特征序列中包含的每个音频特征分别对应的概率向量,确定标注数据中文本数据包含的字符与音频数据对应的字符是否一致,以确定所述质检数据是否满足预先配置的第二质检要求,包括:
76.分别获取每个音频特征对应的概率向量中的最大概率值;
77.若判断任一音频特征对应的最大概率值小于预设的概率阈值,确定标注数据中文本数据包含的字符与音频数据对应的字符不一致,并确定质检数据不满足第二质检要求;或者
78.若判断每个音频特征对应的最大概率值均不小于预设的概率阈值,确定标注数据中文本数据包含的字符与音频数据对应的字符一致,并确定质检数据满足第二质检要求。
79.在本发明实施例中,为了准确地确定每个音频特征在标注数据对应的文本特征序列中是否有对应的第二文本特征,预设有概率阈值。具体实施过程中,通过语音合成模型,获取标注数据对应的质检数据中包括的音频数据对应的音频特征序列中包含的每个音频特征分别对应的概率向量,针对每个音频特征,获取该音频特征对应的概率向量中的最大概率值。然后针对每个音频特征对应的最大概率值,将该音频特征对应的最大概率值与预设的概率阈值进行比较。若确定任一音频特征对应的最大概率值小于预设的概率阈值,说明在标注数据对应的文本特征序列中没有该音频数据对应的某一音频特征所对应的第二文本特征,则确定标注数据中文本数据包含的字符与音频数据对应的字符不一致;若确定每个音频特征对应的最大概率值均不小于预设的概率阈值,说明音频数据对应的每个音频特征均对应有标注数据对应的文本特征序列中的第二文本特征,则确定标注数据中文本数据包含的字符与音频数据对应的字符一致。
80.比如,预设的概率阈值为0.8,获取的音频数据a对应的某一音频特征所对应的最
大概率值为0.7,将该音频特征对应的最大概率值0.7与预设的概率阈值0.8进行比较,确定该音频特征对应的最大概率值0.7小于预设的概率阈值0.8,说明在标注数据a对应的文本特征序列中没有该音频特征所对应的第二文本特征,则确定标注数据a中文本数据包含的字符与音频数据a对应的字符不一致。
81.仍以上述为例,获取的音频数据b对应的某一音频特征对应最大概率值为0.9,将该音频特征对应的最大概率值0.9与预设的概率阈值0.8进行比较,确定该音频特征对应的最大概率值0.9大于预设的概率阈值0.8,说明在标注数据b对应的文本特征序列中存在该音频特征所对应的第二文本特征,则获取下一音频特征对应的最大概率值。当基于上述的步骤,确定该音频数据b对应的每个音频特征对应的最大概率值均不小于预设的概率阈值,则确定标注数据b中文本数据包含的字符与该音频数据b对应的字符一致。
82.其中,任一音频特征均对应多个概率值,而音频数据对应有多个音频特征,可以在确定某一音频特征对应的最大概率值小于预设的概率阈值时,便确定标注数据中文本数据包含的字符与音频数据对应的字符不一致,并停止继续确定是否存在其他的音频特征对应的最大概率值也小于预设的概率阈值;也可以确定每个音频特征对应的最大概率值是否小于预设的概率阈值之后,根据确定的每个比较结果,确定是否存在任一音频特征对应的最大概率值小于预设的概率阈值。
83.为了方便说明,将标注数据中的每个字符与音频数据中的每个音频帧的对应关系进行可视化,图5为本发明实施例提供的一种错误的标注数据的对齐图。如图5所示,该对齐图的横坐标上的任一数值m表征在音频数据对应的音频特征序列中第m个音频特征,纵坐标上的任一数值n表征在标注数据对应的文本特征序列中第n个第二文本特征,在该对齐图中,图中曲线表示标注数据中的每个字符与音频数据中的每个音频帧的对应关系,但图中的矩形框所框选出的区域中是无法明确地找出表示标注数据中的每个字符与音频数据中的每个音频帧的对应关系的曲线,说明该部分的音频特征无法在标注数据对应的文本特征序列中找到存在对应关系的第二文本特征,因此确定标注数据中文本数据包含的字符与音频数据对应的字符不一致。
84.情况三、在实际应用场景中,标注数据可能同时存在标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等、以及确定标注数据中文本数据包含的字符与音频数据对应的字符不一致的问题,则为了提高对标注数据质检的要求,在本发明实施例中,预先配置的质检要求包括第一质检要求和第二质检要求。具体实施过程中,当通过语音合成模型,获取到标注数据对应的质检数据之后,基于质检数据中包括的位置质检数据,确定该标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,并基于质检数据中包括的该音频数据对应的音频特征序列中包含的每个音频特征分别对应的概率向量,确定该标注数据中文本数据包含的字符与音频数据对应的字符是否一致。当确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,和/或,确定标注数据中文本数据包含的字符与音频数据对应的字符不一致时,便确定该质检数据不满足预先配置的质检要求;当确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,且确定标注数据中文本数据包含的字符与音频数据对应的字符一致时,确定该质检数据满足预先配置的质检要求。
85.其中,为了保证质检标注数据的全面性,在确定质检数据不满足预先配置的第一
质检要求之后,可以仍继续确定质检数据是否满足预先配置的第二质检要求,或者是在确定质检数据不满足预先配置的第二质检要求之后,可以仍继续确定质检数据是否满足预先配置的第一质检要求,比如,某一质检数据不满足预先配置的第一质检要求,则仍继续确定该质检数据是否满足预先配置的第二质检要求,以便确定该标注数据中可能存在的所有问题。
86.实施例3:为了方便工作人员对标注错误的标注数据进行修改,在上述各实施例的基础上,在本发明实施例中,确定标注数据对应的质检数据不满足预先配置的质检要求之后,方法还包括:输出标注数据错误的提示信息。
87.在实际应用场景中,当确定某一标注数据对应的质检数据不满足预先配置的质检要求之后,则确定该标注数据被标注错误,需要根据该标注数据对应的音频数据对该标注数据进行修改,以使该标注数据正确,而将修改后的正确的标注数据再次输入至语音合成模型后,获取到的该正确的标注数据对应的质检数据可以满足预先配置的质检要求。
88.为了方便工作人员可以及时对错误的标注数据进行修改,在本发明实施例中,当确定质检数据不满足预先配置的质检要求之后,可以输出标注数据错误的提示信息,以提示工作人员该标注数据被标注错误,及时进行修改。
89.其中,输出的提示信息可以是音频格式的提示信息,比如语音播报提示信息“当前质检的标注数据错误”,也可以在显示界面上显示文本形式对应的提示信息,比如在显示界面上显示提示信息“当前质检的标注数据错误”、闪烁红灯、弹框提示等方式,还可以是通过短信或者邮件发送到相关工作人员的智能终端上。当然,也可以至少两种输出提示信息的方式同时结合,比如同时播报音频格式的提示信息以及在显示界面上显示文本格式的提示信息等。具体的,可以根据实际要求灵活设置,在此不做限定。
90.具体选择哪种方式输出提示信息,可以根据用户的喜好,预先进行设置,或者可以根据电子设备的能力进行选择,例如,一些电子设备并没有可以显示提示信息的显示界面,则对于这些电子设备,在输出提示信息时,可以播报音频格式的提示信息。
91.在一种可能的实施方式中,输出标注数据标注错误的提示信息,包括:
92.若质检数据不满足第一质检要求,则输出标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等的提示信息;和/或
93.若质检数据不满足第二质检要求,则输出标注数据中文本数据包含的字符与音频数据对应的字符不一致的提示信息。
94.在本发明实施例中,为了进一步方便工作人员对错误的标注数据进行修改,可以根据当前标注数据对应的质检数据所不满足的质检要求的类型,确定输出标注数据标注错误的提示信息的内容。具体的,根据当前标注数据对应的质检数据所不满足的质检要求的类型,确定输出标注数据不满足预先配置的质检要求的提示信息的内容,包括如下情况:
95.情况一、若某一标注数据对应的质检数据不满足预先配置的第一质检要求,说明该标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,则为了方便工作人员可以直接根据标注数据所存在的问题进行修改,输出标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等的提示信息。比如,输出“标注数据“明天的天气怎样”中包含的字符个数与对应的音频数据中对应的字符个数不相等,请您检查”的提示信息。
96.在一种可能的实施方式中,若某一标注数据对应的质检数据不满足预先配置的第一质检要求,且确定标注数据中文本数据包含的字符个数比音频数据对应的字符个数多时,则确定该标注数据的错误类型为第一错误类型,并输出该标注数据中存在第一错误类型的提示信息。
97.在另一种可能的实施方式中,若某一标注数据对应的质检数据不满足预先配置的第一质检要求,且确定标注数据中文本数据包含的字符个数比音频数据对应的字符个数少时,则确定该标注数据的错误类型为第二错误类型,并输出该标注数据中存在第二错误类型的提示信息。
98.情况二、若某一标注数据对应的质检数据不满足预先配置的第二质检要求,说明标注数据中文本数据包含的字符与音频数据对应的字符不一致的问题,则为了方便工作人员可以直接根据标注数据所存在的问题进行修改,输出标注数据中文本数据包含的字符与音频数据对应的字符不一致的提示信息。比如,输出“标注数据“明天的天气怎样”中包含的字符与对应的音频数据对应的字符不一致,请您检查”的提示信息。
99.在一种可能的实施方式中,若某一标注数据对应的质检数据不满足预先配置的第二质检要求,说明标注数据中文本数据包含的字符与音频数据对应的字符不一致的问题,则确定该标注数据的错误类型为第三错误类型,并输出该标注数据中存在第三错误类型的提示信息。
100.为了减小工作人员修改标注数据所需的工作量,在本发明实施例中,方法还包括:确定音频数据中的目标音频帧;
101.其中,提示信息中还包括目标音频帧在音频数据中的位置。
102.在本发明实施例中,当确定标注数据对应的质检数据不满足预先配置的第二质检要求后,可以确定在标注数据所包含的每个字符中不存在对应的字符的音频帧,将该音频帧确定为目标音频帧,输出携带有标注数据中文本数据包含的字符与音频数据对应的字符、以及目标音频帧在音频数据中的位置的提示信息。后续工作人员可以根据提示信息中的目标音频帧在音频数据中的位置,快速地在音频数据中找到目标音频段,从而根据目标音频段,对标注数据进行修改和调整。
103.其中,确定音频数据中的目标音频帧,包括:
104.分别获取每个音频特征对应的概率向量中的最大概率值;将最大概率值小于预设的概率阈值的音频特征对应的音频帧确定为目标音频帧。
105.在实际应用过程中,通过语音合成模型,可以确定音频数据对应的音频特征序列中的每个音频特征分别对应标注数据对应的每个第二文本特征的概率值。该概率值越大,说明该音频特征越有可能与该概率值对应的第二文本特征存在对应关系;该概率值越小,说明该音频特征越不可能与该概率值对应的第二文本特征存在对应关系。而一般情况下,对于正确的标注数据来说,针对该标注数据的音频数据对应的音频特征序列中包含的每个音频特征,该音频特征在该标注数据对应的每个第二文本特征中存在对应关系的第二文本特征,而该存在对应关系的第二文本特征一般是该音频特征对应的概率向量中最大概率值所对应的第二文本特征。基于此,在本发明实施例中,分别获取每个音频特征对应的概率向量中的最大概率值。针对每个音频特征,确定该音频特征对应的最大概率值是否小于预设的概率阈值,若确定该最大概率值小于预设的概率阈值,则将该音频特征确定为目标音频
特征,并确定该目标音频特征对应的音频帧为目标音频帧。
106.基于上述实施例中的方式,确定了音频数据中存在的每个目标音频帧之后,输出标注数据中文本数据包含的字符与音频数据对应的字符、以及每个目标音频帧分别在音频数据中的位置的提示信息。后续工作人员可以直接根据该提示信息中携带的每个目标音频帧在音频数据中的位置信息,确定对该标注数据进行修改的位置、以及修改方式,减小工作人员的工作量,提高工作人员对错误的标注数据进行修改的效率。
107.情况三、在实际应用场景中,也可能出现标注数据的质量非常的差,该标注数据对应的质检数据不满足预先配置的第一质检要求和第二质检要求的情况,而为了方便工作人员可以准确地对标注数据进行修改,在确定该标注数据对应的质检数据不满足预先配置的第一质检要求和第二质检要求之后,可以输出标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等的提示信息以及输出标注数据中文本数据包含的字符与音频数据对应的字符不一致的提示信息。
108.实施例4:下面通过具体的实施方式对本发明实施例提供的数据处理方法进行说明,如图6所示,该流程包括:
109.s601:获取训练完成的语音合成模型。
110.在本发明实施例中,用于训练语音合成模型的电子设备与上述实施例中进行数据处理的电子设备可以相同,也可以不同。具体的,可以根据实际需求进行设置,在此不做限定。
111.为了训练语音合成模型,比如,tracotron模型,需要预先收集用于训练该语音合成模型的样本音频数据,确定样本音频数据对应的标注数据,将样本音频数据对应的标注数据确定为样本数据,以对原始语音合成模型进行训练。
112.在实际应用场景下,一般被标注错误的标注数据的数量要小于正确的标注数据,因此,在本发明实施例中,如果在待质检的标注数据足够多的情况下,可以直接将待质检的标注数据作为样本数据,对原始语音合成模型进行训练,以获取训练完成的语音合成模型,从而减少获取用于训练语音合成模型的样本数据所耗费的时间,也可以将预先收集的大量的标注正确的标注数据作为样本数据,对原始语音合成模型进行训练,以获取训练完成的语音合成模型。
113.当然也可以将预先收集的标注正确的标注数据以及待质检的标注数据均作为样本数据,先根据预先收集的标注正确的标注数据,对原始语音合成模型进行训练,获取训练的基础语音合成模型后,再根据待质检标注数据对获取的基础语音合成模型继续训练,以获取训练完成的语音合成模型。具体训练语音合成模型的方式,可以根据实际需求进行灵活设置,在此不做具体限定。
114.具体的,基于样本数据,对语音合成模型进行训练:
115.获取任一样本数据以及样本数据对应的样本音频数据;
116.通过原始语音合成模型,获取样本数据对应的声学特征参数;
117.根据声学特征参数以及样本音频数据,对原始语音合成模型进行训练。
118.由于用于对语音合成模型训练的样本数据有很多,对每个样本数据都进行上述操作,当满足预设的收敛条件时,该语音合成模型训练完成。
119.其中,满足预设的收敛条件可以为基于每个样本数据对应的样本音频数据的声学
特征参数,所确定的损失值(loss)小于预先配置的损失值阈值,或确定的损失值一直处于下降趋势且趋于平缓,或对原始语音合成模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
120.将满足预设的收敛条件的任一语音合成模型确定为训练完成的语音合成模型,以用于后续进行待质检的标注数据的质检。比如,将损失值较小的一个语音合成模型用于后续对待质检的标注数据进行质检。
121.作为一种可能的实施方式,在进行语音合成模型训练时,可以把样本数据分训练样本和测试样本,先基于训练样本对原始语音合成模型进行训练,再基于测试样本对上述已训练的语音合成模型的可靠程度进行验证。
122.其中,在基于测试样本对已训练的语音合成模型进行测试时,也需要计算在该测试过程中,基于每个测试样本对应的测试音频数据的声学特征参数,所确定的测试集损失值(val_loss)。当确定当前获取到的测试集损失值小于预先配置的测试损失值阈值、或者一直处于下降趋势且趋于平缓,则确定该已训练的语音合成模型的可靠,后续可使用该已训练的语音合成模型进行语音合成、或对待质检的标注数据进行质检。
123.其中,在进行语音合成模型训练的过程中,一般采用离线的方式,预先通过进行模型训练的电子设备以及样本数据,对原始语音合成模型进行训练,以获得训练完成的语音合成模型。
124.基于上述实施例中训练完成的语音合成模型,将上述训练完成的语音合成模型保存到后续进行数据处理的电子设备中,通过进行数据处理的电子设备实现对待质检的数据进行质检。
125.s602:获取任一待质检的标注数据以及该标注数据对应的音频数据。
126.s603:获取该标注数据对应的数字序列。
127.s604:通过语音合成模型,基于该数字序列以及该音频数据,确定该标注数据对应的质检数据。
128.s605:判断质检数据是否满足预先配置的质检要求,若是,则执行s606,否则,执行s607。
129.其中,预先配置的质检要求包括第一质检要求,和/或第二质检要求。具体的确定质检数据是否满足预先配置的质检要求,已在上述实施例中进行说明,重复之处不做赘述。
130.s606:确定该标注数据正确。
131.s607:确定该标注数据错误,并输出该标注数据错误的提示信息。
132.具体的,输出提示信息的方法,也在上述实施例中进行说明,重复之处不做赘述。
133.实施例5:本发明实施例提供了一种数据处理装置,如图7所示,包括:
134.获取单元71,用于获取任一待质检的标注数据以及标注数据对应的音频数据,标注数据包括音频数据对应的文本数据及其第一文本特征;
135.确定单元72,用于基于标注数据和音频数据,通过语音合成模型的解码器,确定标注数据对应的质检数据,质检数据表征标注数据中的每个字符与音频数据中的每个音频帧的对应关系;
136.判断单元73,用于根据标注数据对应的质检数据,判断标注数据是否正确。
137.在一种可能的实施方式中,判断单元73具体用于:
138.若确定标注数据对应的质检数据满足预先配置的质检要求,则确定标注数据正确;或者,若确定标注数据对应的质检数据不满足预先配置的质检要求,确定标注数据标注错误。
139.在一种可能的实施方式中,判断单元73根据如下至少一种方式确定标注数据对应的质检数据是否满足预先配置的质检要求:
140.基于质检数据中包括的位置质检数据,确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数是否相等,以确定质检数据是否满足预先配置的第一质检要求,其中,位置质检数据用于标识标注数据对应的每个第二文本特征在文本特征序列中的位置、与音频数据对应的每个音频特征在音频特征序列中的位置的对应关系;其中,第二文本特征是通过语音合成模型中的编码器对标注数据进行编码后获得的;
141.基于质检数据中包括的音频数据对应的音频特征序列中包含的每个音频特征分别对应的概率向量,确定标注数据中文本数据包含的字符与音频数据对应的字符是否一致,以确定质检数据是否满足预先配置的第二质检要求,任一音频特征对应的概率向量中包含该音频特征分别对应标注数据对应的每个第二文本特征的概率值。
142.在一种可能的实施方式中,判断单元73具体用于:
143.若位置质检数据中的第一文本位置与第二文本位置一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,并确定质检数据满足第一质检要求;和/或,若位置质检数据中的第一音频位置与第二音频位置一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数相等,并确定质检数据满足第一质检要求;
144.其中,第一文本位置为文本特征序列中与音频特征序列中的音频特征存在对应关系的最后一个第二文本特征在文本特征序列中的位置,第二文本位置为文本特征序列中最后一个第二文本特征在文本特征序列中的位置。
145.在一种可能的实施方式中,判断单元73具体用于:
146.若位置质检数据的第一文本位置与第二文本位置不一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,并确定质检数据不满足第一质检要求;或者,若位置质检数据的第一音频位置与第二音频位置不一致,则确定标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等,并确定质检数据不满足第一质检要求;
147.其中,第一音频位置为音频序列中与文本序列中的第二文本特征存在对应关系的最后一个音频特征在音频特征序列中的位置;第二音频位置为音频特征序列中最后一个音频特征在音频特征序列中的第二音频位置。
148.在一种可能的实施方式中,判断单元73具体用于:
149.分别获取每个音频特征对应的概率向量中的最大概率值;
150.若判断任一音频特征对应的最大概率值小于预设的概率阈值,确定标注数据中文本数据包含的字符与音频数据对应的字符不一致,并确定所述质检数据不满足第二质检要求;或者,若判断每个音频特征对应的最大概率值均不小于预设的概率阈值,确定标注数据中文本数据包含的字符与音频数据对应的字符一致,并确定所述质检数据满足第二质检要求。
151.在一种可能的实施方式中,装置还包括:输出单元;
152.输出单元,用于在判断单元73确定标注数据对应的质检数据不满足预先配置的质检要求之后,输出标注数据错误的提示信息。
153.在一种可能的实施方式中,输出单元具体用于:
154.若质检数据不满足第一质检要求,则输出标注数据中文本数据包含的字符个数与音频数据对应的字符个数不相等的提示信息;和/或,若质检数据不满足第二质检要求,则输出标注数据中文本数据包含的字符与音频数据对应的字符不一致的提示信息。
155.在一种可能的实施方式中,确定单元72,还用于确定音频数据中的目标音频帧,以使输出单元输出的提示信息中还包括目标音频帧在音频特征序列中的位置。
156.在一种可能的实施方式中,确定单元72具体用于:
157.分别获取每个音频特征对应的概率向量中的最大概率值;将最大概率值小于预设的概率阈值的音频特征对应的音频帧确定为目标音频帧。
158.在本发明实施例中,通过语音合成模型,基于待质检的标注数据以及该标注数据对应的音频数据,可以获取到该标注数据对应的质检数据,而该质检数据表征标注数据中的每个字符与该标注数据对应的音频数据中的每个音频帧的对应关系,根据该标注数据对应的质检数据,即可确定该标注数据是否正确,从而实现无需人工对待质检的标注数据进行质检,减少了质检人员的工作量,减小质检人员的工作能力对质检效率和准确性的影响,并且方便追溯与定位标注错误的标注数据。
159.实施例6:图8为本发明实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本发明实施例还提供了一种电子设备,如图8所示,包括:处理器81、通信接口82、存储器83和通信总线84,其中,处理器81,通信接口82,存储器83通过通信总线84完成相互间的通信;
160.存储器83中存储有计算机程序,当程序被处理器81执行时,使得处理器81执行上述任一数据处理方法实施例中的步骤。
161.由于上述电子设备解决问题的原理与上述数据处理方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
162.上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
163.通信接口82用于上述电子设备与其他设备之间的通信。
164.存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non

volatile memory,nvm),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
165.上述处理器可以是通用处理器,包括中央处理器、网络处理器(network processor,np)等;还可以是数字指令处理器(digital signal processing,dsp)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
166.实施例7:在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储
介质,计算机可读存储介质内存储有可由处理器执行的计算机程序,当程序在处理器上运行时,使得处理器执行时实现上述任一数据处理方法实施例中的步骤。
167.由于上述计算机可读存储介质解决问题的原理与上述数据处理方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
168.本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
169.本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
170.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
171.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
172.显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1