语音数据集的构建方法、电子设备及存储介质与流程

文档序号:36131566发布日期:2023-11-22 20:16阅读:29来源:国知局
语音数据集的构建方法与流程

本技术属计算机应用,尤其涉及一种语音数据集的构建方法、电子设备及计算机可读存储介质。


背景技术:

1、近年来,可穿戴设备产业发展迅猛,其作为人类增强功能的基本组成部分现已被广泛使用在日常生活中,成为人们融入智慧生活的重要入口和应用终端。获取感知信息的设备是当前重点研究的主题,其中骨导技术作为听觉增强的重要手段,已被广泛用于助听器、智能耳机、智能眼镜等设备。

2、骨导语音是通过骨导传感器采集的说话人语音的振动信号,该信号通过声带激励并由人体内部骨骼以及相关组织传递到皮肤表面,具有天然的抗噪性能。在理论研究方面,骨导语音特性与说话人特征密切相关,与气导语音特征关系尚未清晰;在实际应用中,语音活动检测、语音增强等算法都需要依托准确的骨导语音来提升性能。然而骨导语音无法在客观评价中借助设备模拟产生,只能通过真人发声实测,但是公开可用的骨导语音数据集极少,并且测试部位、测试设备的不同会导致骨导语音差异大。因此,如何针对性地获取大量的气导语音和骨导语音同步数据是当前需要解决的问题。


技术实现思路

1、本技术实施例提供了一种语音数据集的构建方法、电子设备及计算机可读存储介质,可以解决如何针对性地获取大量的气导语音和骨导语音同步数据的问题。

2、第一方面,本技术实施例提供了一种语音数据集的构建方法,包括:获取目标语料对应的语音数据,其中,语音数据是利用语音采集设备对采集对象在预设采集环境中阅读目标语料时的语音进行采集生成的,语音数据中包含目标语料对应的气导语音数据及骨导语音数据;对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标;在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集。

3、如此,通过对采集对象阅读语料时的气导语音数据及骨导语音数据进行实时采集,并通过对气导语音数据及骨导语音数据进行可用性评估,以保证加入语音数据集中的各个气导语音数据及骨导语音数据的质量,从而实现了气骨导语音数据集的构建,并保证了气骨导语音数据集的质量。

4、在第一方面一种可能的实现方式中,上述可用性指标包括气导语音数据与骨导语音数据之间的第一相干性指标;相应的,上述对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标,包括:

5、对气导语音数据及骨导语音数据进行相干性分析,以确定气导语音数据与骨导语音数据之间的第一相干信号,其中,第一相干信号用于表示气导语音数据与骨导语音数据之间的相干系数随信号频率的变化关系;

6、根据第一相干信号,确定气导语音数据与骨导语音数据之间的第一相干性指标。

7、如此,由于对于统一采集对象对同一语料进行阅读时产生的语音进行采集,所生成的气导语音数据与骨导语音数据通常具有较高的相似性,因此通过对同时采集的气导语音信号及骨导语音信号进行相干性分析,以通过两者之间的相干性指标分析两者的相似性,确定当前获取到的气导语音数据及骨导语音数据的可靠性和可用性,并将可靠性高的语音数据加入语音数据集,从而保证了语音数据集的质量。

8、可选的,在第一方面另一种可能的实现方式中,上述第一相干性指标包括相干系数峰值及第一相干系数均值中的至少一种。

9、如此,由于语音信号之间的相干系数可以表示语音信号之间的相关性,因此,可以通过气导语音数据与骨导语音数据之间的相干系数进行分析,以评价气导语音数据与骨导语音数据之间的相似性,进而进一步提升了气骨导语音可用性评价的可靠性,进一步提升了语音数据集的质量。

10、可选的,在第一方面再一种可能的实现方式中,上述第一相干性指标包括相干系数峰值;相应的,上述在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集之前,还包括:

11、在气导语音数据与骨导语音数据之间的相干系数峰值大于第一系数阈值的情况下,确定相干系数峰值符合预设指标条件;

12、在气导语音数据与骨导语音数据之间的相干系数峰值小于或等于第一系数阈值的情况下,确定相干系数峰值未符合预设指标条件。

13、如此,由于气导语音数据与骨导语音数据之间的相干系数峰值越大,说明气导语音数据与骨导语音数据之间的相关性越高,从而说明气导语音数据与骨导语音数据的可用性越高,因此,通过第一系数阈值筛选出相干系数峰值较大的气导语音数据及骨导语音数据加入语音数据集,从而保证了语音数据集的质量。

14、可选的,在第一方面又一种可能的实现方式中,上述第一相干性指标包括所述第一相干系数均值;相应的,上述根据第一相干信号,确定气导语音数据与骨导语音数据之间的第一相干性指标,包括:

15、根据第一相干信号,将气导语音数据与骨导语音数据在第一参考频带内的相干系数均值,确定为气导语音数据与骨导语音数据之间的第一相干系数均值;

16、相应的,上述在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集之前,还包括:

17、在第一相干系数均值大于第二系数阈值的情况下,确定第一相干系数均值符合预设指标条件;

18、在第一相干系数均值小于或等于第二系数阈值的情况下,确定第一相干系数均值未符合预设指标条件。

19、如此,由于气导语音数据与骨导语音数据之间的相干系数均值,能够更加准确的反映气导语音数据与骨导语音数据之间的整体相关性,从而通过将气导语音数据与骨导语音数据之间的相干系数均值作为其中一个可用性指标,衡量语音数据的可用性,从而进一步提升了语音数据集的质量。

20、可选的,在第一方面又一种可能的实现方式中,上述对语音数据中的所述气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标之前,还包括:

21、获取目标语料对应的参考气导语音数据,其中,参考气导语音数据是在利用语音采集设备采集目标语料对应的语音数据的同时,利用参考气导传感器采集目标语料对应的气导语音数据。

22、如此,通过在语音采集设备外部设置高精度的气导传感器采集气导语音数据,以通过高质量的气导语音数据对语音采集设备采集的气导语音数据的可用性进行验证,从而进一步保证了加入语音数据集的语音数据的可用性,进一步提升了语音数据集的质量。

23、可选的,在第一方面另一种可能的实现方式中,上述可用性指标还包括气导语音数据与参考气导语音数据之间的第二相干性指标;相应的,上述根据第一相干信号,确定气导语音数据与骨导语音数据之间的第一相干性指标之后,还包括:

24、对气导语音数据及参考气导语音数据进行相干性分析,以确定气导语音数据与参考气导语音数据之间的第二相干信号,其中,第二相干信号用于表示气导语音数据与参考气导语音数据之间的相干系数随信号频率的变化关系;

25、根据第二相干信号,确定气导语音数据与参考气导语音数据之间的第二相干性指标。

26、如此,由于参考气导语音数据是通过专业的高准确度气导传感器采集的,因此参考气导语音数据的质量较高,可以用于验证语音采集设备采集的气导语音数据与骨导语音数据的可用性。从而,通过对气导语音数据及参考气导语音数据进行相干性分析,以通过两者之间的第二相干性指标验证气导语音数据的可用性,并联合气导语音数据与骨导语音数据之间的第一相干性指标验证骨导语音数据的可用性,从而在气导语音数据与参考气导语音数据之间的相关性较高时,可以证明气导语音数据的质量较高,而同时气导语音数据与骨导语音数据之间的相关性也较高时,可以间接证明骨导语音数据的质量也较高,从而通过将参考气导语音数据作为参考指标,进一步提升了气导语音数据及骨导语音数据可用性验证的准确性,进而进一步提升了语音数据集的质量。

27、可选的,在第一方面再一种可能的实现方式中,上述第二相干性指标包括第二相干系数均值;相应的,上述根据第二相干信号,确定气导语音数据与参考气导语音数据之间的第二相干性指标,包括:

28、根据第二相干信号,将气导语音数据与参考气导语音数据在第二参考频带内的相干系数均值,确定为气导语音数据与参考气导语音数据之间的第二相干系数均值;

29、相应的,在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集之前,还包括:

30、在第二相干系数均值大于第三系数阈值的情况下,确定第二相干系数均值符合预设指标条件;

31、在第二相干系数均值小于或等于第三系数阈值的情况下,确定第二相干系数均值未符合预设指标条件。

32、如此,由于气导语音数据与参考气导语音数据之间的相干系数越高,说明两者之间的相关性越高,并且两者之间的相干系数均值可以衡量两者之间的整体相关性,因此在气导语音数据与骨导语音数据之间的第二相干系数均值较大时,确定其符合预设指标条件,从而将质量较高的气导语音数据及骨导语音数据加入语音数据集中,进一步提升了语音数据集的质量。

33、可选的,在第一方面又一种可能的实现方式中,上述可用性指标还包括骨导语音信号对应的频域特征指标;相应的,上述对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标,包括:

34、对骨导语音数据进行频域分析,以确定骨导语音数据对应的频谱;

35、根据骨导语音数据对应的频谱,确定骨导语音数据对应的频域特征指标。

36、如此,由于质量较高、没有噪声干扰的骨导语音数据具有较明显的频域特征,因此可以根据骨导语音对应的频域特征指标对骨导语音数据的可用性进行进一步验证,以进一步提升语音数据集的质量。

37、可选的,在第一方面又一种可能的实现方式中,上述频域特征指标包括频域峰值指标及频域能量指标中的至少一种。

38、可选的,在第一方面另一种可能的实现方式中,上述频域特征指标包括频域峰值指标;相应的,上述在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集之前,还包括:

39、根据骨导语音数据对应的频谱,确定频谱的峰值对应的参考频率点;

40、在参考频率点小于或等于第一频率阈值的情况下,确定频域峰值指标符合预设指标条件;

41、在参考频率点大于第一频率阈值的情况下,确定频域峰值指标未符合预设指标条件。

42、可选的,在第一方面再一种可能的实现方式中,上述频域特征指标包括频域能量指标;相应的,上述在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集之前,还包括:

43、根据骨导语音数据对应的频谱,确定骨导语音数据在第三参考频带内的参考信号能量及骨导语音数据的总信号能量;

44、在参考信号能量与总信号能量的比值大于或等于能量阈值的情况下,确定频域能量指标符合预设指标条件;

45、在参考信号能量与总信号能量的比值小于能量阈值的情况下,确定频域能量指标未符合预设指标条件。

46、如此,通过骨导语音数据在频域的峰值特征和能量特征,对骨导语音的可用性进行进一步验证,从而进一步提升了加入语音数据集的骨导语音数据及气导语音数据的质量,进一步提升了语音数据集的质量。

47、可选的,在第一方面又一种可能的实现方式中,上述对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标之后,还包括:

48、在语音数据对应的可用性指标未符合预设指标条件的情况下,将语音数据丢弃。

49、如此,在语音数据对应的可用性指标未符合预设指标条件时,说明语音数据的质量较差,从而将其丢弃不加入语音数据集,从而保证语音数据集的质量。

50、可选的,在第一方面又一种可能的实现方式中,上述对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标之后,还包括:

51、在语音数据对应的可用性指标未符合预设指标条件的情况下,暂停语音数据采集,并发出采集异常预警信息。

52、如此,在语音数据对应的可用性指标不符合预设指标条件时,说明当前的采集环境或者语音采集设备出现了异常或故障,则可以暂停语音数据的采集并发出采集异常预警信息,以使用户可以对异常情况进行及时排查和修复,保证后续采集的语音数据的质量。

53、可选的,在第一方面另一种可能的实现方式中,上述语音采集设备包含气导传感器、骨导传感器及数据采样模块;相应的,上述获取目标语料对应的语音数据,包括:

54、利用气导传感器采集目标语料对应的原始气导语音,并同时利用骨导传感器采集目标语料对应的原始骨导语音;

55、利用数据采样模块以预设采样率对原始气导语音进行采样,以生成气导语音数据;

56、利用数据采样模块以预设采样率对原始骨导语音进行采样,以生成骨导语音数据。

57、如此,通过气导传感器与骨导传感器分别采集原始气导语音及原始骨导语音,并通过数据采样模块进行采样,以将采集的语音信号转换为数字信号。

58、可选的,在第一方面再一种可能的实现方式中,上述对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标之前,还包括:

59、以第一临界频率对所述气导语音数据进行低通滤波处理;

60、以第二临界频率对骨导语音数据进行高通滤波处理。

61、如此,在获取到气导语音数据及骨导语音数据之后,分别对气导语音数据及骨导语音数据进行滤波处理,以去除气导语音数据及骨导语音数据中的噪声,从而进一步提升了语音数据集的质量。

62、可选的,在第一方面又一种可能的实现方式中,上述获取目标语料对应的语音数据之前,还包括:

63、获取预设采集环境对应的信噪比;

64、确定预设采集环境对应的信噪比大于或等于信噪比阈值。

65、如此,通过在正式的数据采集之前,保证采集环境的信噪比处于较高的水平(即保证采集环境中的噪声水平较低),从而降低了语音数据采集过程中的噪声干扰,进一步提升了采集的语音数据的质量,进而进一步保证了构建的语音数据集的质量。

66、可选的,在第一方面又一种可能的实现方式中,上述获取目标语料对应的语音数据之前,还包括:

67、利用语音采集设备对采集对象在预设采集环境中阅读至少一个语料时的语音进行采集,以生成各个语料对应的预采集语音数据,其中,预采集语音数据中包含语料对应的预采集气导语音数据及预采集骨导语音数据;

68、根据各个预采集语音数据,确定语音采集设备满足预设采集要求。

69、如此,通过在正式进行语音采集之前,先进行预采集,以通过预采集过程中采集的预采集语音数据对语音采集设备的工作状态进行评估,以在语音采集设备的工作状态不符合采集要求时及时对语音采集设备进行调整,并在语音采集设备满足采集要求才开始进行正式的语音采集,从而保证了语音数据采集的可靠性,进一步提升了构建的语音数据集的质量和可靠性。

70、可选的,在第一方面另一种可能的实现方式中,上述目标语料为预设语料库中的任一预设语料;相应的,上述预设语料库是通过以下方式生成的:

71、获取预设的语料生成规则,其中,语料生成规则包括语言类型、语料长度、发音规则、语法规则、语料数量中的至少一种;

72、根据预设的语料生成规则,生成多个预设语料,以构成预设语料库。

73、如此,通过预先构建用于语音采集的语料库,以保证最终构建的语音数据集的语音丰富度和规范性,进一步提升了构建的语音数据集的质量。

74、第二方面,本技术实施例提供了一种语音数据集的构建装置,包括:第一获取模块,用于获取目标语料对应的语音数据,其中,语音数据是利用语音采集设备对采集对象在预设采集环境中阅读目标语料时的语音进行采集生成的,语音数据中包含目标语料对应的气导语音数据及骨导语音数据;第一评估模块,用于对语音数据中的气导语音数据及骨导语音数据进行可用性评估,以确定语音数据对应的可用性指标;第一构建模块,用于在语音数据对应的可用性指标符合预设指标条件的情况下,将语音数据加入语音数据集。

75、在第二方面一种可能的实现方式中,上述可用性指标包括气导语音数据与骨导语音数据之间的第一相干性指标;相应的,上述第一评估模块,包括:

76、第一分析单元,用于对气导语音数据及骨导语音数据进行相干性分析,以确定气导语音数据与骨导语音数据之间的第一相干信号,其中,第一相干信号用于表示气导语音数据与骨导语音数据之间的相干系数随信号频率的变化关系;

77、第一确定单元,用于根据第一相干信号,确定气导语音数据与骨导语音数据之间的第一相干性指标。

78、如此,由于对于统一采集对象对同一语料进行阅读时产生的语音进行采集,所生成的气导语音数据与骨导语音数据通常具有较高的相似性,因此通过对同时采集的气导语音信号及骨导语音信号进行相干性分析,以通过两者之间的相干性指标分析两者的相似性,从而确定当前获取到的气导语音数据及骨导语音数据的可靠性和可用性,并将可靠性高的语音数据加入语音数据集,从而保证了语音数据集的质量。

79、可选的,在第二方面另一种可能的实现方式中,上述第一相干性指标包括相干系数峰值及第一相干系数均值中的至少一种。

80、如此,由于语音信号之间的相干系数可以表示语音信号之间的相关性,因此,可以通过气导语音数据与骨导语音数据之间的相干系数进行分析,以评价气导语音数据与骨导语音数据之间的相似性,进而进一步提升气骨导语音可用性评价的可靠性,进一步提升语音数据集的质量。

81、可选的,在第二方面再一种可能的实现方式中,上述第一相干性指标包括相干系数峰值;相应的,上述装置,还包括:

82、第一确定模块,用于在气导语音数据与骨导语音数据之间的相干系数峰值大于第一系数阈值的情况下,确定相干系数峰值符合预设指标条件;

83、第二确定模块,用于在气导语音数据与骨导语音数据之间的相干系数峰值小于或等于第一系数阈值的情况下,确定相干系数峰值未符合预设指标条件。

84、如此,由于气导语音数据与骨导语音数据之间的相干系数峰值越大,说明气导语音数据与骨导语音数据之间的相关性越高,从而说明气导语音数据与骨导语音数据的可用性越高,因此,通过第一系数阈值筛选出相干系数峰值较大的气导语音数据及骨导语音数据加入语音数据集,从而保证了语音数据集的质量。

85、可选的,在第二方面又一种可能的实现方式中,上述第一相干性指标包括所述第一相干系数均值;相应的,上述第一确定单元,具体用于:

86、根据第一相干信号,将气导语音数据与骨导语音数据在第一参考频带内的相干系数均值,确定为气导语音数据与骨导语音数据之间的第一相干系数均值;

87、相应的,上述装置,还包括:

88、第三确定模块,用于在第一相干系数均值大于第二系数阈值的情况下,确定第一相干系数均值符合预设指标条件;

89、第四确定模块,用于在第一相干系数均值小于或等于第二系数阈值的情况下,确定第一相干系数均值未符合预设指标条件。

90、如此,由于气导语音数据与骨导语音数据之间的相干系数均值,能够更加准确的反映气导语音数据与骨导语音数据之间的整体相关性,从而通过将气导语音数据与骨导语音数据之间的相干系数均值作为其中一个可用性指标,衡量语音数据的可用性,从而进一步提升了语音数据集的质量。

91、可选的,在第二方面又一种可能的实现方式中,上述装置,还包括:

92、第二获取模块,用于获取目标语料对应的参考气导语音数据,其中,参考气导语音数据是在利用语音采集设备采集目标语料对应的语音数据的同时,利用参考气导传感器采集目标语料对应的气导语音数据。

93、如此,通过在语音采集设备外部设置高质量的气导传感器采集气导语音数据,以通过高质量的气导语音数据对语音采集设备采集的气导语音数据的可用性进行验证,从而进一步保证了加入语音数据集的语音数据的可用性,进一步提升了语音数据集的质量。

94、可选的,在第二方面另一种可能的实现方式中,上述可用性指标还包括气导语音数据与参考气导语音数据之间的第二相干性指标;相应的,上述第一评估模块,还包括:

95、第二分析单元,用于对气导语音数据及参考气导语音数据进行相干性分析,以确定气导语音数据与参考气导语音数据之间的第二相干信号,其中,第二相干信号用于表示气导语音数据与参考气导语音数据之间的相干系数随信号频率的变化关系;

96、第二确定单元,用于根据第二相干信号,确定气导语音数据与参考气导语音数据之间的第二相干性指标。

97、如此,由于参考气导语音数据是通过专业的高准确度气导传感器采集的,因此参考气导语音数据的质量较高,可以用于验证语音采集设备采集的气导语音数据与骨导语音数据的可用性。从而,通过对气导语音数据及参考气导语音数据进行相干性分析,以通过两者之间的第二相干性指标验证气导语音数据的可用性,并联合气导语音数据与骨导语音数据之间的第一相干性指标验证骨导语音数据的可用性,从而在气导语音数据与参考气导语音数据之间的相关性较高时,可以证明气导语音数据的质量较高,而同时气导语音数据与骨导语音数据之间的相关性也较高时,可以间接证明骨导语音数据的质量也较高,从而通过将参考气导语音数据作为参考指标,进一步提升了气导语音数据及骨导语音数据可用性验证的准确性,进而进一步提升了语音数据集的质量。

98、可选的,在第二方面再一种可能的实现方式中,上述第二相干性指标包括第二相干系数均值;相应的,上述第二确定单元,具体用于:

99、根据第二相干信号,将气导语音数据与参考气导语音数据在第二参考频带内的相干系数均值,确定为气导语音数据与参考气导语音数据之间的第二相干系数均值;

100、相应的,上述装置,还包括:

101、第五确定模块,用于在第二相干系数均值大于第三系数阈值的情况下,确定第二相干系数均值符合预设指标条件;

102、第六确定模块,用于在第二相干系数均值小于或等于第三系数阈值的情况下,确定第二相干系数均值未符合预设指标条件。

103、如此,由于气导语音数据与参考气导语音数据之间的相干系数越高,说明两者之间的相关性越高,并且两者之间的相干系数均值可以衡量两者之间的整体相关性,因此在气导语音数据与骨导语音数据之间的第二相干系数均值较大时,确定其符合预设指标条件,从而将质量较高的气导语音数据及骨导语音数据加入语音数据集中,进一步提升了语音数据集的质量。

104、可选的,在第二方面又一种可能的实现方式中,上述可用性指标还包括骨导语音信号对应的频域特征指标;相应的,上述第一评估模块,包括:

105、第三确定单元,用于对骨导语音数据进行频域分析,以确定骨导语音数据对应的频谱;

106、第四确定单元,用于根据骨导语音数据对应的频谱,确定骨导语音数据对应的频域特征指标。

107、如此,由于质量较高、没有噪声干扰的骨导语音数据具有较明显的频域特征,因此可以根据骨导语音对应的频域特征指标对骨导语音数据的可用性进行进一步验证,以进一步提升语音数据集的质量。

108、可选的,在第二方面又一种可能的实现方式中,上述频域特征指标包括频域峰值指标及频域能量指标中的至少一种。

109、可选的,在第二方面另一种可能的实现方式中,上述频域特征指标包括频域峰值指标;相应的,上述装置,还包括:

110、第七确定模块,用于根据骨导语音数据对应的频谱,确定频谱的峰值对应的参考频率点;

111、第八确定模块,用于在参考频率点小于或等于第一频率阈值的情况下,确定频域峰值指标符合预设指标条件;

112、第九确定模块,用于在参考频率点大于第一频率阈值的情况下,确定频域峰值指标未符合预设指标条件。

113、可选的,在第二方面再一种可能的实现方式中,上述频域特征指标包括频域能量指标;相应的,上述装置,还包括:

114、第十确定模块,用于根据骨导语音数据对应的频谱,确定骨导语音数据在第三参考频带内的参考信号能量及骨导语音数据的总信号能量;

115、第十一确定模块,用于在参考信号能量与总信号能量的比值大于或等于能量阈值的情况下,确定频域能量指标符合预设指标条件;

116、第十二确定模块,用于在参考信号能量与总信号能量的比值小于能量阈值的情况下,确定频域能量指标未符合预设指标条件。

117、如此,通过骨导语音数据在频域的峰值特征和能量特征,对骨导语音的可用性进行进一步验证,从而进一步提升了加入语音数据集的骨导语音数据及气导语音数据的质量,进一步提升了语音数据集的质量。

118、可选的,在第二方面又一种可能的实现方式中,上述装置,还包括:

119、丢弃模块,用于在语音数据对应的可用性指标未符合预设指标条件的情况下,将语音数据丢弃。

120、如此,在语音数据对应的可用性指标未符合预设指标条件时,说明语音数据的质量较差,从而将其丢弃不加入语音数据集,从而保证语音数据集的质量。

121、可选的,在第二方面又一种可能的实现方式中,上述装置,还包括:

122、暂停模块,用于在语音数据对应的可用性指标未符合预设指标条件的情况下,暂停语音数据采集,并发出采集异常预警信息。

123、如此,在语音数据对应的可用性指标不符合预设指标条件时,说明当前的采集环境或者语音采集设备出现了异常或故障,则可以暂停语音数据的采集并发出采集异常预警信息,以使用户可以对异常情况进行及时排查和修复,保证后续采集的语音数据的质量。

124、可选的,在第二方面另一种可能的实现方式中,上述语音采集设备包含气导传感器、骨导传感器及数据采样模块;相应的,上述第一获取模块,包括:

125、第一采集单元,用于利用气导传感器采集目标语料对应的原始气导语音,并同时利用骨导传感器采集目标语料对应的原始骨导语音;

126、第一采样单元,用于利用数据采样模块以预设采样率对原始气导语音进行采样,以生成气导语音数据;

127、第二采样单元,用于利用数据采样模块以预设采样率对原始骨导语音进行采样,以生成骨导语音数据。

128、如此,通过气导传感器与骨导传感器分别采集原始气导语音及原始骨导语音,并通过数据采样模块进行采样,以将采集的语音信号转换为数字信号。

129、可选的,在第二方面再一种可能的实现方式中,上述装置,还包括:

130、第一滤波模块,用于以第一临界频率对所述气导语音数据进行低通滤波处理;

131、第二滤波模块,用于以第二临界频率对骨导语音数据进行高通滤波处理。

132、如此,在获取到气导语音数据及骨导语音数据之后,分别对气导语音数据及骨导语音数据进行滤波处理,以去除气导语音数据及骨导语音数据中的噪声,从而进一步提升了语音数据集的质量。

133、可选的,在第二方面又一种可能的实现方式中,上述装置,还包括:

134、第三获取模块,用于获取预设采集环境对应的信噪比;

135、第十三确定模块,用于确定预设采集环境对应的信噪比大于或等于信噪比阈值。

136、如此,通过在正式的数据采集之前,保证采集环境的信噪比处于较高的水平(即保证采集环境中的噪声水平较低),从而降低了语音数据采集过程中的噪声干扰,进一步提升了采集的语音数据的质量,进而进一步保证了构建的语音数据集的质量。

137、可选的,在第二方面又一种可能的实现方式中,上述装置,还包括:

138、第一采集模块,用于利用语音采集设备对采集对象在预设采集环境中阅读至少一个语料时的语音进行采集,以生成各个语料对应的预采集语音数据,其中,预采集语音数据中包含语料对应的预采集气导语音数据及预采集骨导语音数据;

139、第十四确定模块,用于根据各个预采集语音数据,确定语音采集设备满足预设采集要求。

140、如此,通过在正式进行语音采集之前,先进行预采集,以巩固预采集过程中采集的预采集语音数据对语音采集设备的工作状态进行评估,以在语音采集设备的工作状态不符合采集要求时及时对语音采集设备进行调整,并在语音采集设备满足采集要求才开始进行正式的语音采集,从而保证了语音数据采集的可靠性,进一步提升了构建的语音数据集的质量和可靠性。

141、可选的,在第二方面另一种可能的实现方式中,上述目标语料为预设语料库中的任一预设语料;相应的,上述预设语料库是通过以下方式生成的:

142、获取预设的语料生成规则,其中,语料生成规则包括语言类型、语料长度、发音规则、语法规则、语料数量中的至少一种;

143、根据预设的语料生成规则,生成多个预设语料,以构成预设语料库。

144、如此,通过预先构建用于语音采集的语料库,以保证最终构建的语音数据集的语音丰富度和规范性,进一步提升了构建的语音数据集的质量。

145、第三方面,本技术实施例提供了一种电子设备,包括:存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现如前所述的语音数据集的构建方法。

146、第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如前所述的语音数据集的构建方法。

147、第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行如前所述的语音数据集的构建方法。

148、上述第二方面、第三方面、第四方面和第五方面所获得的技术效果与上述第一方面中对应的技术手段获得的技术效果近似,在这里不再赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1