语音数据的标记方法及装置的制造方法_5

文档序号：8446544阅读：来源：国知局

[0118]以2)为例，所述特定阈值包括但不限于语速变化50 %、语气变化50 %等。例如，在同一用户的语速加快50%，则对加快的部分设置标记信息；在同一用户的语气变化50%，对发生变化的部分设置标记信息，例如，在声纹信息一致时，但语速不同，则对语速不同的部分标记。
[0119]在本发明其他实施例中，也可以是通过着重音、特殊语气或转换语言种类来判断所提取的特征信息是否与预设的特征信息一致，具体的判断过程与上述实施例中声纹信息和方言信息的过程类似，在此不再一一赘述。同样也可以是通过关键字、用户的性别来判断是否满足标记条件，例如，在语音数据中出现预设的关键字(记录或提取等)时，对满足标记条件的语音数据进行标记。还可以是将各个特征信息结合起来判断，例如，将声纹和着重音结合起来判断，为了提高准确性，在两者均一致时，判断所提取的特征信息与预设的特征信息一致；也可以设置为其中一个满足就判断所提取的特征信息与预设的特征信息一致，例如，在声纹信息或着重音其中一个一致；还可以是在通过声纹判断为同一个用户发出的语音数据时，再通过语速或者语音强度来完成标记过程，例如，在同一个用户的语速及/或语音强度变化时，对发生变化的语音数据进行标记。还可以是当语言种类发生变化时，对变化的部分进行标记。
[0120]所述设置模块30，用于在所提取的特征信息满足标记条件时，对满足标记条件的语音数据设置标记信息。
[0121]具体的，参考图8，所述设置模块30包括确定单元31、获取单元32及设置单元33，
[0122]在所提取的特征信息满足标记条件时，确定满足标记条件的语音数据，S卩，从监测到的语音数据中确定出满足标记条件的部分，对所确定的语音数据设置标记信息；具体的，所述确定单元31，用于确定满足标记条件的语音数据；所述获取单元32，用于获取预设标记信息；所述设置单元33，用于将所述预设标记信息添加到所述满足标记条件的语音数据中。所述标识信息包括但不限于字符串、数字等，例如，将满足其中一个标记条件的语音数据设置标识信息1，将满足另一个标记条件的语音数据设置标识信息2，例如，对同一个用户的声音标记I，对其他用户的声音标记2，或者对A用户标记I，对B用户标记2，对C用户标记3等。通过自动在语音录制过程中对满足标记条件的语音数据进行标记，无需在屏幕点亮的情况下对语音数据进行标记，使得语音标记过程自动化，无需手动完成语音的标记操作。
[0123]在上述按照I)和2)的方式设置标记信息的过程中，所述根据不同特征信息或者变化值不同设置不同的标志信息，例如，声纹信息、语速信息与音调信息对应不同的标记信息，所述声纹信息对应数字标记信息，语速信息对应字符串标记信息，音调信息对应字母标记信息等，且不同特征信息对应不同的标记信息，例如，语速不同对应不同的标记信息，声纹不同对应不同的标记信息等。
[0124]为了更好的描述本发明语音数据的标记方法的过程，以三个不同场景来描述:
[0125]例如，场景一、A用户对被访者B进行访问，A为女性，B为男性。两人米取一问一答的方式进行对话，在每一次A讲话的时候，都进行标记，方便问题的定位，通过声纹信息或语速信息来判断是否为A用户讲话；
[0126]场景二、用户C发起了一个五人的讨论小组正在针对一个问题进行热点问题讨论，录音可根据不同的声纹进行区分、识别到不同的人声，并对同一个声音进行同一标记，方便不同人观点的归类整理；
[0127]场景三，用户D提前设定好“记录”为标记关键词，在记录的过程中对关键字进行实时识别，一旦识别到“记录” 二字，立刻标记。
[0128]除了以上的场景外，在其他语音数据的录制场景下均可以实现对不同的语音进行识别标记，方便后期的定位、整理等操作。
[0129]本实施例通过从监测到的语音数据提取特征信息，并判断所提取到的特征信息是否满足标记条件，在满足标记条件时，对满足标记条件的语音数据进行自动标记。减少了标记操作过程，提高了录音中语音的标记效率。
[0130]需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0131]上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
[0132]通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。
[0133]以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。
【主权项】
1.一种语音数据的标记方法，其特征在于，包括步骤: 在开启语音录制后，监测录制的语音数据；从所述监测的语音数据中提取特征信息；当所述提取到的特征信息满足标记条件时，对与所述提取到的特征信息对应的语音数据设置标记信息。
2.如权利要求1所述的语音数据的标记方法，其特征在于，所述特征信息包括声纹信息、语速信息、响度信息或音调信息中的至少一种。
3.如权利要求1所述的语音数据的标记方法，其特征在于，所述标记条件包括以下情形之一: 所述提取到的特征信息与预设的特征信息一致；或者，所述提取到的特征信息的变化值超过特定阈值。
4.如权利要求1至3任一项所述的语音数据的标记方法，其特征在于，所述当所述提取到的特征信息满足标记条件时，对与所述提取到的特征信息对应的语音数据设置标记信息的步骤包括: 确定所述满足标记条件的语音数据；获取预设标记信息；将所述预设标记信息添加到所述满足标记条件的语音数据中。
5.如权利要求4所述的语音数据的标记方法，其特征在于，所述预设标记信息与所述特征信息相对应。
6.一种语音数据的标记装置，其特征在于，包括: 监测模块，用于在开启语音录制后，监测录制的语音数据；提取模块，用于从所述监测的语音数据中提取特征信息；设置模块，用于当所述提取到的特征信息满足标记条件时，对与所述提取到的特征信息对应的语音数据设置标记信息。
7.如权利要求6所述的语音数据的标记装置，其特征在于，所述特征信息包括声纹信息、语速信息、响度信息或音调信息中的至少一种。
8.如权利要求6所述的语音数据的标记装置，其特征在于，所述标记条件包括以下情形之一: 所述提取到的特征信息与预设的特征信息一致；或者，所述提取到的特征信息的变化值超过特定阈值。
9.如权利要求6至8任一项所述的语音数据的标记装置，其特征在于，所述设置模块包括确定单元、获取单元和设置单元，所述确定单元，用于确定所述满足标记条件的语音数据；所述获取单元，用于获取预设标记信息；所述设置单元，用于将所述预设标记信息添加到所述满足标记条件的语音数据中。
10.如权利要求9所述的语音数据的标记装置，其特征在于，所述预设标记信息与所述特征信息相对应。
【专利摘要】本发明公开了一种语音数据的标记方法，包括步骤：在开启语音录制后，监测录制的语音数据；从所述检测的语音数据中提取特征信息；在所述提取到的特征信息满足标记条件时，对与所述提取到的特征信息对应的语音数据设置标记信息。本发明还公开了一种语音数据的标记装置。本发明减少了标记操作过程，提高了录音中语音数据的标记效率。
【IPC分类】G10L25-48, G10L15-02
【公开号】CN104766604
【申请号】CN201510154477
【发明人】王彦文
【申请人】努比亚技术有限公司
【公开日】2015年7月8日
【申请日】2015年4月2日

完整全部详细技术资料下载

当前第5页1 2 3 4 5