本申请涉及计算机,例如涉及一种用于校验标注数据的方法及装置、电子设备、存储介质。
背景技术:
1、随着科学技术的不断进步,人工智能的发展如火如荼。在人工智能的应用过程中,通常需要构建模型,利用模型来识别各种数据。为了使得模型识别更加精准,需要有高质量的标注数据用于模型训练。相关技术中,通常由人工对语料数据进行标注获得标注数据,再通过人工对标注数据进行效验以提高标注数据的质量。但是,由人工效验标注数据效率较低。
技术实现思路
1、为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
2、本公开实施例提供了一种用于校验标注数据的方法及装置、电子设备、存储介质,以提高效验标注数据的效率。
3、在一些实施例中,所述用于校验标注数据的方法,包括:获取标注有第一标签和第二标签的待验证数据;所述第一标签为用户对待验证数据标注的实体类型;所述第二标签为实体识别模型对待验证数据标注的实体类型;根据所述待验证数据的第一标签和第二标签确定漏标数据和错标数据;根据所述漏标数据和所述错标数据更正所述待验证数据的第一标签。
4、在一些实施例中,所述用于校验标注数据的装置,包括:获取模块,被配置为获取标注有第一标签和第二标签的待验证数据;所述第一标签为用户对待验证数据标注的实体类型;所述第二标签为实体识别模型对待验证数据标注的实体类型;确定模块,被配置为根据所述待验证数据的第一标签和第二标签确定漏标数据和错标数据;更正模块,被配置为根据所述漏标数据和所述错标数据更正所述待验证数据的第一标签。
5、在一些实施例中,所述电子设备,包括处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行上述的用于校验标注数据的方法。
6、在一些实施例中,所述存储介质,所述程序指令在运行时,执行上述的用于校验标注数据的方法。
7、本公开实施例提供的用于校验标注数据的方法及装置、电子设备、存储介质,可以实现以下技术效果:通过获取标注有第一标签和第二标签的待验证数据。第一标签为用户对待验证数据标注的实体类型,第二标签为实体识别模型对待验证数据标注的实体类型。根据待验证数据的第一标签和第二标签确定漏标数据和错标数据。根据漏标数据和错标数据更正待验证数据的第一标签。这样,由于自动确定出用户标注的待验证数据中的错标数据和漏标数据,并自动进行了更正。因此,提高了效验标注数据的效率。
8、以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
1.一种用于校验标注数据的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,标注有第二标签的待验证数据,通过以下方式获取:
3.根据权利要求1所述的方法,其特征在于,根据所述待验证数据的第一标签和第二标签确定漏标数据和错标数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述标签判别模型用于判断待验证数据标注的实体类型为真或假;根据所述标签判别模型和所述第二数据集确定错标数据,包括:
5.根据权利要求3所述的方法,其特征在于,所述标签判别模型用于判断待验证数据标注的实体类型为真或假;根据所述标签判别模型和所述第三数据集确定漏标数据,包括:
6.根据权利要求1所述的方法,其特征在于,根据所述漏标数据和所述错标数据更正所述待验证数据的第一标签,包括:
7.根据权利要求1至6任一项所述的方法,其特征在于,根据所述漏标数据和所述错标数据更正所述待验证数据的第一标签后,还包括:
8.一种用于校验标注数据的装置,其特征在于,包括:
9.一种电子设备,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1至7任一项所述的用于校验标注数据的方法。
10.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至7任一项所述的用于校验标注数据的方法。