基于本体的数据分类分级打标方法及装置与流程

文档序号:37167380发布日期:2024-03-01 12:09阅读:来源:国知局

技术特征:

1.一种基于本体的数据分类分级打标方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,利用统计算法与语义算法,对所述非结构化数据进行关键词抽取处理,得到待打标关键词包括:

3.根据权利要求1所述的方法,其特征在于,利用分类算法与预先建立的图结构数据本体,确定所述待打标关键词对应的文本信息类型包括:

4.根据权利要求3所述的方法,其特征在于,根据预先建立的图结构数据本体及所述标签分类概率,确定所述待打标关键词对应的文本信息类型包括:

5.根据权利要求1所述的方法,其特征在于,利用聚类算法与所述图结构数据本体,确定所述待打标数据项对应的数据项类型包括:

6.根据权利要求1所述的方法,其特征在于,所述图结构数据本体是通过如下步骤建立的:

7.根据权利要求1所述的方法,其特征在于,根据所述图结构数据本体中数据类别与安全等级的对应关系,分别利用所述待打标关键词对应的文本信息类型与所述待打标数据项对应的数据项类型,得到所述结构化数据对应的安全级别及所述非结构化数据对应的安全级别,以完成数据分类分级打标包括:

8.一种基于本体的数据分类分级打标装置,其特征在于,所述装置包括:

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有由计算机执行权利要求1至7任一项所述方法的计算机程序。


技术总结
本发明提供了一种基于本体的数据分类分级打标方法及装置,可用于信息安全、人工智能领域、金融领域或其他领域。方法包括:从包括多源异构数据的应用中获取待打标数据,将待打标数据划分为结构化数据与非结构化数据;利用统计算法与语义算法,对非结构化数据进行关键词抽取处理,利用分类算法与图结构数据本体,确定文本信息类型;对结构化数据进行正则匹配处理,利用聚类算法与图结构数据本体,确定数据项类型;根据图结构数据本体中数据类别与安全等级的对应关系,利用文本信息类型及数据项类型得到安全级别。本发明实现数据分类分级的自动打标,弥补了只支持单一类型数据应用自动打标能力不足的问题,提升数据分类分级打标效率,降低人力成本。

技术研发人员:孙杰,程佩哲,敬涛,张玲
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:
技术公布日:2024/2/29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1