一种基于知识推理的数据安全合规评估与识别方法及系统与流程

文档序号:36864302发布日期:2024-02-02 20:46阅读:19来源:国知局
一种基于知识推理的数据安全合规评估与识别方法及系统与流程

本发明涉及数据合规领域,更具体的,涉及一种基于知识推理的数据安全合规评估与识别方法及系统。


背景技术:

1、在当前数字化时代,电网公司及其附属企业广泛利用线上合作渠道进行营销活动。然而,随着合规要求的增加和监管机构对数据安全和隐私保护的关注,这类多业务的集团公司需要确保其在线上合作渠道中遵守所有适用的合规要点。合规要点的识别是一项关键任务,涉及对大量规章制度、政策、合同和行业标准的理解和解析。

2、目前,许多公司仍然依赖人工进行合规要点的识别和检查。这种方法存在主观性和耗时性的问题,容易导致遗漏或错误地识别合规要点,并且无法满足大规模和高效的合规需求。一些自动化方法使用关键词匹配的方式来识别合规要点。然而,这种方法存在着词义歧义和上下文理解不足的问题。它只能基于预定义的关键词进行匹配,无法处理合规要点的复杂性和多样性。

3、在电网公司内部,随着业务的开展,不同业务所采用的系统、平台、应用程序等采用不同的技术手段实施。复杂和多样性的业务实施过程导致这些技术手段的安全合规属性难以被简单的评估。

4、人为的方式来评估大规模的集成系统、复杂的应用程序会受到大量复杂因素的制约。现有方法的缺陷包括主观性、耗时性、词义歧义、上下文理解不足、缺乏灵活性和自适应性等。

5、另一方面,截止目前为止,也尚不具备一种有效的自动化手段来对各类电网业务的安全合规性进行准确有效的评估。举例来说,运行日志中包含的日志信息能够用来对各类系统或应用的安全合规性进行衡量与评估,但是只是有经验的技术人员能够准确解读日志中的内容。此外,如果对于各类法律法规中规定的安全合规性指标并不了解,即便能够解析日志的内容,仍然无法评判应用的合规程度。此外,由于法律法规文件内容多、容量大、难以解读与准确把握,自动化的判断手段也尚不存在。

6、针对上述问题,亟需一种数据安全合规评估与识别方法及系统。


技术实现思路

1、为解决现有技术中存在的不足,本发明提供一种基于知识推理的数据安全合规要点识别方法,通过收集法律法规文本,构建法规知识图谱,对上报的日志文本和知识图谱进行实体匹配和识别获得实体主体和实体事件,设置合规指标,对文本分类到对应指标汇总成合规得分,构建智能问答系统帮助推导法律法规中的合规要点。

2、本发明采用如下的技术方案。

3、本发明第一方面,涉及一种基于知识推理的数据安全合规评估与识别方法,方法包括以下步骤:收集法律法规文本,构建法规知识图谱;将上报的日志文本或者合规要点查询文本通过法规知识图谱进行实体识别,获得实体本体和实体事件;设置细分合规指标,将实体本体、实体事件与日志文本进行特征融合,将融合特征输入至法规知识图谱中,以将融合特征分类到细分合规指标中,从而针对每个指标计算日志文本的合规得分,并评判行为的合规等级;构建问答系统;以及,通过合规要点从问答系统中查询文本获取法规知识图谱中的合规要点。

4、优选的,构建法规知识图谱,还包括:将实体节点根据节点属性划分为法律条款节点、法律概念节点和法律实体节点三类;将节点关系根据边属性划分为包含关系、涉及关系和处罚关系三类;包含关系用于建立法律概念节点与法律实体节点之间的关联,涉及关系用于建立法律条款节点与法律概念节点之间的关联,处罚关系用于建立法律条款与处罚型法律实体之间的关联。

5、优选的,构建法规知识图谱,还包括:基于法律法规文本的篇幅,确认实体节点提取的方式;对篇幅小于预设门限的法律法规文本,人工标注法律法规文本中的实体节点,并定义实体节点的属性为法律条款、法律概念或法律实体,从而提取法律法规文本中的节点与关系,构建三元组,以实现法律知识图谱的初始构建;对篇幅大于预设门限的法律法规文本,采用自然语言处理方法,对法律法规文本进行解析,得到法律法规文本中的节点与关系,构建三元组,并对初始构建的法律法规知识图谱进行更新。

6、优选的,细分合规指标包括一级场景指标和二级具体指标;其中,一级场景指标根据待评估的日志文本的应用场景、法律法规的规范目标作为分类依据;二级具体指标包括数据的使用范围、数据使用的时效以及信息应用的目的与方式。

7、优选的,一级场景指标包括营销业务应用场景的隐私策略;营销业务应用场景的隐私策略下的二级场景指标包括数据的使用范围、数据使用的时效以及信息应用的目的与方式。

8、优选的,一级场景指标的合规性得分为:

9、

10、其中,ci为一级场景指标在第i项二级测评指标上的得分,取值为0或1;

11、n为二级测评指标个数。

12、优选的,获得文本分词,将文本分词与实体本体实体事件组成所述融合特征;将融合特征输入至预训练过的bert模型中,以实现对融合特征的分类,得到融合特征的分类结果。

13、优选的,基于融合特征的分类结果,将日志文本特征分类到不同的指标中,获取不同指标的得分并进行汇总,得到合规得分;根据合规得分对应到相应的合规等级当中,从而判断合规性的等级。

14、本发明第二方面,涉及一种利用本发明第一方面中方法的一种基于知识推理的数据安全合规评估与识别系统,系统包括图谱构建模块、识别模块、计算模块、系统构建和查询模块;其中,图谱构建模块,用于收集法律法规文本,构建法规知识图谱;识别模块,用于将上报的日志文本或者合规要点查询文本通过法规知识图谱进行实体识别,获得实体本体和实体事件;计算模块,用于设置细分合规指标,将实体本体、实体事件与日志文本进行特征融合,将融合特征输入至法规知识图谱中,以将融合特征分类到细分合规指标中,从而针对每个指标计算日志文本的合规得分,并评判行为的合规等级;系统构建模块,用于构建问答系统;查询模块,通过合规要点从问答系统中查询文本获取法规知识图谱中的合规要点。

15、本发明第三方面,涉及一种终端,包括处理器及存储介质;存储介质用于存储指令;处理器用于根据指令进行操作以执行本发明第一方面中方法的步骤。

16、本发明第四方面,涉及计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面中方法的步骤。

17、本发明的有益效果在于,与现有技术相比,本发明中的一种基于知识推理的数据安全合规要点识别方法,能够通过收集法律法规文本,构建法规知识图谱,对上报的日志文本和知识图谱进行实体匹配和识别获得实体主体和实体事件,设置合规指标,对文本分类到对应指标汇总成合规得分,构建智能问答系统帮助推导法律法规中的合规要点。本发明客观省时、结果准确、充分理解法律法规中的合规性要求、针对不同的数据业务具备较高的灵活性与自适应性。

18、本发明的有益效果还包括:

19、1、方法通过基于知识推理的方式,结合知识图谱、自然语言处理和机器学习等技术,可以解决业务数据合规要点识别与检测的问题,实现快速、准确地获得各类电力营销线上对外合作渠道业务中的合规得分,并且识别出关键合规要点。

20、2、方法预先定义多层级的评估指标,通过机器学习模型对输入文本进行准确的分类,从而针对不同指标实现合规评级,确保了评级过程的精准性。

21、3、方法在讲输入文本输入至bert模型进行训练前,充分扩展了输入文本的特征,并采用增强特征进行训练,充分确保了训练数据的丰富程度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1