基于大数据的缉私案件情报关联方法与流程

文档序号:21698683发布日期:2020-07-31 22:54阅读:1372来源:国知局
基于大数据的缉私案件情报关联方法与流程

本发明属于基于计算模型的数据处理技术领域,具体涉及一种基于大数据的缉私案件情报关联方法。



背景技术:

情报工作是缉私链条中的重要环节,缉私部门应对的走私犯罪案件都要依靠前期情报工作发现、经营。严峻的海关缉私现实要求情报部门必须借助科技手段,构建缉私线索处理服务系统,完善缉私案件智能挖掘与研判。

走私犯罪案件一般具有时间跨度大、地域范围广、中间环节多、犯罪手法多样等特点。目前,走私犯罪案件取证的各个环节之间需要以一定的逻辑关系和前后情节进行关联,必须形成真实完整的、相互印证的证据链才能定罪量刑,亟需科学的定量分析、规范高效的分析模型来对情报进行深层次关联。

基于以上分析,有必要基于缉私情报的案件特征,研究面向大数据的缉私情报获取,基于时空框架的缉私案件情报识别以及证据链条的拼接,实现缉私案件的情报关联。



技术实现要素:

本发明针对海关传统缉私情报工作存在的瓶颈问题,提出了面向大数据的缉私情报关联模型,并对该模型在真实案件复盘中的具体应用效果进行验证。

为实现上述目的,本发明采用的技术方案为基于大数据的缉私案件情报关联方法,包含以下步骤:

s1:基于缉私案件相关信息,构建缉私案件的情报要素关系表达;

s2:基于上述深度学习算法模型的要素关系抽取方法,完成多层次缉私情报关联分析;

s3:结合单据链、资金链和货物链证据链条,实现大数据环境下智能化的缉私情报关联分析验证。

上述步骤s1中所述深度学习算法模型的建模流程具体包括以下步骤:

s11:缉私案件的要素关系表达

基于缉私案件的案件特征,数据来源,构建缉私案件的要素关系表达模型。

s12:字符向量化

对数据资料进行情报关系标注,得到已标注数据集,基于已标注训练集及未标注的案件文本语料,利用产生词向量的相关模型工具对分好词的文本进行无监督训练学习;

上述步骤s2中所述深度学习算法模型的建模流程具体包括以下步骤:

s21:情报边界检测

抽取句子中的情报边界,并对情报进行序列标注,构建情报边界检测模型。

s22:情报关系类型推断

给定一个包含n个节点的图,图卷积神经网络的目标是学习图上的结构相关的节点表示,网络的输入为:一个输出节点向量,一个图结构的矩阵表示。图卷积神经网络的每层都可以用非线性函数进行传递,再通过激活函数(如,relu激活函数)获得节点输出矩阵。

s3:缉私情报关联分析验证

作为优选,上述激活函数为relu。

与现有技术相比,本发明具有以下的有益技术效果:

(1)本发明以大数据时代在海关缉私工作中的难点为出发点,针对海关传统缉私情报工作存在的瓶颈问题,提出了面向大数据的缉私情报关联模型,以及对该模型在真实案件复盘中的具体应用效果进行验证。

(2)本发明基于时空框架的缉私案件情报关联,实现情报要素、要素关系自动关联,有效节省人力物力的投入,应用大数据分析方法对缉私工作产生的积极影响,有效提高了缉私情报部门一线办案人员的工作效率。

附图说明

图1为对缉私情报要素和要素关系进行情报关联的流程图;

图2为情报要素表达模型示意图;

图3为要素边界检测模型示意图;

图4为基于gcn的要素关系抽取网络结构示意图。

具体实施方式

现结合附图对本发明作进一步详细的说明。

为形成有效的间接证据,必须基于缉私情报的案件特征,以缉私案件情报要素为主轴,对案件文本信息中的要素关系进行抽取,实现缉私案件的情报关联。为了更深层次的反映情报要素之间的关联关系,基于图卷积神经网络(graphconvolutionalnetwork,简称gcn)的案事件要素关系抽取方法,对缉私情报要素和要素关系进行情报关联。建模的流程如图1所示,具体包括:

s11:缉私案件的要素关系表达

目前,我国公安信息系统通常按照五要素“人、事、物、组织、地点”进行信息收集、处理和管理。公安业务通常需要回答以下几种类型的基本问题:“警情涉及谁?警情什么时候发生的?警情发生在哪里?涉警行为人做了什么?涉警行为人为什么这么做?与警情有关的物品是什么?案事件造成了什么样的后果?”因此,公安情报可以概括为以案事件为核心的五类基本要素,即时间、地点、人物、物品、事件。其中,时间和地点是人物、物品和事件三类要素存在和演化的基本条件,且具有属性、行为、状态和过程特征。需要说明的是,人物包括组织和虚拟人物。案事件要素关系可以分为概念关系和特征关系两种类型。其中,概念关系是指在同一分类体系中,不同要素所属概念之间的语义关系,包括等同关系、上位关系、下位关系、同位关系和相关关系等。特征关系是不同要素特征之间的关系,例如时间关系、空间关系、属性关系、状态关系、过程关系等。

总体上,根据要素的类型、特征及其逻辑关系,案事件的情报要素可以划分为三个层次:概念层、要素层和要素关系层。其中,要素层可以分为三个子层次,包括基本特征(时间、空间、属性、行为)、状态特征和过程特征;要素关系层可以分为两个子层次:概念关系和特征关系。按照案事件要素的层次划分,可以形成不同层级的案事件要素语义单元。情报要素表达模型包括情报要素子模型和情报要素关系子模型,如图2所示。

s12:字符向量化

为了获取高质量的词向量特征,首先由基层民警对数据资料进行情报的要素标注,标注的要素类别基于本实施例提出的情报要素表达模型,由此得到已标注数据集。基于已标注训练集及未标注的案件文本语料,利用word2vec工具对分好词的文本进行无监督训练学习。

s21:情报边界检测

要素边界检测模型如图3所示,实体边界e是一个具有要素类型的词序列,为了抽取句子中的要素边界,项目拟采用bilou标签方案对要素进行序列标注,标记为xi,使用bilstm模型来捕获来自句子中的前向和后向信息。然后,使用softmax函数预测单词对应的标签。根据输入句子和真实标签序列,最小化损失函数以收敛实体边界模型。

s22:情报关系类型推断

接下来开始要素关系类型推断,给定一个包含n个节点的图,gcn的目标是学习图上的结构相关的节点表示,网络的输入为:一个输出节点向量,一个图结构的矩阵表示。gcn的每层都可以用非线性函数进行传递,再通过激活函数(如,relu激活函数)获得节点输出矩阵。

本发明引入一个无向二分图,包含情报要素节点和情报关系节点,可以显式建模多个要素类型和要素关系类型的交互。本项目对于图中的边,将每个要素关系节点连接到其对应的两个要素节点,而不是直接连接任何要素(关系)节点。所以,对于每一个要素节点,观察其他要素节点的唯一方法是通过其参与的关系节点。同时,引入二元关系分类任务,给定句子s中的关系节点rij,为二元关系标签的后验,二分关系分类的训练目标是最小化

如果则把要素边界e和关系节点rij之间边的权重设置为1,否则为0。通过二元关系分类,预测要素对之间是否存在某种关系(忽略特定的关系类型),这样能够更深层次的反映情报要素之间的关联关系。

在构建情报要素-情报关系二分图之后,将此图输入到多层gcn中,以获得节点级别输出(即要素或关系节点表示),这些表示同时融合了图中其他节点的信息。然后,每个节点的最终表示由输入节点和节点级别输出构成。

通过如图4所示的网络结构,实现情报的要素和要素关系的情报关联。

s3:缉私情报关联分析验证

本发明将结合情报评估的五个维度(表1),对情报关联的可靠性、有效性、时效性、重复性以及紧急程度进行综合评估分析。

表1情报评估分析矩阵

需要说明的是,以上具体实施方式的描述并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1