基于区块链技术的产品检测报告管理方法与流程

文档序号:26007608发布日期:2021-07-23 21:26阅读:156来源:国知局
基于区块链技术的产品检测报告管理方法与流程

本发明涉及区块链领域下的数据管理,且更为具体地,涉及一种基于区块链技术的产品检测报告管理方法、基于区块链技术的产品检测报告管理系统和电子设备。



背景技术:

区块链是一个分布式的共享账本和数据库,具有去中心化、不可篡改、全程留痕、可以追溯、集体维护、公开透明等特点。这些特点保证了区块链的“诚实”与“透明”,为区块链创造信任奠定基础。近年来,随着区块链技术的成熟与发展,由于区块链具有独特的不可更改特征,各种基于区块链技术的数据管理技术及其应用应运而生。

以往消费者通常凭经验和有限的知识挑选商品,消费者在购买结构比较复杂且价格昂贵的商品,只凭个人经验、外观检查、手感等主观性手段则无法判断其内在质量。实行产品认证后,经过认证的商品都带有特定的产品检测报告,这就向消费者提供了一种质量信息:该商品经过公正的第三方——认证机构对其进行的鉴定和评价,其质量符合国家规定的标准。

由于单件产品可能需要满足多个工业标准,相应地,对于单件产品来说,可能存在多个产品检测报告。并且,除了产品本身的检测报告以外,还可能存在产品的关键件(原材料)的检测报告,这就对产品检测报告的管理提出了很大挑战,例如,用户可能希望通过产品的证书号就能够查询到所有相关的产品检测报告,包括整机和关键件的产品检测报告,而这些需求目前都没有解决方案来满足。

因此,期待一种优化地用于产品检测报告管理的技术方案。



技术实现要素:

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于区块链技术的产品检测报告管理方法、基于区块链技术的产品检测报告管理系统和电子设备,其针对区块链本身的分布式存储和管理特性和区块链所存储的数据的不可篡改和溯源特性,采用深度学习技术来对产品检测报告进行语义理解,并借助产品证书的图像信息的辅助,来对产品的检测报告进行语义识别和分类,以实现对于产品检测报告的准确标注和索引。这样,通过采用区块链来对产品检测报告进行存储和管理,可以利用区块链的去中心化分布式存储特性和不可修改特性,来确保产品检测报告管理和查询的便利性和安全性。

根据本申请的一个方面,提供了一种基于区块链技术的产品检测报告管理方法,其包括:

获取待识别的产品检测报告的文档和图像;

从所述待识别的产品检测报告的文档中提取出文本信息;

将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量;

将所述待识别的产品检测报告的图像输入卷积神经网络以获得特征图;

对所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量,所述图像特征向量的长度与所述特征图的通道维度的长度相等;

分别对所述图像特征向量和所述文本特征向量进行归一化处理,以将所述图像特征向量和所述文本特征向量中各个位置的特征值归一化到0到1的区间内,以获得归一化图像特征向量和归一化文本特征向量;

计算所述归一化图像特征向量和所述归一化文本特征向量的按位置差值,以获得差分特征向量;

以所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量进行加权,以获得分类特征向量;

将所述分类特征向量通过分类器以获得分类结果,其中,所述分类结果用于表示待识别的产品检测报告是否与参考产品证书相关;

根据所述分类结果对所述待识别的产品检测报告进行标注和索引;以及

将标注和索引后的所述待识别的产品检测报告上传到区块链结构的区块中。

在上述基于区块链技术的产品检测报告管理方法中,所述特征图的通道数与所述文本特征向量的长度相等。

在上述基于区块链技术的产品检测报告管理方法中,对所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量,包括:对所述特征图的每个通道的特征矩阵进行最大值池化处理以提取出所述特征图的每个通道的特征矩阵的全局信息,以获得所述图像特征向量。

在上述基于区块链技术的产品检测报告管理方法中,从所述待识别的产品检测报告的文档中提取出文本信息,包括:以光学字符识别技术从所述待识别的产品检测报告的文档中提取出所述文本信息。

在上述基于区块链技术的产品检测报告管理方法中,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量,包括:将所述文本信息通过词嵌入模型以获得文本词向量;以及,将所述文本词向量通过双向长短期记忆网络以获得所述文本特征向量。

在上述基于区块链技术的产品检测报告管理方法中,将所述分类特征向量通过分类器以获得分类结果,其中,所述分类结果用于表示待识别的产品检测报告是否与参考产品证书相关,包括:将所述分类特征向量输入softmax分类函数,以获得所述待识别的产品检测报告与参考产品证书相关的第一概率,以及,待识别的产品检测报告与参考产品证书不相关的第二概率;以及,基于所述第一概率和所述第二概率,生成所述分类结果。

根据本申请的另一方面,提供了一种基于区块链技术的产品检测报告管理系统,其包括:

信息获取单元,用于获取待识别的产品检测报告的文档和图像;

文本信息提取单元,用于从所述信息获取单元获得的所述待识别的产品检测报告的文档中提取出文本信息;

文本特征向量生成单元,用于将所述文本信息提取单元获得的所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量;

特征图生成单元,用于将所述信息获取单元获得的所述待识别的产品检测报告的图像输入卷积神经网络以获得特征图;

图像特征向量生成单元,用于对所述特征图生成单元获得的所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量,所述图像特征向量的长度与所述特征图的通道维度的长度相等;

归一化处理单元,用于分别对所述图像特征向量生成单元获得的所述图像特征向量和所述文本特征向量生成单元获得的所述文本特征向量进行归一化处理,以将所述图像特征向量和所述文本特征向量中各个位置的特征值归一化到0到1的区间内,以获得归一化图像特征向量和归一化文本特征向量;

差分特征向量生成单元,用于计算所述归一化处理单元获得的所述归一化图像特征向量和所述归一化文本特征向量的按位置差值,以获得差分特征向量;

分类特征向量生成单元,用于以所述归一化处理单元获得的所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量生成单元获得的所述差分特征向量进行加权,以获得分类特征向量;

分类结果生成单元,用于将所述分类特征向量生成单元获得的所述分类特征向量通过分类器以获得分类结果,其中,所述分类结果用于表示待识别的产品检测报告是否与参考产品证书相关;

标注单元,用于根据所述分类结果生成单元获得的所述分类结果对所述待识别的产品检测报告进行标注和索引;以及

上传单元,用于将所述标注单元获得的所述标注和索引后的所述待识别的产品检测报告上传到区块链结构的区块中。

在上述基于区块链技术的产品检测报告管理系统中,所述特征图的通道数与所述文本特征向量的长度相等。

在上述基于区块链技术的产品检测报告管理系统中,所述图像特征向量生成单元,进一步用于:对所述特征图的每个通道的特征矩阵进行最大值池化处理以提取出所述特征图的每个通道的特征矩阵的全局信息,以获得所述图像特征向量。

在上述基于区块链技术的产品检测报告管理系统中,所述文本信息提取单元,进一步用于:以光学字符识别技术从所述待识别的产品检测报告的文档中提取出所述文本信息。

在上述基于区块链技术的产品检测报告管理系统中,所述文本特征向量生成单元,包括:文本词向量生成子单元,用于将所述文本信息通过词嵌入模型以获得文本词向量;以及,特征向量生成子单元,用于将所述文本词向量生成子单元获得的所述文本词向量通过双向长短期记忆网络以获得所述文本特征向量。

在上述基于区块链技术的产品检测报告管理系统中,所述分类结果生成单元,包括:概率生成子单元,用于将所述分类特征向量输入softmax分类函数,以获得所述待识别的产品检测报告与参考产品证书相关的第一概率,以及,待识别的产品检测报告与参考产品证书不相关的第二概率;以及,确定子单元,用于基于所述概率生成子单元获得的所述第一概率和所述第二概率,生成所述分类结果。

根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于区块链技术的产品检测报告管理方法。

根据本申请的再又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于区块链技术的产品检测报告管理方法。

与现有技术相比,本申请提供的基于区块链技术的产品检测报告管理方法、基于区块链技术的产品检测报告管理系统和电子设备,其针对区块链本身的分布式存储和管理特性和区块链所存储的数据的不可篡改和溯源特性,采用深度学习技术来对产品检测报告进行语义理解,并借助产品证书的图像信息的辅助,来对产品的检测报告进行语义识别和分类,以实现对于产品检测报告的准确标注和索引。这样,通过采用区块链来对产品检测报告进行存储和管理,可以利用区块链的去中心化分布式存储特性和不可修改特性,来确保产品检测报告管理和查询的便利性和安全性。

附图说明

通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的基于区块链的产品检测报告数据库的架构示意图;

图2图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法的应用场景图;

图3图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法的流程图;

图4图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法的系统架构示意图;

图5图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法中,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量的流程图;

图6图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法中,将所述分类特征向量通过分类器以获得分类结果的流程图;

图7图示了根据本申请实施例的基于区块链技术的产品检测报告管理系统的框图;

图8图示了根据本申请实施例的基于区块链技术的产品检测报告管理系统中文本特征向量生成单元的框图;

图9图示了根据本申请实施例的基于区块链技术的产品检测报告管理系统中分类结果生成单元的框图;

图10图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。

区块链架构概述

图1图示了根据本申请实施例的基于区块链的产品检测报告数据库的架构示意图。如图1所示,根据本申请实施例的基于区块链的产品检测报告数据库采用典型的区块链架构,产品检测报告,例如整机和关键件的产品检测报告p1、p2、…、pn存储在以区块链构造的各个存储区块b1、b2、…、bn中。当然,本领域技术人员可以理解,不同类型的产品检测报告也可以分别存储在单独的区块中,例如,某个区块专用于存储整机的产品检测报告,而另一区块专用于存储关键件的产品检测报告。

按照典型的区块链存储架构,每个区块b1、b2、…、bn包括指针h1、h2、…、hn和数据部分d1、d2、…、dn。指针h1、h2、…、hn可以是各种类型的哈希指针,比如区块链存储架构中常用的sha-256哈希函数,该哈希指针指向上一个区块。

在本申请实施例中,下一区块的哈希指针的值基于上一区块的哈希指针的值与数据部分的哈希函数值,例如,h2=h1×h(d1),h(d1)表示数据部分d1的哈希函数值。首个区块的哈希指针的值可以是随机数值。这样,任何对某个区块内的数据部分的修改都将反应在下一区块的哈希指针的值上,并进一步改变后续所有区块的哈希指针的值,使得对于数据部分的修改实质上不可能的。

这里,本领域技术人员可以理解,根据本申请实施例的基于区块链的产品检测报告数据库可以采用任意的通用的区块链架构,本申请实施例并不意在限制区块链架构的具体实现。并且,在本申请实施例中,区块链优选地采用私有链或者联盟链,从而利于在产品检测报告提供商或者产品检测报告提供商联盟的公司或者企业内部进行产品检测报告存储管理,相应地,用于存储产品检测报告的各个存储区块可以预先配置,而不需要基于共识算法生成,这样,可以避免共识算法所导致的计算资源的消耗。

也就是说,根据本申请实施例的基于区块链的产品检测报告数据库的区块链架构聚焦于产品检测报告的存储管理,而不涉及类似电子货币的基于区块链的价值传递功能,因此,该区块链架构可以由公司或者企业内部的管理部门预先配置在云端,并由各个技术部门从终端接入,进行产品检测报告的上传,并在云端进行统一存储和管理。所以,由于各个技术部门很可能分布在不同的地理位置,应用区块链架构可以方便地实现产品检测报告的分布式存储。

另一方面,根据本申请实施例的区块链架构中的各个区块也可以与公有链的区块相关联,以使得每个区块具有与公有链的关联区块相对应的时间戳信息。这样,当需要记录需要时间属性的信息,比如产品检测报告的上传时间,从而确定产品检测报告是否为早期版本时,就可以利用区块链中各区块的时间顺序属性。

场景概述

如前所述,由于单件产品可能需要满足多个工业标准,相应地,对于单件产品来说,可能存在多个产品检测报告。并且,除了产品本身的检测报告以外,还可能存在产品的关键件(原材料)的检测报告,这就对产品检测报告的管理提出了很大挑战,例如,用户可能希望通过产品的证书号就能够查询到所有相关的产品检测报告,包括整机和关键件的产品检测报告。

基于此,本申请的申请人考虑到由于目前产品没进入一个新的市场渠道,都需要进行产品检测,而这些市场渠道在地理上呈现出分布式的特点,且另一方面,产品检测报告需要保证真实性,而这正符合区块链技术的分布式存储和管理特性和区块链所存储的数据的不可篡改和溯源特性,因此,本申请的申请人通过使用区块链技术来对如上所述的产品检测报告进行管理。

并且,如上所述,由于目前关于单个产品可能存在相关联的多个检测报告,也就是,多个检测报告均与某个产品相关联,且产品除本身的检测报告以外,还涉及到其关键件(原材料)的检测报告,而且由于使用区块链技术后,存储到区块中的数据不可更改,因此需要在存储数据之前对于数据进行准确的标注和索引,才能够使得用户在查询时,通过某产品的证书信息就可以查询到所有与其相关的检测报告以及关键件(原材料)的检测报告。

随着深度神经网络在语义理解方面取得的巨大进步,本申请的申请人考虑使用深度学习技术来对产品的检测报告进行语义理解,并借助产品证书的图像信息的辅助,来对产品的检测报告进行语义识别和分类,从而确定产品检测报告是否与参考产品证书相关联,这样,可以实现对于产品检测报告的准确标注和索引。

具体地,在本申请的技术方案中,首先获取待识别的产品检测报告并提取其文本信息,例如,可以简单地通过例如ocr的技术来获取其文本信息,并通过语义理解模型获得文本特征向量,例如,语义理解模型可以为双向lstm网络,也可以是bert模型等基于transformer(转换器)的模型。

这里,由于期望以图像识别所获得的高维图像信息来辅助进行文本语义识别,以及文本分类,因此期望将图像识别所获取的高维图像信息与如上获得的高维文本语义信息相互关联,并且另一方面,这可以使得关联后的文本特征向量包括用于比较的参考图像信息,以实现基于参考图像信息的分类。

本申请的申请人考虑到图像证书中主要待识别的也是图像中的对象信息,比如颁证机关标识、证书关键词等,也就是,这里证书关键词可以视为图像中的对象作为对象图像信息进行考虑,而不是作为语义信息。因此,在使用卷积神经网络提取高维特征时,本申请主要关心的是每个卷积核作为过滤器所提取出的高维特征的全局信息,也就是,每个通道所对应的特征图的全局信息。所以,本申请对于每个通道的特征矩阵进行最大值池化,以获得通道维度长度的图像特征向量。并且,为了避免在维度转换时引入额外误差,在本申请中在通过卷积神经网络从产品证书图像获得特征图时,所获得的特征图的通道数与文本特征向量的长度相等。

并且,进一步地,为了引入比较信息,首先将文本特征向量与图像特征向量均归一化到0到1之间的区间内,以使得其映射到相同的高维特征空间中,再计算归一化后的文本特征向量与图像特征向量的差分特征向量,并以归一化后的图像特征向量的每个位置的值对差分特征向量进行加权,以获得分类特征向量。

最后,通过将分类特征向量输入分类器就可以获得分类结果,该分类结果用于表示待识别的产品检测报告是否与参考产品证书相关。然后,根据所述分类结果对于待识别的产品检测报告进行标注和索引,并上传到区块链存储架构中。

图2图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法的应用场景图。如图2所示,在该应用场景中,首先,获取待识别的产品检测报告的文档和图像;然后,将获取的所述待识别的产品检测报告的文档和图像输入至部署有基于区块链技术的产品检测报告管理算法的服务器中(例如,如图2中所示意的云服务器s),其中,所述服务器能够基于区块链技术的产品检测报告管理算法对所述待识别的产品检测报告的文档和图像进行处理,以生成表示待识别的产品检测报告是否与参考产品证书相关的分类结果。然后,根据所述分类结果对所述待识别的产品检测报告进行标注和索引后上传到区块链结构(例如,如图2中所示意的t)的区块中。

在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图3图示了基于区块链技术的产品检测报告管理方法的流程图。如图3所示,根据本申请实施例的基于区块链技术的产品检测报告管理方法,包括:s110,获取待识别的产品检测报告的文档和图像;s120,从所述待识别的产品检测报告的文档中提取出文本信息;s130,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量;s140,将所述待识别的产品检测报告的图像输入卷积神经网络以获得特征图;s150,对所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量,所述图像特征向量的长度与所述特征图的通道维度的长度相等;s160,分别对所述图像特征向量和所述文本特征向量进行归一化处理,以将所述图像特征向量和所述文本特征向量中各个位置的特征值归一化到0到1的区间内,以获得归一化图像特征向量和归一化文本特征向量;s170,计算所述归一化图像特征向量和所述归一化文本特征向量的按位置差值,以获得差分特征向量;s180,以所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量进行加权,以获得分类特征向量;s190,将所述分类特征向量通过分类器以获得分类结果,其中,所述分类结果用于表示待识别的产品检测报告是否与参考产品证书相关;s200,根据所述分类结果对所述待识别的产品检测报告进行标注和索引;以及,s210,将标注和索引后的所述待识别的产品检测报告上传到区块链结构的区块中。

图4图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法的架构示意图。如图4所示,在所述基于区块链技术的产品检测报告管理方法的网络架构中,首先,获取待识别的产品检测报告的文档(例如,如图4中所示意的in1)和图像(例如,如图4中所示意的in2);接着,从所述待识别的产品检测报告的文档中提取出文本信息(例如,如图4中所示意的t1);接着,将所述文本信息通过基于深度神经网络的语义理解模型(例如,如图4中所示意的sum)以获得文本特征向量(例如,如图4中所示意的v1);接着,将所述待识别的产品检测报告的图像输入卷积神经网络(例如,如图4中所示意的cnn)以获得特征图(例如,如图4中所示意的f1);接着,对所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量(例如,如图4中所示意的v2);接着,分别对所述图像特征向量和所述文本特征向量进行归一化处理,以获得归一化图像特征向量(例如,如图4中所示意的vn2)和归一化文本特征向量(例如,如图4中所示意的vn1);接着,计算所述归一化图像特征向量和所述归一化文本特征向量的按位置差值,以获得差分特征向量(例如,如图4中所示意的vd);接着,以所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量进行加权,以获得分类特征向量(例如,如图4中所示意的vc);接着,将所述分类特征向量通过分类器(例如,如图4中所示意的圈s)以获得分类结果;然后,根据所述分类结果对所述待识别的产品检测报告进行标注和索引;最后,将标注和索引后的所述待识别的产品检测报告上传到区块链结构(例如,如图4中所示意的t)的区块中。

在步骤s110中,获取待识别的产品检测报告的文档和图像。如前所述,本申请考虑使用深度学习技术来对产品的检测报告进行语义理解,并借助产品证书的图像信息的辅助,来对产品的检测报告进行语义识别和分类。因此,在本申请中,首先需要获取待识别的产品检测报告的文档和图像。这里,在本申请实施例中,所述产品检测报告的文档可被设置为各种格式,例如,doc格式,pdf格式等,而所述产品检测报告的图像可被实施为通过扫描形成的电子图像,或者,通过拍摄产品检测报告而生成的图像,对此,并不为本申请所局限。

在步骤s120中,从所述待识别的产品检测报告的文档中提取出文本信息。具体地,在本申请实施例中,从所述待识别的产品检测报告的文档中提取出文本信息的过程,包括:以光学字符识别技术从所述待识别的产品检测报告的文档中提取出所述文本信息。本领域普通技术人员应知晓,所谓ocr(opticalcharacterreconginition光字符识别技术),是指电子设备检查纸上打印的字符,通过检测暗亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。应可以理解,通过光学字符识别技术对产品检测报告的文档内容进行提取,可以将文档内容以文本格式输出,以便于计算机的处理。

在步骤s130中,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量。具体地,在本申请实施例中,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量的过程,包括:首先,将所述文本信息通过词嵌入模型以获得文本词向量。也就是,首先将文本信息转化为结构化数据。应可以理解,文本是一类非常重要的非结构化数据,通过词嵌入模型可以将文本转化为结构化数据,即,以向量的形式表示文本数据。这里,以词嵌入模型来将文本信息转化为文本词向量,该词嵌入模型例如word2vec等。然后,将所述文本词向量通过双向长短期记忆网络以获得所述文本特征向量。本领域普通技术人员应知晓,长短期记忆网络(lstm)是解决循环神经网络rnn结构中存在的“梯度消失”问题而提出的,是一种特殊的循环神经网络。标准lstm网络按时间顺序处理序列,它们忽略了未来的上下文。双向lstm由两个普通的lstm所组成,一个正向的lstm,利用过去的信息,一个逆序的lstm,利用未来的信息,这样在时刻t,既能够使用t-1时刻的信息,又能够利用到t+1时刻的信息。一般来说,由于双向lstm能够同时利用过去时刻和未来时刻的信息,会比单向lstm最终的预测更加准确。应可以理解,通过双向长短期记忆网络对文本词向量进行处理,充分利用了文本词向量中的信息和其对应的上下文信息,以获得文本特征向量。

图5图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法中,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量的流程图。如图5所示,将所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量,包括:s310,将所述文本信息通过词嵌入模型以获得文本词向量;以及,s320,将所述文本词向量通过双向长短期记忆网络以获得所述文本特征向量。

值得一提的是,在本申请实施例中,还可以通过其他方式将所述文本词向量进行处理以获得所述文本特征向量,例如,在本申请的另一示例中,通过bert模型等基于transformer(转换器)的模型对文本词向量进行处理以获得所述文本特征向量。本领域普通技术人员应知晓,bert模型的目标是利用大规模无标注语料训练、获得文本的包含丰富语义信息的representation,即:文本的语义表示,然后将文本的语义表示在特定nlp任务中作微调,最终应用于该nlp任务。

在步骤s140中,将所述待识别的产品检测报告的图像输入卷积神经网络以获得特征图。也就是,以卷积神经网络提取出所述待识别的产品检测报告的图像中的高维特征,以获得特征图。具体地,在本申请实施例中,所述特征图的通道数与所述文本特征向量的长度相等。也就是,卷积神经网络的卷积核的个数与所述文本特征向量的长度相等。

特别地,在本申请实施例中,所述卷积神经网络可以是深度残差网络,本领域普通技术人员应知晓,由于梯度消失,深层网络很难训练,因为梯度反向传播到前面的层,重复相乘可能使梯度无穷小,结果就是,随着网络的层数更深,其性能趋于饱和,甚至迅速下降。而残差网络的特点是容易优化,并且能够通过增加相当的深度来提高准确率。其内部的残差块引入一个恒等快捷键(也称之为跳跃连接线),直接跳过一个或者多个层,在网络上堆叠这样的结构,就算梯度消失,至少把原来的输出恒等映射了过去,相当于在浅层网络上堆叠了“复制层”,缓解了在深度神经网络中增加深度带来的梯度消失问题。

在步骤s150中,对所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量,所述图像特征向量的长度与所述特征图的通道维度的长度相等。具体地,在本申请实施例中,对所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量的过程,包括:对所述特征图的每个通道的特征矩阵进行最大值池化处理以提取出所述特征图的每个通道的特征矩阵的全局信息,以获得所述图像特征向量。应可以理解,在使用卷积神经网络提取高维特征时,本申请主要关心的是每个卷积核作为过滤器所提取出的高维特征的全局信息,也就是,每个通道所对应的特征图的全局信息。所以,本申请对于每个通道的特征矩阵进行最大值池化,以获得通道维度长度的图像特征向量。

在步骤s160中,分别对所述图像特征向量和所述文本特征向量进行归一化处理,以将所述图像特征向量和所述文本特征向量中各个位置的特征值归一化到0到1的区间内,以获得归一化图像特征向量和归一化文本特征向量。也就是,将文本特征向量与图像特征向量均归一化到0到1之间的区间内,以使得其映射到相同的高维特征空间中。

在步骤s170中,计算所述归一化图像特征向量和所述归一化文本特征向量的按位置差值,以获得差分特征向量。应可以理解,将文本特征向量与图像特征向量均归一化到0到1之间的区间后,计算按位置差值,以使得获得的差分特征向量包含图像识别所获取的高维图像信息与的高维文本语义信息的关联信息。

在步骤s180中,以所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量进行加权,以获得分类特征向量。应可以理解,以所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量进行加权,可以使得获得的分类特征向量融合了用于比较的参考图像信息和图像识别所获取的高维图像信息与获得的高维文本语义信息之间的关联信息,以提高分类准确性。

在步骤s190中,将所述分类特征向量通过分类器以获得分类结果,其中,所述分类结果用于表示待识别的产品检测报告是否与参考产品证书相关。

具体地,在本申请实施例中,将所述分类特征向量通过分类器以获得分类结果的过程,包括:首先,将所述分类特征向量输入softmax分类函数,以获得所述待识别的产品检测报告与参考产品证书相关的第一概率,以及,待识别的产品检测报告与参考产品证书不相关的第二概率。本领域普通技术人员应知晓,softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类。然后,基于所述第一概率和所述第二概率,生成所述分类结果。也就是,比较第一概率与第二概率中的最大值作为分类结果。

图6图示了根据本申请实施例的基于区块链技术的产品检测报告管理方法中,将所述分类特征向量通过分类器以获得分类结果的流程图。如图6所示,在本申请实施例中,将所述分类特征向量通过分类器以获得分类结果,包括:s410,将所述分类特征向量输入softmax分类函数,以获得所述待识别的产品检测报告与参考产品证书相关的第一概率,以及,待识别的产品检测报告与参考产品证书不相关的第二概率;以及,s420,基于所述第一概率和所述第二概率,生成所述分类结果。

在步骤s200中,根据所述分类结果对所述待识别的产品检测报告进行标注和索引。应可以理解,通过根据所述分类结果对所述待识别的产品检测报告进行标注和索引,就可以使得用户在查询时,通过产品的证书号就能够查询到所有相关的产品检测报告,包括整机和关键件的产品检测报告。

在步骤s210中,将标注和索引后的所述待识别的产品检测报告上传到区块链结构的区块中。也就是,通过区块链来对产品检测报告进行管理,存储到区块中的产品检测报告不可更改且可溯源。

综上,本申请实施例的基于区块链技术的产品检测报告管理方法被阐明,其针对区块链本身的分布式存储和管理特性和区块链所存储的数据的不可篡改和溯源特性,采用深度学习技术来对产品检测报告进行语义理解,并借助产品证书的图像信息的辅助,来对产品的检测报告进行语义识别和分类,以实现对于产品检测报告的准确标注和索引。这样,通过采用区块链来对产品检测报告进行存储和管理,可以利用区块链的去中心化分布式存储特性和不可修改特性,来确保产品检测报告管理和查询的便利性和安全性。

示例性系统

图7图示了根据本申请实施例的基于区块链技术的产品检测报告管理系统的框图。如图7所示,根据本申请实施例的基于区块链技术的产品检测报告管理系统700,包括:信息获取单元710,用于获取待识别的产品检测报告的文档和图像;文本信息提取单元720,用于从所述信息获取单元710获得的所述待识别的产品检测报告的文档中提取出文本信息;文本特征向量生成单元730,用于将所述文本信息提取单元720获得的所述文本信息通过基于深度神经网络的语义理解模型以获得文本特征向量;特征图生成单元740,用于将所述信息获取单元710获得的所述待识别的产品检测报告的图像输入卷积神经网络以获得特征图;图像特征向量生成单元750,用于对所述特征图生成单元740获得的所述特征图进行通道维度上的最大值池化处理,以获得图像特征向量,所述图像特征向量的长度与所述特征图的通道维度的长度相等;归一化处理单元760,用于分别对所述图像特征向量生成单元750获得的所述图像特征向量和所述文本特征向量生成单元730获得的所述文本特征向量进行归一化处理,以将所述图像特征向量和所述文本特征向量中各个位置的特征值归一化到0到1的区间内,以获得归一化图像特征向量和归一化文本特征向量;差分特征向量生成单元770,用于计算所述归一化处理单元760获得的所述归一化图像特征向量和所述归一化文本特征向量的按位置差值,以获得差分特征向量;分类特征向量生成单元780,用于以所述归一化处理单元760获得的所述归一化图像特征向量的各个位置的特征值作为权重对所述差分特征向量生成单元770获得的所述差分特征向量进行加权,以获得分类特征向量;分类结果生成单元790,用于将所述分类特征向量生成单元780获得的所述分类特征向量通过分类器以获得分类结果,其中,所述分类结果用于表示待识别的产品检测报告是否与参考产品证书相关;标注单元800,用于根据所述分类结果生成单元790获得的所述分类结果对所述待识别的产品检测报告进行标注和索引;以及,上传单元810,用于将所述标注单元800获得的所述标注和索引后的所述待识别的产品检测报告上传到区块链结构的区块中。

在一个示例中,在上述产品检测报告管理系统700中,所述特征图的通道数与所述文本特征向量的长度相等。

在一个示例中,在上述产品检测报告管理系统700中,所述图像特征向量生成单元750,进一步用于:对所述特征图的每个通道的特征矩阵进行最大值池化处理以提取出所述特征图的每个通道的特征矩阵的全局信息,以获得所述图像特征向量。

在一个示例中,在上述产品检测报告管理系统700中,所述文本信息提取单元720,进一步用于:以光学字符识别技术从所述待识别的产品检测报告的文档中提取出所述文本信息。

在一个示例中,在上述产品检测报告管理系统700中,如图8所示,所述文本特征向量生成单元730,包括:文本词向量生成子单元731,用于将所述文本信息通过词嵌入模型以获得文本词向量;以及,特征向量生成子单元732,用于将所述文本词向量生成子单元731获得的所述文本词向量通过双向长短期记忆网络以获得所述文本特征向量。

在一个示例中,在上述产品检测报告管理系统700中,如图9所示,所述分类结果生成单元790,包括:概率生成子单元791,用于将所述分类特征向量输入softmax分类函数,以获得所述待识别的产品检测报告与参考产品证书相关的第一概率,以及,待识别的产品检测报告与参考产品证书不相关的第二概率;以及,确定子单元792,用于基于所述概率生成子单元791获得的所述第一概率和所述第二概率,生成所述分类结果。

这里,本领域技术人员可以理解,上述产品检测报告管理系统700中的各个单元和模块的具体功能和操作已经在上面参考图1到图6的基于区块链技术的产品检测报告管理方法的描述中得到了详细介绍,并因此,将省略其重复描述。

如上所述,根据本申请实施例的产品检测报告管理系统700可以实现在各种终端设备中,例如用于产品检测报告管理的服务器等。在一个示例中,根据本申请实施例的产品检测报告管理系统700可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该产品检测报告管理系统700可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该产品检测报告管理系统700同样可以是该终端设备的众多硬件模块之一。

替换地,在另一示例中,该产品检测报告管理系统700与该终端设备也可以是分立的设备,并且该产品检测报告管理系统700可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面,参考图10来描述根据本申请实施例的电子设备。如图10所示,电子设备包括10包括一个或多个处理器11和存储器12。处理器11可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于区块链技术的产品检测报告管理方法的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如文本特征向量、差分特征向量等各种内容。

在一个示例中,电子设备10还可以包括:输入系统13和输出系统14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入系统13可以包括例如键盘、鼠标等等。

该输出系统14可以向外部输出各种信息,包括分类结果等。该输出系统14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图10中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于区块链技术的产品检测报告管理方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的基于区块链技术的产品检测报告管理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1