烟草生产数据管理方法及装置与流程

文档序号:31185786发布日期:2022-08-19 21:42阅读:44来源:国知局
烟草生产数据管理方法及装置与流程

1.本发明涉及人工智能技术领域,尤其涉及一种烟草生产数据管理方法、装置、设备及计算机可读存储介质。


背景技术:

2.烟草工业在生产过程中会产生大量的数据,这些烟草生产相关的数据不仅涉及到烟草生产的相关设备,还涉及到其他方面。数据通常是后续对烟草生产流程进行调整和管理的重要参考数据。现有的对烟草生成数据进行管理的方法通常是根据上报的烟草生产数据进行分析并调整,这种方法涉及的维度不够全面,同时采用人工分析和调整的方式进行管理,导致效率更低。因此亟待提出一种效率更高的烟草生产数据管理方法。


技术实现要素:

3.本发明提供一种烟草生产数据管理方法、装置及计算机可读存储介质,其主要目的在于解决烟草生产数据管理的效率较低的问题。
4.为实现上述目的,本发明提供的一种烟草生产数据管理方法,包括:获取烟草生产相关数据,所述烟草生产相关数据包括烟草处理流程数据,烟草设备数据和烟草监测数据;基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据;对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果;对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据;当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据;基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
5.可选地,所述基于预设的回归模型建立烟草生产能源消耗预测模型,包括:获取烟草样本数据,确定所述烟草样本数据中的多个变量数据;对所述多个变量数据中的自变量数据和因变量数据进行相关性分析,得到标准自变量数据和标准因变量数据;根据所述标准自变量数据和所述标准因变量数据构建消耗预测公式,并将所述消耗预测公式作为模型的基本形式生成能源消耗预测模型。
6.可选地,所述根据所述标准自变量数据和所述标准因变量数据构建消耗预测公式,包括:
所述消耗预测公式为:其中,y为因变量,表示能源消耗量,x1为自变量,表示产量,x2为自变量,表示环境温度变化量, x3为自变量,表示环境湿度变化量,α、β1、β2和β3为预设的固定参数。
7.可选地,所述对所述烟草设备数据进行数据预处理,得到标准设备数据,包括:利用预设的空缺值识别语句识别出所述烟草设备数据中的空缺位置,并在预设参考数值库中查找填充值对所述空缺位置进行填充,得到初始设备数据;对所述初始设备数据进行离散化处理,得到标准设备数据。
8.可选地,所述利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果,包括:将多个所述标准设备数据进行随机组成生成的多个集合作为候选频繁一项集,并利用预设的支持度计算公式计算所述候选频繁一项集中每个集合对应的支持度;去除所述候选频繁一项集中所述支持度小于预设支持阈值的集合,得到频繁二项集,并计算所述频繁二项集中每个集合对应的支持度;基于所述支持度对所述频繁二项集执行筛选处理,直至集合数目为一个时,将所述集合作为目标集合;将所述目标集合作为所述标准设备数据对应的设备分析结果。
9.可选地,所述利用预设的支持度计算公式计算所述候选频繁一项集中每个集合对应的支持度,包括:所述预设的支持度计算公式为:其中, 为所述支持度,为x和y同时出现的次数, 为 x和y的数目之和,p(xy)是指 x 和 y 同时发生的概率。
10.可选地,所述将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据之前,所述方法还包括:获取多个不同的表达式组件;根据所述烟草监测数据的性质对所述烟草监测数据进行分析,得到分析结果;根据所述分析结果从多个不同的表达式组件中选择表达式组件进行编写,得到所述预设正则表达式。
11.可选地,所述利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,包括:利用所述数据管理模块中的模型层访问所述烟草能源消耗数据、所述设备分析结果及所述敏感监测数据,并将数据存储在数据存储层;调用所述数据存储层中的数据推送至界面层进行界面呈现,得到数据管理结果。
12.可选地,所述将所述数据管理结果推送给用户,包括:根据数据管理结果的传输文件将所述数据管理结果传输至数据推送引擎;利用所述数据推送引擎推送所述数据管理结果至用户。
13.为了解决上述问题,本发明还提供一种烟草生产数据管理装置,所述装置包括:消耗预测模块,用于获取烟草生产相关数据,所述烟草生产相关数据包括烟草处
理流程数据,烟草设备数据和烟草监测数据,基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据;设备分析模块,用于对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果;敏感判定模块,用于对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据,当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据;数据管理模块,用于基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
14.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现上述所述的烟草生产数据管理方法。
15.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的烟草生产数据管理方法。
16.本发明实施例中,通过对烟草处理流程数据进行消耗预测,得到烟草能源消耗数据,对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果,所述数据预处理保证了标准设备数据的准确性,关联挖掘算法可以提高设备分析的效率,对烟草监测数据进行数据类型识别并根据不同的数据类型进行敏感数据判定,提高了敏感数据判定的准确性。基于界面层、控制层、模型层和数据存储层构建数据管理模块,所述数据管理模块包含不同功能的数据层,因此可以实现对烟草生产数据的精准管理,根据所述数据管理模块对所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,根据一个数据管理模块实现对多个数据的管理,提升了数据管理的效率。因此本发明提出的烟草生产数据管理方法、装置、电子设备及计算机可读存储介质,可以解决烟草生产数据管理的效率较低的问题。
附图说明
17.图1为本发明一实施例提供的烟草生产数据管理方法的流程示意图;图2为本发明一实施例提供的烟草生产数据管理装置的功能模块图;图3为本发明一实施例提供的实现所述烟草生产数据管理方法的电子设备的结构示意图。
18.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
19.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
20.本技术实施例提供一种烟草生产数据管理方法。所述烟草生产数据管理方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述烟草生产数据管理方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
21.参照图1所示,为本发明一实施例提供的烟草生产数据管理方法的流程示意图。在本实施例中,所述烟草生产数据管理方法包括:s1、获取烟草生产相关数据,所述烟草生产相关数据包括烟草处理流程数据,烟草设备数据和烟草监测数据。
22.本发明实施例中,所述烟草生产相关数据中包括烟草处理流程数据、烟草设备数据和烟草监测数据。其中,所述烟草处理流程数据主要包括叶片处理阶段、叶丝处理阶段、叶梗处理阶段、卷烟包装阶段等。所述烟草设备数据是指设备参数、烟草生产线参数等。所述烟草监测数据是指烟草生产阶段时产生的需要进行敏感性识别的数据,并不是所有的烟草监测数据都可以公布出来,相对较为敏感的数据后续需要进行隐藏。
23.具体地,可以从不同的烟草企业里获取烟草生产相关数据,或者从存储烟草相关数据的数据库中获取。
24.s2、基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据。
25.本发明实施例中,所述预设的回归模型为多元线性回归模型(multivariable linear regression model ),在所述多元线性回归模型中一个变量往往受到多个变量的影响。例如,烟草能源消耗会受到环境温度、相对湿度、常规消耗量等多种因素的影响。
26.具体地,所述基于预设的回归模型建立烟草生产能源消耗预测模型,包括:获取烟草样本数据,确定所述烟草样本数据中的多个变量数据;对所述多个变量数据中的自变量数据和因变量数据进行相关性分析,得到标准自变量数据和标准因变量数据;根据所述标准自变量数据和所述标准因变量数据构建消耗预测公式,并将所述消耗预测公式作为模型的基本形式生成能源消耗预测模型。
27.详细地,所述烟草样本数据中包含卷烟厂逐日生产能源消耗及日产量和在气象局获取的逐日平均温度和平均相对湿度。其中,所述烟草样本数据中的变量数据包含自变量数据和因变量数据,自变量数据可以为产量、温度变化量和湿度变化量。因变量数据可以为能耗消耗量。
28.其中,对所述多个变量数据中的自变量数据和因变量数据进行相关性分析可以是利用现有的相关系计算公式进而确定得到标准自变量数据和标准因变量数据。
29.进一步地,所述根据所述标准自变量数据和所述标准因变量数据构建消耗预测公式,包括:所述消耗预测公式为:其中, y为因变量,表示能源消耗量,x1为自变量,表示产量,x2为自变量,表示环境温度变化量,x3为自变量,表示环境湿度变化量,α、β1、β2和β3为预设的固定参数。
30.详细地,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据。
31.s3、对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果。
32.本发明实施例中,由于烟草生产过程中会产生大量的数据,这些数据蕴含着许多和生产设备、生产过程相关的规律性,因此可以通过关联挖掘算法挖掘出隐含在数据中的潜在规律。
33.具体地,所述对所述烟草设备数据进行数据预处理,得到标准设备数据,包括:利用预设的空缺值识别语句识别出所述烟草设备数据中的空缺位置,并在预设参考数值库中查找填充值对所述空缺位置进行填充,得到初始设备数据;对所述初始设备数据进行离散化处理,得到标准设备数据。
34.详细地,所述烟草设备数据是在工业生产过程中产生的,而工业生产过程中产生的很多数据都是有缺陷的,其中,最常出现的缺陷为出现空缺值,因此需要利用预设的空缺值识别语句识别出所述烟草设备数据中的空缺位置并进行填充。由于关联规则算法不接受连续属性,因为关联规则算法是一个计数引擎,用于计数离散属性状态的相关性,则在使用时必须对连续属性进行离散化。
35.其中,所述离散化处理是通过数据库编程实现的。
36.进一步地,所述利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果,包括:将多个所述标准设备数据进行随机组成生成的多个集合作为候选频繁一项集,并利用预设的支持度计算公式计算所述候选频繁一项集中每个集合对应的支持度;去除所述候选频繁一项集中所述支持度小于预设支持阈值的集合,得到频繁二项集,并计算所述频繁二项集中每个集合对应的支持度;基于所述支持度对所述频繁二项集执行筛选处理,直至集合数目为一个时,将所述集合作为目标集合;将所述目标集合作为所述标准设备数据对应的设备分析结果。
37.详细地,所述关联挖掘算法即apriori算法采用了迭代的方法,先搜索出候选一项集及对应的支持度,剪枝去掉低于支持度的一项集,得到频繁一项集。然后对剩下的频繁一项集进行连接,得到候选的频繁二项集,筛选去掉低于支持度的候选频繁二项集,得到真正的频繁二项集,以此类推,迭代下去,直到无法找到频繁k+1项集为止,对应的频繁k项集的集合即为算法的输出结果。
38.具体地,所述利用预设的支持度计算公式计算所述候选频繁一项集中每个集合对应的支持度,包括:所述预设的支持度计算公式为:其中, 为所述支持度,为x和 y同时出现的次数,为x和 y的数目之和, p(xy)是指 x 和 y 同时发生的概率。s4、对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,
将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据。
39.本发明实施例中,所述第一类别为香烟防伪条码、烟草来源编码等信息。
40.具体地,所述将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据之前,所述方法还包括:获取多个不同的表达式组件;根据所述烟草监测数据的性质对所述烟草监测数据进行分析,得到分析结果;根据所述分析结果从多个不同的表达式组件中选择表达式组件进行编写,得到所述预设正则表达式。
41.详细地,所述表达式组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合,所述流量数据的性质为其所述类别具有的特殊性质。
42.其中,所述烟草监测数据的性质不同,其性质为所述烟草监测数据所属类别具有的特殊性质,例如,当流量数据为烟草时,则具有构成烟草的特定性质,香烟防伪条码的不同位数具有不同的含义,根据所述香烟防伪条码的性质对所述烟草监测数据进行分析,即分析组成烟草监测数据的部分,得到分析结果,根据分析结果选择表达式组件,按照烟草监测数据构建正则表达式。
43.例如,当所述烟草监测数据为香烟防伪条码,所述类别为第一类别时,其性质即为构成所述香烟防伪条码的不同位置数据代表的含义。所述预设正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是利用所述表达式组件组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
44.进一步地,当所述烟草监测数据为第一类别时,令所述烟草监测数据为香烟防伪条码,根据所述香烟防伪条码获取预先编写的与香烟防伪条码的性质对应的正则表达式,可以知道所述香烟防伪条码的第一行的前五位数字为物流编码、出库时间,表示卷烟的分拣日期,第6到12位为卷烟工业生产码序号,第13至14位表示卷烟物流企业分拣过程自动编排的卷烟件码,第15至16位表示该条卷烟在这箱卷烟中的顺序码。第二行中前四位拼音字母缩写标识卷烟商业企业信息,第11位数字表示卷烟零售店信息,第12至16位是卷烟零售店的烟草专卖证号码。
45.本实施例中,还可以根据不同位数获取预先编写的代表不位数的性质的正则表达式,以此对流量数据进行过滤。
46.具体地,判断所述烟草监测数据是否与正则表达式匹配之后,若不匹配,则将所述烟草监测数据判定为非敏感数据。
47.s5、当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据。
48.本发明实施例中,所述第二类别为图片、字符串和特殊字符等。
49.具体地,当所述烟草监测数据为第二类别时,利用预设的哈希函数计算所述烟草监测数据的哈希值,并判定所述哈希值与预设哈希阈值是否一致,若一致则判定对应的流量数据为敏感监测数据。
50.其中,所述预设的哈希函数为hash()。
51.详细地,通过计算所述烟草监测数据的哈希值可以将一个数据转换为一个标志,
这个标志和源数据的每一个字节都有十分紧密的关系,通过计算哈希值并且与所述预设哈希阈值比较,从而简单便捷地判定敏感监测数据。
52.s6、基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
53.本发明实施例中,基于界面层、控制层、模型层和数据存储层构建数据管理模块,其中,所述界面层中包含物理界面层和外部数据接口层,用于对用户提供一个相对美观且实用的人机界面。所述控制层中包含服务层,所述模型层中包含业务逻辑层和数据访问层,所述数据存储层主要是指数据库和文件系统,用于提供持久化的数据存储和数据管理服务,支持整个模块各层的功能实现。
54.具体地,所述利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,包括:利用所述数据管理模块中的模型层访问所述烟草能源消耗数据、所述设备分析结果及所述敏感监测数据,并将数据存储在数据存储层;调用所述数据存储层中的数据推送至界面层进行界面呈现,得到数据管理结果。
55.详细地,所述界面层由物理界面及外部数据接口层组成,物理界面层用来接收底层设备的数据,外部数据接口层负责与外部其他系统的数据进行数据交互。可以将界面呈现的数据管理结果生成并导出为excel文档和图片文件的方式。
56.进一步地,所述将所述数据管理结果推送给用户,包括:根据数据管理结果的传输文件将所述数据管理结果传输至数据推送引擎;利用所述数据推送引擎推送所述数据管理结果至用户。
57.本发明实施例中,通过对烟草处理流程数据进行消耗预测,得到烟草能源消耗数据,对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果,所述数据预处理保证了标准设备数据的准确性,关联挖掘算法可以提高设备分析的效率,对烟草监测数据进行数据类型识别并根据不同的数据类型进行敏感数据判定,提高了敏感数据判定的准确性。基于界面层、控制层、模型层和数据存储层构建数据管理模块,并根据所述数据管理模块对所述,烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,因此本发明提出的烟草生产数据管理方法可以解决烟草生产数据管理的效率较低的问题。
58.如图2所示,是本发明一实施例提供的烟草生产数据管理装置的功能模块图。
59.本发明所述烟草生产数据管理装置100可以安装于电子设备中。根据实现的功能,所述烟草生产数据管理装置100可以包括消耗预测模块101、设备分析模块102、敏感判定模块103及数据管理模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
60.在本实施例中,关于各模块/单元的功能如下:所述消耗预测模块101,用于获取烟草生产相关数据,所述烟草生产相关数据包括烟草处理流程数据,烟草设备数据和烟草监测数据,基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗
预测,得到烟草能源消耗数据;所述设备分析模块102,用于对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果;所述敏感判定模块103,用于对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据,当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据;所述数据管理模块104,用于基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
61.详细地,所述烟草生产数据管理装置100各模块的具体实施方式如下:步骤一、获取烟草生产相关数据,所述烟草生产相关数据包括烟草处理流程数据,烟草设备数据和烟草监测数据。
62.本发明实施例中,所述烟草生产相关数据中包括烟草处理流程数据、烟草设备数据和烟草监测数据。其中,所述烟草处理流程数据主要包括叶片处理阶段、叶丝处理阶段、叶梗处理阶段、卷烟包装阶段等。所述烟草设备数据是指设备参数、烟草生产线参数等。所述烟草监测数据是指烟草生产阶段时产生的需要进行敏感性识别的数据,并不是所有的烟草监测数据都可以公布出来,相对较为敏感的数据后续需要进行隐藏。
63.具体地,可以从不同的烟草企业里获取烟草生产相关数据,或者从存储烟草相关数据的数据库中获取。
64.步骤二、基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据。
65.本发明实施例中,所述预设的回归模型为多元线性回归模型(multivariable linear regression model ),在所述多元线性回归模型中一个变量往往受到多个变量的影响。例如,烟草能源消耗会受到环境温度、相对湿度、常规消耗量等多种因素的影响。
66.具体地,所述基于预设的回归模型建立烟草生产能源消耗预测模型,包括:获取烟草样本数据,确定所述烟草样本数据中的多个变量数据;对所述多个变量数据中的自变量数据和因变量数据进行相关性分析,得到标准自变量数据和标准因变量数据;根据所述标准自变量数据和所述标准因变量数据构建消耗预测公式,并将所述消耗预测公式作为模型的基本形式生成能源消耗预测模型。
67.详细地,所述烟草样本数据中包含卷烟厂逐日生产能源消耗及日产量和在气象局获取的逐日平均温度和平均相对湿度。其中,所述烟草样本数据中的变量数据包含自变量数据和因变量数据,自变量数据可以为产量、温度变化量和湿度变化量。因变量数据可以为能耗消耗量。
68.其中,对所述多个变量数据中的自变量数据和因变量数据进行相关性分析可以是利用现有的相关系计算公式进而确定得到标准自变量数据和标准因变量数据。
69.进一步地,所述根据所述标准自变量数据和所述标准因变量数据构建消耗预测公式,包括:
所述消耗预测公式为:其中,y为因变量,表示能源消耗量,x1为自变量,表示产量,x2为自变量,表示环境温度变化量, x3为自变量,表示环境湿度变化量,α、β1、β2和β3为预设的固定参数。[0072] 详细地,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据。
[0070]
步骤三、对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果。
[0071]
本发明实施例中,由于烟草生产过程中会产生大量的数据,这些数据蕴含着许多和生产设备、生产过程相关的规律性,因此可以通过关联挖掘算法挖掘出隐含在数据中的潜在规律。
72.具体地,所述对所述烟草设备数据进行数据预处理,得到标准设备数据,包括:利用预设的空缺值识别语句识别出所述烟草设备数据中的空缺位置,并在预设参考数值库中查找填充值对所述空缺位置进行填充,得到初始设备数据;对所述初始设备数据进行离散化处理,得到标准设备数据。
[0073]
详细地,所述烟草设备数据是在工业生产过程中产生的,而工业生产过程中产生的很多数据都是有缺陷的,其中,最常出现的缺陷为出现空缺值,因此需要利用预设的空缺值识别语句识别出所述烟草设备数据中的空缺位置并进行填充。由于关联规则算法不接受连续属性,因为关联规则算法是一个计数引擎,用于计数离散属性状态的相关性,则在使用时必须对连续属性进行离散化。
[0074]
其中,所述离散化处理是通过数据库编程实现的。
[0075]
进一步地,所述利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果,包括:将多个所述标准设备数据进行随机组成生成的多个集合作为候选频繁一项集,并利用预设的支持度计算公式计算所述候选频繁一项集中每个集合对应的支持度;去除所述候选频繁一项集中所述支持度小于预设支持阈值的集合,得到频繁二项集,并计算所述频繁二项集中每个集合对应的支持度;基于所述支持度对所述频繁二项集执行筛选处理,直至集合数目为一个时,将所述集合作为目标集合;将所述目标集合作为所述标准设备数据对应的设备分析结果。
[0076]
详细地,所述关联挖掘算法即apriori算法采用了迭代的方法,先搜索出候选一项集及对应的支持度,剪枝去掉低于支持度的一项集,得到频繁一项集。然后对剩下的频繁一项集进行连接,得到候选的频繁二项集,筛选去掉低于支持度的候选频繁二项集,得到真正的频繁二项集,以此类推,迭代下去,直到无法找到频繁k+1项集为止,对应的频繁k项集的集合即为算法的输出结果。
[0077]
具体地,所述利用预设的支持度计算公式计算所述候选频繁一项集中每个集合对应的支持度,包括:所述预设的支持度计算公式为:
其中,为所述支持度,为 x和 y同时出现的次数,为 x和y的数目之和,p(xy)是指 x 和 y 同时发生的概率。步骤四、对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据。
[0078]
本发明实施例中,所述第一类别为香烟防伪条码、烟草来源编码等信息。
[0079]
具体地,所述将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据之前,所述方法还包括:获取多个不同的表达式组件;根据所述烟草监测数据的性质对所述烟草监测数据进行分析,得到分析结果;根据所述分析结果从多个不同的表达式组件中选择表达式组件进行编写,得到所述预设正则表达式。
[0080]
详细地,所述表达式组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合,所述流量数据的性质为其所述类别具有的特殊性质。
[0081]
其中,所述烟草监测数据的性质不同,其性质为所述烟草监测数据所属类别具有的特殊性质,例如,当流量数据为烟草时,则具有构成烟草的特定性质,香烟防伪条码的不同位数具有不同的含义,根据所述香烟防伪条码的性质对所述烟草监测数据进行分析,即分析组成烟草监测数据的部分,得到分析结果,根据分析结果选择表达式组件,按照烟草监测数据构建正则表达式。
[0082]
例如,当所述烟草监测数据为香烟防伪条码,所述类别为第一类别时,其性质即为构成所述香烟防伪条码的不同位置数据代表的含义。所述预设正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是利用所述表达式组件组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
[0083]
进一步地,当所述烟草监测数据为第一类别时,令所述烟草监测数据为香烟防伪条码,根据所述香烟防伪条码获取预先编写的与香烟防伪条码的性质对应的正则表达式,可以知道所述香烟防伪条码的第一行的前五位数字为物流编码、出库时间,表示卷烟的分拣日期,第6到12位为卷烟工业生产码序号,第13至14位表示卷烟物流企业分拣过程自动编排的卷烟件码,第15至16位表示该条卷烟在这箱卷烟中的顺序码。第二行中前四位拼音字母缩写标识卷烟商业企业信息,第11位数字表示卷烟零售店信息,第12至16位是卷烟零售店的烟草专卖证号码。
[0084]
本实施例中,还可以根据不同位数获取预先编写的代表不位数的性质的正则表达式,以此对流量数据进行过滤。
[0085]
具体地,判断所述烟草监测数据是否与正则表达式匹配之后,若不匹配,则将所述烟草监测数据判定为非敏感数据。
[0086]
步骤五、当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据。
[0087]
本发明实施例中,所述第二类别为图片、字符串和特殊字符等。
[0088]
具体地,当所述烟草监测数据为第二类别时,利用预设的哈希函数计算所述烟草监测数据的哈希值,并判定所述哈希值与预设哈希阈值是否一致,若一致则判定对应的流
量数据为敏感监测数据。
[0089]
其中,所述预设的哈希函数为hash()。
[0090]
详细地,通过计算所述烟草监测数据的哈希值可以将一个数据转换为一个标志,这个标志和源数据的每一个字节都有十分紧密的关系,通过计算哈希值并且与所述预设哈希阈值比较,从而简单便捷地判定敏感监测数据。
[0091]
步骤六、基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
[0092]
本发明实施例中,基于界面层、控制层、模型层和数据存储层构建数据管理模块,其中,所述界面层中包含物理界面层和外部数据接口层,用于对用户提供一个相对美观且实用的人机界面。所述控制层中包含服务层,所述模型层中包含业务逻辑层和数据访问层,所述数据存储层主要是指数据库和文件系统,用于提供持久化的数据存储和数据管理服务,支持整个模块各层的功能实现。
[0093]
具体地,所述利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,包括:利用所述数据管理模块中的模型层访问所述烟草能源消耗数据、所述设备分析结果及所述敏感监测数据,并将数据存储在数据存储层;调用所述数据存储层中的数据推送至界面层进行界面呈现,得到数据管理结果。
[0094]
详细地,所述界面层由物理界面及外部数据接口层组成,物理界面层用来接收底层设备的数据,外部数据接口层负责与外部其他系统的数据进行数据交互。可以将界面呈现的数据管理结果生成并导出为excel文档和图片文件的方式。
[0095]
进一步地,所述将所述数据管理结果推送给用户,包括:根据数据管理结果的传输文件将所述数据管理结果传输至数据推送引擎;利用所述数据推送引擎推送所述数据管理结果至用户。
[0096]
本发明实施例中,通过对烟草处理流程数据进行消耗预测,得到烟草能源消耗数据,对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果,所述数据预处理保证了标准设备数据的准确性,关联挖掘算法可以提高设备分析的效率,对烟草监测数据进行数据类型识别并根据不同的数据类型进行敏感数据判定,提高了敏感数据判定的准确性。基于界面层、控制层、模型层和数据存储层构建数据管理模块,所述数据管理模块包含不同功能的数据层,因此可以实现对烟草生产数据的精准管理,并根据所述数据管理模块对所述,烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,根据一个数据管理模块实现对多个数据的管理,提升了数据管理的效率。因此本发明提出的烟草生产数据管理装置可以解决烟草生产数据管理的效率较低的问题。
[0097]
如图3所示,是本发明一实施例提供的实现烟草生产数据管理方法的电子设备的结构示意图。
[0098]
所述电子设备可以包括处理器10、存储器11、通信接口12和总线13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如烟草生产数据管理程序。
[0099]
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card, smc)、安全数字(secure digital, sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如烟草生产数据管理程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0100]
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如烟草生产数据管理程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0101]
所述通信接口12用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0102]
所述总线13可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线13可以分为地址总线、数据总线、控制总线等。所述总线13被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0103]
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0104]
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
[0105]
进一步地,所述电子设备还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设
备之间建立通信连接。
[0106]
可选地,该电子设备还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0107]
应该了解,所述实施例仅为说明之用,在专利申请保护范围上并不受此结构的限制。
[0108]
所述电子设备中的所述存储器11存储的烟草生产数据管理程序是多个指令的组合,在所述处理器10中运行时,可以实现:获取烟草生产相关数据,所述烟草生产相关数据包括烟草处理流程数据,烟草设备数据和烟草监测数据;基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据;对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果;对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据;当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据;基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
[0109]
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0110]
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
[0111]
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:获取烟草生产相关数据,所述烟草生产相关数据包括烟草处理流程数据,烟草设备数据和烟草监测数据;基于预设的回归模型建立烟草生产能源消耗预测模型,利用所述烟草生产能源消耗预测模型对所述烟草处理流程数据进行消耗预测,得到烟草能源消耗数据;对所述烟草设备数据进行数据预处理,得到标准设备数据,利用关联挖掘算法对所述标准设备数据进行设备分析,得到设备分析结果;
对所述烟草监测数据进行数据类型识别,当所述烟草监测数据为第一类别时,将与预设正则表达式匹配的烟草监测数据判定为敏感监测数据;当所述烟草监测数据为第二类别时,计算所述烟草监测数据对应的哈希值,并将与预设哈希阈值一致的烟草监测数据为敏感监测数据;基于界面层、控制层、模型层和数据存储层构建数据管理模块,利用所述数据管理模块将所述烟草能源消耗数据、所述设备分析结果和所述敏感监测数据进行数据管理,得到数据管理结果,并将所述数据管理结果推送给用户。
[0112]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0113]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0114]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0115]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0116]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0117]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0118]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0119]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1