一种适合大数据价值评价的计算方法

文档序号:9598356阅读:760来源:国知局
一种适合大数据价值评价的计算方法
【技术领域】
[0001] 本发明涉及的是用于数据价值评价的计算方法,属于大数据交易过程中的数据价 值评价算法领域。
【背景技术】
[0002] 随着大数据时代的来临,服务计算、云计算、物联网等信息技术的快速发展为新兴 交易模式的发展提供了新思路。交易的商品越来越"数据化"。电力、市政、交通、气象、经 济等行业大数据彼此交融,形式多种多样,包括结构化数据、半结构化数据和非结构化数据 等,应用数据挖掘、机器学习、并行计算、流计算等"大数据"技术,可以在体量巨大、类型繁 多、低价值密度的数据中挖掘出高附加值的信息,具有巨大的经济价值和社会价值。
[0003] 大数据交易中的主体是数据,如何给进行交易的数据一个合理的价值评价从而确 定数据的交易价格就显得尤为重要。目前国内认可并已投入使用的评价大数据价值的六大 维度分别是:数据品种、时间跨度、数据深度、数据完整性、数据样本覆盖和数据实时性。这 六个数据价值的评价维度在不同的数据应用场景下所占的权重是不一样的,如果仅仅依靠 数据买方或卖方的定性分析和逻辑判断,缺乏定量分析依据来确定数据的价值量,显然是 不合理的。
[0004] 层次分析法(Analytical Hierarchy Process)综合了人们的主观判断,是一种简 明、实用的定性分析与定量分析相结合的系统分析与评价的方法,适用于多目标、多判据的 系统综合评价。考虑到数据价值评价的维度多、数据价值效益的维度多,以及不同应用场景 下数据价值的不同,数据的价值是不同的,本发明提出了基于不同应用场景下,数据价值计 算的层次分析法,以定性分析和定量分析相结合的方式来确定数据的价值量,给数据的价 值计算提供了一个较好的研究方向。

【发明内容】

[0005] 发明目的:针对多元的海量大数据,提出了一种基于层次分析法的适合大数据的 数据价值计算方法。
[0006] 技术方案:为达到上述目的,本发明可采用如下技术方案:
[0007] -种适合大数据价值评价的计算方法,包括以下步骤:
[0008] (1)、将数据价值的评价过程所涉及的影响因素分成若干层次,建立多级递阶的层 次结构模型,包括目标层、准则层和应用层;目标层即为数据价值;
[0009] ⑵、确定应用层的数据价值基值量;
[0010] (3)、将同一层次的任意两个影响因素进行重要性比较,对该两个影响因素重要性 之比做出判断,给予量化;
[0011] (4)、对同一层次上的各个因素,以上一级的因素为依据,进行两两比较,根据评价 尺度对它们的重要性给予一定的标度,确定其相对重要度,并据此构建判断矩阵;
[0012] (5)、计算判断矩阵的特征向量,以此确定各层因素的相对重要度,该相对重要度 以权重量化;
[0013] (6)、通过上述权重的计算,再乘上数据价值基值量,即得到某一应用场景下的数 据价值。
[0014] 有益效果:使用本发明的适合大数据的数据价值计算方法,可以获得各个数据应 用场景下数据的价值量,从而有利于确定使得数据买卖双方都愿意接收的数据价格定位区 间,实现大数据交易过程中买卖双方的"双赢",有益于大数据交易市场的良性发展。
【附图说明】
[0015] 图1是是本发明的基于层次分析法的数据价值评价分层模型示意图。
【具体实施方式】
[0016] 下面结合附图对本发明进行详细的描述。
[0017] 本发明公开一种适合大数据价值评价的计算方法,包括以下步骤:
[0018] (1)、如图1所示,将数据价值的评价过程所涉及的影响因素分成若干层次,建立 多级递阶的层次结构模型,包括目标层、准则层和应用层;目标层即为数据价值;
[0019] (2)、确定应用层的数据价值基值量;
[0020] (3)、将同一层次的任意两个影响因素进行重要性比较,对该两个影响因素重要性 之比做出判断,给予量化;
[0021] (4)、对同一层次上的各个因素,以上一级的因素为依据,进行两两比较,根据评价 尺度对它们的重要性给予一定的标度,确定其相对重要度,并据此构建判断矩阵;
[0022] (5)、计算判断矩阵的特征向量,以此确定各层因素的相对重要度,该相对重要度 以权重量化;
[0023] (6)、通过上述权重的计算,再乘上数据价值基值量,即得到某一应用场景下的数 据价值。
[0024] 进一步地,根据所述(1)中,大数据交易中的主体是数据,数据本身的质量将直接 影响到数据的价值。目前评价数据价值的是数据品种、时间跨度、数据深度、数据完整性、数 据样本覆盖和数据实时性这六个维度,由于其是与数据本身的价值最直接相关的,故将其 放在最靠近目标层的第一准则层中。因为多元大数据的来源各异,各个种类的数据、各个时 间跨度的数据、不同完整性的数据等对六大数据评价维度的影响也不尽相同,所以将六大 维度细分后得到第二准则层。不同的数据应用场景下有不同的效益,所以对数据的价值评 价中还要考虑到各类效益,故将效益也纳入到准则层中。所有的数据价值都是在应用层即 数据的应用场景下进行价值计算的。因为本次发明的目的是求解数据价值量,故将数据价 值放在目标层。以目前通用的数据价值六大评价维度(数据品种、时间跨度、数据深度、数 据完整性、数据样本覆盖、数据实时性)为第一准则层,然后将数据品种依据其来源分为六 大类,而其余的五类维度只做定性分析确定归类到三个子层之中,三个子层相对于其上的 五个维度的权重系数按最好的为〇. 95,次之的是0. 7,差的为0. 5做计算。以完整性为例, 完整性好相对权重取为0. 95,完整性一般的相对权重取为0. 7,完整性差的取为0. 5
[0025] 所述(2)中,数据价值的基值量的确定,主要是考虑到相同的数据在不同的数据 应用场景下,数据价值自身就会有差异,而且对于不同的应用,数据的六大维度所占权重 也不相同,所以需要先确定某场景下,数据的价值基值量,其值的确定是在结合数据增值量 (即通过这个数据的研究分析,应用后可能获得的价值)后给出的。
[0026] 而所述(3)中,第二基准层中的时间跨度、数据深度、数据完整性、数据样本覆盖 和数据实时性各自的三类细分环节先定性分析,即按照一定的尺度,将数据归类到三个层 次中的一个中(如长时间跨度数据、中等时间跨度数据和短时间内数据),然后量化,所以 三个层次之间不再做两两比较。
[0027] 进一步地,所述(4)中,在确定了某一应用场景后,从下往上开始计算权重。对同 属一层的各要素,以上一
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1