数据资产评估方法和装置与流程

文档序号:31927063发布日期:2022-10-25 23:00阅读:299来源:国知局
数据资产评估方法和装置与流程

1.本公开涉及大数据处理及应用领域,尤其涉及一种数据资产评估方法和装置。


背景技术:

2.数据资产是指由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料、电子数据等。数据资产价值评估是使数据的内在价值和使用价值有一个可操作的量化指标,评估结果是数据交易的基础,同时也可以优化数据运营生成的流程和资源配置。
3.目前无形资产已形成了一套较为完善的评估体系,主要有成本法、市场法、收益折现法等。虽然数据资产也属于无形资产,但是由于数据资产的评估标准和影响因素与一般无形资产相差很大,因此无形资产的价值评估算法不能完全应用到数据资产价值评估当中去。同时,相同的数据资产,由于其应用领域、使用方法、获利方式的不同,会造成其价值差异。这些都导致数据资产价值评估工作的复杂性和难度更大。
4.由于数据资产价值受到越来越广泛的关注,数据资产价值评估作为数据资产价值的生命线,是数据资产发挥价值的基础,亟需开展数据资产价值评估工作以提升数据增值运营水平。
5.当前对数据资产价值评估的算法主要包括层次分析法,但使用层次分析法进行数据资产价值估算,工作量繁重,主观性也较强。该方法需要数据专家对每份数据下成本、固有价值、市场价值以及环境因素四个主因素下的多个影响因素构造比较判断矩阵以及评分。
6.另外,目前所有的数据价值评估都只考虑了数据本身的特性,导致不同数据之间的评估结果往往缺乏可比较性;另一方面,数据的价值常随时间变化,对关联数据的影响,也无法在独立评估过程中体现出来。


技术实现要素:

7.本公开要解决的一个技术问题是,提供一种数据资产评估方法和装置,能够减少工程量和繁琐步骤,并且,由于考虑了数据之间的关联关系,使得数据资产价值评估更客观、更公正。
8.根据本公开一方面,提出一种数据资产评估方法,包括:抽取待评估数据的数据特征;将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值;获取待评估数据之间的数据血缘关系;以及基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。
9.在一些实施例中,基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值包括:根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值;基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值;利用权重函数值,对价值临时值进行加权平均计算,
得到价值加权值;以及判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将价值加权值作为价值最终值。
10.在一些实施例中,利用公式计算待评估数据相对于父数据的权重函数值,其中,
x
为待评估数据与父数据之间的最小血缘距离,
wd
为权重函数值。
11.在一些实施例中,利用公对价值初始值进行迭代更新计算,其中,为待评估数据的价值临时值,
bd
为生成待评估数据的父数据的集合,
lj
为父数据的生成数据数,r为传播系数。
12.在一些实施例中,数据特征包括数据成本特征、数据质量特征和数据应用特征中的一项或多项。
13.在一些实施例中,数据成本特征包括数据存储量大小、数据运维人员人数、数据传输成本、数据运维成本、数据采集成本中的一项或多项;数据质量特征包括数据量、数据维度大小、数据一致性、数据准确性、数据延时时长、数据更新频率中的一项或多项;以及数据应用特征包括数据时效性、数据影响度、数据多源性、数据使用频次、数据使用部门、数据使用业务个数、数据拥有者数量中的一项或多项。
14.在一些实施例中,获取样本数据和样本数据对应的标签值,其中,标签值为价值;抽取样本数据的数据特征;以及利用样本数据的数据特征和标签值,训练回归模型,得到价值评估模型。
15.在一些实施例中,将标签值进行归一化处理。
16.在一些实施例中,样本数据包括数据交易合同中的数据,以及通过层次法进行价值评估的业务数据中的一种或多种。
17.根据本公开的另一方面,还提出一种数据资产评估装置,包括:特征抽取单元,被配置为抽取待评估数据的数据特征;初始值预测单元,被配置为将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值;血缘关系获取单元,被配置为获取待评估数据之间的数据血缘关系;以及价值确定单元,被配置为基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。
18.在一些实施例中,价值确定单元被配置为根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值;基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值;利用权重函数值,对价值临时值进行加权平均计算,得到价值加权值;以及判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将价值加权值作为价值最终值。
19.根据本公开的另一方面,还提出一种数据资产评估装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上述的数据资产评估方法。
20.根据本公开的另一方面,还提出一种非瞬时性计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上述的数据资产评估方法。
21.本公开实施例中,利用训练好的价值评估模型对待评估数据进行预测及设置初始值,然后基于数据血缘关系,对数据资产价值的初始值进行更新。不仅减少了工程量和繁琐
步骤,并且,由于考虑了数据之间的关联关系,使得数据资产价值评估更客观、更公正。
22.通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
23.构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
24.参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
25.图1为本公开的数据资产评估方法的一些实施例的流程示意图。
26.图2为本公开的数据资产评估方法的另一些实施例的流程示意图。
27.图3为本公开的数据资产评估装置的一些实施例的结构示意图。
28.图4为本公开的数据资产评估装置的另一些实施例的结构示意图。
29.图5为本公开的数据资产评估装置的另一些实施例的结构示意图。
具体实施方式
30.现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
31.同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
32.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
33.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
34.在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
35.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
36.为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
37.图1为本公开的数据资产评估方法的一些实施例的流程示意图。
38.在步骤110,抽取待评估数据的数据特征。
39.在一些实施例中,数据特征包括数据成本特征、数据质量特征和数据应用特征等。
40.在一些实施例中,数据成本特征包括数据存储量大小、数据运维人员人数、数据传输成本、数据运维成本、数据采集成本等与数据成本相关的特征。
41.在一些实施例中,数据质量特征包括数据量、数据维度大小、数据一致性、数据准确性、数据延时时长、数据更新频率等。
42.在一些实施例中,数据应用特征包括数据时效性、数据影响度、数据多源性、数据使用频次、数据使用部门、数据使用业务个数、数据拥有者数量等。
43.在步骤120,将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值。
44.在一些实施例中,获取样本数据和样本数据对应的标签值,其中,标签值为价值;抽取样本数据的数据特征;以及利用样本数据的数据特征和标签值,训练回归模型,得到价值评估模型。
45.在步骤130,获取待评估数据之间的数据血缘关系。
46.在一些实施例中,数据血缘关系,即数据关联关系。例如,数据a是由数据b和数据c合并成,则数据a与数据b存在父子关系,数据a也与数据c存在父子关系。
47.在步骤140,基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。
48.在一些实施例中,根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值;基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值;利用权重函数值,对价值临时值进行加权平均计算,得到价值加权值;以及判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将价值加权值作为价值最终值。
49.在上述实施例中,利用训练好的价值评估模型对待评估数据进行预测及设置初始值,然后基于数据血缘关系,对数据资产价值的初始值进行更新。不仅减少了工程量和繁琐步骤,并且,由于考虑了数据之间的关联关系,使得数据资产价值评估更客观、更公正。
50.图2为本公开的数据资产评估方法的另一些实施例的流程示意图。该实施例包括模型训练过程和利用“基于数据血缘的价值评估算法”对数据的评估价值初值进行价值更新过程。
51.在步骤210,获取样本数据和样本数据对应的标签值,其中,标签值为价值。
52.在一些实施例中,样本数据包括数据交易合同中的数据,以及通过层次法进行价值评估的业务数据等。例如,从数据交易合同中获取数据及交易金额。或者,组织专家对少量典型数据通过层次法进行价值评估,其中,典型数据是指数据使用次数比较多的业务数据。
53.在一些实施例中,将标签值进行归一化处理。例如,将各数据的价值泛化到(0,100),便于后续模型的训练,并且,减少了计算误差。
54.在步骤220,抽取样本数据的数据特征。
55.在一些实施例中,样本数据的数据特征包括数据成本特征、数据质量特征和数据应用特征等。
56.在步骤230,利用样本数据的数据特征和标签值,训练回归模型,得到价值评估模型。
57.在一些实施例中,将样本数据的数据特征作为模型的输入参数,将规范化的价值作为模型的输出参数,利用机器学习算法训练回归模型,得到价值评估模型。
58.在一些实施例中,数据建模流程可以设置为1月或更长时间执行一次,或者根据需要随时启动更新,而且可以设置在低峰时间运行,对系统效率影响较小。
59.在步骤240,抽取待评估数据的数据特征。
60.在步骤250,将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估
数据对应的价值初始值。例如,价值初始值为
61.在步骤260,获取待评估数据之间的数据血缘关系。
62.相关技术中,忽略了数据之间的血缘关系。实际上数据大多数并不孤立,数据之间存在关联;如果不考虑这种数据之间的联系,对各个数据进行独立的评估,一方面因为在独立的评估过程中引入的主观性差异较大,导致不同数据之间的评估结果往往缺乏可比较性;另一方面,数据的价值常随时间变化,对关联数据的影响,也无法在独立评估过程中体现出来。该实施例中,构建数据血缘关系图,考虑数据与数据之间的关系对数据资产价值的影响,后续执行基于数据血缘的价值评估算法,来对数据的评估价值初值进行价值更新。
63.在步骤270,根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值。
64.在一些实施例中,利用公式计算待评估数据相对于父数据的权重函数值,其中,x为待评估数据与父数据之间的最小血缘距离,wd为权重函数值。该权重函数值即父数据对待评估数据的影响关系,其中,随着血缘距离的增加,数据的价值传播会越来越弱。
65.在步骤280,基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值。
66.在一些实施例中,利用公对价值初始值进行迭代更新计算,其中,为待评估数据的价值临时值,bd为生成待评估数据的父数据的集合,l
*
为父数据的生成数据数,r为传播系数,例如,设置为0.9。
67.在步骤290,利用权重函数值,对价值临时值进行加权平均计算,得到价值加权值。
68.在一些实施例中,利用得到待评估函数的价值加权值。
69.在步骤2100,判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则执行步骤2110,否则,继续执行步骤280。
70.在步骤2110,将价值加权值作为待评估数据的价值最终值。即得到待评估数据的量化价值。数据的价值估值可以作为数据属性展示,凸显数据重要性。
71.在上述实施例中,一方面,利用利用机器学习算法从数据维度和数据关系维度等多个维度进行数据价值评估,减少人工介入,简化了数据价值评估流程;另一方面,突破传统数据资产仅仅对数据本身的评估,不仅从数据资产的多种维度进行评估价值的计算,而且还考虑了数据与数据之间的关系对数据资产价值的影响,从而将数据资产价值评估更客观、更公正;再者,由于数据价值随时间变化,当存在新的事实或知识,比如某些数据的重要性发生变化而重新评估,或者有新的数据交易的情况下,能够快速有效更新对数据的价值评估。
72.本公开的上述流程,能够以功能扩展的形式通过算法模块实现,主要是对数据运营管理系统中的数据分析流程进行扩展,并不会对现有生产流程产生任何影响,通过部署
相应算法处理模块即可实现。
73.图3为本公开的数据资产评估装置的一些实施例的结构示意图。该装置包括特征抽取单元310和初始值预测单元320、血缘关系获取单元330和价值确定单元340。
74.特征抽取单元310被配置为抽取待评估数据的数据特征。
75.在一些实施例中,数据特征包括数据成本特征、数据质量特征和数据应用特征等。
76.在一些实施例中,数据成本特征包括数据存储量大小、数据运维人员人数、数据传输成本、数据运维成本、数据采集成本等与数据成本相关的特征。
77.在一些实施例中,数据质量特征包括数据量、数据维度大小、数据一致性、数据准确性、数据延时时长、数据更新频率等。
78.在一些实施例中,数据应用特征包括数据时效性、数据影响度、数据多源性、数据使用频次、数据使用部门、数据使用业务个数、数据拥有者数量等。
79.初始值预测单元320被配置为将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值。
80.在一些实施例中,如图4所示,该装置还包括模型训练单元410,其中,特征抽取单元310还被配置为获取样本数据和样本数据对应的标签值,其中,标签值为价值,抽取样本数据的数据特征。模型训练单元410被配置为利用样本数据的数据特征和标签值,训练回归模型,得到价值评估模型。
81.该实施例中,利用种子数据构建数据价值回归算法,定量衡量数据价值与数据属性之间的关系。
82.在一些实施例中,样本数据包括数据交易合同中的数据,以及通过层次法进行价值评估的业务数据。
83.在一些实施例中,将标签值进行归一化处理。
84.血缘关系获取单元330被配置为获取待评估数据之间的数据血缘关系。
85.价值确定单元340被配置为基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。
86.在一些实施例中,价值确定单元340被配置为根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值;基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值;利用权重函数值,对价值临时值进行加权平均计算,得到价值加权值;以及判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将价值加权值作为价值最终值。
87.在上述实施例中,利用血缘距离加权更新数据价值,不仅定性考虑了数据血缘的影响,更定量评估了血缘关系距离对于数据价值的影响,利用数据属性以及数据血缘属性,从多个维度构建数据资产价值评估,不仅减少了工程量和繁琐步骤,并且,由于考虑了数据之间关联关系,使得数据资产价值评估更客观、更公正。
88.本公开的数据资产价值评估,一方面,有利于企业明确数据资产价值,从而优化数据运营生成的流程和资源配置,另一方面,数据资产的准确的价值评估,有利于完善数据资产管理,加速数据资产交易进程。
89.图5为本公开的数据资产评估装置的另一些实施例的结构示意图。该装置包括存储器510和处理器520。其中:存储器510可以是磁盘、闪存或其它任何非易失性存储介质。存
储器用于存储图1-2所对应实施例中的指令。处理器520耦接至存储器510,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器520用于执行存储器中存储的指令。
90.在一些实施例中,处理器520通过bus总线530耦合至存储器510。该装置500还可以通过存储接口540连接至外部存储系统550以便调用外部数据,还可以通过网络接口560连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。
91.在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,不仅减少了工程量和繁琐步骤,提高价值评估的通用性,并且,由于考虑了数据之间关联关系,使得数据资产价值评估更客观、更公正。
92.在另一些实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现图1-2所对应实施例中的方法的步骤。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
93.本公开是参照根据本公开实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
94.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
95.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
96.至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
97.虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1