基于人工智能的数据系统测试方法及相关设备与流程

文档序号:31051748发布日期:2022-08-06 07:40阅读:84来源:国知局
1.本技术涉及人工智能
技术领域
:,尤其涉及一种基于人工智能的数据系统测试方法、装置、电子设备及存储介质。
背景技术
::2.随着数字化业务的发展,数据系统在企业运营过程中的重要性日益显著,数据系统的性能是评估一个数据系统的较为关键的维度,所述数据系统的性能主要包括数据加工的准确性和数据筛查的准确性等。3.现有的数据系统测试方法通常为分模块针对性测试,缺乏对不同模块性能重要性的考虑,导致测试结果不够准确。技术实现要素:4.鉴于以上内容,有必要提供一种基于人工智能的数据系统测试方法及相关设备,以解决如何提高数据系统测试结果的准确度这一技术问题,其中,相关设备包括基于人工智能的数据系统测试装置、电子设备及存储介质。5.本技术实施例提供一种基于人工智能的数据系统测试方法,所述方法包括:6.依据预设程序从开源数据库提取测试数据,所述测试数据为格式化的数据;7.基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度;8.计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度;9.将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度;10.基于所述更新指标评估所述数据系统以获取测试结果。11.上述数据系统测试方法中,通过对数据系统的不同模块单独测试以获得功能模块指标集合,并基于所述功能模块指标集合计算不同功能模块指标的权重,最后基于所述权重构建数据系统综合指标以评估数据系统的性能,考虑了不同模块的测试结果之间的关联性,从而提高测试结果的准确度。12.在一些实施例中,所述基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标包括:13.将所述测试数据输入所述数据系统以获取加工结果数据和筛查结果数据;14.分别计算所述加工结果数据和所述筛查结果数据以获取所述加工准确度指标和所述筛查准确度指标。15.如此,将所述测试数据输入所述数据系统获得结果数据,并进一步基于所述结果数据构建了所述测试指标,所述测试指标能够表征所述数据系统的性能优劣,能够为后续数据系统的评估提供数据支撑,从而提升后续评估结果的准确性。16.在一些实施例中,所述分别计算所述加工结果数据和所述筛查结果数据以获取所述加工准确度指标和所述筛查准确度指标包括:17.依据预设的距离度量方法计算所述加工结果数据的距离数据,所述距离数据用以表征所述加工结果数据的相似程度;18.多次计算所述距离数据的方差,以获取加工准确度指标;19.多次计算所述筛查结果数据的方差获得第二方差集合;20.依据自定义聚合度度量方法计算所述第二方差集合的聚合度以获取筛查准确度指标,所述筛查准确度指标的值越高则表明所述数据系统的数据筛查功能越完备。21.如此,通过度量所述加工结果数据之间的距离获得了所述加工准确度指标,并通过计算所述筛查结果数据的方差获得了筛查准确度指标,所述加工准确度指标和筛查准确度指标能够表征所述测试结果数据的聚合程度,从而表征了所述数据系统的性能优劣,进而能够提升后续评估结果的准确度。22.在一些实施例中,所述计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性包括:23.计算所述加工准确度指标和筛查准确度指标的方差和协方差以构建协方差矩阵;24.计算所述协方差矩阵的特征值作为指标重要性,所述特征值包括加工特征值和筛查特征值。25.如此,通过构建所述加工准确度指标和筛查准确度指标的协方差矩阵获取了所述指标重要性,为后续建立自定义整合模型提供了数据支撑,从而能够提高所述测试指标的准确度。26.在一些实施例中,所述将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标之前,所述方法还包括:27.依据预设的标准化方法计算所述指标重要性以获取归一化的指标重要性,所述归一化的指标重要性包括归一化的加工特征值和归一化的筛查特征值。28.如此,基于所述自定义的标准化方法对所述指标重要性进行归一化处理,能够提升所述指标重要性的置信度,进而能够提升所述更新指标的准确度。29.在一些实施例中,所述自定义整合模型满足关系式:30.t=α1·mean1+α2·mean231.其中,t代表所述更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度;β1代表所述归一化的加工特征值,用以表征加工准确度的重要性;β2代表所述归一化的筛查特征值,用以表征筛查准确度的重要性;mean1代表所述加工准确度指标的平均值,mean2代表所述筛查准确度指标的平均值。32.如此,通过建立整合模型可根据所述归一化后的指标重要性对所述测试指标进行整合以获取更新指标,便于后续数据系统的评估。33.在一些实施例中,所述基于所述更新指标评估所述数据系统以获取测试结果包括:34.基于所述更新指标评估所述数据系统以获取评估结果;35.对比所述评估结果与预设阈值以获取测试结果。36.如此,基于预设阈值与所述数据系统的更新指标获得了测试结果,所述预设阈值可由开发人员基于企业需求制定,因此所述测试结果的获取方式较为灵活。37.本技术实施例还提供一种基于人工智能的数据系统测试装置,所述装置包括:38.获取单元,用于依据预设程序从开源数据库提取测试数据,所述测试数据为格式化的数据;39.测试单元,用于基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度;40.计算单元,用于计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度;41.整合单元,用于将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度;42.评估单元,用于基于所述更新指标评估所述数据系统以获取测试结果。43.本技术实施例还提供一种电子设备,所述电子设备包括:44.存储器,存储计算机可读指令;及45.处理器,执行所述存储器中存储的计算机可读指令以实现所述基于人工智能的数据系统测试方法。46.本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述基于人工智能的数据系统测试方法。附图说明47.图1是本技术所涉及的基于人工智能的数据系统测试方法的较佳实施例的流程图。48.图2是本技术所涉及的基于所述测试数据测试所述数据系统以获取测试指标的较佳实施例的流程图。49.图3是本技术所涉及的计算所述加工准确度指标和筛查准确度指标之间的关联性以获取指标重要性的较佳实施例的流程图。50.图4是本技术所涉及的基于人工智能的数据系统测试装置的较佳实施例的功能模块图。51.图5是本技术所涉及的基于人工智能的数据系统测试方法的较佳实施例的电子设备的结构示意图。52.图6是本技术所涉及的测试数据的示意图。具体实施方式53.为了能够更清楚地理解本技术的目的、特征和优点,下面结合附图和具体实施例对本技术进行详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本技术,所述描述的实施例仅是本技术一部分实施例,而不是全部的实施例。54.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。55.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的
技术领域
:的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。56.本技术实施例提供一种基于人工智能的数据系统测试方法,可应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。57.所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personaldigitalassistant,pda)、游戏机、交互式网络电视(internetprotocoltelevision,iptv)、智能式穿戴式设备等。58.所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloudcomputing)的由大量主机或网络服务器构成的云。59.所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtualprivatenetwork,vpn)等。60.如图1所示,是本技术基于人工智能的数据系统测试方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。61.s10,依据预设程序从开源数据库提取测试数据,所述测试数据为格式化的数据。62.该可选的实施例中,所述开源数据库是按一定结构组织存储的、集成的、可共享的数据的集合,示例性的,所述预设的数据库可以是mysql数据库,所述mysql数据库是一种关系型数据库。63.该可选的实施例中,获取所述测试数据的目的是对数据系统进行测试,所述数据系统是为实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质、处理对象和管理系统的集合体。64.该可选的实施例中,所述数据系统可接收任意的格式化数据以输出数据处理结果,因此所述测试数据可以是任意格式化的数据,任意开源数据库中的数据均可作为测试数据用以测试所述数据系统,本方案对此不做限定,图6为所述测试数据的示意图。65.该可选的实施例中,可在计算机中运行所述预设程序以获取测试数据,示例性的,所述预设程序的形式可以为“select‘table’from‘database’”,其中table代表所述测试数据,database代表所述测试数据所在的数据库的名称,所述table代表的测试数据是表格的形式,其中每行为一条数据,每列为数据的一个字段,示例性的,所述table可以具备n行m列,n可为10000,m可为5,因此所述table包含的字段名称集合可以是{字段1,字段2,字段3,字段4,字段5}。66.该可选的实施例中,将所述table代表的数据表作为所述测试数据。67.如此,基于预设的数据库获得了测试数据集,为后续数据系统的测试环节提供了数据支持,可以使测试结果更加精确。68.s11,基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度。69.请参见图2,在一个可选的实施例中,所述基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度包括:70.s111,将所述测试数据输入所述数据系统以获取加工结果数据和筛查结果数据。71.该可选的实施例中,所述数据系统包括数据加工程序和数据筛查程序,可将所述测试数据输入所述数据加工程序获取加工结果数据,将所述测试数据输入所述数据筛查程序获取筛查结果数据。72.该可选的实施例中,所述数据加工程序为多个数据运算程序的集合,每个数据运算程序可以是一段sql脚本,所述数据运算程序可以包括求积程序、求商程序、求和程序、求差程序,所述求积程序的形式可为“selecta*bas‘积’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的积;所述求商程序的形式可为“selectc/das‘商’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的商;所述求和程序的形式可为“selecte+fas‘和’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的和;所述求差程序的形式可为“selectg-has‘差’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的差。73.该可选的实施例中,所述将所述测试数据输入所述数据加工程序获取加工结果数据的具体实施步骤为:74.将所述测试数据输入所述求积程序以获取测试数据的乘积p,所述p包含10000个乘积,所述求积程序中的a可以代表所述table中的字段1,b可以代表所述table中的字段2;75.将所述测试数据输入所述求商程序以获取测试数据的商值q,所述q包含10000个商,所述求商程序中的c可以代表所述table中的字段2,d可以代表所述table中的字段3;76.将所述测试数据输入所述求和程序以获取测试数据的和值s,所述s包含10000个和值,所述求和程序中的e可以代表所述table中的字段3,f可以代表所述table中的字段4;77.将所述测试数据输入所述求差程序以获取测试数据的差值d,所述d包含10000个差值,所述求差程序中的g可以代表所述table中的字段4,h可以代表所述table中的字段5;78.逐列排列所述p、q、s和d可获得一个具备10000行4列的矩阵z。79.该可选的实施例中,可重复实施所述获取加工结果数据的步骤n次以获取n组测试结果,示例性的,n可以是20,每次实施所述获取加工结果数据的步骤可获得一个对应的矩阵,因此可获取20个10000*4的矩阵,记所述20个矩阵的集合为z,可以表示为z={z1,z2,…,z20}。80.该可选的实施例中,所述数据筛查程序可以是一段sql脚本,其功能是筛选出满足预设筛查条件的数据,其形式可以是“selectdatafromtablewhere‘condition’”,其中,data代表所述筛查程序的返回值所在的字段,示例性的,data=“字段4”,table代表所述测试数据,condition代表所述预设筛查条件。81.该可选的实施例中,所述预设筛查条件可以是“rownum=3”,其含义为筛选出所述测试数据中第3行第4列的数据,所述将所述测试数据输入所述数据筛查程序以获取筛查结果数据的具体实施步骤为,运行所述数据筛查程序以获取满足所述预设筛查条件的返回值,所述返回值为所述测试数据中第3行第4列的数据。82.该可选的实施例中,可重复所述获取筛查结果数据的方法m次以获取筛查结果数据,示例性的,m可以是20,因此所述筛查结果数据可以是数据集合{data1,data2,…,data20},其中每个数据的下标代表所述筛查结果的次序。83.该可选的实施例中,可将所述矩阵集合z={z1,z2,…,z20}作为所述加工结果数据,可将所述数据集合{data1,data2,…,data20}作为所述筛查结果数据。84.s112,分别计算所述加工结果数据和所述筛查结果数据以获取所述加工准确度指标和所述筛查准确度指标。85.该可选的实施例中,可依据预设的距离度量方法计算所述加工结果数据的距离数据,所述距离数据用以表征所述加工结果数据的相似程度;再计算所述举例数据的方差以获取加工准确度指标。以所述矩阵集合z中的z1和z2为例,所述预设的距离度量方法的实施步骤为:86.基于余弦距离公式计算z1的第一列数据与z2的第一列数据之间的余弦距离并记为sd11,21,所述余弦距离公式为:[0087][0088]其中,a代表所述z1的第一列向量;b代表所述z2的第一列向量,sd11,21代表所述a与b的余弦距离,ai代表向量a中第i个维度的数值,bi代表向量b中第i个维度的数值,k代表所述向量a和向量b的维度;[0089]基于上述余弦距离公式分别计算所述z1和z2中其余三列数据对应的余弦距离并记为sd12,22、sd13,23和sd14,24;[0090]计算所述sd11,21、sd12,22、sd13,23和sd14,24的均值并记为sd,所述sd代表的均值用以表征所述矩阵z1和z2之间的相似程度,所述sd的值越大则表明所述矩阵z1和z2的相似度越低。[0091]该可选的实施例中,由于所述矩阵集合z包含20个矩阵,因此其中两两矩阵之间的距离数据有190个,记为sdu={sd1,sd2,…,sd190},所述sdu即为所述加工结果数据的距离数据。[0092]该可选的实施例中,可计算所述距离数据的方差以获取加工准确度指标,所述距离数据的方差的计算公式为:[0093][0094]其中,s1代表所述190个距离数据的方差,sdi代表所述sdu中第i个距离数据,所述s1的值越高则表明所述加工结果数据之间的相似度越高,进而表明加工准确度越高。[0095]该可选的实施例中,可重复所述方差s1的获取方式20次以获得第一方差集合s1_z={s11,s12,…,s120},其目的是对所述数据加工程序进行多次测试以模拟所述数据系统在较高负载环境下的工作情况,以测试所述数据系统中数据加工程序的稳定性,可将所述第一方差集合s1_z作为所述加工准确度指标。[0096]该可选的实施例中,可计算所述筛查结果数据的第二方差集合,再依据自定义聚合度度量方法计算所述第二方差集合中数据的聚合度以获取筛查准确度指标。其中所述筛查结果数据的方差的计算方式为:[0097][0098]其中,s2代表所述筛查结果数据的方差,所述s2的值越大则表明所述筛查数据的聚合程度越低,各个筛查结果数据之间的差异较大,筛查准确度较低;datai代表所述筛查结果数据中的第i个数据。[0099]该可选的实施例中,可重复所述s2的获取方式20次以获得第二方差集合s2_z={s21,s22,…,s220},其目的是对所述筛查程序进行多次测试以模拟所述数据系统在较高负载环境下的工作情况,以测试所述数据系统中程序的稳定性。[0100]该可选的实施例中,可依据自定义聚合度度量方法计算所述第二方差集合中数据的聚合度以获取筛查准确度指标,所述自定义的聚合度度量方法的具体实施步骤为:[0101]计算所述第二方差集合中数据的峰度,所述第二方差集合的峰度的计算公式为:[0102][0103]其中,k代表所述第二方差集合中数据的峰度,所述k代表的峰度用以表征所述第二方差集合中数据的聚合程度,所述k的值越大则所述第二方差集合中的数据的聚合程度越高,所述k的取值范围是[1,∞);s2j代表所述第二方差集合中的第j个数据,μ代表所述第二方差集合的均值,σ代表所述第二方差集合的标准差;[0104]基于所述第二方差集合中数据的峰度更新所述第二方差集合以获取筛查准确度指标,所述更新方法满足以下关系式:[0105][0106]其中,s2e代表所述第二方差集合中第e个方差数据,k代表所述第二方差集合中数据的峰度,ee代表第e个更新之后的方差数据,由于所述第二方差集合中包含20个方差数据,因此更新后的方差数据有20个,记为{e1,e2,…,e20}。[0107]该可选的实施例中,可将所述更新后的方差数据{e1,e2,…,e20}作为所述筛查准确度指标。[0108]如此,将所述测试数据输入所述数据系统的应用程序获得结果数据,进一步基于所述结果数据构建了所述测试指标,能够为后续计算数据系统综合指标提供数据支撑,从而提升后续评估结果的准确性。[0109]s12,计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度。[0110]请参见图3,在一个可选的实施例中,计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度包括:[0111]s121,计算所述加工准确度指标和筛查准确度指标的方差和协方差以构建协方差矩阵。[0112]该可选的实施例中,所述协方差矩阵的构建方式为,计算所述加工准确度指标与筛查准确度指标的协方差,将所述协方差作为所述协方差矩阵中左下角与右上角的元素,将加工准确度指标和筛查准确度指标的方差作为所述协方差矩阵中左上角与右下角的元素,所述协方差的计算公式为:[0113][0114]其中,cov代表所述加工准确度指标与所述筛查准确度指标的协方差,s1i代表第i个加工准确度指标,ei代表第i个筛查准确度指标。[0115]s122,计算所述协方差矩阵的特征值作为指标重要性,所述特征值包括加工特征值和筛查特征值。[0116]该可选的实施例中,可将所述协方差矩阵记为m,将所述协方差矩阵m的特征值记为α,所述特征值α需满足的条件为|α·i-z|=0,其中i为内部元素全为1的单位矩阵且i的维度与m相同,由于所述m包含两个维度,因此依据所述条件可获得所述矩阵m的特征值α1与α2。其中,若所述α1所在的行与所述加工准确度的方差所在的行相同,则α1的值用以表征所述加工准确度的重要程度;若所述α2所在的行与所述筛查准确度的方差所在的行相同,则α2的值用以表征所述筛查准确度的重要程度。[0117]该可选的实施例中,可将所述特征值α1与α2作为所述指标重要性。[0118]如此,通过构建所述加工准确度指标和筛查准确度指标的协方差矩阵获取了所述指标重要性,为后续建立自定义整合模型提供了数据支撑,从而能够提高所述测试指标的准确度。[0119]s13,将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度。[0120]该可选的实施例中,在将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标之前,所述方法还包括:[0121]依据预设的标准化方法计算所述指标重要性以获取归一化的指标重要性,所述归一化的指标重要性包括归一化的加工特征值和归一化的筛查特征值。[0122]该可选的实施例中,所述预设的标准化方法可以是极大化法,所述极大化法的具体实施方式为,记所述特征值α1与α2中的最大值为αmax,依据所述特征值α1与α2和所述最大值αmax计算所述归一化的指标重要性,具体计算方式为:[0123][0124][0125]其中,β1代表所述归一化的加工特征值,所述β1的值越大则表明所述加工准确度的重要性越高;β2代表所述归一化的筛查特征值,所述β2的值越大则表明所述筛查准确度的重要性越高;α1代表所述加工特征值;α2代表所述筛查特征值;αmax代表所述α1与α2中的最大值。[0126]该可选的实施例中,可基于所述归一化的指标重要性构建自定义整合模型,所述自定义整合模型用以整合所述加工准确度指标和筛查准确度指标,所述自定义整合模型满足以下公式:[0127][0128]其中,t代表所述更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度;β1代表所述归一化的加工特征值,用以表征加工准确度的重要性;β2代表所述归一化的筛查特征值,用以表征筛查准确度的重要性;mean1代表所述加工准确度指标的平均值,mean2代表所述筛查准确度指标的平均值。[0129]该可选的实施例中,可将所述t的值作为所述数据系统的更新指标。[0130]如此,通过对指标重要性进行归一化处理能够降低由于指标重要性的数量级差异导致的误差,并依据归一化的指标重要性建立了自定义整合模型用以整合所述加工准确度指标和筛查准确度指标,并最终获得了更新指标,用以表征数据系统加工链路的准确度,便于后续进行数据系统的评估。[0131]s14,基于所述更新指标评估所述数据系统以获取测试结果。[0132]该可选的实施例中,可依据预设的阈值和所述数据系统的更新指标评估所述数据系统以获取测试结果,测试人员可基于测试经验设置阈值,所述预设的阈值可记为t,示例性的,t可以是0.9,若所述数据系统的更新指标t大于t,则可判断该数据系统合格,否则该数据系统不合格,可记测试结果为r,r的计算方式为:[0133][0134]该可选的实施例中,可将r代表的结果作为所述测试结果。[0135]如此,通过对比预设阈值与所述数据系统的更新指标获得了测试结果,所述预设阈值可由开发人员基于企业需求制定,因此所述测试结果的获取方式较为灵活。[0136]上述基于人工智能的数据系统测试方法通过对数据系统的不同程序单独测试以获得测试指标,并基于所述测试指标计算不同程序的权重,基于所述权重构建数据系统更新指标以评估数据系统的性能,考虑了不同程序的测试结果的重要性,相较于现有的测试方法,测试结果的准确度更高。[0137]如图4所示,是本技术实施例提供的基于人工智能的数据系统测试装置的较佳实施例的功能模块图。基于人工智能的数据系统测试装置11包括获取单元110、测试单元111、计算单元112、整合单元113、评估单元114。本技术所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。[0138]在一个可选的实施例中,获取单元110用于依据预设程序从测试数据库中提取测试数据。[0139]该可选的实施例中,所述开源数据库是按一定结构组织存储的、集成的、可共享的数据的集合,示例性的,所述预设的数据库可以是mysql数据库,所述mysql数据库是一种关系型数据库。[0140]该可选的实施例中,获取所述测试数据的目的是对数据系统进行测试,所述数据系统是为实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质、处理对象和管理系统的集合体。[0141]该可选的实施例中,所述数据系统可接收任意的格式化数据以输出数据处理结果,因此所述测试数据可以是任意格式化的数据,任意开源数据库中的数据均可作为测试数据用以测试所述数据系统,本方案对此不做限定,图6为所述测试数据的示意图。[0142]该可选的实施例中,可在计算机中运行所述预设程序以获取测试数据,示例性的,所述预设程序的形式可以为“select‘table’from‘database’”,其中table代表所述测试数据,database代表所述测试数据所在的数据库的名称,所述table代表的测试数据是表格的形式,其中每行为一条数据,每列为数据的一个字段,示例性的,所述table可以具备n行m列,n可为10000,m可为5,因此所述table包含的字段名称集合可以是{字段1,字段2,字段3,字段4,字段5}。[0143]该可选的实施例中,将所述table代表的数据表作为所述测试数据。[0144]在一个可选的实施例中,测试单元111用于基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度。[0145]该可选的实施例中,所述基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度包括:[0146]将所述测试数据输入所述数据系统以获取加工结果数据和筛查结果数据;[0147]分别计算所述加工结果数据和所述筛查结果数据以获取所述加工准确度指标和所述筛查准确度指标。[0148]该可选的实施例中,所述数据系统包括数据加工程序和数据筛查程序,可将所述测试数据输入所述数据加工程序获取加工结果数据,将所述测试数据输入所述数据筛查程序获取筛查结果数据。[0149]该可选的实施例中,所述数据系统包括数据加工程序和数据筛查程序,可将所述测试数据输入所述数据加工程序获取加工结果数据,将所述测试数据输入所述数据筛查程序获取筛查结果数据。[0150]该可选的实施例中,所述数据加工程序为多个数据运算程序的集合,每个数据运算程序可以是一段sql脚本,所述数据运算程序可以包括求积程序、求商程序、求和程序、求差程序,所述求积程序的形式可为“selecta*bas‘积’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的积;所述求商程序的形式可为“selectc/das‘商’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的商;所述求和程序的形式可为“selecte+fas‘和’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的和;所述求差程序的形式可为“selectg-has‘差’fromtable”,其功能为计算所述测试数据中每条数据某两个字段的差。[0151]该可选的实施例中,所述将所述测试数据输入所述数据加工程序获取加工结果数据的具体实施步骤为:[0152]将所述测试数据输入所述求积程序以获取测试数据的乘积p,所述p包含10000个乘积,所述求积程序中的a可以代表所述table中的字段1,b可以代表所述table中的字段2;[0153]将所述测试数据输入所述求商程序以获取测试数据的商值q,所述q包含10000个商,所述求商程序中的c可以代表所述table中的字段2,d可以代表所述table中的字段3;[0154]将所述测试数据输入所述求和程序以获取测试数据的和值s,所述s包含10000个和值,所述求和程序中的e可以代表所述table中的字段3,f可以代表所述table中的字段4;[0155]将所述测试数据输入所述求差程序以获取测试数据的差值d,所述d包含10000个差值,所述求差程序中的g可以代表所述table中的字段4,h可以代表所述table中的字段5;[0156]逐列排列所述p、q、s和d可获得一个具备10000行4列的矩阵z。[0157]该可选的实施例中,可重复实施所述获取加工结果数据的步骤n次以获取n组测试结果,示例性的,n可以是20,每次实施所述获取加工结果数据的步骤可获得一个对应的矩阵,因此可获取20个10000*4的矩阵,记所述20个矩阵的集合为z,可以表示为z={z1,z2,…,z20}。[0158]该可选的实施例中,所述数据筛查程序可以是一段sql脚本,其功能是筛选出满足预设筛查条件的数据,其形式可以是“selectdatafromtablewhere‘condition’”,其中,data代表所述筛查程序的返回值所在的字段,示例性的,data=“字段4”,table代表所述测试数据,condition代表所述预设筛查条件。[0159]该可选的实施例中,所述预设筛查条件可以是“rownum=3”,其含义为筛选出所述测试数据中第3行第4列的数据,所述将所述测试数据输入所述数据筛查程序以获取筛查结果数据的具体实施步骤为,运行所述数据筛查程序以获取满足所述预设筛查条件的返回值,所述返回值为所述测试数据中第3行第4列的数据。[0160]该可选的实施例中,可重复所述获取筛查结果数据的方法m次以获取筛查结果数据,示例性的,m可以是20,因此所述筛查结果数据可以是数据集合{data1,data2,…,data20},其中每个数据的下标代表所述筛查结果的次序。[0161]该可选的实施例中,可将所述矩阵集合z={z1,z2,…,z20}作为所述加工结果数据,可将所述数据集合{data1,data2,…,data20}作为所述筛查结果数据。[0162]该可选的实施例中,可依据预设的距离度量方法计算所述加工结果数据的距离数据,所述距离数据用以表征所述加工结果数据的相似程度;再计算所述举例数据的方差以获取加工准确度指标。以所述矩阵集合z中的z1和z2为例,所述预设的距离度量方法的实施步骤为:[0163]基于余弦距离公式计算z1的第一列数据与z2的第一列数据之间的余弦距离并记为sd11,21,所述余弦距离公式为:[0164][0165]其中,a代表所述z1的第一列向量;b代表所述z2的第一列向量,sd11,21代表所述a与b的余弦距离,ai代表向量a中第i个维度的数值,bi代表向量b中第i个维度的数值,k代表所述向量a和向量b的维度;[0166]基于上述余弦距离公式分别计算所述z1和z2中其余三列数据对应的余弦距离并记为sd12,22、sd13,23和sd14,24;[0167]计算所述sd11,21、sd12,22、sd13,23和sd14,24的均值并记为sd,所述sd代表的均值用以表征所述矩阵z1和z2之间的相似程度,所述sd的值越大则表明所述矩阵z1和z1的相似度越低。[0168]该可选的实施例中,由于所述矩阵集合z包含20个矩阵,因此其中两两矩阵之间的距离数据有190个,记为sdu={sd1,sd2,…,sd190},所述sdu即为所述加工结果数据的距离数据。[0169]该可选的实施例中,可计算所述距离数据的方差以获取加工准确度指标,所述距离数据的方差的计算公式为:[0170][0171]其中,s1代表所述190个距离数据的方差,sdi代表所述sdu中第i个距离数据,所述s1的值越高则表明所述加工结果数据之间的相似度越高,进而表明加工准确度越高。[0172]该可选的实施例中,可重复所述方差s1的获取方式20次以获得第一方差集合s1_z={s11,s12,…,s120},其目的是对所述数据加工程序进行多次测试以模拟所述数据系统在较高负载环境下的工作情况,以测试所述数据系统中数据加工程序的稳定性,可将所述第一方差集合s1_z作为所述加工准确度指标。[0173]该可选的实施例中,可多次计算所述筛查结果数据的第二方差集合,再依据自定义聚合度度量方法计算所述第二方差集合中数据的聚合度以获取筛查准确度指标。其中所述筛查结果数据的方差的计算方式为:[0174][0175]其中,s2代表所述筛查结果数据的方差,所述s2的值越大则表明所述筛查数据的聚合程度越低,各个筛查结果数据之间的差异较大,筛查准确度较低;datai代表所述筛查结果数据中的第i个数据。[0176]该可选的实施例中,可重复所述s2的获取方式20次以获得第二方差集合s2_z={s21,s22,…,s220},其目的是对所述筛查程序进行多次测试以模拟所述数据系统在较高负载环境下的工作情况,以测试所述数据系统中程序的稳定性。[0177]该可选的实施例中,可依据自定义聚合度度量方法计算所述第二方差集合中数据的聚合度以获取筛查准确度指标,所述自定义的聚合度度量方法的具体实施步骤为:[0178]计算所述第二方差集合中数据的峰度,所述第二方差集合的峰度的计算公式为:[0179][0180]其中,k代表所述第二方差集合中数据的峰度,所述k代表的峰度用以表征所述第二方差集合中数据的聚合程度,所述k的值越大则所述第二方差集合中的数据的聚合程度越高,所述k的取值范围是[1,∞);s2j代表所述第二方差集合中的第j个数据,μ代表所述第二方差集合的均值,σ代表所述第二方差集合的标准差;[0181]基于所述第二方差集合中数据的峰度更新所述第二方差集合以获取筛查准确度指标,所述更新方法满足以下关系式:[0182][0183]其中,s2l代表所述第二方差集合中第l个方差数据,k代表所述第二方差集合中数据的峰度,el代表第l个更新之后的方差数据,由于所述第二方差集合中包含20个方差数据,因此所述更新后的方差数据有20个,记为{e1,e2,…,e20}。[0184]该可选的实施例中,可将所述更新后的方差数据{e1,e2,…,e20}作为所述筛查准确度指标。[0185]在一个可选的实施例中,计算单元112用于计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度。[0186]该可选的实施例中,所述计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度包括:[0187]计算所述加工准确度指标和筛查准确度指标的方差和协方差以构建协方差矩阵;[0188]计算所述协方差矩阵的特征值作为所述指标重要性,所述指标重要性包括加工特征值和筛查特征值。[0189]该可选的实施例中,所述协方差矩阵的构建方式为,计算所述加工准确度指标与筛查准确度指标的协方差,将所述协方差作为所述协方差矩阵中左下角与右上角的元素,将加工准确度指标和筛查准确度指标的方差作为所述协方差矩阵中左上角与右下角的元素,所述协方差的计算公式为:[0190][0191]其中,cov代表所述加工准确度指标与所述筛查准确度指标的协方差,s1i代表第i个加工准确度指标,ei代表第i个筛查准确度指标。[0192]该可选的实施例中,可将所述协方差矩阵记为m,将所述协方差矩阵m的特征值记为α,所述特征值α需满足的条件为|α·i-z|=0,其中i为内部元素全为1的单位矩阵且i的维度与m相同,由于所述m包含两个维度,因此依据所述条件可获得所述矩阵m的特征值α1与α2。其中,若所述α1所在的行与所述加工准确度的方差所在的行相同,则α1的值用以表征所述加工准确度的重要程度;若所述α2所在的行与所述筛查准确度的方差所在的行相同,则α2的值用以表征所述筛查准确度的重要程度。[0193]该可选的实施例中,可将所述特征值α1与α2作为所述指标重要性。[0194]在一个可选的实施例中,计算单元113用于将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度。[0195]该可选的实施例中,在将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标之前,所述方法还包括:[0196]依据预设的标准化方法计算所述指标重要性以获取归一化的指标重要性,所述归一化的指标重要性包括归一化的加工特征值和归一化的筛查特征值。[0197]该可选的实施例中,可依据预设的标准化方法计算所述指标重要性以获取归一化的指标重要性,所述预设的标准化方法可以是极大化法,所述极大化法的具体实施方式为,记所述特征值α1与α2中的最大值为αmax,依据所述特征值特征值α1与α2和所述最大值αmax计算所述归一化的指标重要性,具体计算方式为:[0198][0199][0200]其中,β1代表所述归一化的加工特征值,所述β1的值越大则表明所述加工准确度的重要性越高;β2代表所述归一化的筛查特征值,所述β2的值越大则表明所述筛查准确度的重要性越高;α1代表所述加工特征值;α2代表所述筛查特征值;αmax代表所述α1与α2中的最大值。[0201]该可选的实施例中,可基于所述归一化的指标重要性构建自定义整合模型,所述自定义整合模型用以整合所述加工准确度指标和筛查准确度指标,所述自定义整合模型满足以下公式:[0202][0203]其中,t代表所述更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度;β1代表所述归一化的加工特征值,用以表征加工准确度的重要性;β2代表所述归一化的筛查特征值,用以表征筛查准确度的重要性;mean1代表所述加工准确度指标的平均值,mean2代表所述筛查准确度指标的平均值。[0204]该可选的实施例中,可将所述t作为所述数据系统的更新指标。[0205]在一个可选的实施例中,评估单元114用于基于所述更新指标评估所述数据系统以获取测试结果。[0206]该可选的实施例中,可依据预设的阈值和所述数据系统的更新指标评估所述数据系统以获取测试结果,测试人员可基于测试经验设置阈值,所述预设的阈值可记为t,示例性的,t可以是0.9,若所述数据系统的更新指标t大于t,则可判断该数据系统合格,否则该数据系统不合格,可记测试结果为r,r的计算方式为:[0207][0208]该可选的实施例中,可将r代表的结果作为所述测试结果。[0209]上述基于人工智能的数据系统测试方法通过对数据系统的不同程序单独测试以获得测试指标,并基于所述测试指标计算不同程序的权重,基于所述权重构建数据系统更新指标以评估数据系统的性能,考虑了不同程序的测试结果的重要性,相较于现有的测试方法,测试结果的准确度更高。[0210]如图5所示,是本技术实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令,处理器13用执行储器中存储的计算机可读指令以实现上述任一实施例的基于人工智能的数据系统测试方法。[0211]在一个可选的实施例中,电子设备1还包括总线、存储在存储器12中并可在处理器13上运行的计算机程序,例如基于人工智能的数据系统测试程序。[0212]图5仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图5示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。[0213]结合图1,电子设备1中的存储器12存储多个计算机可读指令以实现一种基于人工智能的数据系统测试方法,处理器13可执行多个指令从而实现:[0214]依据预设程序从开源数据库提取测试数据,所述测试数据为格式化的数据;[0215]基于所述测试数据测试所述数据系统以获取测试指标,所述测试指标包括加工准确度指标和筛查准确度指标,所述加工准确度指标用以表征所述数据系统进行数据加工的准确度,所述筛查准确度指标用以表征所述数据系统进行数据筛查的准确度;[0216]计算所述加工准确度指标和筛查准确度指标的特征值以获取指标重要性,所述指标重要性用以表征所述筛查准确度和加工准确度的重要程度;[0217]将所述指标重要性和所述测试指标输入自定义整合模型获取整合结果并作为更新指标,所述更新指标用以表征所述数据系统在进行数据筛查和数据加工链路测试任务时的准确度;[0218]基于所述更新指标评估所述数据系统以获取测试结果。[0219]具体地,处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。[0220]本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,电子设备1既可以是总线型结构,也可以是星形结构,电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如电子设备1还可以包括输入输出设备、网络接入设备等。[0221]需要说明的是,电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本技术,也应包含在本技术的保护范围以内,并以引用方式包含于此。[0222]其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质可以是非易失性的,也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smartmediacard,smc)、安全数字(securedigital,sd)卡、闪存卡(flashcard)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于人工智能的数据系统测试程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。[0223]处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(centralprocessingunit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(controlunit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在存储器12内的程序或者模块(例如执行基于人工智能的数据系统测试程序等),以及调用存储在存储器12内的数据,以执行电子设备1的各种功能和处理数据。[0224]处理器13执行电子设备1的操作系统以及安装的各类应用程序。处理器13执行所述应用程序以实现上述各个基于人工智能的数据系统测试方法实施例中的步骤,例如图1所示的步骤。[0225]示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在存储器12中,并由处理器13执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如,所述计算机程序可以被分割成获取单元110、测试单元111、计算单元112、整合单元114、评估单元115。[0226]上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本技术各个实施例所述基于人工智能的数据系统测试方法的部分。[0227]电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。[0228]其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存储器及其他存储器等。[0229]进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。[0230]本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。[0231]总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图5中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现存储器12以及至少一个处理器13等之间的连接通信。[0232]本技术实施例还提供一种计算机可读存储介质(图未示),计算机可读存储介质中存储有计算机可读指令,计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于人工智能的数据系统测试方法。[0233]在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。[0234]所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。[0235]另外,在本技术各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。[0236]此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。[0237]最后应说明的是,以上实施例仅用以说明本技术的技术方案而非限制,尽管参照较佳实施例对本技术进行了详细说明,本领域的普通技术人员应当理解,可以对本技术的技术方案进行修改或等同替换,而不脱离本技术技术方案的精神和范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1