本发明涉及测试数据构件,具体而言,涉及一种测试数据构建方法、装置、电子设备和存储介质。
背景技术:
1、风险模型的迭代速度影响了金融业务开展的快慢,模型上线需要经历开发、测试、发布等多个阶段。风控模型的测试结果直接影响后期模型上线后的风控表现。测试阶段的工作繁重,尤其在对公领域,智能化审批模型的规则多、维度高、勾稽强,对测试用例要求高、难度大。风控模型对于测试用力的要求包括:测试用例要求高内聚低耦合,每个测试用例应尽量独立,不依赖或影响其他测试用例;测试用例的上下文有一定的顺序性,需满足一定前置条件;测试用例的测试点需要全面覆盖所有测试分支;测试用例的个数与模型策略的复杂度正相关,呈几何指数增长;测试用例必须可回归。
2、而在实际操作中,传统的模型测试阶段需要业务人员编写大量的测试数据进行测试,很难满足以上要求。现有技术在编写测试用例时的问题在于:测试数据准备周期长、数据量大、人力成本高;测试数据覆盖面不全,很难覆盖所有条件分支;测试数据质量差,与真实金融场景差异大,指标间的逻辑关系经常被忽略;测试数据复用性较低,测试数据很难应用到新的风控模型;测试数据链路不完整,涉及多个业务系统集成测试时,需要在多个系统埋入统一构建的测试数据,往往会出现数据主体信息不一致的情况。
3、本领域需要提供一种测试数据构建方法、装置、电子设备和存储介质,其能够克服现有技术的缺陷。
技术实现思路
1、本发明提供了一种测试数据构建方法、装置、电子设备和存储介质。其能够解决现有技术存在的问题。本发明的目的通过以下技术方案得以实现。
2、第一方面,本发明的一个实施方式提供了一种测试数据构建方法,其用于生成风险模型的测试数据,测试数据构建方法包括多个步骤:
3、步骤1:根据业务场景建立测试数据框架;
4、步骤2:根据业务场景定义测试数据的生成标准和衍生规则;
5、步骤3:根据业务场景中的数据配置生成器,其中,生成器用于根据生成标准和衍生规则生成测试数据;以及
6、步骤4:使用生成器生成测试数据。
7、根据本发明的上述一个实施方式提供的测试数据构建方法,其中测试数据框架包括指标、实体和案例,指标与业务场景中的具体数据相对应,实体与业务场景中的业务实体相对应且每个实体包括多个指标,案例与业务场景中的案例相对应且每个案例包括多个实体。
8、根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标根据指标生成标准生成,指标生成标准包括指标类型、数据类型和指标名称,每个指标数据还包括阈值、精度、步长、字典码和/或正则表达式。
9、根据本发明的上述一个实施方式提供的测试数据构建方法,其中实体根据实体生成标准生成,实体生成标准包括实体类型、实体表达式列表和实体指标生成标准列表,实体表达式列表用于定义实体指标列表中包含的各个指标之间的关系,实体指标生成标准列表用于定义实体所包括的各个指标的生成标准。
10、根据本发明的上述一个实施方式提供的测试数据构建方法,其中案例根据案例生成标准生成,案例生成标准包括案例表达式列表和案例指标生成标准列表,案例表达式列表用于定义案例指标列表中包含的各个指标之间的关系,案例指标生成标准列表用于定义实体所包括的各个指标的生成标准。
11、根据本发明的上述一个实施方式提供的测试数据构建方法,其中步骤2:根据业务场景定义测试数据的生成标准和衍生规则包括下列步骤:
12、步骤21:根据业务场景涉及的数据确定指标生成标准;
13、步骤22:根据业务场景涉及的实体确定实体生成标准;
14、步骤23:根据业务场景确定案例生成标准;以及
15、步骤24:确定指标、实体和案例的衍生规则。
16、根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标类型包括一般指标、关注指标和关系指标。
17、根据本发明的上述一个实施方式提供的测试数据构建方法,其中数据类型包括数值型、浮点型、字典型和字符型。
18、根据本发明的上述一个实施方式提供的测试数据构建方法,其中衍生规则是生成测试数据的算法,衍生规则包括根据指标类型生成指标数据或者根据业务场景的业务数据的数据分布设定对应的概率分布或通过自学习概率分布生成指标数据。
19、第二方面,本发明的一个实施方式提供了一种测试数据构建装置,包括:
20、框架构筑单元,被配置成根据业务场景建立测试数据框架;
21、定义单元,被配置成根据业务场景定义测试数据的生成标准和衍生规则;
22、配置单元,被配置成根据业务场景中的数据配置数据生成器;
23、生成单元,被配置成根据测试数据的衍生规则并使用数据生成器生成测试数据。
24、第三方面,本发明的一个实施方式提供了一种电子设备,其包括:
25、一个或多个处理器;
26、存储装置,其上存储有一个或多个程序,
27、当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如前述的测试数据构建方法。
28、第四方面,本发明的一个实施方式提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序被一个或多个处理器执行时实现前述的测试数据构建方法。
29、根据本发明实施方式的测试数据构建方法、装置、电子设备和存储介质的优点在于:使用了数字孪生的思想,将真实的金融业务场景映射到数字空间,建立对应的测试数据框架;通过定义数据分层、核定数据标准、实现数据算法,制定了一套“以实到虚”的全要素多层级映射方案,完成现实到虚拟的映射,进行可收敛的数据衍生,从而自动形成测试数据,构建用于风险模型测试的案例库;测试数据能够按照预设的数据标准与算法进行衍生,通过数据的衍生,自动搭建案例库,实现了测试数据的自动生成与复用;不需人工手动录入数据,大大缩短了数据的准备周期,解决了数据准备周期长、人力成本高、数据复用性差的问题;数据衍生能够基于标准或概率,数据由程序自动演算,解决了测试数据的数据质量差、覆盖面不全,数据链路不完整等问题。
1.一种测试数据构建方法,其特征在于,其包括多个步骤:
2.根据权利要求1所述的测试数据构建方法,其特征在于,测试数据框架包括指标、实体和案例,指标与业务场景中的具体数据相对应,实体与业务场景中的业务实体相对应且每个实体包括多个指标,案例与业务场景中的案例相对应且每个案例包括多个实体。
3.根据权利要求2所述的测试数据构建方法,其特征在于,指标根据指标生成标准生成,指标生成标准包括指标类型、数据类型和指标名称,每个指标数据还包括阈值、精度、步长、字典码和/或正则表达式。
4.根据权利要求3所述的测试数据构建方法,其特征在于,实体根据实体生成标准生成,实体生成标准包括实体类型、实体表达式列表和实体指标生成标准列表,实体表达式列表用于定义实体指标列表中包含的各个指标之间的关系,实体指标生成标准列表用于定义实体所包括的各个指标的生成标准。
5.根据权利要求4所述的测试数据构建方法,其特征在于,案例根据案例生成标准生成,案例生成标准包括案例表达式列表和案例指标生成标准列表,案例表达式列表用于定义案例指标列表中包含的各个指标之间的关系,案例指标生成标准列表用于定义实体所包括的各个指标的生成标准。
6.根据权利要求5所述的测试数据构建方法,其特征在于,步骤2:根据业务场景定义测试数据的生成标准和衍生规则包括下列步骤:
7.根据权利要求6所述的测试数据构建方法,其特征在于,指标类型包括一般指标、关注指标和关系指标。
8.根据权利要求6所述的测试数据构建方法,其特征在于,数据类型包括数值型、浮点型、字典型和字符型。
9.根据权利要求7所述的测试数据构建方法,其特征在于,衍生规则是生成测试数据的算法,衍生规则包括根据指标类型生成指标数据或者根据业务场景的业务数据的数据分布设定对应的概率分布或通过自学习概率分布生成指标数据。
10.一种测试数据构建装置,其特征在于,包括:
11.一种电子设备,其特征在于,其包括:
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被一个或多个处理器执行时实现如权利要求1-9中任一所述的方法。