数据文本生成装置和方法与流程

文档序号:15271644发布日期:2018-08-28 22:30阅读:161来源:国知局

本申请涉及数据处理技术领域,尤其涉及一种数据文本生成装置和方法。



背景技术:

目前较多的计算机系统都是以数据文本为载体进行系统间的批量数据传输,即数据源系统将数据批量写入文本,通过网络传输至数据应用系统。

采用此类数据传输机制,数据应用系统自身功能的测试验证过程包括:数据源系统预埋数据—数据源系统批量生成数据文本—数据源系统下发数据文本至数据应用系统—数据应用系统使用数据源系统下发的数据文本进行功能测试验证。

显然,目前数据应用系统的功能测试验证完全依赖于数据源系统的数据文本下发,这样的强耦合性很有可能导致数据应用系统的功能测试受数据源系统的数据质量、数据多样性及数据文本下发时效性等因素影响。



技术实现要素:

有鉴于此,本申请提供一种数据文本生成装置和方法,在满足数据应用系统的功能测试验证需求的情况下,减少对数据源系统的过度依赖。技术方案如下:

基于本申请的一方面,本申请提供一种数据文本生成装置,包括:

用于接收数据文本结构的数据文本结构管理模块,所述数据文本结构包括多个字段、以及各个字段的字段结构信息;

用于对所述数据文本结构中各个字段的字段内容进行配置的数据文本字段内容配置模块;

用于对数据文本的格式进行配置的数据文本格式配置模块;

用于依据所述数据文本结构、所述数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本的数据文本生成模块。

可选地,所述数据文本字段内容配置模块对所述数据文本结构中各个字段的字段内容进行配置包括:

所述数据文本字段内容配置模块对所述数据文本结构中各个字段的字段内容的生成方式进行配置。

可选地,所述字段内容的生成方式包括以下至少一种:

默认值生成数据方式、列表取值生成数据方式、范围取值生成数据方式、日期仿真器生成方式、ip仿真器生成方式、url仿真器生成方式、地址仿真器生成方式、电话号码仿真器生成方式、电子邮箱仿真器生成方式、身份证仿真器生成方式、所在城市仿真器生成方式、姓名仿真器生成方式、营业执照仿真器生成方式、邮政编码仿真器生成方式、正则表达式生成方式。

可选地,所述字段结构信息包括字段名称、字段顺序、字段类型、字段长度;

所述数据文本的格式包括字段间分隔符、文件名格式、文件编码。

可选地,所述数据文本结构管理模块还用于存储接收到的数据文本结构,以及用于提供选择不同数据文本结构的接口。

可选地,所述装置还包括:

用于接收数据文本,并识别接收到的数据文本的数据文本结构的数据文本识别模块;

用于将识别到的的数据文本的数据文本结构与所述数据文本结构管理模块存储的数据文本结构进行比较,得到差异信息,并输出所述差异信息的数据文本管理模块。

基于本申请的另一方面,本申请提供一种数据文本生成方法,应用于前文所述的数据文本生成装置中,所述方法包括:

接收数据文本结构,所述数据文本结构包括多个字段、以及各个字段的字段结构信息;

对所述数据文本结构中各个字段的字段内容进行配置;

对数据文本的格式进行配置;

依据所述数据文本结构、所述数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本。

可选地,所述对所述数据文本结构中各个字段的字段内容进行配置包括:

对所述数据文本结构中各个字段的字段内容的生成方式进行配置。

可选地,所述字段内容的生成方式包括以下至少一种:

默认值生成数据方式、列表取值生成数据方式、范围取值生成数据方式、日期仿真器生成方式、ip仿真器生成方式、url仿真器生成方式、地址仿真器生成方式、电话号码仿真器生成方式、电子邮箱仿真器生成方式、身份证仿真器生成方式、所在城市仿真器生成方式、姓名仿真器生成方式、营业执照仿真器生成方式、邮政编码仿真器生成方式、正则表达式生成方式。

可选地,所述字段结构信息包括字段名称、字段顺序、字段类型、字段长度;

所述数据文本的格式包括字段间分隔符、文件名格式、文件编码。

本申请提供的数据文本生成装置和方法中,通过数据文本结构管理模块接收数据文本结构,利用数据文本字段内容配置模块实现对数据文本结构中各个字段的字段内容的配置,利用数据文本格式配置模块实现对数据文本的格式的配置,最后由数据文本生成模块依据数据文本结构、数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本。本申请生成的数据文本无论从文本格式、文本内容上还是数据准备的效率上,都完全满足数据应用系统的功能测试验证需求。且本申请利用数据文本生成装置生成数据文本,代替数据源系统下发数据文本,使得数据应用系统自身功能的测试验证过程优化为:数据文本生成装置生成数据文本—数据应用系统使用数据文本生成装置生成的数据文本进行功能测试验证,有效避免了对数据源系统的过度依赖。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种数据文本生成装置的结构示意图;

图2为本申请实施例中数据文本结构的示意图;

图3为本申请实施例提供的另一种数据文本生成装置的结构示意图;

图4为本申请实施例提供的一种数据文本生成方法的流程图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,数据应用系统自身功能的测试验证过程包括:数据源系统预埋数据—数据源系统批量生成数据文本—数据源系统下发数据文本至数据应用系统—数据应用系统使用数据源系统下发的数据文本进行功能测试验证。

针对目前现有的数据应用系统自身功能的测试验证过程,本申请的申请人发现,数据应用系统的功能测试验证完全依赖于数据源系统的数据文本下发,这样的强耦合性很有可能导致数据应用系统的功能测试受数据源系统的数据质量、数据多样性及数据文本下发时效性等因素影响。且,该方法需要数据应用系统的测试人员充分了解数据源系统的业务逻辑和数据文本的传输机制以进行数据预埋和数据文本传输,这就导致数据应用系统测试学习成本增加,且数据准备环节和干系人的增加,由此导致测试过程的沟通成本上升。

针对此,本申请的申请人进一步发现,从测试方法上考虑,数据应用系统自身功能测试验证过程中,对数据文本的来源并不敏感,其关心的是数据文本的文本内容和文本格式是否符合功能验证的需求。

基于此,本申请的主要设计思想之一包括但不限于,利用本申请提供的数据文本生成装置生成数据文本,代替数据源系统下发数据文本,由此使得数据应用系统自身功能的测试验证过程优化为:数据文本生成装置生成数据文本—数据应用系统使用数据文本生成装置生成的数据文本进行功能测试验证。显然采用本申请提供的数据文本生成装置生成数据文本,代替数据源系统下发数据文本,裁剪了数据源系统数据预埋和数据文本传输环节,自然减少了测试人员的学习成本和沟通成本。且,本申请提供的数据文本生成装置生成的数据文本能够满足数据应用系统的功能测试验证需求,不会影响数据应用系统的测试效果,数据应用系统在一定程度上可以独立地生成测试数据进行功能测试验证,有效避免了对数据源系统的过度依赖。

具体地,本申请提供的数据文本生成装置如图1所示,包括:数据文本结构管理模块10、数据文本字段内容配置模块20、数据文本格式配置模块30和数据文本生成模块40。其中,

数据文本结构管理模块10用于接收数据文本结构,其中数据文本结构包括多个字段、以及各个字段的字段结构信息。

一般地,用户通过数据文本结构管理模块10上传数据文本结构,即数据文本结构管理模块10接收用户上传的数据文本结构。具体地,用户可以将数据文本结构记载在excel文档中,将包含数据文本结构的excel文档上传至数据文本结构管理模块10,该上传的数据文本结构将作为后续生成数据文本时的文本结构依据。

数据文本结构中包括多个字段,以及各个字段的字段结构信息,其中字段结构信息可以包括字段名称、字段顺序、字段类型、字段长度等结构信息,例如图2所示,其中图2仅示例性地示出了一部分结构信息,图2不作为本申请的限定。

可以理解地,本申请中的数据文本结构指的是,数据文本由哪些字段组成、字段顺序是什么、每个字段的类型是什么、字段长度约束是多少等等。举例来说,当需生成记录用户信息的数据文本,用户信息包括:用户姓名、用户年龄、用户性别时,该数据文本对应的数据文本结构所包含的信息应包括:

(1)数据文本结构包含三个字段,分别为:用户姓名、用户年龄、用户性别;

(2)数据文本结构包含的三个字段顺序从左到右依次为:用户姓名、用户年龄、用户性别;

(3)数据文本结构包含的三个字段的字段长度分别为:用户姓名10个字符、用户年龄10个字符、用户性别2个字符。

也就是,本申请中的数据文本结构为数据文本的具体结构。

在实际应用中,数据文本包含两种属性,一种是数据内容,一种是数据内容的组成方式,也就是数据文本的具体结构。举例来说,对于“123456”而言,数据内容是“123456”,数据文本的具体结构是“前三个字符为用户名、后三个字符为密码”,也就是,数据文本的具体结构包括两个字段,第一个字段,即前三个字符“123”用于表示用户名,第二个字段,即后三个字符“456”用于表示密码。

数据文本字段内容配置模块20以数据文本结构为基础,对数据文本结构中各个字段的字段内容进行配置。

具体地,本申请中数据文本字段内容配置模块20对数据文本结构中各个字段的字段内容进行配置的实现方式可以具体为:对数据文本结构中各个字段的字段内容的生成方式进行配置,从而在具体生成字段内容时,采用为各个字段配置的生成方式来生成相应的字段内容。

在本申请实际应用过程中,为各个字段的字段内容配置的生成方式包括各种仿真数据生成器和生成算法,可以包括以下至少一种:默认值生成数据方式、列表取值生成数据方式、范围取值生成数据方式、日期仿真器生成方式、ip仿真器生成方式、url仿真器生成方式、地址仿真器生成方式、电话号码仿真器生成方式、电子邮箱仿真器生成方式、身份证仿真器生成方式、所在城市仿真器生成方式、姓名仿真器生成方式、营业执照仿真器生成方式、邮政编码仿真器生成方式、正则表达式生成方式等。

仍以前述生成记录用户信息的数据文本为例。数据文本字段内容配置模块20可以配置“用户姓名”字段的生成方式为姓名仿真器生成方式,配置“用户年龄”字段的生成方式为范围取值生成数据方式,配置“用户性别”字段的生成方式为范围取值生成数据方式。

数据文本字段内容配置模块20作为本申请提供的数据文本生成装置的核心功能模块,其字段内容配置的灵活性、字段内容生成方式的丰富性直接决定了数据文本生成装置的可用性。本申请通过设计十五种仿真数据生成器和生成算法,足以满足数据定向生成的需求。

数据文本格式配置模块30对数据文本的格式进行配置。

其中数据文本的格式可以包括数据文本的字段间分隔符、文件名格式、文件编码等文本格式相关信息。

仍以前述生成记录用户信息的数据文本为例。如果数据文本格式配置模块30定义两个字段间使用一个分隔符“/”,那么生成的数据文本中各字段间将以“/”分隔,举例来说,如“张三/25/男”,由此通过分隔符“/”,可以清楚地分辨出不同字段内容。

数据文本生成模块40依据所述数据文本结构、所述数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本。

本申请中,数据文本结构说明了数据文本中包含哪些字段、字段的顺序如何,每个字段的最大长度是多少等字段结构信息。字段内容指的是字段的值。数据文本的格式包含了字段间采用的分隔符、文件名格式、文件编码等信息。数据文本生成模块40依据数据文本结构、数据文本结构中各个字段的字段内容、以及数据文本的格式,能够直接生成数据文本。对于生成的数据文本,用户可直接从数据文本生成模块40中下载所需的数据文本。

数据文本生成的实质,是将满足测试验证需求的字段内容,按照规范的格式写入数据文本。本申请中的数据文本格式配置模块30实现对数据文本的格式的配置,数据文本字段内容配置模块20通过提供个性化的字段内容生成方式来配置各个字段的值,这样生成的数据文本无论从格式上、文本数据内容上还是数据准备的效率上,都完全满足测试验证的需求。因此,数据应用系统在一定程度上可以独立地生成测试数据进行功能测试验证,避免了对数据源系统的过度依赖。

因此应用本申请提供的数据文本生成装置,通过数据文本结构管理模块10接收数据文本结构,利用数据文本字段内容配置模块20实现对数据文本结构中各个字段的字段内容的配置,利用数据文本格式配置模块30实现对数据文本的格式的配置,最后由数据文本生成模块40依据数据文本结构、数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本。本申请生成的数据文本无论从文本格式、文本内容上还是数据准备的效率上,都完全满足数据应用系统的功能测试验证需求。且本申请利用数据文本生成装置生成数据文本,代替数据源系统下发数据文本,使得数据应用系统自身功能的测试验证过程优化为:数据文本生成装置生成数据文本—数据应用系统使用数据文本生成装置生成的数据文本进行功能测试验证,有效避免了对数据源系统的过度依赖。

在上述实施例的基础上,可选地,本申请中的数据文本结构管理模块10还可以用于存储接收到的数据文本结构,以及用于提供选择不同数据文本结构的接口。

在本申请实际应用过程中,数据文本结构管理模块10可以将接收到的所有数据文本结构按照不同的版本区分存储,并提供供用户用于选择不同数据文本结构的接口。在后续生成数据文本的过程中,如果生成的数据文本的结构在数据文本结构管理模块10中存储,则无需用户再次上传数据文本结构,可以直接由用户通过用于选择不同数据文本结构的接口来选择用户所需的数据文本结构,进而根据数据生成需求,利用数据文本字段内容配置模块20修改各个字段的字段内容的配置信息,利用数据文本格式配置模块30修改数据文本的格式配置信息,进而由数据文本生成模块40重新生成符合需求的数据文本。

本申请通过数据文本结构管理模块10可以实现对各个数据文本结构的维护、管理、修改、增加、删除等操作,保证数据文本结构的正确性和复用性。

在上述实施例的基础上,可选地,如图3所示,本申请提供的数据文本生成装置还可以包括:数据文本识别模块50和数据文本管理模块60。其中,

数据文本识别模块50用于接收数据文本,并对接收到的数据文本进行识别,识别出接收到的数据文本的数据文本结构。

数据文本管理模块60用于将识别到的数据文本的数据文本结构与数据文本结构管理模块10存储的数据文本结构进行比较,得到差异信息,并输出所述差异信息。

本申请提供的数据文本生成装置支持接收现有的数据文本,并对接收的数据文本的数据文本结构进行识别,进而比较接收到的数据文本的数据文本结构与之前存储的数据文本结构,得知数据文本结构间的差异信息,最后将差异信息输出,由此操作人员可以清楚地获知当前输入的数据文本的数据文本结构与数据文本生成装置中存储的数据文本结构间存在哪些差异,并基于差异信息可以对当前输入的数据文本的数据文本结构的内容和格式进行修改,从而生成与原有数据文本结构(即数据文本生成装置中存储的数据文本结构)相同的数据文本。

基于前文本申请提供的一种数据文本生成装置,本申请还提供一种数据文本生成方法,如图4所示。本申请提供的数据文本生成方法应用于数据文本生成装置,方法具体包括:

步骤101,接收数据文本结构,所述数据文本结构包括多个字段、以及各个字段的字段结构信息。其中字段结构信息可以包括字段名称、字段顺序、字段类型、字段长度等。

本申请中的数据文本结构指的是,数据文本由哪些字段组成、字段顺序是什么、每个字段的类型是什么、字段长度约束是多少等等。举例来说,当需生成记录用户信息的数据文本,用户信息包括:用户姓名、用户年龄、用户性别时,该数据文本对应的数据文本结构所包含的信息应包括:

(1)数据文本结构包含三个字段,分别为:用户姓名、用户年龄、用户性别;

(2)数据文本结构包含的三个字段顺序从左到右依次为:用户姓名、用户年龄、用户性别;

(3)数据文本结构包含的三个字段的字段长度分别为:用户姓名10个字符、用户年龄10个字符、用户性别2个字符。

也就是,本申请中的数据文本结构为数据文本的具体结构。

在实际应用中,数据文本包含两种属性,一种是数据内容,一种是数据内容的组成方式,也就是数据文本的具体结构。举例来说,对于“123456”而言,数据内容是“123456”,数据文本的具体结构是“前三个字符为用户名、后三个字符为密码”,也就是,数据文本的具体结构包括两个字段,第一个字段,即前三个字符“123”用于表示用户名,第二个字段,即后三个字符“456”用于表示密码。

步骤102,对所述数据文本结构中各个字段的字段内容进行配置。

本申请对所述数据文本结构中各个字段的字段内容进行配置的实现方式可以具体为:对所述数据文本结构中各个字段的字段内容的生成方式进行配置。

在本申请实际应用过程中,为各个字段的字段内容配置的生成方式包括各种仿真数据生成器和生成算法,可以包括以下至少一种:

默认值生成数据方式、列表取值生成数据方式、范围取值生成数据方式、日期仿真器生成方式、ip仿真器生成方式、url仿真器生成方式、地址仿真器生成方式、电话号码仿真器生成方式、电子邮箱仿真器生成方式、身份证仿真器生成方式、所在城市仿真器生成方式、姓名仿真器生成方式、营业执照仿真器生成方式、邮政编码仿真器生成方式、正则表达式生成方式。

仍以前述生成记录用户信息的数据文本为例。本申请可以配置“用户姓名”字段的生成方式为姓名仿真器生成方式,配置“用户年龄”字段的生成方式为范围取值生成数据方式,配置“用户性别”字段的生成方式为范围取值生成数据方式。

步骤103,对数据文本的格式进行配置。其中数据文本的格式可以包括字段间分隔符、文件名格式、文件编码。

仍以前述生成记录用户信息的数据文本为例。如果本申请定义两个字段间使用一个分隔符“/”,那么生成的数据文本中各字段间将以“/”分隔,举例来说,如“张三/25/男”,由此通过分隔符“/”,可以清楚地分辨出不同字段内容。

步骤104,依据所述数据文本结构、所述数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本。

本申请中,数据文本结构说明了数据文本中包含哪些字段、字段的顺序如何,每个字段的最大长度是多少等字段结构信息。字段内容指的是字段的值。数据文本的格式包含了字段间采用的分隔符、文件名格式、文件编码等信息。由此,本申请依据数据文本结构、数据文本结构中各个字段的字段内容、以及数据文本的格式,能够直接生成数据文本。对于生成的数据文本,用户可直接从数据文本生成装置中下载所需的数据文本。

数据文本生成的实质,是将满足测试验证需求的字段内容,按照规范的格式写入数据文本。本申请实现了对数据文本的格式的配置,通过提供个性化的字段内容生成方式来配置各个字段的值,这样生成的数据文本无论从格式上、文本数据内容上还是数据准备的效率上,都完全满足测试验证的需求。因此,数据应用系统在一定程度上可以独立地生成测试数据进行功能测试验证,避免了对数据源系统的过度依赖。

因此应用本申请提供的数据文本生成方法,通过实现对数据文本结构中各个字段的字段内容的配置,以及对数据文本的格式的配置,最后依据数据文本结构、数据文本结构中各个字段的字段内容、以及数据文本的格式,生成数据文本。本申请生成的数据文本无论从文本格式、文本内容上还是数据准备的效率上,都完全满足数据应用系统的功能测试验证需求。且本申请利用数据文本生成装置生成数据文本,代替数据源系统下发数据文本,使得数据应用系统自身功能的测试验证过程优化为:数据文本生成装置生成数据文本—数据应用系统使用数据文本生成装置生成的数据文本进行功能测试验证,有效避免了对数据源系统的过度依赖。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于方法类实施例而言,由于其与装置类实施例基本相似,所以描述的比较简单,相关之处参见装置类实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的一种数据文本生成装置和方法进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1