数据处理方法和装置与流程

文档序号:11590339阅读:152来源:国知局
本发明涉及计算机
技术领域
,尤其涉及一种数据处理方法和装置。
背景技术
:目前,在计算机系统中使用的协议不仅有网络协议,也包括对于特定的系统和传输需求而约定的数据传输协议等。网络协议是通信计算机双方必须共同遵从的一组约定,如怎么样建立连接、怎么样互相识别等。约定的数据传输协议是根据系统之间的数据传输要求等约定的传输数据的格式以及内容,传输的数据包括:项目信息数据、监控信息数据、控制数据等。例如,管理系统和生产系统之间需要传输生产进度数据,约定生产进度数据传输协议,确定传输的生产进度数据的格式以及内容。生产系统基于生产进度数据协议生成生产进度报告并发送给管理系统,管理系统基于生产进度数据传输协议解析生产进度报告并获取进度信息。目前,开发人员处理数据传输协议都是基于代码进行处理,但是,实际需要的协议内容数据较少,而基于数据传输协议生成的协议数据中冗余的内容数据较多,使得处理协议数据的计算速度慢,并且,在系统升级、改造等情况下,原先约定的数据传输协议的具体格式和内容也随之改变,由于对协议数据的处理都在代码中进行处理,代码修改量较大,协议数据不易维护。技术实现要素:有鉴于此,本发明要解决的一个技术问题是提供一种数据处理方法和装置,将协议数据转换为电子电子表格文件数据进行整理、筛选处理,并建立数据属性与协议内容数据的映射关系。根据本发明的一个方面,提供一种数据处理方法,包括:将协议数据转换为第一电子表格文件数据,其中,所述第一电子表格文件数据包含有数据属性信息和协议内容数据;根据筛选规则对所述第一电子表格文件数据进行整理并确定需要删除的第一数据属性,从所述第一电子表格文件数据中删除具有第一数据属性的协议内容数据,得到第二电子表格文件数据;基于所述第二电子表格文件数据建立保留的第二数据属性与具有第二数据属性的协议内容数据的映射关系,根据所述映射关系进行相应地处理。可选地,所述基于所述第二电子表格文件数据建立保留的第二数据属性与具有第二数据属性的协议内容数据的映射关系包括:生成文本文件,将所述第二电子表格文件数据的格式转换为所述文本文件的格式并存储,其中,所述文本文件中包含有第二数据属性信息、所述具有第二数据属性的协议内容数据;读取所述文本文件,获取所述第二数据属性信息和所述具有第二数据属性的协议内容数据并建立所述映射关系。可选地,所述建立所述映射关系包括:根据所述第二数据属性信息和所述具有第二数据属性的协议内容数据生成协议数据字典;其中,所述协议数据字典中的键为所述第二数据属性信息,所述协议数据字典中的键对应的键值为所述具有第二数据属性的协议内容数据。可选地,在所述文本文件中,具有相同的第二数据属性的协议内容数据排列在同一列,并且,排列在同一行的协议内容数据属于同一条协议数据;所述生成协议数据字典还包括:获取所述文本文件中排列在同一行中的协议内容数据,建立所述协议数据字典。可选地,所述文本文件中包含有多行协议内容数据;建立分别与多行协议内容数据相对应的多个协议数据字典;建立数组,将所述多个协议数据字典存入所述数组中。可选地,从所述协议数据字典中获取与所述第二数据属性信息相匹配的协议内容数据;确定所述协议数据中是否存在所述相匹配的协议内容数据,基于所述确定结果判断生成的所述协议数据字典是否正确。可选地,所述根据所述映射关系进行相应地处理包括:响应于调用指令,从所述协议数据字典中获取与所述调用指令中的调用信息相匹配的协议内容数据并进行显示,用以根据所述相匹配的协议内容数据生成代码或文件。可选地,所述第一电子表格文件数据和所述第二电子表格文件数据包括:excel数据;所述文本文件包括:csv文件。可选地,所述将协议数据转换为第一电子表格文件数据包括:确定所述协议数据的协议类型,获取与所述协议类型对应的电子表格模板;按照与所述协议类型相对应的提取规则从所述协议数据中提取数据属性信息和协议内容数据并填充到所述电子表格模板中,得到所述第一电子表格文件数据。可选地,所述根据筛选规则对所述第一电子表格文件数据进行整理包括:遍历所述第一电子表格文件数据,对所述协议内容数据进行泛化处理;整理所述协议内容数据,以使具有相同数据属性的协议内容数据排列在同一列。根据本发明的另一方面,提供一种数据处理装置,包括:数据获取模块,用于将协议数据转换为第一电子表格文件数据,其中,所述第一电子表格文件数据包含有数据属性信息和协议内容数据;数据筛选模块,用于根据筛选规则对所述第一电子表格文件数据进行整理并确定需要删除的第一数据属性,从所述第一电子表格文件数据中删除具有第一数据属性的协议内容数据,得到第二电子表格文件数据;数据映射模块,用于基于所述第二电子表格文件数据建立保留的第二数据属性与具有第二数据属性的协议内容数据的映射关系,根据所述映射关系进行相应地处理。可选地,所述数据映射模块,包括:数据转换单元,用于生成文本文件,将所述第二电子表格文件数据的格式转换为所述文本文件的格式并存储,其中,所述文本文件中包含有第二数据属性信息、所述具有第二数据属性的协议内容数据;映射生成单元,用于读取所述文本文件,获取所述第二数据属性信息和所述具有第二数据属性的协议内容数据并建立所述映射关系。可选地,所述映射生成单元,还用于根据所述第二数据属性信息和所述具有第二数据属性的协议内容数据生成协议数据字典;其中,所述协议数据字典中的键为所述第二数据属性信息,所述协议数据字典中的键对应的键值为所述具有第二数据属性的协议内容数据。可选地,在所述文本文件中,具有相同的第二数据属性的协议内容数据排列在同一列,并且,排列在同一行的协议内容数据属于同一条协议数据;所述映射生成单元,还用于获取所述文本文件中排列在同一行中的协议内容数据,建立所述协议数据字典。可选地,所述文本文件中包含有多行协议内容数据;所述映射生成单元,还用于建立分别与多行协议内容数据相对应的多个协议数据字典;建立数组,将所述多个协议数据字典存入所述数组中。可选地,数据检验模块,用于从所述协议数据字典中获取与所述第二数据属性信息相匹配的协议内容数据;确定所述协议数据中是否存在所述相匹配的协议内容数据,基于所述确定结果判断生成的所述协议数据字典是否正确。可选地,所述数据映射模块,包括:调用处理单元,用于响应于调用指令,从所述协议数据字典中获取与所述调用指令中的调用信息相匹配的协议内容数据并进行显示,用以根据所述相匹配的协议内容数据生成代码或文件。可选地,所述第一电子表格文件数据和所述第二电子表格文件数据包括:excel数据;所述文本文件包括:csv文件。可选地,所述数据获取模块,还用于确定所述协议数据的协议类型,获取与所述协议类型对应的电子表格模板;按照与所述协议类型相对应的提取规则从所述协议数据中提取数据属性信息和协议内容数据并填充到所述电子表格模板中,得到所述第一电子表格文件数据。可选地,所述数据筛选模块,还用于遍历所述第一电子表格文件数据,对所述协议内容数据进行泛化处理;整理所述协议内容数据,以使具有相同数据属性的协议内容数据排列在同一列。。本发明的数据处理方法和装置,将协议数据转换为电子电子表格文件数据进行整理、筛选处理,并建立数据属性与协议内容数据的映射关系,可以基于映射关系获取协议数据,降低了协议数据的处理难度,减少了代码量,节省了代码开发时间,提高了软件开发效率,提高了系统的运行速度并降低了系统资源的占用,能够减少后期的代码维护工作。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为根据本发明的数据处理方法的一个实施例的流程示意图;图2为根据本发明的数据处理方法的另一个实施例的流程示意图;图3为根据本发明的数据处理装置的一个实施例的模块示意图;图4为根据本发明的数据处理装置的一个实施例中数据映射模块的模块示意图。具体实施方式下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面结合各个图和实施例对本发明的技术方案进行多方面的描述。下文中的“第一”、“第二”等仅用于描述上相区别,并没有其它特殊的含义。图1为根据本发明的数据处理方法的一个实施例的流程示意图,如图1所示:步骤101,将协议数据转换为第一电子表格文件数据,第一电子表格文件数据包含有数据属性信息和协议内容数据。协议数据包括网络协议数据,如rs485协议数据等,协议数据也可以包括在开发人员之间、系统之间等约定的数据传输协议数据,包括:项目数据传输协议数据、监控上报协议数据、控制协议数据等。步骤102,根据筛选规则对第一电子表格文件数据进行整理并确定需要删除的第一数据属性,从第一电子表格文件数据中删除具有第一数据属性的协议内容数据,得到第二电子表格文件数据。筛选规则可以根据具体的协议类型和需求进行设置,可以去除不需要的协议内容数据。步骤103,基于第二电子表格文件数据建立保留的第二数据属性与具有第二数据属性的协议内容数据的映射关系,根据映射关系进行相应地处理。可以有多种处理方法,例如,在代码开发中可以基于映射关系获取经过筛选、整理等处理后的协议内容数据,生成代码或文件等。上述实施例的数据处理方法,将协议数据转换为电子表格形式,对表格数据进行筛选、整理等处理,建立保留的数据属性与具有此数据属性的协议内容数据的映射关系,并基于映射关系进行处理,能够减少可编辑的代码量,节省了开发时间,并减少后期维护的工作量。图2为根据本发明的数据处理方法的另一个实施例的流程示意图,如图2所示:步骤201,获取第一电子表格数据,对第一电子表格数据进行整理、筛选等处理,得到第二电子表格文件数据。协议数据有对应的数据格式,确定协议数据的协议类型,获取与协议类型对应的电子表格模板。按照与协议类型相对应的提取规则从协议数据中提取数据属性信息和协议内容数据并填充到电子表格模板中,得到第一电子表格文件数据。第一电子表格文件可以为excel表格等。例如,根据项目或工程数据的传输需要制订了项目数据传输协议,项目数据传输协议的协议数据具有固定的格式,包括版本号、编码格式。项目编号、项目描述等字段。接收到项目数据传输协议数据,可以有很多条协议数据,每条协议数据都可能含有项目版本、项目编码格式、项目编号等。按照与项目数据传输协议的协议类型相对应的提取规则,从协议数据中提取数据属性信息和协议内容数据并填充到电子表格模板中。获取表格数据主要用于提取有用的数据,生成的第一电子表格文件数据的格式如下表一所示:表1-第一电子表格文件数据格式表项目数据传输协议数据较多,第一电子表格文件数据的数据属性信息包括:项目id、项目版本、项目编号、项目描述所需文件等。对第一电子表格文件数据进行简化处理,根据筛选规则对第一电子表格文件数据进行整理并确定需要删除的第一数据属性。例如,遍历第一电子表格文件数据,对协议内容数据进行泛化处理。整理协议内容数据,以使具有相同数据属性的协议内容数据排列在同一列。对于协议内容数据中描述性文字的冗余数据需要整理,删除括号中的描述等。泛化是指将一些相似的词替换为同一种表示,例如,将没有、暂时没有、无、预留等协议内容数据替换为无。删除描述性而又无决定性意义的数据属性“项目描述所需文件”,从第一电子表格文件数据中删除具有“项目描述所需文件”数据属性的协议内容数据,整列删除后整理为简洁的第二电子表格文件数据,第二电子表格文件数据表格的格式如下表二所示:项目id项目版本编码格式项目编号1无utf-8无21无无32无10000143utf-81000025无utf-8100007表2-第二电子表格文件数据的格式表步骤202,生成文本文件,将第二电子表格文件数据的格式转换为文本文件的格式并存储在文本文件中。文本文件中包含有第二数据属性信息、具有第二数据属性的协议内容数据。得到整理后的较简洁的第二电子表格文件数据,基于第二电子表格文件数据生成程序便于识别的文本文件形式,每个程序要求的格式不同,需要设置对应的本文文件的格式。文本文件的格式可以包括:txt,csv等。例如,第二电子表格文件数据为excel数据,将excel数据生成程序便于识别的csv文件,将excel文件另存为csv文件,csv文件每列用逗号分隔开,适合编程调用。将第二电子表格文件数据的excel格式转换为文本文件的csv格式如下:项目id,项目版本,编码格式,项目编号1,无,utf-8,无2,1,无,无3,2,无,1000014,3,utf-8,1000025,无,utf-8,100007步骤203,读取文本文件,获取第二数据属性信息和具有第二数据属性的协议内容数据。基于文本文件处理成第二数据属性信息和具有第二数据属性的协议内容数据的映射关系,可以基于映射关系获取开发环境可识别的代码。将大批量的协议数据转换成了简洁的代码数据,通过外部文件进行协议数据的筛选、整理,可以减少代码量以及代码的维护工作量,映射关系可以被其它的软件功能进行调用。映射关系可以实现为字典等。步骤204,根据第二数据属性信息和具有第二数据属性的协议内容数据生成协议数据字典。字典使用key-value的形式储存数据。字典中的对象储存没有顺序,使用key来表示每个对象。字典可以有多种构建方式。例如,协议数据字典中的键(key)为第二数据属性信息,协议数据字典中的键为项目id、项目版本、编码格式、项目编号等,协议数据字典中的键对应的键值(value)为具有项目id、项目版本、编码格式、项目编号等数据属性的协议内容数据。在文本文件中,具有相同的第二数据属性的协议内容数据排列在同一列,排列在同一行的协议内容数据属于同一条协议数据。获取文本文件中排列在同一行中的协议内容数据,建立协议数据字典。读取文本文件,获取文本文件中的行和列数据,数据属性作为字典的键值,生成每条记录的协议数据字典。因为有多条记录,再将其加到数组中,字典和数组即为开发环境可识别的代码。例如,对应于第二电子表格文件数据转换的csv文件,csv文件中包含有5行协议内容数据,建立分别与5行协议内容数据相对应的5个协议数据字典,并建立数组,将5个协议数据字典存入数组中。当生成协议数据字典后,从协议数据字典中获取与第二数据属性信息相匹配的协议内容数据。确定最初的协议数据中是否存在获取的与第二数据属性信息相匹配的协议内容数据,如果存在,判断生成的协议数据字典正确,如果不存在,则判断生成的协议数据字典不正确。可以将得到的协议数据字典中的数据跟最初的表格数据作抽样对比处理,以确保数据的正确性和完整性。协议数据字典生成后可供其它的模块或开发人员调用,有多种处理方法。例如,在在开发环境中,开发人员调用协议数据字典,协议数据字典响应于调用指令,从协议数据字典中获取与调用指令中的调用信息相匹配的协议内容数据并进行显示。开发人员从协议数据字典中获得协议内容数据后,将协议内容数据的全部或部分写入代码中,生成开发代码,或者,开发人员从协议数据字典中获取协议内容数据后,将协议内容数据的全部或部分写入网页等文件中。上述实施例提供的数据处理方法,将协议数据转换为电子电子表格文件数据,将进行整理、筛选后获取的简洁的协议数据转换为文本文件,通过读取文本文件建立数据属性与协议内容数据的映射关系,通过程序实现上述的功能,能够基于映射关系获取协议数据并进行处理,降低了协议数据的处理难度,减少了相关的代码量,提高了软件开发效率,提高了计算机系统的运行速度并降低了对计算机系统资源的占用,能够减少后期的代码维护工作。在一个实施例中,如图4所示,本发明提供一种数据处理装置30,包括:数据获取模块31、数据筛选模块32、数据映射模块33和数据检验模块34。数据获取模块31将协议数据转换为第一电子表格文件数据,第一电子表格文件数据包含有数据属性信息和协议内容数据。数据筛选模块32根据筛选规则对第一电子表格文件数据进行整理并确定需要删除的第一数据属性,从第一电子表格文件数据中删除具有第一数据属性的协议内容数据,得到第二电子表格文件数据。数据映射模块33基于第二电子表格文件数据建立保留的第二数据属性与具有第二数据属性的协议内容数据的映射关系,根据映射关系进行相应地处理。数据获取模块31确定协议数据的协议类型,获取与协议类型对应的电子表格模板,按照与协议类型相对应的提取规则从协议数据中提取数据属性信息和协议内容数据并填充到电子表格模板中,得到第一电子表格文件数据。数据筛选模块32遍历第一电子表格文件数据,对协议内容数据进行泛化处理,整理协议内容数据,以使具有相同数据属性的协议内容数据排列在同一列。如图4所示,数据映射模块33包括:数据转换单元331、映射生成单元332和调用处理单元333。数据转换单元331生成文本文件,将第二电子表格文件数据的格式转换为文本文件的格式并存储在文本文件中,文本文件中包含有第二数据属性信息、具有第二数据属性的协议内容数据。映射生成单元332读取文本文件,获取第二数据属性信息和具有第二数据属性的协议内容数据并建立映射关系。映射生成单元332根据第二数据属性信息和具有第二数据属性的协议内容数据生成协议数据字典,协议数据字典中的键为第二数据属性信息,协议数据字典中的键对应的键值为具有第二数据属性的协议内容数据。在文本文件中,具有相同的第二数据属性的协议内容数据排列在同一列,并且,排列在同一行的协议内容数据属于同一条协议数据。映射生成单元332获取文本文件中排列在同一行中的协议内容数据,建立协议数据字典。文本文件中包含有多行协议内容数据。映射生成单元332建立分别与多行协议内容数据相对应的多个协议数据字典,建立数组,将多个协议数据字典存入数组中。调用处理单元333响应于调用指令,从协议数据字典中获取与调用指令中的调用信息相匹配的协议内容数据并进行显示,用以根据相匹配的协议内容数据生成代码或文件。数据检验模块34从协议数据字典中获取与第二数据属性信息相匹配的协议内容数据,确定协议数据中是否存在相匹配的协议内容数据,基于确定结果判断生成的协议数据字典是否正确。第一电子表格文件数据和第二电子表格文件数据包括:excel数据等;文本文件包括:csv文件等。上述实施例提供的数据处理方法和装置,将协议数据转换为电子电子表格文件数据,将进行整理、筛选后获取的简洁的协议数据转换为文本文件,通过读取文本文件建立数据属性与协议内容数据的映射关系,能够基于映射关系获取协议数据进行处理,降低了协议数据的处理难度,减少了相关的代码量,节省了代码开发时间,提高了软件开发效率,提高了计算机系统的运行速度并降低了计算机系统资源的占用,减少了因协议修改的代码修改数量,能够减少后期的代码维护工作,易于维护。可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1