数据处理方法及系统的制作方法

文档序号:6385464阅读:174来源:国知局
专利名称:数据处理方法及系统的制作方法
技术领域
本发明涉及计算机领域,具体而言,涉及一种数据处理方法及系统。
背景技术
在一些情况下,当需要将某种数据表中的目标数据转换到另一个文档的某一位置时,需要人工的将数据表中数据手工录入到目标文档的对应位置上。这种数据处理方式效率较低而且出错概率比较高。针对现有技术中人工数据处理速度较慢的问题,目前尚未提出有效的解决方案。

发明内容
本发明提供了一种数据处理方法及系统,以至少解决现有技术中人工数据处理速度较慢的问题。为了实现上述目的,根据本发明的一个方面,提供了一种数据处理方法。根据本发明的数据处理方法包括读取数据表中的目标数据;获取用户在数据表中设置的标识符,其中,标识符对应于目标数据,不同的标识符对应不同的目标数据;获取标识符在目标文档中对应的目标位置,其中,在目标文档中,不同的标识符对应不同的预设的目标位置;以及将目标数据写入对应的目标位置。进一步地,目标数据包括第一数据和第二数据,获取用户在数据表中设置的标识符包括获取用户在数据 表中设置的第一标识符和第二标识符,其中,第一标识符对应于第一数据,第二标识符对应于第二数据,获取标识符在目标文档中对应的目标位置包括获取第一标识符在目标文档中对应的第一位置以及第二标识符在目标文档中对应的第二位置。进一步地,第一标识符为第一颜色,第二标识符为第二颜色,获取第一标识符在目标文档中对应的第一位置以及第二标识符在目标文档中对应的第二位置包括获取第一颜色在目标文档中对应的第一位置以及第二颜色在目标文档中对应的第二位置。进一步地,在将目标数据写入对应的目标位置之后,上述方法还包括获取第一数据和第二数据的匹配关系;以及检测目标文档中的第一数据和第二数据是否满足匹配关系。进一步地,在将目标数据写入对应的目标位置之前,上述方法还包括获取标识符对应的数据的格式;判断目标数据的格式是否满足标识符对应的数据的格式;当目标数据的格式满足标识符对应的数据的格式时,将目标数据写入对应的目标位置。 进一步地,在将目标数据写入对应的目标位置之后,上述方法还包括当目标数据的格式不满足标识符对应的数据的格式时,生成错误消息或停止读取目标数据,其中,错误消息用于提示用户读取目标数据时发生错误。进一步地,读取数据表中的数据包括读取数据表中的工作表;以及读取工作表中的数据。进一步地,在将目标数据写入对应的目标位置之后,上述方法还包括按照预设形式输出目标数据。为了实现上述目的,根据本发明的另一个方面,提供了一种数据处理系统,该装置用于执行本发明提供的任意一种数据处理方法。根据本发明的另一方面,提供了一种数据处理系统。该数据处理系统包括读取单元,用于读取数据表中的目标数据;第一获取单元,用于获取用户在数据表中设置的标识符,其中,标识符对应于目标数据,不同的标识符对应不同的目标数据;第二获取单元,用于获取标识符在目标文档中对应的目标位置,其中,在目标文档中,不同的标识符对应不同的预设的目标位置;以及写入单元,用于将目标数据写入对应的目标位置。进一步地,目标数据包括第一数据和第二数据,第一获取单元还用于在数据表中获取用户设置的第一标识符和第二标识符,其中,第一标识符对应于第一数据,第二标识符对应于第二数据,第二获取单元还用于获取第一标识符在目标文档中对应的第一位置以及第二标识符在目标文档中对应的第二位置。通过本发明,由于对目标数据设置了标识符并预先设定了标识符对应数据在目标文档中的位置,从而可以在获取标识符后,自动将标识符对应的数据映射到目标文档中,该步骤取代了人工手工录入数据的操作,因此解决了现有技术中人工数据处理速度较慢的问题,进而达到了提高数据处理效率的效果。


构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中图1是根据本发明实施例的数据处理系统的结构框图;图2是根据本发明实施例的数据处理方法的流程图;图3是根据本发明优选实施例的数据处理方法的流程图;以及图4是SheetVO的示意图。
具体实施例方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。本发明实施例提供了一种数据处理系统,以下对本发明实施例所提供的数据处理系统进行介绍。图1是根据本发明实施例的数据处理系统的结构框图。如图1所示,该数据处理系统包括读取单元11、第一获取单元12、第二获取单元13和写入单元14。读取单元11用于读取数据表中的目标数据。第一获取单元12用于获取用户在数据表中设置的标识符,其中,标识符对应于目标数据,不同的标识符对应不同的目标数据。第二获取单元13用于获取标识符在目标文档中对应的目标位置,其中,在目标文档中,不同的标识符对应不同的预设的目标位置。目标文档可以位于处理系统内,也可以位于处理系统外,因此,目标位置既可以是本处理系统中的位置,也可以是其他数据表中的位置。例如,通过处理系统对Excel中的数据进行处理,那么目标位置既可以是处理系统中的位置,也可以是其他数据表中的位置。写入单元14用于将目标数据写入对应的目标位置。在本实施例中,由于对目标数据设置了标识符并预先设定了标识符对应数据在目标文档中的位置,从而可以在获取标识符后,自动将标识符对应的数据映射到目标文档中,该步骤取代了人工手工录入数据的操作,进而达到了提高数据处理效率的效果。具体地,数据表的目标数据可以包括第一数据和第二数据,第一获取单元还用于在数据表中获取用户设置的第一标识符和第二标识符,其中,第一标识符对应于第一数据,第二标识符对应于第二数据,第二获取单元还用于获取第一标识符在目标文档中对应的第一位置以及第二标识符在目标文档中对应的第二位置。本发明实施例还提供了一种数据处理方法,该方法可以基于上述的装置来执行。图2是根据本发明实施例的数据处理方法的流程图。如图2所示,该数据处理方法包括如下的步骤S202至步骤S208。步骤S202,读取数据表中的目标数据。具体的,由于一个数据表中可以包括多个工作表(sheet),因此可以先读取数据表中的工作表,然后在读取工作表中的数据。步骤S204,获取用户在数据表中设置的标识符,其中,标识符对应于目标数据,不同的标识符对应不同的目标数据。数据表中可以包括多种目标数据,S卩,目标数据包括第一数据和第二数据,相应地,在本步骤中,可以获取 用户在数据表中设置的第一标识符和第二标识符,其中,第一标识符对应于第一数据,第二标识符对应于第二数据。标识符用于标记表格中的数据,因此,每个标识符和该标识符所标记的数据存在对应关系。 步骤S206,获取标识符在目标文档中对应的目标位置,其中,在目标文档中,不同的标识符对应不同的预设的目标位置。具体地,可以获取第一标识符在目标文档中对应的第一位置以及第二标识符在目标文档中对应的第二位置。同种标识符均能用来区分不同的数据,例如,设置不同的字体,设置不同的字号,或者对一种类型的数据设置字体加粗,对另一种类型的数据设置字体倾斜等等。只要设置不同的标识符,均能起到将不同类型的数据对应到不同位置的目的,在本实施例中,为了使不同类型数据的区别更加明显,可以用不同的填涂颜色作为不同的标识符,即,第一标识符为第一颜色,第二标识符为第二颜色,在本步骤中,可以获取第一颜色在目标文档中对应的第一位置以及第二颜色在目标文档中对应的第二位置。例如,预先设置数据表中填涂黄色的数据为时间,填涂绿色的数据为金额,那么数据表中填涂黄色的数据与目标文档中表征时间的位置对应,填涂绿色的数据与目标文档中表征金额的位置对应。步骤S208,将目标数据写入对应的目标位置。仍以颜色作为标识符的具体事例对本步骤进行描述,当上述步骤已经确定填涂黄色的数据与目标文档中表征时间的位置对应时,直接将填涂黄色的数据写入目标文档中的对应位置即可。为了保证数据写入的准确性,在在将目标数据写入对应的目标位置之前,还可以先获取标识符对应的数据的格式,并判断目标数据的格式是否满足标识符对应的数据的格式,当目标数据的格式满足标识符对应的数据的格式时,将目标数据写入对应的目标位置。相反地,当目标数据的格式不满足标识符对应的数据的格式时,生成错误消息或停止读取目标数据,其中,错误消息用于提示用户读取目标数据时发生错误。为了进一步保证数据写入的准确性,在在将目标数据写入对应的目标位置之后,还可以获取第一数据和第二数据的匹配关系,并检测目标文档中的第一数据和第二数据是否满足匹配关系。例如,填涂红色的数据为起始时间,填涂蓝色的数据为结束时间,起始时间必然早于结束时间,因此,可以在目标文档中检测起始时间是否早于结束时间,从而判断数据的写入是否正确。图3是根据本发明优选实施例的数据处理方法的流程图。在该实施例中,以将EXCEL文档中的数据转移到XBRL财务数据中为例,对本实施例提供的方法进行具体描述。如图3所示,该数据处理方法包括如下的步骤S301至步骤S310。步骤S301,加载Excel文件。具体地,可以使用JavaAPI提供的文件输出流java.1o加载一个后缀名为.xslx的文件到Java文件系统中,从而获取需要POI读取该Excel文件。步骤S3O2,读取 Excel 工作表(sheet)。在Excel中,财务数据可能存储在多个工作表中,利用POI提供的读取sheet表功能可以遍历所有已存在的工作表,并读取工作表名称作为数据集合中的主要索引。主要索弓I的功能是搜索已读取已采集的财务数据,即,将所有财务数据以Sheet表名进行分类。另外,遍历所有工作表还可以便于后续步骤中读取每个工作表中所有已标记颜色的单元格。在读取Sheet表名称时可以过滤名称中的特殊字符,并将特殊字符转换为合法字符。步骤S303,读取工作表单元格。使用POI提供的读取单元格的方法,将Sheet表中的单元格逐行读取。POI的读取机制是逐行读取,直到Sheet表中的行指针最后一行结束,在读取数据时会读取一行上的所有单元格,直到单元格指针到达该行的末尾时读取结束。在读取Excel文件中所有单元格的同时,还会根据颜色列表中的背景颜色过滤掉其他颜色和未标记背景颜色的数据。例如颜色列表中仅包括红色和黄色,则填充绿色颜色的数据将被过滤掉。步骤S304,根据颜色剥离财务数据。在读取单元格时可以只读取已标记预设背景颜色单元格。标记颜色是遵照一套已经预设颜色RGB (红绿蓝)数值规范或Lab色彩模型的单元格背景。在读取带有预设背景颜色单元格同时会检查该颜色对应的单元格内数据,根据规则将不合法的数据记录在步骤S309中的消息列表中。例如,绿色背景色的单元格内的数据是一个日期或一个阶段的日期。用背景颜色无法表达的特殊标记,可以采用〃批注〃的方式进行标记。特殊标记是给单元格添加一条批注,批注的内容可以遵循例如以下的格式标记规范。1,批注内容属性描述格式为“名称值”。
2,多个属性描述则在每个属性描述结束后加以“分号(;)”结尾。单一属性可以不加分号。3,批注内容全部使用英文/半角格式。4,时期与时点一般不会同时出现。货币、数值单位与精度属性描述只能出现一次。5,时期日期格式可以按照该格式“ YYYY-MM-DD, YYYY-MM-DD ” 或 “ YYYY/MM/DD,YYYY/MM/DD”。例如:“2010-05_12,2010-09-08” 2010-05-12 期初,2010-09-08 期末,期末日期晚于期初日期。两个日期之间需要使用“逗号(,)”进行分割。6,时期日期若要描述全年可以是“YYYY”格式,例如“2010”采集组件会解析成“2010-01-01,2010-12-31”。7,时点日期格式为 “YYYY-MM-DD” 或 “YYYY/MM/DD”,例如“2010-12-31”,〃2010/12/31"。8,脚注“footnote”属性只会过滤特殊字符“〈”或者“〉”。批注样例表
权利要求
1.一种数据处理方法,其特征在于,包括 读取数据表中的目标数据; 获取用户在所述数据表中设置的标识符,其中,所述标识符对应于所述目标数据,不同的标识符对应不同的目标数据; 获取所述标识符在目标文档中对应的目标位置,其中,在所述目标文档中,不同的标识符对应不同的预设的目标位置;以及 将所述目标数据写入对应的所述目标位置。
2.根据权利要求1所述的数据处理方法,其特征在于, 所述目标数据包括第一数据和第二数据, 获取用户在所述数据表中设置的标识符包括 获取用户在所述数据表中设置的第一标识符和第二标识符,其中,所述第一标识符对应于所述第一数据,所述第二标识符对应于所述第二数据, 获取所述标识符在目标文档中对应的目标位置包括 获取所述第一标识符在所述目标文档中对应的第一位置以及所述第二标识符在所述目标文档中对应的第二位置。
3.根据权利要求2所述的数据处理方法,其特征在于, 所述第一标识符为第一颜色,所述第二标识符为第二颜色, 获取所述第一标识符在所述目标文档中对应的第一位置以及所述第二标识符在所述目标文档中对应的第二位置包括 获取所述第一颜色在所述目标文档中对应的所述第一位置以及所述第二颜色在所述目标文档中对应的所述第二位置。
4.根据权利要求2所述的数据处理方法,其特征在于,在将所述目标数据写入对应的所述目标位置之后,所述方法还包括 获取所述第一数据和所述第二数据的匹配关系;以及 检测所述目标文档中的所述第一数据和所述第二数据是否满足所述匹配关系。
5.根据权利要求1所述的数据处理方法,其特征在于,在将所述目标数据写入对应的所述目标位置之前,所述方法还包括 获取所述标识符对应的数据的格式; 判断所述目标数据的格式是否满足所述标识符对应的数据的格式; 当所述目标数据的格式满足所述标识符对应的数据的格式时,将所述目标数据写入对应的所述目标位置。
6.根据权利要求5所述的数据处理方法,其特征在于,在将所述目标数据写入对应的所述目标位置之后,所述方法还包括 当所述目标数据的格式不满足所述标识符对应的数据的格式时,生成错误消息或停止读取所述目标数据,其中,所述错误消息用于提示用户读取所述目标数据时发生错误。
7.根据权利要求1所述的数据处理方法,其特征在于,读取数据表中的数据包括 读取所述数据表中的工作表;以及 读取所述工作表中的所述数据。
8.根据权利要求1所述的数据处理方法,其特征在于,在将所述目标数据写入对应的所述目标位置之后,所述方法还包括 按照预设形式输出所述目标数据。
9.一种数据处理系统,其特征在于,包括 读取单元,用于读取数据表中的目标数据; 第一获取单元,用于获取用户在所述数据表中设置的标识符,其中,所述标识符对应于所述目标数据,不同的标识符对应不同的目标数据; 第二获取单元,用于获取所述标识符在目标文档中对应的目标位置,其中,在所述目标文档中,不同的标识符对应不同的预设的目标位置;以及 写入单元,用于将所述目标数据写入对应的所述目标位置。
10.根据权利要求9所述的数据处理系统,其特征在于, 所述目标数据包括第一数据和第二数据, 所述第一获取单元还用于在所述数据表中获取用户设置的第一标识符和第二标识符,其中,所述第一标识符对应于所述第一数据,所述第二标识符对应于所述第二数据, 所述第二获取单元还用于获取所述第一标识符在所述目标文档中对应的第一位置以及所述第二标识符在所述目标文档中对应的第二位置。
全文摘要
本发明公开了一种数据处理方法及系统,该数据处理方法包括读取数据表中的目标数据;获取用户在数据表中设置的标识符,其中,标识符对应于目标数据,不同的标识符对应不同的目标数据;获取标识符在目标文档中对应的目标位置,其中,在目标文档中,不同的标识符对应不同的预设的目标位置;以及将目标数据写入对应的目标位置。通过本发明,由于对目标数据设置了标识符并预先设定了标识符对应数据在目标文档中的位置,从而可以在获取标识符后,自动将标识符对应的数据映射到目标文档中,该步骤取代了人工手工录入数据的操作,进而达到了提高数据处理效率的效果。
文档编号G06F17/30GK103064823SQ20121057296
公开日2013年4月24日 申请日期2012年12月25日 优先权日2012年12月25日
发明者赫明, 韩鹏, 刘欢 申请人:北京易时信通科技有限公司, 恩梯梯数据(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1