文件处理方法、装置、计算机设备和存储介质与流程

文档序号:37504939发布日期:2024-04-01 14:12阅读:9来源:国知局
文件处理方法、装置、计算机设备和存储介质与流程

本申请涉及数据处理,特别是涉及一种文件处理方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、在部分项目数据输出场景下,需要替换掉项目数据中的敏感字段。传统技术中,为确保可以准确替换,通常需要人工逐一核对、替换,但随着需要输出的项目数据逐渐增多,人工替换的方式需要耗费较多的人力、物力,且数据替换效率较低、易出现遗漏。随着技术的发展,除了人工替换的方式,目前还可以使用全自动的方式完成一些简单的大规模替换,如设定替换规则,并按照替换规则机械、大批量的进行数据替换,以提高数据替换效率。但是,考虑到部分项目数据涉及的业务复杂、技术细节较多,项目数据中的某些字段需要按照特殊规则进行替换,而不能直接替换,如果直接进行简单的大规模替换,反而会导致替换错误。

2、因此,目前的人工替换、或者全自动的简单大规模替换方法,均无法既高效又准确地实现项目数据的替换。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够既高效又准确地实现项目数据准确替换的文件处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种文件处理方法,包括:

3、将扫描字符中字符数达到设定数量的长扫描字符拆分为多个子字符;

4、按照字符数从少到多的顺序,依次使用各子字符扫描原始文件中的文本与图片,确定与长扫描字符匹配的待替换字符在原始文件中的位置信息;

5、对各待替换字符的位置信息进行数据汇总,并将汇总得到的扫描结果发送至终端;终端用于基于扫描结果,确定针对每一待替换字符的替换规则;

6、按照终端反馈的替换规则,替换原始文件中的各待替换字符,得到更新文件。

7、第二方面,本申请还提供了一种文件处理装置,包括:

8、字符拆分模块,用于将扫描字符中字符数达到设定数量的长扫描字符拆分为多个子字符;

9、文件扫描模块,用于按照字符数从少到多的顺序,依次使用各子字符扫描原始文件中的文本与图片,确定与长扫描字符匹配的待替换字符在原始文件中的位置信息;

10、扫描结果获得模块,用于对各待替换字符的位置信息进行数据汇总,并将汇总得到的扫描结果发送至终端;终端用于基于扫描结果,确定针对每一待替换字符的替换规则;

11、字符替换模块,用于按照终端反馈的替换规则,替换原始文件中的各待替换字符,得到更新文件。

12、第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述文件处理方法中的步骤。

13、第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述文件处理方法中的步骤。

14、第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述文件处理方法中的步骤。

15、上述文件处理方法、装置、计算机设备、存储介质和计算机程序产品,先将扫描字符中字符数达到设定数量的长扫描字符拆分为多个子字符,以便按照字符数从少到多的顺序,依次使用各子字符扫描原始文件中的文本与图片,即可以通过子字符逐步缩小扫描范围,提高扫描效率,而不是使用长扫描字符与原始文件中内容进行字符的逐一匹配,且兼具对文本、图片的扫描功能,然后,确定与长扫描字符匹配的待替换字符在原始文件中的位置信息,并对各待替换字符的位置信息进行数据汇总,将汇总得到的扫描结果发送至终端,其中,终端用于基于扫描结果,确定针对每一待替换字符的替换规则,进一步的,按照终端反馈的替换规则,准确替换原始文件中的各待替换字符,得到更新文件,而不是简单进行批量替换,从而可以提高替换准确率,且兼具对文本、图片中待替换字符的替换功能。整个过程中,通过对长扫描字符进行拆分扫描,提高自动扫描的效率,进而提高替换效率,还兼具对文本、图片中待替换字符的扫描与替换功能,且会按照终端反馈的替换规则进行准确替换,因此,可以既高效又准确地实现项目数据的替换。



技术特征:

1.一种文件处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取所述原始文件,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述对各所述待替换字符的位置信息进行数据汇总,并将汇总得到的扫描结果发送至终端,包括:

5.根据权利要求1所述的方法,其特征在于,所述按照所述终端反馈的替换规则,替换所述原始文件中的各所述待替换字符,得到更新文件,包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1至6任意一项所述的方法,其特征在于,所述方法还包括:

8.一种文件处理装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,所述装置还包括:

10.根据权利要求8所述的装置,其特征在于,所述装置还包括:

11.根据权利要求8所述的装置,其特征在于,所述扫描结果获得模块还用于针对每一所述待替换字符,对所述待替换字符所属文件的文件路径、在所属文件的行数、以及在所处行的偏移量与数量进行数据汇总,得到所述待替换字符对应的序列信息;对各所述待替换字符的序列信息进行数据汇总,生成扫描结果;将所述扫描结果以报告形式发送至所述终端。

12.根据权利要求8所述的装置,其特征在于,所述字符替换模块还用于按照所述终端反馈的替换规则,确定各所述待替换字符中,经核查存在数据替换必要性的目标字符;针对所述原始文件中的每一所述目标字符,按照所述终端反馈的针对所述目标字符的替换规则,对所述目标字符进行替换,得到所述更新文件。

13.根据权利要求12所述的装置,其特征在于,所述装置还包括:

14.根据权利要求8至13任意一项所述的装置,其特征在于,所述装置还包括:

15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。


技术总结
本申请涉及数据处理技术领域,具体涉及一种文件处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将扫描字符中字符数达到设定数量的长扫描字符拆分为多个子字符;按照字符数从少到多的顺序,依次使用各子字符扫描原始文件中的文本与图片,确定与长扫描字符匹配的待替换字符在原始文件中的位置信息;对各待替换字符的位置信息进行数据汇总,并将汇总得到的扫描结果发送至终端;终端用于基于扫描结果,确定针对每一待替换字符的替换规则;按照终端反馈的替换规则,替换原始文件中的各待替换字符,得到更新文件。采用本方法能够既高效又准确地实现项目数据的替换。

技术研发人员:张雨
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/3/31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1