一种出错文件的处理方法及装置制造方法

文档序号:6525048阅读:142来源:国知局
一种出错文件的处理方法及装置制造方法
【专利摘要】本发明公开了一种出错文件的处理方法及装置。本发明的方法及装置,先获取出错文件的运行数据,再提取运行数据中的特征信息,并得到特征信息标识码,再根据标识码对出错文件进行分类,最后基于每个类别对出错文件进行批量处理。由于本发明提供的方法及装置是基于出错电子文件的运行数据的特征信息标识码对电子文件进行分类的,只要电子文件的特征信息标识码相同,就可以将电子文件归为一类,在缩短文件分类时间的基础上,提高了电子文件分类的准确度,保证了出错文件处理的准确性,由此解决了电子文件分类时间长且分类准确度不高的问题。
【专利说明】一种出错文件的处理方法及装置
【技术领域】
[0001]本发明涉及出错文件处理,具体涉及一种出错文件的处理方法及装置。
【背景技术】
[0002]在电子文件的运行过程中,可能由于程序开发的Bug或者运行环境出现的意外状况(如运行终端的内存不足、系统版本不兼容等),都会造成电子文件运行出错,因此,用户必须对出现运行错误的电子文件(出错文件)的运行情况进行分析,并给予相应的处理。
[0003]但是,由于需要分析处理的数据较多,如果对每个出错文件都进行处理方式的检查和执行,则会延长出错文件的处理时间,增大用户的工作量。而有些出错文件的处理方式是相同的,故可以先对出错文件进行分类,再对分类后的出错文件进行批量处理,这样便可以极大地缩短对出错文件处理的时间,从而减少用户的工作量。想要将出错文件分类,首先需要对待分类的电子文件进行比对,得到不同点,再根据不同点进行分类。
[0004]目前,常用的一种文件比对方法是通过文件比较工具BCompare进行文件比对。文件比较工具BCompare可以比较两个文件(夹),并进行内容整合等。但是,此工具仅能比较两个文件(夹),这是由此工具的设计定位所限制的,此工具设计的出发点就是比较两个文件版本的区别。当要分类的电子文件的数量较多时,如果使用此工具进行比对分类,比对时间长,不能满足电子文件的分类要求,故对出错文件进行处理的时间同样会很长。另一种常用的文件比对方法是将待分类的电子文件的MD5值进行比对,从而得到不同点进行分类。但是,此方法对文件的比对过于严格,需要对电子文件的每一字符均进行比对,只有比对的电子文件的每个字符都相同,才认定电子文件相同,否则就会认定有不同点。但是,当同一电子文件在不同的系统上运行时,不同的系统会对电子文件的调用路径代码进行修改,这便造成同一个电子文件的调用路径代码在不同的系统上所处的行数不同。当通过此方法进行文件比对时,往往会认为在不同系统上的同一电子文件是不同的文件,从而将在不同系统上的同一文件分为不同的类别。因此,此文件比对方法的准确度并不高,从而会造成分类错误,进而造成对电子文件的错误处理,不能很好地达到对出错文件处理的目的。
[0005]综上所述,基于现有的文件分类技术,对文件进行处理所存在的问题是:
[0006]1、由文件比对时间长而导致的文件分类时间长,由文件分类时间长而导致的对文件进行处理的时间长;
[0007]2、由文件比对不准确而导致的文件分类错误,由文件分类错误而导致的对电子文件的错误处理。

【发明内容】

[0008]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的出错文件的处理方法及装置。
[0009]其中,本发明提供的出错文件的处理方法,包括:
[0010]获取在运行中出现错误的电子文件的运行数据;[0011]提取每一出现错误的电子文件的运行数据中的特征信息;
[0012]根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码;
[0013]根据不同的特征信息标识码,对所述多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码;
[0014]根据每一类别的共同特性,对同一类别中的电子文件进行批量处理。
[0015]所述获取在运行中出现错误的电子文件的运行数据,包括:当电子文件在运行时,保存所述电子文件的运行数据;当所述电子文件在运行中出现运行错误时,将所述出现运行错误的电子文件的运行数据上传至服务器端。
[0016]所述电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。
[0017]所述根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码,包括:基于在所述服务器端预置的标识码计算函数将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值;
[0018]或,利用校验码计算工具将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。
[0019]所述对同一类别中的电子文件进行批量处理,包括:将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对;其中,所述特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法;
[0020]若比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0021]若比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
[0022]所述系统的版本、运行终端的型号和系统的配置被统称为运行场景参数;所述电子文件的格式类型、文件名称和调用路径被统称为基本参数;所述将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对,包括:
[0023]将每个类别的运行场景参数的标识码分别与所述特征库中已知的出错文件的运行场景参数的标识码进行比对,判断类别中的电子文件与所述特征库中已知的出错文件的运行环境是否相同;
[0024]若运行场景参数的标识码比对相同,说明运行环境相同,则将每个类别的基本参数的标识码分别与所述特征库中已知的出错文件的基本参数的标识码进行比对;
[0025]若基本参数的标识码比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0026]若基本参数的标识码比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新;
[0027]若运行场景参数的标识码比对不同,说明运行环境不同,对该类别中的电子文件进行批量处理。
[0028]所述对电子文件进行批量处理,包括:删除电子文件、修复电子文件的漏洞、更改电子文件的格式类型、改变电子文件的运行场景。[0029]其中,本发明提供的出错文件的处理装置,包括:
[0030]数据获取模块,用于获取在运行中出现错误的电子文件的运行数据;
[0031]特征信息提取模块,用于提取每一出现错误的电子文件的运行数据中的特征信息;
[0032]特征信息标识码生成模块,用于根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码;
[0033]分类模块,用于根据不同的特征信息标识码,对所述多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码;
[0034]数据处理模块,用于根据每一类别的共同特性,对同一类别中的电子文件进行批
量处理。
[0035]所述数据获取模块,包括:
[0036]数据存储单元,用于当电子文件在运行时,保存所述电子文件的运行数据;
[0037]数据传输单元,用于当所述电子文件在运行中出现运行错误时,将所述出现运行错误的电子文件的运行数据上传至服务器端,完成对在运行中出现错误的电子文件的运行数据的获取。
[0038]所述电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。
[0039]所述特征信息标识码生成模块,具体用于基于在所述服务器端预置的标识码计算函数将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash 值;
[0040]或,所述特征信息标识码生成模块,具体用于利用校验码计算工具将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。
[0041]所述数据处理模块,包括:
[0042]比对单元,用于将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对;其中,所述特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法;
[0043]数据处理执行单元,用于若所述比对单元的比对结果为相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0044]特征库更新单元,用于若所述比对单元的比对结果为不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
[0045]所述系统的版本、运行终端的型号和系统的配置被统称为运行场景参数;所述电子文件的格式类型、文件名称和调用路径被统称为基本参数;所述比对单元,包括:
[0046]第一比对执行子单元,用于将每个类别的运行场景参数的标识码分别与所述特征库中已知的出错文件的运行场景参数的标识码进行比对,判断类别中的电子文件与所述特征库中已知的出错文件的运行环境是否相同;
[0047]第二比对执行子单元,用于若所述第一比对执行子单元的比对结果为运行场景参数的标识码比对相同,说明运行环境相同,则将每个类别的基本参数的标识码分别与所述特征库中已知的出错文件的基本参数的标识码进行比对;[0048]批量处理单元,用于若所述第一比对执行子单元的比对结果为运行场景参数的标识码比对不同,说明运行环境不同,对该类别中的电子文件进行批量处理;
[0049]所述数据处理执行单元,具体用于若所述第二比对执行子单元的比对结果为基本参数的标识码比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0050]所述特征库更新单元,具体用于若所述第二比对执行子单元的比对结果为基本参数的标识码比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
[0051]所述对电子文件进行批量处理,包括:删除电子文件、修复电子文件的漏洞、更改电子文件的格式类型、改变电子文件的运行场景。
[0052]根据本发明的方法及装置,先获取出错文件的运行数据,再提取运行数据中的特征信息,并得到特征信息标识码,再根据标识码对出错文件进行分类,最后基于每个类别对出错文件进行批量处理。由于本发明提供的方法及装置是基于出错电子文件的运行数据的特征信息标识码对电子文件进行分类的,只要电子文件的特征信息标识码相同,就可以将电子文件归为一类,一方面避免了将每个电子文件均进行比对,由此缩短了文件分类的时间;另一方面避免了由将各电子文件的每一字符均进行比对而导致的错误分类的情况的发生,从而在缩短文件分类时间的基础上,提高了电子文件分类的准确度,保证了出错文件处理的准确性,由此解决了电子文件分类时间长且分类准确度不高的问题,取得了缩短出错文件的处理时间和提高出错文件处理的准确性的有益效果。
[0053]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0054]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0055]图1示出了本发明实施例提供的出错文件的处理方法的流程图;
[0056]图2示出了本发明实施例提供的出错文件的处理装置的结构示意图。
【具体实施方式】
[0057]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0058]参见图1,本发明实施例提供的出错文件的处理方法,包括:
[0059]步骤SllO:获取在运行中出现错误的电子文件的运行数据;
[0060]对步骤SllO进行具体的说明:当电子文件在运行时,保存电子文件的运行数据;当电子文件在运行中出现运行错误时,将出现运行错误的电子文件的运行数据上传至网络服务器端。
[0061]步骤S120:提取每一出现错误的电子文件的运行数据中的特征信息;其中,电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。其中,电子文件的调用路径包括:电子文件的格式类型、文件名称和代码在系统上所处的行数。需要说明的是,电子文件的调用路径的内容不仅可以包含电子文件的格式类型、文件名称和代码在系统上所处的行数,而且还可以包括电子文件的运行数据中的其他特征信息,本发明实施例对电子文件的运行数据中的特征信息和电子文件的调用路径的组成部分的具体形式均不需要进行限制。
[0062]步骤S130:根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码;其中,特征信息标识码是由特征信息生成的唯一代码,如MD5值或hash值,本发明实施例对特征信息标识码的具体形式不需要进行限制。
[0063]由此可知,步骤S130的具体步骤为:根据提取到的运行数据的特征信息分别计算得到对应的特征信息的MD5值或hash值。
[0064]在此,本发明实施例提供了两种计算特征信息的MD5值或hash值的方法:
[0065]第一种计算特征信息的MD5值或hash值的方法是:
[0066]基于预置在网络服务器端中的标识码计算函数将提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值;
[0067]第二种计算特征信息的MD5值或hash值的方法是:
[0068]利用校验码计算工具将提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。其中,校验码计算工具可以包括校验码计算器(HashCalc)和MD5校验码计算器等等,本发明实施例对校验码计算工具的具体形式不需要进行限制。
[0069]步骤S140:根据不同的特征信息标识码,对多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码;具体的分类步骤为:如果计算得到多个不同的MD5值或hash值,将具有相同的MD5值或hash值的电子文件归为一类,得到多个不同的MD5值或hash值的集合,故同一集合中的所有电子文件都具有相同的MD5值或hash值;
[0070]步骤S150:根据每一类别的共同特性,对同一类别中的电子文件进行批量处理。其中,对同一类别中的电子文件进行批量处理的具体步骤包括:将每个类别的特征信息标识码分别与预置在网络服务器端的特征库中已知的出错文件的特征信息标识码进行比对;其中,特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法;
[0071]若比对相同,则根据特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0072]若比对不同,则将该类别的特征信息标识码添加到特征库中,对特征库进行更新。
[0073]需要说明的是,在本实施例中,电子文件的运行数据的特征信息中的系统的版本、运行终端的型号和系统的配置被统称为运行场景参数;电子文件的运行数据的特征信息中的电子文件的格式类型、文件名称和调用路径被统称为基本参数;故步骤S150更具体的实施步骤包括:
[0074]将每个类别的运行场景参数的标识码分别与特征库中已知的出错文件的运行场景参数的标识码进行比对,判断类别中的出错文件与特征库中已知的出错文件的运行环境是否相同;需要说明的是,可以将每个类别的系统的版本、运行终端的型号和系统的配置中任意一个的标识码与特征库中已知的出错文件的相应的运行场景参数的标识码进行比对,也可以将每个类别的系统的版本、运行终端的型号和系统的配置中任意几个的标识码与特征库中已知的出错文件的相应的运行场景参数的标识码进行比对。
[0075]若运行场景参数的标识码比对相同,说明运行环境相同,则将每个类别的基本参数的标识码分别与特征库中已知的出错文件的基本参数的标识码进行比对;需要说明的是,可以将每个类别的电子文件的格式类型、文件名称和调用路径中任意一个的标识码与特征库中已知的出错文件的相应的基本参数的标识码进行比对,也可以将每个类别的电子文件的格式类型、文件名称和调用路径中任意几个的标识码与特征库中已知的出错文件的相应的基本参数的标识码进行比对。其中,电子文件的调用路径中的电子文件的格式类型、文件名称和代码在系统上所处的行数之间的顺序由待比对的已知出错文件的调用路径标识码所表征的调用路径中元素的顺序决定,从而使提取到的电子文件的调用路径中的电子文件的格式类型、文件名称和代码在系统上所处的行数之间的顺序与待比对的已知出错文件的调用路径标识码所表征的调用路径中元素的顺序一致,保证了提取到的电子文件的调用路径标识码有相应的已知出错文件的调用路径标识码与其比对,确保了比对操作的正常进行,进而确保了后续处理工作的正常进行。
[0076]若基本参数的标识码比对相同,则根据特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0077]若基本参数的标识码比对不同,则将该类别的特征信息标识码添加到特征库中,对特征库进行更新;在本实施例中,对特征库进行更新的具体步骤包括:将该类别的特征信息标识码、标识码所表征的错误类型及针对该特征信息标识码的处理方案添加到特征库中,对特征库进行更新。
[0078]若运行场景参数的标识码比对不同,说明运行环境不同,对该类别中的电子文件进行批量处理。
[0079]在本实施例中,对电子文件进行批量处理的方案包括:删除电子文件、修复电子文件的漏洞、更改电子文件的格式类型、改变电子文件的运行场景等,本发明实施例对电子文件的处理方案的具体形式不需要进行限制。
[0080]这里需要说明的是,当发现出现运行错误的电子文件与特征库中已知的出错文件的运行环境不同时,优先将该类别中的出错文件在其他运行环境中运行。若出错文件可以在其他运行环境中正常运行,说明出错文件与原运行环境不兼容,则可以根据实际应用情况改变出错文件的运行场景,将出错文件在其他运行环境中运行或对出错文件进行纠错,使出错文件可以与原运行环境兼容,即可以在原运行环境中正常运行。
[0081]在日常的学习和工作中,由于程序开发的Bug或使用者操作不当,经常会造成在电子设备中运行的电子文件出现错误,形成崩溃出错文件。如果不对崩溃出错文件进行清理或纠正,则不利于电子文件的正常使用。严重时,甚至会造成系统崩溃,因此,在电子文件的使用过程中,需要对崩溃出错文件进行及时的清理或纠正,以保证系统的正常运行。
[0082]通过本发明实施例对出错文件进行处理的具体步骤如下:
[0083]1.获取多个在运行中出现错误的电子文件的运行数据,组成电子文件集合F{n, f2, f>..};
[0084]2.从集合F中提取出现错误的电子文件fx的运行数据中的特征信息Kx ;
[0085]3.通过校验码计算工具计算信息Kx的MD5,记做Mx ;
[0086]4.得到一个集合M {Ma,Mb, Mc,...,Mx},对于集合M中的每一个元素Mx,均有一个或多个集合F中的元素与之对应,记为集合Mx {fxl, fx2, fx3,…};
[0087]5.将集合M中的每一个元素Mx的MD5各自分别与特征库中对应的已知出错文件的特征信息MD5进行对比;
[0088]若某一 Mx的比对结果为相同,则根据预置的处理方案对该Mx类别中的电子文件进行批量处理;
[0089]若某一 Mx的比对结果为不同,则将该Mx类别的特征信息MD5、MD5所表征的错误类型及针对该特征信息MD5的处理方案添加到特征库中,对特征库进行更新。
[0090]参见图2,本发明实施例提供的出错文件的处理装置,包括:
[0091]数据获取模块210,用于获取在运行中出现错误的电子文件的运行数据;
[0092]在本实施例中,数据获取模块210,包括: [0093]数据存储单元211,用于当电子文件在运行时,保存电子文件的运行数据;
[0094]数据传输单元212,用于当电子文件在运行中出现运行错误时,将出现运行错误的电子文件的运行数据上传至网络服务器端,完成对在运行中出现错误的电子文件的运行数据的获取。
[0095]特征信息提取模块220,用于提取每一出现错误的电子文件的运行数据中的特征信息;其中,电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。其中,电子文件的调用路径包括:电子文件的格式类型、文件名称和代码在系统上所处的行数。需要说明的是,电子文件的调用路径的内容不仅可以包含电子文件的格式类型、文件名称和代码在系统上所处的行数,而且还可以包括电子文件的运行数据中的其他特征信息,本发明实施例对电子文件的运行数据中的特征信息和电子文件的调用路径的组成部分的具体形式均不需要进行限制。
[0096]特征信息标识码生成模块230,用于根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码;其中,特征信息标识码是由特征信息生成的唯一代码,如MD5值或hash值,本发明实施例对特征信息标识码的具体形式不需要进行限制。
[0097]由此可知,特征信息标识码生成模块230,具体用于根据提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。
[0098]本发明实施例提供了两种特征信息标识码生成模块230的具体形式:
[0099]第一种特征信息标识码生成模块230的具体形式为:
[0100]特征信息标识码生成模块230,具体用于基于在网络服务器端中预置的标识码计算函数将提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值;
[0101]第二种特征信息标识码生成模块230的具体形式为:
[0102]特征信息标识码生成模块230,具体用于利用校验码计算工具将提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。其中,校验码计算工具可以包括校验码计算器(HashCalc)和MD5校验码计算器等等,本发明实施例对校验码计算工具的具体形式不需要进行限制。
[0103]分类模块240,用于根据不同的特征信息标识码,对多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码;例如:如果计算得到多个不同的MD5值或hash值,将具有相同的MD5值或hash值的电子文件归为一类,得到多个不同的MD5值或hash值的集合,故同一集合中的所有电子文件都具有相同的MD5值或hash值;
[0104]数据处理模块250,用于根据每一类别的共同特性,对同一类别中的电子文件进行批量处理。
[0105]具体地,数据处理模块250,包括:
[0106]比对单元251,用于将每个类别的特征信息标识码分别与预置在网络服务器端的特征库中已知的出错文件的特征信息标识码进行比对;其中,特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法;
[0107]数据处理执行单元252,用于若比对单元251的比对结果为相同,则根据特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0108]特征库更新单元253,用于若比对单元251的比对结果为不同,则将该类别的特征信息标识码添加到特征库中,对特征库进行更新。
[0109]需要说明的是,在本实施例中,电子文件的运行数据的特征信息中的系统的版本、运行终端的型号和系统的配置被统称为运行场景参数;电子文件的运行数据的特征信息中的电子文件的格式类型、文件名称和调用路径被统称为基本参数;故比对单元251,包括:
[0110]第一比对执行子单元,用于将每个类别的运行场景参数的标识码分别与特征库中已知的出错文件的运行场景参数的标识码进行比对,判断类别中的出错文件与特征库中已知的出错文件的运行环境是否相同;需要说明的是,可以将每个类别的系统的版本、运行终端的型号和系统的配置中任意一个的标识码与特征库中已知的出错文件的相应的运行场景参数的标识码进行比对,也可以将每个类别的系统的版本、运行终端的型号和系统的配置中任意几个的标识码与特征库中已知的出错文件的相应的运行场景参数的标识码进行比对。
[0111]第二比对执行子单元,用于若第一比对执行子单元的比对结果为运行场景参数的标识码比对相同,说明运行环境相同,则将每个类别的基本参数的标识码分别与特征库中已知的出错文件的基本参数的标识码进行比对;需要说明的是,可以将每个类别的电子文件的格式类型、文件名称和调用路径中任意一个的标识码与特征库中已知的出错文件的相应的基本参数的标识码进行比对,也可以将每个类别的电子文件的格式类型、文件名称和调用路径中任意几个的标识码与特征库中已知的出错文件的相应的基本参数的标识码进行比对。其中,电子文件的调用路径中的电子文件的格式类型、文件名称和代码在系统上所处的行数之间的顺序由待比对的已知出错文件的调用路径标识码所表征的调用路径中元素的顺序决定,从而使提取到的电子文件的调用路径中的电子文件的格式类型、文件名称和代码在系统上所处的行数之间的顺序与待比对的已知出错文件的调用路径标识码所表征的调用路径中元素的顺序一致,保证了提取到的电子文件的调用路径标识码有相应的已知出错文件的调用路径标识码与其比对,确保了比对操作的正常进行,进而确保了后续处理工作的正常进行。[0112]批量处理单元,用于若第一比对执行子单元的比对结果为运行场景参数的标识码比对不同,说明运行环境不同,对该类别中的电子文件进行批量处理;
[0113]数据处理执行单元252,具体用于若第二比对执行子单元的比对结果为基本参数的标识码比对相同,则根据特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0114]特征库更新单元253,具体用于若第二比对执行子单元的比对结果为基本参数的标识码比对不同,则将该类别的特征信息标识码添加到特征库中,对特征库进行更新。其中,对特征库进行更新的具体步骤包括:将该类别的特征信息标识码、标识码所表征的错误类型及针对该特征信息标识码的处理方案添加到特征库中,对特征库进行更新。
[0115]在本实施例中,对电子文件进行批量处理的方案包括:删除电子文件、修复电子文件的漏洞、更改电子文件的格式类型、改变电子文件的运行场景等,本发明实施例对电子文件的处理方案的具体形式不需要进行限制。
[0116]这里需要说明的是,当发现出现运行错误的电子文件与特征库中已知的出错文件的运行环境不同时,优先将该类别中的出错文件在其他运行环境中运行。若出错文件可以在其他运行环境中正常运行,说明出错文件与原运行环境不兼容,则可以根据实际应用情况改变出错文件的运行场景,将出错文件在其他运行环境中运行或对出错文件进行纠错,使出错文件可以与原运行环境兼容,即可以在原运行环境中正常运行。
[0117]根据本发明的方法及装置,先获取出错文件的运行数据,再提取运行数据中的特征信息,并得到特征信息标识码,再根据标识码对出错文件进行分类,最后基于每个类别对出错文件进行批量处理。由于本发明提供的方法及装置是基于出错电子文件的运行数据的特征信息标识码对电子文件进行分类的,只要电子文件的特征信息标识码相同,就可以将电子文件归为一类,一方面避免了将每个电子文件均进行比对,由此缩短了文件分类的时间;另一方面避免了由将各电子文件的每一字符均进行比对而导致的错误分类的情况的发生,从而在缩短文件分类时间的基础上,提高了电子文件分类的准确度,保证了出错文件处理的准确性,由此解决了电子文件分类时间长且分类准确度不高的问题,取得了缩短出错文件的处理时间和提高出错文件处理的准确性的有益效果。
[0118]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0119]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0120]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0121]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0122]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0123]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP )来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0124]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0125]本发明还公开Al、一种出错文件的处理方法,包括:
[0126]获取在运行中出现错误的电子文件的运行数据;
[0127]提取每一出现错误的电子文件的运行数据中的特征信息;
[0128]根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码;
[0129]根据不同的特征信息标识码,对所述多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码;
[0130]根据每一类别的共同特性,对同一类别中的电子文件进行批量处理。
[0131]A2、如Al所述的方法,所述获取在运行中出现错误的电子文件的运行数据,包括:当电子文件在运行时,保存所述电子文件的运行数据;当所述电子文件在运行中出现运行错误时,将所述出现运行错误的电子文件的运行数据上传至服务器端。[0132]A3、如Al所述的方法,所述电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。
[0133]A4、如A2所述的方法,所述根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码,包括:基于在所述服务器端预置的标识码计算函数将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值;
[0134]或,利用校验码计算工具将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。
[0135]A5、如A3所述的方法,所述对同一类别中的电子文件进行批量处理,包括:将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对;其中,所述特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法;
[0136]若比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0137]若比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
[0138]A6、如A5所述的方法,所述系统的版本、运行终端的型号和系统的配置被统称为运行场景参数;所述电子文件的格式类型、文件名称和调用路径被统称为基本参数;所述将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对,包括:
[0139]将每个类别的运行场景参数的标识码分别与所述特征库中已知的出错文件的运行场景参数的标识码进行比对,判断类别中的电子文件与所述特征库中已知的出错文件的运行环境是否相同;
[0140]若运行场景参数的标识码比对相同,说明运行环境相同,则将每个类别的基本参数的标识码分别与所述特征库中已知的出错文件的基本参数的标识码进行比对;
[0141 ] 若基本参数的标识码比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0142]若基本参数的标识码比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新;
[0143]若运行场景参数的标识码比对不同,说明运行环境不同,对该类别中的电子文件进行批量处理。
[0144]A7、如A6所述的方法,所述对电子文件进行批量处理,包括:删除电子文件、修复电子文件的漏洞、更改电子文件的格式类型、改变电子文件的运行场景。
[0145]本发明还公开了 B8、一种出错文件的处理装置,包括:
[0146]数据获取模块,用于获取在运行中出现错误的电子文件的运行数据;
[0147]特征信息提取模块,用于提取每一出现错误的电子文件的运行数据中的特征信息;
[0148]特征信息标识码生成模块,用于根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码;[0149]分类模块,用于根据不同的特征信息标识码,对所述多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码;
[0150]数据处理模块,用于根据每一类别的共同特性,对同一类别中的电子文件进行批
量处理。
[0151]B9、如B8所述的装置,所述数据获取模块,包括:
[0152]数据存储单元,用于当电子文件在运行时,保存所述电子文件的运行数据;
[0153]数据传输单元,用于当所述电子文件在运行中出现运行错误时,将所述出现运行错误的电子文件的运行数据上传至服务器端,完成对在运行中出现错误的电子文件的运行数据的获取。
[0154]BlO^n B8所述的装置,所述电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。
[0155]B11、如B9所述的装置,所述特征信息标识码生成模块,具体用于基于在所述服务器端预置的标识码计算函数将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值;
[0156]或,所述特征信息标识码生成模块,具体用于利用校验码计算工具将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。
[0157]B12、如BlO所述的装置,所述数据处理模块,包括:
[0158]比对单元,用于将`每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对;其中,所述特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法;
[0159]数据处理执行单元,用于若所述比对单元的比对结果为相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;
[0160]特征库更新单元,用于若所述比对单元的比对结果为不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
[0161]B13、如B12所述的装置,所述系统的版本、运行终端的型号和系统的配置被统称为运行场景参数;所述电子文件的格式类型、文件名称和调用路径被统称为基本参数;所述比对单元,包括:
[0162]第一比对执行子单元,用于将每个类别的运行场景参数的标识码分别与所述特征库中已知的出错文件的运行场景参数的标识码进行比对,判断类别中的电子文件与所述特征库中已知的出错文件的运行环境是否相同;
[0163]第二比对执行子单元,用于若所述第一比对执行子单元的比对结果为运行场景参数的标识码比对相同,说明运行环境相同,则将每个类别的基本参数的标识码分别与所述特征库中已知的出错文件的基本参数的标识码进行比对;
[0164]批量处理单元,用于若所述第一比对执行子单元的比对结果为运行场景参数的标识码比对不同,说明运行环境不同,对该类别中的电子文件进行批量处理;
[0165]所述数据处理执行单元,具体用于若所述第二比对执行子单元的比对结果为基本参数的标识码比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理;[0166]所述特征库更新单元,具体用于若所述第二比对执行子单元的比对结果为基本参数的标识码比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
[0167]B14、如B13所述的装置,所述对电子文件进行批量处理,包括:删除电子文件、修复电子文件的漏洞、更改电子文件的格式类型、改变电子文件的运行场景。
【权利要求】
1.一种出错文件的处理方法,包括: 获取在运行中出现错误的电子文件的运行数据; 提取每一出现错误的电子文件的运行数据中的特征信息; 根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码; 根据不同的特征信息标识码,对所述多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码; 根据每一类别的共同特性,对同一类别中的电子文件进行批量处理。
2.如权利要求1所述的方法,所述获取在运行中出现错误的电子文件的运行数据,包括:当电子文件在运行时,保存所述电子文件的运行数据;当所述电子文件在运行中出现运行错误时,将所述出现运行错误的电子文件的运行数据上传至服务器端。
3.如权利要求1所述的方法,所述电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。
4.如权利要求2所述的方法,所述根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码,包括:基于在所述服务器端预置的标识码计算函数将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值; 或,利用校验码计算工具将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或has h值。
5.如权利要求3所述的方法,所述对同一类别中的电子文件进行批量处理,包括:将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对;其中,所述特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法; 若比对相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理; 若比对不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库进行更新。
6.一种出错文件的处理装置,包括: 数据获取模块,用于获取在运行中出现错误的电子文件的运行数据; 特征信息提取模块,用于提取每一出现错误的电子文件的运行数据中的特征信息;特征信息标识码生成模块,用于根据提取到的运行数据中的特征信息分别生成对应的特征信息标识码; 分类模块,用于根据不同的特征信息标识码,对所述多个电子文件进行分类,同一类别中的所有电子文件都具有相同的特征信息标识码; 数据处理模块,用于根据每一类别的共同特性,对同一类别中的电子文件进行批量处理。
7.如权利要求6所述的装置,所述数据获取模块,包括: 数据存储单元,用于当电子文件在运行时,保存所述电子文件的运行数据; 数据传输单元,用于当所述电子文件在运行中出现运行错误时,将所述出现运行错误的电子文件的运行数据上传至服务器端,完成对在运行中出现错误的电子文件的运行数据的获取。
8.如权利要求6所述的装置,所述电子文件的运行数据中的特征信息包括:电子文件在运行时所处的系统的版本、运行终端的型号、系统的配置、电子文件的格式类型、文件名称及调用路径中的任意一个或几个。
9.如权利要求7所述的装置,所述特征信息标识码生成模块,具体用于基于在所述服务器端预置的标识码计算函数将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值; 或,所述特征信息标识码生成模块,具体用于利用校验码计算工具将所述提取到的运行数据中的特征信息分别计算得到对应的特征信息的MD5值或hash值。
10.如权利要求8所述的装置,所述数据处理模块,包括: 比对单元,用于将每个类别的特征信息标识码分别与特征库中已知的出错文件的特征信息标识码进行比对;其中,所述特征库中包含已知的出错文件的特征信息标识码、电子文件的错误类型及相应的处理方法; 数据处理执行单元,用于若所述比对单元的比对结果为相同,则根据所述特征库中的电子文件的错误类型及相应的处理方法对类别中的电子文件进行批量处理; 特征库更新单元,用于若所述比对单元的比对结果为不同,则将该类别的特征信息标识码添加到所述特征库中,对特征库`进行更新。
【文档编号】G06F17/30GK103761247SQ201310714578
【公开日】2014年4月30日 申请日期:2013年12月20日 优先权日:2013年12月20日
【发明者】王鑫, 张建法 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1