一种从日志文件中提取图片的方法、存储介质和服务器与流程

文档序号:17118532发布日期:2019-03-15 23:34阅读:257来源:国知局
一种从日志文件中提取图片的方法、存储介质和服务器与流程

本发明涉及计算机技术领域,尤其涉及一种从日志文件中提取图片的方法、存储介质和服务器。



背景技术:

在数据分析与处理的很多应用场合中,需要将日志文件内包含的base64字符串格式的图片信息提取出来,然后转换为实际的图片进行展示。目前的处理方式通常为:人工从日志文件中搜索定位图片信息;将搜索到的图片信息拷贝出来,然后利用base64字符串转图片工具将该图片信息转换为实际的图片。然而,采用这种方式的处理效率十分低下。



技术实现要素:

有鉴于此,本发明实施例提供了一种从日志文件中提取图片的方法、存储介质和服务器,能够提高从日志文件中提取图片的处理效率。

本发明实施例的第一方面,提供了一种从日志文件中提取图片的方法,包括:

获取日志文件;

分别统计所述日志文件中每个base64字符串的长度;

将长度超过预设阈值的base64字符串从所述日志文件中提取出来;

使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。

本发明实施例的第二方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如本发明实施例的第一方面提出的从日志文件中提取图片的方法的步骤。

本发明实施例的第三方面,提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:

获取日志文件;

分别统计所述日志文件中每个base64字符串的长度;

将长度超过预设阈值的base64字符串从所述日志文件中提取出来;

使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。

本发明提出的从日志文件中提取图片的方法包括:获取日志文件;分别统计所述日志文件中每个base64字符串的长度;将长度超过预设阈值的base64字符串从所述日志文件中提取出来;使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。上述过程利用图片信息对应的base64字符串较长的特点,能够方便地定位日志文件中的图片信息,与传统的人工搜索定位图片信息的方式相比,极大地提高了从日志文件中提取图片的处理效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种从日志文件中提取图片的方法的第一个实施例的流程图;

图2是本发明实施例提供的一种从日志文件中提取图片的方法的第二个实施例的流程图;

图3是本发明实施例提供的一种从日志文件中提取图片的装置的一个实施例的结构图;

图4是本发明实施例提供的一种服务器的示意图。

具体实施方式

本发明实施例提供了一种从日志文件中提取图片的方法、存储介质和服务器,能够提高从日志文件中提取图片的处理效率。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1,本发明实施例中一种从日志文件中提取图片的方法的第一个实施例包括:

101、获取日志文件;

首先,获取日志文件,该日志文件的内容采用base64编码,也即内容为base64格式的字符串。base64是网络上常见的用于传输8bit字节码的编码方式之一,是一种基于64个可打印字符来表示二进制数据的方法,可用于在http环境下传递较长的标识信息。另外,该日志文件中包含一定数量的图片信息,这些图片信息是由原始图片的二进制数据采用base64编码形成的base64字符串。

102、分别统计所述日志文件中每个base64字符串的长度;

在获取到日志文件之后,分别统计所述日志文件中每个base64字符串的长度。若要提取日志文件中的图片,首先需要定位图片信息在日志文件中的位置,也即从日志文件的内容中找出由图片的二进制数据转换形成的base64字符串。在这里,分别统计所述日志文件中每个base64字符串的长度,也即统计每个base64字符串包含的字符的数量。在该日志文件中,各个base64字符串之间以特定的间隔字符隔开,比如用空格符或者逗号隔开。

103、将长度超过预设阈值的base64字符串从所述日志文件中提取出来;

在统计得到所述日志文件中每个base64字符串的长度之后,将长度超过预设阈值的base64字符串从所述日志文件中提取出来。图片的特点是信息量比较大,故由图片的二进制数据转换形成的base64字符串也较长,因此可以将长度超过一定阈值(比如1000个字符)的base64字符串确定为包含图片信息的字符串,从该日志文件中提取出来。

进一步的,在获取日志文件之后,还可以包括:

(1)判断所述日志文件的内容是否为json格式;

(2)若所述日志文件的内容为json格式,则检测所述日志文件中的第一字符串,所述第一字符串用于指示图片信息的起点;

(3)将所述第一字符串之后的base64字符串从所述日志文件中提取出来。

json是一种轻量级的数据交换格式,基于ecmascript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据,简洁和清晰的层次结构使得json成为理想的数据交换语言。对于json格式的日志文件,可以不通过统计字符串长度的方式定位图片信息。这是由于在json格式的日志内容中,其图片信息之前的字符串一般为“picture”,或“photo”等特定字符串,也即这些特定字符串指示着图片信息的起点,故可以从日志文件中搜索这些特定字符串,将这些字符串之后的base64字符串确定为图片信息,从所述目标日志文件中提取出来。

更进一步的,对于上述步骤(1),具体可以包括以下2种方式:

方式1:

获取输入的格式选取指令;根据所述格式选取指令判断所述日志文件的内容是否为json格式。在实际应用中,可以设计一个从日志文件中抽取图片的工具app,打开该app的相应界面,用户可以选取相应的日志文件,并且可以在界面中输入格式选取指令,用于区分日志文件的内容格式。比如,用户选择格式1,表明日志内容的格式为json格式;用户选择格式2,表明日志内容的格式不是json格式。

方式2:

检测所述日志文件中是否包含第二字符串,所述第二字符串为json格式的日志文件中包含的特定字符串;若所述日志文件中包含所述第二字符串,则判定所述日志文件的内容为json格式。在json格式的日志文件内容中,一般会包含“name”、“age”、“id”等特定字符串,因此可以通过检测日志文件内容中是否包含这些特定字符串来确定日志文件的内容是否为json格式。

104、使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。

从所述日志文件中提取出base64字符串之后,使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。可以采用现有技术中的各类方式将提取出的base64字符串转换为图片,然后在某个预设的界面展示转换得到的图片。经过实验对比,采用本方法比传统的人工定位图片信息的方法相比,图片提取与比对的速度快10倍以上。另外,还可以根据本方法设计得到一个从日志文件中抽取图片的工具app,该app支持日志文件的录入,图片的导出与存储等操作,能够有效提高用户的操作体验。

进一步的,在步骤104之后,还可以包括:

(1)获取图片转换的时间;

(2)根据所述图片转换的时间为转换得到的图片命名。

由于日志文件中可能包含很多图片的base64字符串,也即通过转换得到的图片数量也较多。为了便于管理这些图片,可以获取图片转换的时间,然后根据所述图片转换的时间为转换得到的图片命名。比如,可以采用“特定字符串+时间戳”的命名方式,如“temp_2018/08/2416:00”。

本发明实施例提出的从日志文件中提取图片的方法包括:获取日志文件;分别统计所述日志文件中每个base64字符串的长度;将长度超过预设阈值的base64字符串从所述日志文件中提取出来;使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。上述过程利用图片信息对应的base64字符串较长的特点,能够方便地定位日志文件中的图片信息,与传统的人工搜索定位图片信息的方式相比,极大地提高了从日志文件中提取图片的处理效率。

请参阅图2,本发明实施例中一种从日志文件中提取图片的方法的第二个实施例包括:

201、获取日志文件;

首先,获取日志文件,该日志文件的内容采用base64编码,也即内容为base64格式的字符串。base64是网络上常见的用于传输8bit字节码的编码方式之一,是一种基于64个可打印字符来表示二进制数据的方法,可用于在http环境下传递较长的标识信息。另外,该日志文件中包含多张图片的图片信息,这些图片信息是由原始图片的二进制数据采用base64编码形成的base64字符串。

202、分别统计所述日志文件中每个base64字符串的长度;

在获取到日志文件之后,分别统计所述日志文件中每个base64字符串的长度。若要提取日志文件中的图片,首先需要定位图片信息在日志文件中的位置,也即从日志文件的内容中找出由图片的二进制数据转换形成的base64字符串。在这里,分别统计所述日志文件中每个base64字符串的长度,也即统计每个base64字符串包含的字符的数量。

203、将长度超过预设阈值的base64字符串从所述日志文件中提取出来;

在统计得到所述日志文件中每个base64字符串的长度之后,将长度超过预设阈值的base64字符串从所述日志文件中提取出来。图片的特点是信息量比较大,故由图片的二进制数据转换形成的base64字符串也较长,因此可以将长度超过一定阈值(比如1000个字符)的base64字符串确定为包含图片信息的字符串,从该日志文件中提取出来。

204、使用base64字符串转图片工具按照字符串提取的先后顺序依次将提取出来的多个base64字符串转换为图片,得到多张目标图片;

在提取出长度超过预设阈值的base64字符串之后,使用base64字符串转图片工具按照字符串提取的先后顺序依次将提取出来的多个base64字符串转换为图片,得到多张目标图片。在提取字符串时,按照字符串处于日志文件内容中的前后顺序依次提取。在本发明实施例中,日志文件包含多张目标图片的base64字符串数据,在执行图片转换时,记录每次图片转换的执行时间,便于后续的排序处理。

205、按照图片转换的顺序对所述多张目标图片进行排序;

在通过图片转换得到多张目标图片之后,按照图片转换的顺序对所述多张目标图片进行排序。在排序时,参照每张图片转换时的执行时间,执行时间越前则排序越前。比如,转换得到4张目标图片,分别为图片1、图片2、图片3和图片4,它们执行图片转换的执行时间依次为图片2、图片3、图片1和图片4,则排序后的目标图片依次为图片2、图片3、图片1和图片4。

206、将所述多张目标图片按照所述排序两两并列于预设界面中展示。

最后,将所述多张目标图片按照所述排序两两并列于预设界面中展示。假设依次转换得到的图片为:图片1、图片2、图片3、图片4、图片5和图片6。则将图片1和图片2并列在指定界面中展示,便于对比图片1和图片2;将图片3和图片4并列在指定界面中展示,便于对比图片3和图片4…以此类推。

本发明实施例应用于图片比对的应用场合,用户将需要比对的图片(已转换为base64字符串)按顺序发送给服务器,服务器在接收到这些图片之后,会按预设格式以及图片接收的顺序生成对应的日志文件。因此,该日志文件中记录着需要依次比对的多幅图片的图片信息。

另外,在为转换得到的图片命名时,可以添加一些指示信息,用于提醒用户某张图片应当与哪一张图片进行比对。比如,将转换得到的第一张图片命名为“picture1(picture2)”,转换得到的第二张图片命名为“picture2(picture1)”,用户可以清楚地获知这两张图片需要进行比对。

进一步的,在展示目标图片的时候,还可以统计所述目标图片的数量,若所述目标图片的数量为单数,则输出预设的提示信息。在两两比对图片的应用场合中,转换得到的目标图片的数量应当为双数,因此若发现转换得到的目标图片的数量为单数,则表明会出现有图片无法比对,或者与错误的图片进行比对等问题。此时输出预设的提示信息,比如“比对图片的数量不符,请注意”的提示信息,以提醒用户注意,并查找图片数量不符的原因。

进一步的,在获取日志文件之后,还可以包括:

(1)检测所述日志文件的内容中是否包含用于指示图片丢失的第三字符串;

(2)若所述日志文件的内容中包含所述第三字符串,则将所述第三字符串替换为特定图片的base64字符串,所述特定图片为用于指示图片丢失的图片。

针对上述应用场合,在用户将图片发送给服务器的过程中,可能会出现图片丢失的情况。而若出现图片丢失的情况,服务器在记录日志文件时会自动添加某个特定字符串,用于指示出现图片丢失。比如,当一个图片丢失时,在记录日志文件时会自动产生一个“@@@####@@@”字符串。

在进行图片比对时,若出现图片的丢失,则可能产生错误比对的问题,比如依次转换得到的图片为:图片1、图片2、图片3、图片4,其中图片1需要和图片2比对,图片3需要和图片4比对,若图片2丢失,则可能出现将图片1和图片3比对的错误情况。为了避免出现这种错误比对的问题,若检测到所述日志文件的内容中包含所述用于指示图片丢失的特定字符串,则将该特定字符串替换为某张特定图片的base64字符串,所述特定图片为用于指示图片丢失的图片,比如可以是带有“图片不存在”或“图片丢失”字样的图片。通过这样设置,若图片2丢失,则依次转换得到的图片为:图片1、特定图片、图片3、图片4,那么会将图片1和该特定图片并列在指定页面中展示,用户即可获知与图片1比对的图片已丢失,便于制定相应的处理措施。

本发明实施例提出的从日志文件中提取图片的方法包括:获取日志文件;分别统计所述日志文件中每个base64字符串的长度;将长度超过预设阈值的base64字符串从所述日志文件中提取出来;使用base64字符串转图片工具按照字符串提取的先后顺序依次将提取出来的多个base64字符串转换为图片,得到多张目标图片;按照图片转换的顺序对所述多张目标图片进行排序;将所述多张目标图片按照所述排序两两并列于预设界面中展示。本发明实施例应用于图片比对的应用场合,能够自动提取日志文件中的图片信息,并在预设的界面并列展示需要比对的图片,通过这样设置,用户可以十分方便地完成图片比对的工作。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

上面主要描述了一种从日志文件中提取图片的方法,下面将对一种从日志文件中提取图片的装置进行详细描述。

请参阅图3,本发明实施例中一种从日志文件中提取图片的装置的一个实施例包括:

日志文件获取模块301,用于获取日志文件;

字符串长度统计模块302,用于分别统计所述日志文件中每个base64字符串的长度;

第一字符串提取模块303,用于将长度超过预设阈值的base64字符串从所述日志文件中提取出来;

图片转换模块304,用于使用base64字符串转图片工具将提取出来的base64字符串转换为图片,并在预设的界面展示转换得到的图片。

进一步的,所述从日志文件中提取图片的装置还可以包括:

格式判断模块,用于判断所述日志文件的内容是否为json格式;

第一字符串检测模块,用于若所述日志文件的内容为json格式,则检测所述日志文件中的第一字符串,所述第一字符串用于指示图片信息的起点;

第二字符串提取模块,用于将所述第一字符串之后的base64字符串从所述日志文件中提取出来。

更进一步的,所述格式判断模块可以包括:

格式选取指令获取单元,用于获取输入的格式选取指令;

第一格式判断单元,用于根据所述格式选取指令判断所述日志文件的内容是否为json格式;

第二字符串检测单元,用于检测所述日志文件中是否包含第二字符串,所述第二字符串为json格式的日志文件中包含的特定字符串;

第二格式判断单元,用于若所述日志文件中包含所述第二字符串,则判定所述日志文件的内容为json格式。

进一步的,所述图片转换模块可以包括:

图片转换单元,用于使用base64字符串转图片工具按照字符串提取的先后顺序依次将提取出来的多个base64字符串转换为图片,得到多张目标图片;

图片排序单元,用于按照图片转换的顺序对所述多张目标图片进行排序;

图片展示单元,用于将所述多张目标图片按照所述排序两两并列于所述界面中展示。

进一步的,所述从日志文件中提取图片的装置还可以包括:

第三字符串检测模块,用于检测所述日志文件的内容中是否包含用于指示图片丢失的第三字符串;

字符串替换模块,用于若所述日志文件的内容中包含所述第三字符串,则将所述第三字符串替换为特定图片的base64字符串,所述特定图片为用于指示图片丢失的图片。

进一步的,所述从日志文件中提取图片的装置还可以包括:

时间获取模块,用于获取图片转换的时间;

图片命名模块,用于根据所述图片转换的时间为转换得到的图片命名。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如图1或图2表示的任意一种从日志文件中提取图片的方法的步骤。

本发明实施例还提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如图1或图2表示的任意一种从日志文件中提取图片的方法的步骤。

图4是本发明一实施例提供的服务器的示意图。如图4所示,该实施例的服务器4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42。所述处理器40执行所述计算机可读指令42时实现上述各个从日志文件中提取图片的方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至304的功能。

示例性的,所述计算机可读指令42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令42在所述服务器4中的执行过程。

所述服务器4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述服务器4可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是服务器4的示例,并不构成对服务器4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器4还可以包括输入输出设备、网络接入设备、总线等。

所述处理器40可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器41可以是所述服务器4的内部存储单元,例如服务器4的硬盘或内存。所述存储器41也可以是所述服务器4的外部存储设备,例如所述服务器4上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器41还可以既包括所述服务器4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述服务器所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1