乱码文件解码方法、装置、存储介质及解码器与流程

文档序号:31727026发布日期:2022-10-05 00:51阅读:283来源:国知局
乱码文件解码方法、装置、存储介质及解码器与流程

1.本技术涉及计算机技术领域,具体涉及一种乱码文件解码方法、装置、存储介质及解码器。


背景技术:

2.乱码,指的是由于本地计算机在用文本编辑器打开源文件时,使用了不相应字符集而造成部分或所有字符无法被阅读的一系列字符。系统开发中,当开发人员引入或者重新打开一个已有的外部工程时,会遇到由于环境或者编码问题而引发的项目文件中显示的文字都是乱码的现象。
3.可以通过开发工具比如eclipse或者idea中设置对应的中文编码将显示乱码的正确文本内容,但是其只能解决少部分的乱码,对于一些不常见的乱码无法转换成正确的文字。


技术实现要素:

4.本技术实施例提供一种乱码文件解码方法、装置、存储介质及解码器,能够将乱码转换成正确的文字。
5.本技术实施例提供一种乱码文件解码方法,方法包括:
6.获取待处理的系统文件;
7.将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包;
8.若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件;
9.将所述乱码信息和所述源文件中的源代码进行比较,得到与所述乱码信息匹配的目标源代码;
10.将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件。
11.可选地,所述若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件,包括:
12.若所述初始解码文件中包含乱码信息,则识别所述乱码信息的字符语言类型;所述字符语言类型包括英语、日语、韩语、印地语和阿拉伯语;
13.查询所述字符语言类型对应的字符编码集,获取所述乱码信息对应的目标字符,并将所述初始解码文件中的乱码信息替换为所述目标字符;
14.若至少一个所述乱码信息不存在对应的目标字符,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
15.可选地,所述若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件,包括:
16.若所述初始解码文件中包含乱码信息,则获取所述预设解码器对所述系统文件执行解码操作的目标字符编码集;
17.在所述目标字符编码集与所述字符编码集相同时,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
18.可选地,所述若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件,包括:
19.若所述初始解码文件中包含乱码信息,则获取所述系统文件的文件类型;
20.查询预设规则映射表,获取所述文件类型对应的溯源规则;
21.根据所述溯源规则处理所述系统文件的文件属性,得所述系统文件的溯源标识,文件属性包括:文件创建时间、访问时间、打开方式、大小;
22.将所述溯源标识对应的文件确认为所述系统文件的源文件。
23.可选地,所述将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件之后,所述方法还包括:
24.建立所述乱码信息与所述目标源代码的映射关系表;
25.所述将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包之后,所述方法还包括
26.在所述初始解码文件存在乱码信息时,查询所述映射关系表;
27.若识别到所述关系映射表中存在与所述乱码信息匹配的目标乱码信息,则确定所述目标乱码信息在关系映射表中对应的目标源代码,为所述乱码信息的目标源代码;
28.若识别到所述关系映射表中不存在与所述乱码信息匹配的目标乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
29.可选地,所述将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件之后,还包括:
30.采用所述乱码信息以及所述目标代码对预设解码模型进行训练,得到目标解码模型;
31.所述将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件之后,还包括:
32.在所述初始解码文件中包含乱码信息时,将所述乱码信息输入所述目标解码模型。
33.可选地,所述文件类型包括:工程文件类型、文档文件类型。
34.本技术实施例还提供一种乱码文件解码装置,包括:
35.第一获取模块,用于获取待处理的系统文件;
36.识别模块,用于将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包;
37.第二获取模块,用于若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件;
38.对比模块,用于将所述乱码信息和所述源文件中的源代码进行比较,得到与所述乱码信息匹配的目标源代码;
39.替换模块,用于将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件。
40.本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权上任一项所述的乱码文件解码方法。
41.本技术实施例还提供一种解码器,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器通过调用所述计算机程序,用于执行如上任一项所述的乱码文件解码方法。
42.本技术实施例提供的技术方案,在获取待处理的系统文件后,将系统文件输入预设解码器,通过预设解码器识别系统文件,得到系统文件的初始解码文件,其中,预设解码器为对系统文件执行解码操作的软件开发工具包,在预设解码器解码初始解码文件后,若初始解码文件中包含乱码信息,则根据系统文件的文件类型,以及文件类型对应的溯源规则,获取系统文件的源文件,并将乱码信息和源文件中的源代码进行比较,得到与乱码信息匹配的目标源代码,最后将初始解码文件中的乱码信息替换为目标源代码,得到解码文件。预设解码器在确定初始解码文件中存在乱码信息后,通过获取系统文件的源文件的方式得到与乱码信息匹配的目标源代码,能够在系统文件存在大量的乱码信息时,将乱码信息转换成正确的文字。
附图说明
43.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
44.图1为本技术实施例提供的乱码文件解码方法的流程示意图。
45.图2为本技术实施例提供的乱码文件解码方法的另一流程示意图。
46.图3为本技术实施例提供的乱码文件解码方法的又一流程示意图。
47.图4为本技术实施例提供的乱码文件解码装置的结构示意图。
48.图5为本技术实施例提供的解码器的结构示意图。
具体实施方式
49.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本技术的保护范围。
50.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
51.本技术实施例提供一种乱码文件解码方法,该乱码文件解码方法的执行主体可以是本技术实施例提供的解码器,或者集成了该解码器的设备。其中,该解码器可以采用硬件或者软件的方式实现,例如,乱码文件解码装置,或者计算机,其中,计算机可以是台式电脑、平板电脑、掌上电脑等。
52.在以下的实施例中则以预设解码器作为执行主体解释本技术实施例提供的乱码文件解码方法。
53.本技术实施例提供的方法,在将获取到的系统文件输入至预设解码器进行解码的过程中,预设解码器识别系统文件并获取系统文件的初始解码文件,在解码的过程中,发现系统文件存在乱码信息时,预设解码器则根据系统文件类型以及文件类型对应的溯源规则,获取系统文件的源文件,进而将得到的乱码信息和原文件中的源代码进行比较,得到乱码信息匹配的目标源代码,再将初始解码文件中的乱码信息替换为源代码,得到解码文件。在本技术实施例中预设解码器在解码系统文件的过程中,确定系统文件的初始解码文件包含乱码信息时,通过文件类型以及文件类型对应的溯源规则,获取到系统文件的源文件,进而得到乱码信息的目标源代码的,实现了对系统文件进行解码后,显示乱码信息正确的文字。
54.请参阅图1,图1为本技术实施例提供的乱码文件解码方法的流程示意图。本技术实施例提供的乱码文件解码方法的具体流程可以如下:
55.101、获取待处理的系统文件。
56.在系统开发时,通常需要解码已经编写完成的系统文件,该系统文件可以通过即时通讯工具(例如,微信、qq)的方式获取,也可以通过蓝牙的方式传输,或者使用有线传输的方式得到,本技术中,不对获取系统文件的方式进行限制。
57.系统文件可以为使用编码程序编写得到的文件。例如,可以使用ecplise得到的工程文件类型的系统文件,或者使用dreamweaver编码得到的web文件类型的系统文件、或者文档文件等。
58.102、将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包。
59.预设解码器是对系统文件执行解码操作,进而在显示界面中显示系统文件对应的源码信息的软件开发工具包。
60.在预设解码器对系统文件进行解码后,得到系统文件的初始解码文件。可以理解的是,在一个系统文件中包含多个子文件时,预设解码器得到的初始解码文件同样存在多个。
61.经过预设解码器解码得到的初始解码文件的显示内容包括正确解码后得到的内容以及乱码信息。
62.乱码信息指的是在预设解码器对系统文件的初始解码文件进行解码的过程中,不能显示初始解码文件的代码对应的正确的字符,而显示为其他无意义的字符。例如,在显示界面上显示文档的文本内容时,可以基于文档中的文本内容的字体信息,以及与字体信息匹配的字体库的信息,在计算机中查找到与字体信息匹配的字体库,将该字体库加载到该文本内容,从而显示正确的文本内容。如果电子设备中缺少与字体信息匹配的字体库,就会
用不匹配的字体库解析该文本内容,从而导致在预设解码器对初始解码文件解码时,出现乱码信息的情况。又或者,当系统文件是在不同版本的编码程序中编写,由于版本的差异,导致同一系统文件在不同的编码程序中的显示不同的解码结果。亦或者,由于电脑使用不同的操作系统,导致在对同一系统文件进行解码的过程中,出现不同的乱码信息。
63.103、若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
64.可以理解的是,在系统文件可以包括多种类型,例如,由c语言编码生成的工程文件类型的系统文件。亦或者使用c#编码得到web文件类型的系统文件。
65.示例性地,在工程文件类型的系统文件中,包含了以wxapkg结尾的pkg子文件、db-shm结尾的db-shm子文件、以db-wal结尾的db-wal子文件、以data结尾的data子文件、以text结尾的text子文件、或者以png结尾的图片子文件。
66.示例性地,在web文件类型的系统文件中包含了以html结尾的网页类型。
67.由此,在本实施例中,在解码时直接读取文件的后缀名即可确定系统文件的文件类型。预设解码器直接根据与文件类型对应的溯源规则进行溯源。
68.例如,在系统文件为工程文件类型的系统文件时,其对应的溯源规则为读取未解码前的系统文件或者未解压前的系统文件的存储地址,得到系统文件的源文件。在系统文件为web文件类型的系统文件时,并且系统文件中以发布,则可以利用scrapy爬虫进行网络式爬取,对爬取到的符合要求的网页进行访问,得到系统文件的源文件。
69.可以理解的是,在本实施例中系统文件的文件类型以工程文件类型以及web文件类型进行示例性说明,系统文件的文件类型还可包括除上述类型外的其它文件类型的系统文件,对应的溯源规则也可不同,在本实施例中,不在对其进行详细描述。
70.104、将所述乱码信息和所述源文件中的源代码进行比较,得到与所述乱码信息匹配的目标源代码。
71.在本实施例中,在获取到源代码后,将乱码信息和源代码进行比较,得到乱码信息匹配的目标源代码。
72.示例性地,在本实施例中,在预设解码器进行解码时,若是由于出现生僻字的原因导致预设解码器解码失败,解码后显示的乱码信息中存在部分正确显示的文字信息。在得到源代码后,直接将乱码信息与源代码进行一一对比,在源代码中存在与乱码信息中相像的源代码时,则确定其为乱码信息匹配的目标源代码。
73.例如,在乱码信息中出现了“亻恩”在源代码中存在“憁”,则确定与乱码信息匹配的目标源代码为“憁”。
74.示例性地,在乱码信息由多个字符组成,且其中包含有正确的文字信息时,则将乱码信息与源代码进行比对,当乱码信息中正确的文字信息与源代码中正确的文字信息比对一致时,则根据正确的文字信息确定乱码信息。
75.例如,在乱码信息中出现了“亻恩恫”在源代码中存在“愡恫”则确定源代码“愡恫”为与乱码信息匹配的目标源代码。
76.105、将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件。
77.在本实施例中,在得到与初始解码文件中的乱码信息匹配的目标源代码后,使用目标源代码,使用目标源代码代替在初始解码文件中的乱码信息,得到解码文件,并在显示
界面中显示解码文件。
78.在本实施例中,在获取待处理的系统文件后,将系统文件输入预设解码器,通过预设解码器识别系统文件,得到系统文件的初始解码文件,其中,预设解码器为对系统文件执行解码操作的软件开发工具包,在预设解码器解码初始解码文件后,若初始解码文件中包含乱码信息,则根据系统文件的文件类型,以及文件类型对应的溯源规则,获取系统文件的源文件,并将乱码信息和源文件中的源代码进行比较,得到与乱码信息匹配的目标源代码,最后将初始解码文件中的乱码信息替换为目标源代码,得到解码文件。预设解码器在确定初始解码文件中存在乱码信息后,通过获取系统文件的源文件的方式得到与乱码信息匹配的目标源代码,能够在系统文件存在大量的乱码信息时,将乱码信息转换成正确的文字。
79.参照图2,在一些实施例中,预设解码器根据乱码信息的解码情况执行获取系统文件的源文件。其中,预设解码器获取系统文件的源文件的步骤包括:
80.201、若所述初始解码文件中包含乱码信息,则识别所述乱码信息的字符语言类型;所述字符语言类型包括英语、日语、韩语、印地语和阿拉伯语;
81.202、查询所述字符语言类型对应的字符编码集,获取所述乱码信息对应的目标字符,并将所述初始解码文件中的乱码信息替换为所述目标字符;
82.203、若至少一个所述乱码信息不存在对应的目标字符,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
83.在确定初始解码文件中包含乱码信息后,预设解码器识别乱码信息的字符的语言类型,其中,字符语言类型包括:英语、日语、韩语、印地语和阿拉伯语、德语、西班牙语、俄语、法语等。
84.可以理解的是,在计算机编码时,由于不同类型的字符语言使用不同的字符编码。由此,在解码时需要确定对应的字符编码才能得到对应的字符。
85.由此,在本实施例中,在预设解码器确定初始解码文件中包含乱码信息后,可获取乱码信息的字符语言类型。可以理解的是,在编程的过程中,通常使用同一种字符编码集进行编程,但是在特殊情况写会使用同一字符语言类型下的其它字符编码集。由此,在本实施例中,预设解码器在确定解码后的初始解码文件中存在乱码信息时,根据乱码信息的字符语言类型的字符编码集依次对乱码信息进行解码,查看乱码信息是否是由于字符编码集使用错误产生,若使用字符编码集解码成功,则确定在字符编码集中的字符为乱码信息对应的目标字符。
86.预设解码器依次使用同一字符语言类型下不同的字符编码集对初始解码文件中的乱码信息进行解码。进一步确认是否还存在乱码信息,若存在至少一个无法在字符编码中找到目标字符的乱码信息,则根据系统文件的类型以及对应的溯源规则,查找系统文件的源文件。
87.在本实施例中,在初始解码文件中存在乱码信息时,首先采用乱码信息的字符语言类型对应的字符编码集对乱码信息进行解码,在字符编码集找不存在与乱码信息对应的目标字符后,再通过溯源规则获取系统文件的源文件对乱码信息进行解码。通过使用不同的字符编码集对第一次解码后的乱码信息进行再次解码,能够提高将乱码信息转换成正确的文字的速度。
88.在一些实施例中,在预设解码器使用目标字符编码集对系统文件进行解码得到乱
码信息时,查看乱码信息的字符编码集是否与目标字符编码集相同,若相同,则代表无法利用对应的字符编码集对乱码信息进行解码,即存在由于系统文件内容错误,导致解码失败的情况。由此,预设解码器直接通过溯源规则的方式获取系统文件的源文件。减少使用其它字符编码集解码的时间,提高将乱码信息转换为正确的文字的效率。
89.参照图3,在一些实施例中,根据系统文件类型以及文件类型对应的溯源规则获取到系统文件的源文件,包括:
90.301、若所述初始解码文件中包含乱码信息,则获取所述系统文件的文件类型;
91.302、查询预设规则映射表,获取所述文件类型对应的溯源规则;
92.303、根据所述溯源规则处理所述系统文件的文件属性,得所述系统文件的溯源标识,文件属性包括:文件创建时间、访问时间、打开方式、大小;
93.304、将所述溯源标识对应的文件设置为所述系统文件的源文件。
94.预设解码器在确定初始解码文件中包含乱码信息后,则获取系统文件的文件类型,进而在预设规则映射表中确定文件类型对应的溯源规则,按照溯源规则处理系统文件的文件属性,进而得到系统文件的溯源标识,将溯源标识对应的文件确认为系统文件的源文件。
95.其中,文件属性包括:文件创建时间、访问时间、打开方式、大小、占用空间、修改时间、版本号、字符数等。
96.示例性地,在本实施例中,系统文件以文档类型的文件进行说明。预设解码器确定系统文件为文档类型文件后,通过映射表中确定文档类型文件对应的溯源规则为通过文件命名的方式进行溯源,按照溯源规则筛选系统文件的文件属性,例如,文件大小、版本号等,得到系统文件的溯源标识,进而确定与溯源标识一致的文件为系统文件的源文件。
97.在本实施例中,通过预设规则映射表确定文件类型对应的溯源规则,并按照溯源规则处理系统文件属性得到溯源标识,进而确定与溯源标识一致的文件为系统文件的源文件,通过建立映射表的方式实现了快速获取系统文件的源文件。
98.在一些实施例中,预设解码器还可以通过建立映射表的方式提高确定乱码信息正确显示时文字信息的效率。
99.示例性地,在得到乱码信息正确显示时的文字信息后,可以乱码信息与目标源代码映射存储至关系映射表。
100.在预设解码器确定初始解码文件中存在乱码信息时,查询映射关系表,确定映射关系表中是否存在与解码得到的乱码信息一致的目标乱码信息,若存在,则将目标乱码信息在关系映射表中对应的目标源代码确定为乱码信息的目标源代码。
101.在关系映射表中不存在与乱码信息匹配的目标乱码信息时,则根据系统文件的文件类型,以及文件类型对应的溯源规则,获取系统文件的源文件。
102.在本实施例中,通过建立乱码信息与目标源代码的关系映射表的方式确定乱码信息的目标源代码,即,通过关系映射表直接得到乱码信息的目标源代码,提高了确定乱码信息的目标源代码的速度。
103.在一些实施例中,预设解码器还可通过自学习的方式,得到目标解码模型,若初始解码文件中包含乱码信息时,则将乱码信息输入目标解码模型,通过目标解码模型的输出层的输出信息确定乱码信息的目标源代码。
104.其中,预设编码器通过获取大量的乱码信息以及目标源代码,并对其进行标记,将乱码信息输入预设解码模型,通过已标记的目标源代码与预设解码模型输出层输出的目标源代码反向调整预设解码模型的设置参数,直至预设解码模型输出层输出的目标源代码与样本数据中的目标源代码相符,确定当前训练得到的预设解码模型为目标解码模型。
105.可以理解的是,为了提高目标解码模型的准确性,预设解码器还可以将关系映射表与目标解码模型结合的方式共同确定目标源代码。
106.在一实施例中还提供一种乱码文件解码装置400。请参阅图4,图4为本技术实施例提供的乱码文件解码装置400的结构示意图。其中该乱码文件解码装置400应用于解码器,包括:
107.第一获取模块401,用于获取待处理的系统文件;
108.识别模块402,用于将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包;
109.第二获取模块403,用于若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件;
110.对比模块404,用于将所述乱码信息和所述源文件中的源代码进行比较,得到与所述乱码信息匹配的目标源代码;
111.替换模块405,用于将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件。
112.在一些实施例中,第二获取模块403还包括:
113.若所述初始解码文件中包含乱码信息,则识别所述乱码信息的字符语言类型;所述字符语言类型包括英语、日语、韩语、印地语和阿拉伯语;
114.查询所述字符语言类型对应的字符编码集,获取所述乱码信息对应的目标字符,并将所述初始解码文件中的乱码信息替换为所述目标字符;
115.若至少一个所述乱码信息不存在对应的目标字符,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
116.在一些实施例中,第二获取模块403还包括:
117.若所述初始解码文件中包含乱码信息,则获取所述预设解码器对所述系统文件执行解码操作的目标字符编码集;
118.在所述目标字符编码集与所述字符编码集相同时,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
119.在一些实施例中,第二获取模块403还包括:
120.若所述初始解码文件中包含乱码信息,则获取所述系统文件的文件类型;
121.查询预设规则映射表,获取所述文件类型对应的溯源规则;
122.根据所述溯源规则处理所述系统文件的文件属性,得所述系统文件的溯源标识,文件属性包括:文件创建时间、访问时间、打开方式、大小;
123.将所述溯源标识对应的文件确认为所述系统文件的源文件。
124.替换模块405,将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件之后,还包括:
125.建立所述乱码信息与所述目标源代码的映射关系表;
126.所述将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包之后,所述方法还包括
127.在所述初始解码文件存在乱码信息时,查询所述映射关系表;
128.若识别到所述关系映射表中存在与所述乱码信息匹配的目标乱码信息,则确定所述目标乱码信息在关系映射表中对应的目标源代码,为所述乱码信息的目标源代码;
129.若识别到所述关系映射表中不存在与所述乱码信息匹配的目标乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件。
130.替换模块405,将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件之后,还包括:
131.采用所述乱码信息以及所述目标代码对预设解码模型进行训练,得到目标解码模型;
132.所述将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件之后,还包括:
133.在所述初始解码文件中包含乱码信息时,将所述乱码信息输入所述目标解码模型。
134.应当说明的是,本技术实施例提供的乱码文件解码装置400与上文实施例中的乱码文件解码方法属于同一构思,通过该乱码文件解码装置400可以实现乱码文件解码方法实施例中提供的任一方法,其具体实现过程详见乱码文件解码方法实施例,此处不再赘述。
135.由上可知,本技术实施例提出的乱码文件解码装置400,在获取待处理的系统文件后,将系统文件输入预设解码器,通过预设解码器识别系统文件,得到系统文件的初始解码文件,其中,预设解码器为对系统文件执行解码操作的软件开发工具包,在预设解码器解码初始解码文件后,若初始解码文件中包含乱码信息,则根据系统文件的文件类型,以及文件类型对应的溯源规则,获取系统文件的源文件,并将乱码信息和源文件中的源代码进行比较,得到与乱码信息匹配的目标源代码,最后将初始解码文件中的乱码信息替换为目标源代码,得到解码文件。预设解码器在确定初始解码文件中存在乱码信息后,通过获取系统文件的源文件的方式得到与乱码信息匹配的目标源代码,能够在系统文件存在大量的乱码信息时,将乱码信息转换成正确的文字。
136.本技术实施例还提供一种解码器,如图5所示,图5为本技术实施例提供的解码器的结构示意图。该解码器500包括有一个或者一个以上处理核心的处理器501、有一个或一个以上计算机可读存储介质的存储器502及存储在存储器502上并可在处理器上运行的计算机程序。其中,处理器501与存储器502电性连接。本领域技术人员可以理解,图中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
137.处理器501是解码器500的控制中心,利用各种接口和线路连接整个解码器500的各个部分,通过运行或加载存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行解码器500的各种功能和处理数据,从而对解码器500进行整体监
控。
138.在本技术实施例中,解码器500中的处理器501会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能:
139.获取待处理的系统文件;
140.将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包;
141.若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件;
142.将所述乱码信息和所述源文件中的源代码进行比较,得到与所述乱码信息匹配的目标源代码;
143.将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件。
144.以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
145.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
146.由上可知,本实施例提供的计算机,在获取待处理的系统文件后,将系统文件输入预设解码器,通过预设解码器识别系统文件,得到系统文件的初始解码文件,其中,预设解码器为对系统文件执行解码操作的软件开发工具包,在预设解码器解码初始解码文件后,若初始解码文件中包含乱码信息,则根据系统文件的文件类型,以及文件类型对应的溯源规则,获取系统文件的源文件,并将乱码信息和源文件中的源代码进行比较,得到与乱码信息匹配的目标源代码,最后将初始解码文件中的乱码信息替换为目标源代码,得到解码文件。预设解码器在确定初始解码文件中存在乱码信息后,通过获取系统文件的源文件的方式得到与乱码信息匹配的目标源代码,能够在系统文件存在大量的乱码信息时,将乱码信息转换成正确的文字。
147.本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
148.为此,本技术实施例提供一种计算机可读存储介质,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括如下步骤:
149.获取待处理的系统文件;
150.将所述系统文件输入预设解码器,通过所述预设解码器识别所述系统文件,得到所述系统文件的初始解码文件;所述预设解码器为对系统文件执行解码操作的软件开发工具包;
151.若所述初始解码文件中包含乱码信息,则根据所述系统文件的文件类型,以及所述文件类型对应的溯源规则,获取所述系统文件的源文件;
152.将所述乱码信息和所述源文件中的源代码进行比较,得到与所述乱码信息匹配的目标源代码;
153.将所述初始解码文件中的乱码信息替换为所述目标源代码,得到解码文件。
154.以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
155.上述的存储介质可以为rom/ram、磁碟、光盘等。由于该存储介质中所存储的计算机程序,可以执行本技术实施例所提供的任一种乱码文件解码方法中的步骤,因此,可以实现本技术实施例所提供的任一种乱码文件解码方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
156.以上对本技术实施例所提供的一种乱码文件解码方法、装置、介质及电子设备进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1