基于人工智能的文件同步方法、装置、设备及存储介质与流程

文档序号:31848565发布日期:2022-10-19 00:28阅读:40来源:国知局
1.本技术涉及人工智能
技术领域
:,尤其涉及一种基于人工智能的文件同步方法、装置、电子设备及存储介质。
背景技术
::2.随着信息科技的发展,金融保险行业逐渐倾向于利用大数据分析技术生成业务报表来为企业提供业务决策支持。在业务数据更新的过程中,通常在短时间内会存在成百上千个数据文件同步更改的需求,这一现状给文件同步带来了极大的挑战。3.目前,通常通过人工检查文件并对于不符合规范的文件进行修改和变更,这种方式费时费力且极大的浪费了人力资源,因此,寻求一种快捷并准确的文件同步方法势在必行。技术实现要素:4.鉴于以上内容,有必要提供一种基于人工智能的文件同步方法及相关设备,以解决如何提高文件同步的效率这一技术问题,其中,相关设备包括基于人工智能的文件同步装置、电子设备及存储介质。5.本技术实施例提供一种基于人工智能的文件同步方法,所述方法包括:6.对历史文件进行编码获得每个历史文件对应的编码数据;7.依据所述编码数据训练目标文件分类模型;8.依据预设的编码规范评估提报文件获得合格文件,所述提报文件代表未被评估且待同步的文件,所述合格文件代表符合所述预设的编码规范的提报文件;9.依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件;10.设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件;11.依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步。12.上述基于人工智能的文件同步方法通过对历史文件进行编码获得了编码数据,并依据编码数据训练目标文件分类模型以供后续文件的分类任务,并依据预设编码规范对于提报文件进行评估以筛选出合格的文件,进一步制定每个合格文件的优先级并对于所有合格文件进行分类,最终依据合格文件的类别和优先级循环执行同步操作,从而提升了文件同步的效率。13.在一些实施例中,所述每个历史文件包含多个关键字,所述对历史文件进行编码获得每个历史文件对应的编码数据,包括:14.构建所述关键字的索引,并依据所述索引和关键字构建关键字哈希表;15.依据所述历史文件中关键字的排列顺序组合每个关键字对应的索引作为每个历史文件对应的编码向量;16.对所述编码向量进行特征提取获得每个历史文件对应的编码数据。17.如此,通过构建所有历史文件中的关键字索引获得了每个关键字对应的编码向量,并依据预设的特征提取算法对每个编码向量进行特征提取获得每个历史文件对应的编码数据,从而以较低维度的量化数据表征历史文件,提升了后续历史文件分类的准确度和效率。18.在一些实施例中,所述依据所述编码数据训练目标文件分类模型,包括:19.依据所述关键字的语义对每个历史文件对应的编码数据进行标注获得多个标签数据;20.将所述编码数据作为样本数据,并将所述样本数据与所述标签数据一一对应构建训练数据集;21.依据所述训练数据集训练目标文件分类模型。22.如此,依据历史文件中关键字的语义对每个历史文件对应的编码数据进行标注获得标签数据,将所有编码数据作为样本数据并与标签数据一一对应作为训练数据集,进一步利用训练数据训练文件分类模型,通过大量数据拟合出了较为精确的文件分类模型,能够为后续大数据自动同步流程提供便捷的分类方式,提升了大数据自动同步流程的效率。23.在一些实施例中,所述依据所述训练数据集训练目标文件分类模型,包括:24.构建初始文件分类模型,所述初始文件分类模型包括编码器和解码器;25.将所述样本数据输入所述初始文件分类模型,获得所述样本数据对应的预测概率列表;26.将所述预测概率列表和所述标签数据对应的概率列表输入预设的损失函数获得损失值,依据所述损失值迭代更新所述初始文件分类模型中的参数以获得目标文件分类模型。27.如此,通过预设的损失函数约束所述目标文件分类模型的分类结果,从而能够提升所述目标文件分类模型的准确度。28.在一些实施例中,所述依据预设的编码规范评估提报文件获得合格文件,包括:29.对提报文件进行分词获得提报词汇列表,所述提报词汇列表包含多个提报词汇;30.依据预设的编码规范评估每个提报词汇获得多个评估结果,并依据所有评估结果计算所述提报词汇列表对应的评估值;31.依据所述评估值将所述提报词汇列表对应的提报文件分类为合格文件和不合格文件。32.如此,通过预设的编码规范对提报文件进行分类,并依据所述提报文件的类别做出下一步操作,能够在大数据同步的最初阶段筛查不符合编码规范的文件,从而提升文件同步的效率。33.在一些实施例中,所述依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件,包括:34.依据所述关键字哈希表查询所述合格文件中每个关键字对应的索引以获得所述合格文件对应的编码向量;35.依据所述预设的特征提取算法对所述合格文件的编码向量进行特征提取获得合格文件的编码数据;36.将所述合格文件的编码数据输入所述目标文件分类模型获得分类结果,并依据所述分类结果标记所述合格文件以获得分类文件。37.如此,通过对提报文件进行分词和查询获得了提报向量,并将提报向量输入所述文件分类模型获得了所述提报文件对应的类别,为后续大数据同步提供了类别指引,从而提升了大数据同步的效率。38.在一些实施例中,每个分类文件对应一个提报时间,所述设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件,包括:39.依据所述分类文件的提报时间设置所述分类文件的时间优先级;40.依据所述时间优先级由高到低的顺序执行所述分类文件以获得每个分类文件对应的运行日志;41.遍历所述运行日志的内容以查询报错信息,若无报错信息则标记所述分类文件为待同步文件,若有报错信息则标记该分类文件并通知开发人员进行修改。42.如此,基于分类文件提报的时间设置了分类文件对应的时间优先级,并依据时间优先级由高到低的顺序运行分类文件以获得运行日志,进一步依据运行日志的报错信息制定所述分类文件的错误信息,能够将包含错误信息的文件剔除,从而提升文件同步的安全性。43.本技术实施例还提供一种基于人工智能的文件同步装置,所述装置包括:44.编码单元,用于对历史文件进行编码获得每个历史文件对应的编码数据;45.训练单元,用于依据所述编码数据训练目标文件分类模型;46.评估单元,用于依据预设的编码规范评估提报文件获得合格文件;47.分类单元,用于依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件;48.执行单元,用于设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件;49.同步单元,用于依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步。50.本技术实施例还提供一种电子设备,所述电子设备包括:51.存储器,存储计算机可读指令;及52.处理器,执行所述存储器中存储的计算机可读指令以实现所述基于人工智能的文件同步方法。53.本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述基于人工智能的文件同步方法。54.上述基于人工智能的文件同步方法通过对历史文件进行编码获得了编码数据,并依据编码数据训练目标文件分类模型以供后续文件的分类任务,并依据预设编码规范对于提报文件进行评估以筛选出合格的文件,进一步制定每个合格文件的优先级并对于所有合格文件进行分类,最终依据合格文件的类别和优先级循环执行同步操作,从而提升了文件同步的效率。附图说明55.图1是本技术所涉及的一种基于人工智能的文件同步方法的较佳实施例的流程图。56.图2是本技术所涉及的基于人工智能的文件同步装置的较佳实施例的功能模块图。57.图3是本技术所涉及的基于人工智能的文件同步方法的较佳实施例的电子设备的结构示意图。58.图4是本技术实施例所涉及的目标文件分类模型的结构示意图。59.图5是本技术实施例所涉及的运行日志示意图。具体实施方式60.为了能够更清楚地理解本技术的目的、特征和优点,下面结合附图和具体实施例对本技术进行详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本技术,所述描述的实施例仅是本技术一部分实施例,而不是全部的实施例。61.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。62.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的
技术领域
:的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。63.本技术实施例提供一种基于人工智能的文件同步方法,可应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。64.所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personaldigitalassistant,pda)、游戏机、交互式网络电视(internetprotocoltelevision,iptv)、智能式穿戴式设备等。65.所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloudcomputing)的由大量主机或网络服务器构成的云。66.所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtualprivatenetwork,vpn)等。67.如图1所示,是本技术基于人工智能的文件同步方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。68.s10,对历史文件进行编码获得每个历史文件对应的编码数据。69.在一个可选的实施例中,每个历史文件包含多个关键字,所述对历史文件进行编码获得每个历史文件对应的编码数据,包括:70.构建所述关键字的索引,并依据所述索引和关键字构建关键字哈希表;71.依据每个历史文件中关键字的排列顺序组合每个关键字对应的索引作为每个历史文件对应的编码向量;72.对所述编码向量进行特征提取获得每个历史文件对应的编码数据。73.该可选的实施例中,所述历史文件可以是sql文件,所述历史文件的功能是在所述服务器集群中完成对数据的增删改查等操作,所述服务器集群包含多个服务器系统,所述关键字可以是sql语言中的默认的关键字,所述关键字至少包括“select”、“from”、“where”、“and”、“or”、“union”、“insert”、“delete”、“group”、“having”、“count”、“update”等。74.该可选的实施例中,可依据自然数构建每个关键字的索引,示例性的,可将“select”的索引设置为1、可将“from”的索引设置为2、可将“where”的索引设置为3、可将“and”的索引设置为4、可将“or”的索引设置为5、可将“union”的索引设置为6,其余关键字以此类推。75.在另一些可选的实施例中,还可从ascii编码集、unicode编码集或utf-8编码集等现有的编码集中任选一个以查询每个关键字对应的编码作为每个关键字对应的索引,以ascii编码集为例,可将“select”的索引设置为8369766784、可将“from”的索引设置为70827977、可将“where”的索引设置为8772698269、可将“and”的索引设置为657868、可将“or”的索引设置为7982、可将union的索引设置为8578737978。76.该可选的实施例中,可将所述关键字的索引作为键,并将每个索引对应的关键字作为值以构建键值对,并存储所有键值对以构建关键字哈希表,所述关键字哈希表包含多个键值对,每个键值对用以表征一组索引和关键字。77.该可选的实施例中,可依据每个历史文件中关键字的排列顺序组合每个关键字对应的索引作为每个文件对应的编码向量。78.示例性的,若利用自然数设置所述关键字的索引,当某一个历史文件中关键字的排列顺序为“select”、“from”、“where”、“and”,则该历史文件对应的编码向量为[1,2,3,4];当另一个历史文件中关键字的排列顺序为“from”、“select”、“and”、“or”、“where”,则该历史文件对应的编码向量为[2,1,4,5,3]。[0079]该可选的实施例中,可依据预设的特征提取算法对所述编码向量进行特征提取获得每个历史文件对应的编码数据,所述特征提取算法的目的是对所述编码向量进行降维以提升后续文件分类的效率。所述预设的特征提取算法可以是svd奇异值分解算法、pca(principlecomponentanalysis,主成分分析)算法、ae(auto-encoder,自编码神经网络)网络等现有的特征提取算法,本技术对此不作限定。[0080]该可选的实施例中,可记所述编码数据为vi,其中,i∈[1,n]且i代表编码数据的索引,n代表所述历史文件的个数,且所有的编码数据的维度都相等。[0081]如此,通过构建所有历史文件中的关键字索引获得了每个关键字对应的编码向量,并依据预设的特征提取算法对每个编码向量进行特征提取获得每个历史文件对应的编码数据,从而以较低维度的量化数据表征历史文件,提升了后续历史文件分类的准确度和效率。[0082]s11,依据所述编码数据训练目标文件分类模型。[0083]在一个可选的实施例中,所述依据所述编码数据训练目标文件分类模型,包括:[0084]依据所述关键字的语义对每个历史文件对应的编码数据进行标注获得多个标签数据;[0085]将所述编码数据作为样本数据,并将所述样本数据与所述标签数据一一对应构建训练数据集;[0086]依据所述训练数据集训练目标文件分类模型。[0087]该可选的实施例中,可依据所述关键字的语义对每个历史文件对应的编码数据进行标注以获得多个标签数据,每个标签数据包含一个编码数据和该编码数据对应的类别标签,示例性的,当某一个历史文件中包含insert,delet,update,select等关键字,则可标注该历史文件对应编码数据的类别标签为dml(datamanipulationlanguage,数据操纵语言);当某一个历史文件中包含create、drop、alter等关键字,则可标注该历史文件对应编码数据的类别标签为ddl(datadefinitionlanguage,数据定义语言),并可将所有具备类别标签的编码数据作为标签数据。[0088]该可选的实施例中,可依据所述标签数据的类别标签构建每个标签数据的概率列表,所述概率列表用以表征标签数据的类别和该标签数据属于某一类别的概率,所述概率列表具备两个维度,第一个维度的数值用以表征所述标签数据属于dml类别的概率,第二个维度的数值用以表征所述标签数据属于ddl类别的概率,示例性的,当某一个标签数据属于ddl类别时,则该标签数据对应的概率列表为[0,1]。[0089]该可选的实施例中,可将所有的编码数据作为样本数据,并将所有样本数据与对应标签数据作为训练数据获得训练数据集,进一步可依据所述训练数据集训练目标文件分类模型。[0090]在一个可选的实施例中,所述依据所述训练数据集训练目标文件分类模型,包括:[0091]构建初始文件分类模型,所述初始文件分类模型包括编码器和解码器;[0092]将所述样本数据输入所述初始文件分类模型,获得所述样本数据对应的预测概率列表;[0093]将所述预测概率列表和所述标签数据对应的概率列表输入预设的损失函数获得损失值,依据所述损失值迭代更新所述初始文件分类模型中的参数以获得目标文件分类模型。[0094]该可选的实施例中,所述初始文件分类模型包括编码器和解码器,所述编码器和所述解码器的结构可以是fcnn(fullconnectneuralnetwork)网络、textcnn(textconvolutionneuralnetwork,文本卷积神经网络)或rnn(recurrentneuralnetwork,循环神经网络)等现有的神经网络结构。[0095]该可选的实施例中,所述初始文件分类模型中编码器的输入是所述样本数据,所述初始文件分类模型中解码器的输出是所述样本数据对应的预测概率列表,所述预测概率列表中第一个维度的数值用以表征所述样本数据属于dml类别的概率,所述预测概率列表中第二个维度的数值用以表征所述样本数据属于ddl类别的概率,示例性的,所述预测概率列表的形式可以是[0.2,0.8],该预测概率列表表明所述样本数据属于dml类别的概率为0.2,且所述样本数据属于ddl类别的概率为0.8。[0096]示例性的,如图4所示为所述文件分类模型的结构示意图。[0097]该可选的实施例中,为了使所述样本数据对应的预测概率列表与所述样本数据对应的标签数据的概率列表尽可能的相似,可依据预设的损失函数迭代更新所述初始文件分类模型的参数以获得目标文件分类模型,所述预设的损失函数可以是交叉熵函数,所述交叉熵函数满足以下关系式:[0098][0099]其中,loss代表所述交叉熵函数的损失值,所述损失值越小则表明所述样本数据对应的预测概率列表与所述标签数据对应的概率列表之间的相似性越高;i代表所述类别标签的索引,且i∈{dml,ddl};p(i)代表所述标签数据中i类别的概率;q(i)代表所述预测概率列表中i类别的概率。[0100]该可选的实施例中,可将所述样本数据依次送入所述初始文件分类模型以获取预测概率列表,并依据所述预测概率列表与标签数据对应的概率列表计算损失值,进一步可利用梯度下降法迭代更新所述初始文件分类模型中的参数,直到所述损失值不再降低,则终止迭代并获得目标文件分类模型。[0101]如此,依据历史文件中关键字的语义对每个历史文件对应的编码向量进行标注获得标签数据,将所有编码数据作为样本数据并与标签数据一一对应作为训练数据集,进一步利用训练数据训练初始文件分类模型,通过大量数据拟合出了较为精确的目标文件分类模型,能够为后续大数据自动同步流程提供便捷的分类方式,提升了大数据自动同步流程的效率。[0102]s12,依据预设的编码规范评估提报文件获得合格文件,所述提报文件代表未被评估且待同步的文件,所述合格文件代表符合所述预设的编码规范的提报文件。[0103]在一个可选的实施例中,所述依据预设的编码规范评估提报文件获得合格文件,包括:[0104]对提报文件进行分词获得提报词汇列表,所述提报词汇列表包含多个提报词汇;[0105]依据预设的编码规范评估每个提报词汇获得多个评估结果,并依据所有评估结果计算所述提报词汇列表对应的评估值;[0106]依据所述评估值将所述提报词汇列表对应的提报文件分类为合格文件和不合格文件。[0107]该可选的实施例中,可依据预设的分词工具对提报文件进行分词以获得所述提报文件对应的提报词汇列表,示例性的,所述预设的分词工具可以是jieba分词工具、ansj分词工具或hanlp分词工具等现有的分词工具,本技术对此不作限定。所述分词工具的输入是所述提报文件,所述分词工具的输出是所述提拔文件对应的提报词汇列表,所述提报词汇列表包括多个提报词汇。[0108]示例性的,当所述提报文件的内容为“selecttablefromdatabase”,则该提报文件对应的提报词汇列表为[select,table,from,database]。[0109]该可选的实施例中,可初始化设置所述提报词汇列表对应的评估值为0,并可依据预设的编码规范评估所述提报词汇列表中的每个提报词汇,若所述提报词汇不符合所述预设的编码规范则该提报词汇列表对应的评估值增加1,否则不对所述评估值做任何操作,所述预设的编码规范至少包括:[0110]若所述提报词汇是关键字则该提报词汇应为大写格式;[0111]若所述提报词汇不是关键字,则该提报词汇的首字母应大写。[0112]该可选的实施例中,可依据所述提报词汇列表对应的评估值对该提报词汇列表对应的提报文件进行分类,若所述评估值不为0,则可将所述提报文件分类为不合格文件;若所述评估值为0,则可将所述提报文件分类为合格文件。[0113]该可选的实施例中,可将不合格文件退回至开发人员并通知开发人员进行修改;并可将合格文件送入步骤s13进行分类操作。[0114]如此,通过预设的编码规范对提报文件进行分类,并依据所述提报文件的类别做出下一步操作,能够在大数据同步的最初阶段筛查不符合编码规范的文件,从而提升文件同步的效率。[0115]s13,依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件。[0116]在一个可选的实施例中,所述依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件,包括:[0117]依据所述关键字哈希表查询所述合格文件中每个关键字对应的索引以获得所述合格文件对应的编码向量;[0118]依据所述预设的特征提取算法对所述合格文件的编码向量进行特征提取获得合格文件的编码数据;[0119]将所述合格文件的编码数据输入所述目标文件分类模型获得分类结果,并依据所述分类结果标记所述合格文件以获得分类文件。[0120]该可选的实施例中,可依据所述关键字哈希表查询所述合格文件中每个关键字对应的索引,示例性的,当所述合格文件中关键字为“select”,则从所述关键字哈希表中查询该关键字对应的索引为1。[0121]该可选的实施例中,可依据所述合格文件中关键字的排列顺序组合所述关键字的索引以获得合格文件编码向量,示例性的,当所述关键字的排列顺序为“select”、“from”、“where”、“and”,则所述合格文件对应的编码向量为[1,2,3,4]。[0122]该可选的实施例中,可依据所述预设的特征提取算法对所述合格文件的编码向量进行特征提取以获取该编码向量对应的合格文件的编码数据,所述预设的特征提取算法可以是svd奇异值分解算法、pca(principlecomponentanalysis,主成分分析)算法、ae(auto-encoder,自编码神经网络)网络等现有的特征提取算法,本技术对此不作限定。[0123]该可选的实施例中,可将所述合格文件的编码数据输入所述目标文件分类模型获得分类结果,所述分类结果为预测概率列表,所述预测概率列表具备两个维度,每个维度分别对应一个概率值,每个概率值分别用以表征所述合格文件属于dml类别的概率和属于ddl类别的概率,示例性的,当所述预测分类列表为[0.1,0.9]时,该预测分类列表用以表征对应的合格文件属于dml类别的概率为0.1,且属于ddl类别的概率为0.9。[0124]该可选的实施例中,可选取所述合格文件对应的预测分类列表中较大概率值对应的类别作为所述合格文件对应的类别,并依据所述类别对所述待合格文件进行标记获得分类文件。[0125]示例性的,当某一个合格文件经过所述目标文件分类模型进行分类后获得的分类结果为[0.1,0.9],则该合格文件属于ddl类别,则该合格文件对应的分类文件的类别为ddl。[0126]如此,通过对提报文件进行分词和查询获得了提报向量,并将提报向量输入所述文件分类模型获得了所述提报文件对应的类别,为后续大数据同步提供了类别指引,从而提升了大数据同步的效率。[0127]s14,设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件。[0128]在一个可选的实施例中,每个分类文件对应一个提报时间,所述设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件,包括:[0129]依据所述分类文件的提报时间设置所述分类文件的时间优先级;[0130]依据所述时间优先级由高到低的顺序执行所述分类文件以获得每个分类文件对应的运行日志;[0131]遍历所述运行日志的内容以查询报错信息,若无报错信息则标记所述分类文件为待同步文件,若有报错信息则标记该分类文件并通知开发人员进行修改。[0132]该可选的实施例中,可依据所述分类文件的提报时间设置所述分类文件的时间优先级,所述提报时间用以表征所述分类文件被上传至服务器系统中的时刻,所述时间优先级用以表征所述分类文件应被执行的次序,所述提报时间与当前时刻的差值越大则该提报时间对应的分类文件的时间优先级越高。[0133]该可选的实施例中,可依据所述分类文件的时间优先级由高到低的次序执行所述分类文件以获得所述分类文件对应的运行日志,示例性的,如图5所示为所述运行日志的结构示意图。[0134]该可选的实施例中,可依据预设的遍历方法遍历所述运行日志中的每个日志词汇,并对比遍历到的每个日志词汇与预设的报错关键词以获得多个对比结果,若遍历到的日志词汇与所述报错关键词相同则遍历结果为1,若遍历到的日志词汇与所述报错关键词不同则遍历结果为0,所述预设的遍历方法可以是顺序遍历算法、随机遍历算法或二分遍历算法中的任意一种,本技术对此不作限定,所述预设的报错关键词可以是“warning”。[0135]该可选的实施例中,若所述多个对比结果中包括1,则该运行日志对应的分类文件运行失败,可标记该分类文件为“运行失败文件”并将该分类文件返还至开发人员并通知开发人员进行修改。[0136]该可选的实施例中,若遍历结束且所有对比结果都为0则未查询到报错信息,则表明该分类文件运行成功且可以将该分类文件作为待同步文件以进行数据同步操作。[0137]如此,基于分类文件提报的时间设置了分类文件对应的时间优先级,并依据时间优先级由高到低的顺序运行分类文件以获得运行日志,进一步依据运行日志的报错信息制定所述分类文件的错误信息,能够将包含错误信息的文件剔除,从而提升文件同步的安全性。[0138]s15,依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步。[0139]在一个可选的实施例中,所述依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步,包括:[0140]将类别为dml的待同步文件分组为实时组,并将类别为ddl的待同步文件分组为循环组;[0141]先遍历所述实时组中的所有待同步文件以完成实时同步;[0142]再遍历所述循环组中的所有待同步文件以完成循环同步。[0143]该可选的实施例中,可将类别为dml的待同步文件归类为实时组,并可将类别为ddl的待同步文件归类为循环组,所述实时组和所述循环组都至少包括一个待同步文件。[0144]该可选的实施例中,首先可依据所述实时组中每一个待同步文件的时间优先级由高到低的顺序遍历所述实时组中每一个待同步文件。为了确保所述待同步文件不会对服务器系统造成影响,可查询每次遍历到的待同步文件是否具备后置依赖表,由于所述后置依赖表是指基于待同步文件产生的数据表,因此当待同步文件同步至所述服务器集群的所有服务器节点后将对所述服务器集群中该待同步文件的所有后置依赖表产生影响,则若所述待同步文件具备后置依赖表,则将该待同步文件转移至所述循环组;若所述待同步文件不具备后置依赖表,则可将该待同步文件分发至所述服务器集群中的所有服务器系统,并在所有服务器系统中执行该待同步文件以完成同步操作。直到所述实时组中的所有待同步文件都被遍历完成则停止遍历。[0145]该可选的实施例中,可在预设的启动时刻开始遍历所述循环组中所有的待同步文件,示例性的,所述预设的启动时刻可以是服务器系统时间的18:00。[0146]该可选的实施例中,可依据所述循环组中所有待同步文件的时间优先级由高到低的顺序遍历所述循环组中所有的待同步文件,并可查询每次遍历到的待同步文件是否具备后置依赖表,若所述待同步文件具备后置依赖表,则不对该待同步文件做任何操作;若该待同步文件不具备后置依赖表,则可将该待同步文件分发至所述服务器集群中的所有服务器系统,并在所有服务器系统中执行该待同步文件以完成同步操作。[0147]该可选的实施例中,可依据预设的循环时间定时遍历所述循环组中的所有待同步文件以对所述循环组中每个待同步文件进行同步操作,直至所述循环组中的所有待同步文件都完成同步操作则停止循环,示例性的,当所述预设的循环时间为10分钟时,则每隔10分钟遍历一次所述循环组,直至所述循环组中所有的待同步文件完成同步操作则停止循环。[0148]如此,通过待同步文件的类别分组执行同步操作,并在同步过程中查询所述待同步文件的后置依赖表以规避所述待同步文件对数据库的修改从而造成对服务器系统的影响,提升了数据同步操作的安全性。[0149]上述基于人工智能的文件同步方法通过对历史文件进行编码获得了编码数据,并依据编码数据训练目标文件分类模型以供后续文件的分类任务,并依据预设编码规范对于提报文件进行评估以筛选出合格的文件,进一步制定每个合格文件的优先级并对于所有合格文件进行分类,最终依据合格文件的类别和优先级循环执行同步操作,从而提升了文件同步的效率。[0150]如图2所示,是本技术实施例提供的基于人工智能的文件同步装置的较佳实施例的功能模块图。基于人工智能的文件同步装置11包括编码单元110、训练单元111、评估单元112、分类单元113、执行单元114、同步单元115。本技术所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。[0151]在一个可选的实施例中,编码单元110用于对历史文件进行编码获得每个历史文件对应的编码数据。[0152]在一个可选的实施例中,每个历史文件包含多个关键字,所述对历史文件进行编码获得每个历史文件对应的编码数据,包括:[0153]构建所述关键字的索引,并依据所述索引和关键字构建关键字哈希表;[0154]依据每个历史文件中关键字的排列顺序组合每个关键字对应的索引作为每个历史文件对应的编码向量;[0155]对所述编码向量进行特征提取获得每个历史文件对应的编码数据。[0156]该可选的实施例中,所述历史文件可以是sql文件,所述历史文件的功能是在所述服务器集群中完成对数据的增删改查等操作,所述服务器集群包含多个服务器系统,所述关键字可以是sql语言中的默认的关键字,所述关键字至少包括“select”、“from”、“where”、“and”、“or”、“union”、“insert”、“delete”、“group”、“having”、“count”、“update”等。[0157]该可选的实施例中,可依据自然数构建每个关键字的索引,示例性的,可将“select”的索引设置为1、可将“from”的索引设置为2、可将“where”的索引设置为3、可将“and”的索引设置为4、可将“or”的索引设置为5、可将“union”的索引设置为6,其余关键字以此类推。[0158]在另一些可选的实施例中,还可从ascii编码集、unicode编码集或utf-8编码集等现有的编码集中任选一个以查询每个关键字对应的编码作为每个关键字对应的索引,以ascii编码集为例,可将“select”的索引设置为8369766784、可将“from”的索引设置为70827977、可将“where”的索引设置为8772698269、可将“and”的索引设置为657868、可将“or”的索引设置为7982、可将union的索引设置为8578737978。[0159]该可选的实施例中,可将所述关键字的索引作为键,并将每个索引对应的关键字作为值以构建键值对,并存储所有键值对以构建关键字哈希表,所述关键字哈希表包含多个键值对,每个键值对用以表征一组索引和关键字。[0160]该可选的实施例中,可依据每个历史文件中关键字的排列顺序组合每个关键字对应的索引作为每个文件对应的编码向量。[0161]示例性的,若利用自然数设置所述关键字的索引,当某一个历史文件中关键字的排列顺序为“select”、“from”、“where”、“and”,则该历史文件对应的编码向量为[1,2,3,4];当另一个历史文件中关键字的排列顺序为“from”、“select”、“and”、“or”、“where”,则该历史文件对应的编码向量为[2,1,4,5,3]。[0162]该可选的实施例中,可依据预设的特征提取算法对所述编码向量进行特征提取获得每个历史文件对应的编码数据,所述特征提取算法的目的是对所述编码向量进行降维以提升后续文件分类的效率。所述预设的特征提取算法可以是svd奇异值分解算法、pca(principlecomponentanalysis,主成分分析)算法、ae(auto-encoder,自编码神经网络)网络等现有的特征提取算法,本技术对此不作限定。[0163]该可选的实施例中,可记所述编码数据为vi,其中,i∈[1,n]且i代表编码数据的索引,n代表所述历史文件的个数,且所有的编码数据的维度都相等。[0164]在一个可选的实施例中,训练单元111用于依据所述编码数据训练目标文件分类模型。[0165]在一个可选的实施例中,所述依据所述编码数据训练目标文件分类模型,包括:[0166]依据所述关键字的语义对每个历史文件对应的编码数据进行标注获得多个标签数据;[0167]将所述编码数据作为样本数据,并将所述样本数据与所述标签数据一一对应构建训练数据集;[0168]依据所述训练数据集训练目标文件分类模型。[0169]该可选的实施例中,可依据所述关键字的语义对每个历史文件对应的编码数据进行标注以获得多个标签数据,每个标签数据包含一个编码数据和该编码数据对应的类别标签,示例性的,当某一个历史文件中包含insert,delet,update,select等关键字,则可标注该历史文件对应编码数据的类别标签为dml(datamanipulationlanguage,数据操纵语言);当某一个历史文件中包含create、drop、alter等关键字,则可标注该历史文件对应编码数据的类别标签为ddl(datadefinitionlanguage,数据定义语言),并可将所有具备类别标签的编码数据作为标签数据。[0170]该可选的实施例中,可依据所述标签数据的类别标签构建每个标签数据的概率列表,所述概率列表用以表征标签数据的类别和该标签数据属于某一类别的概率,所述概率列表具备两个维度,第一个维度的数值用以表征所述标签数据属于dml类别的概率,第二个维度的数值用以表征所述标签数据属于ddl类别的概率,示例性的,当某一个标签数据属于ddl类别时,则该标签数据对应的概率列表为[0,1]。[0171]该可选的实施例中,可将所有的编码数据作为样本数据,并将所有样本数据与对应标签数据作为训练数据获得训练数据集,进一步可依据所述训练数据集训练目标文件分类模型。[0172]在一个可选的实施例中,所述依据所述训练数据集训练目标文件分类模型,包括:[0173]构建初始文件分类模型,所述初始文件分类模型包括编码器和解码器;[0174]将所述样本数据输入所述初始文件分类模型,获得所述样本数据对应的预测概率列表;[0175]将所述预测概率列表和所述标签数据对应的概率列表输入预设的损失函数获得损失值,依据所述损失值迭代更新所述初始文件分类模型中的参数以获得目标文件分类模型。[0176]该可选的实施例中,所述初始文件分类模型包括编码器和解码器,所述编码器和所述解码器的结构可以是fcnn(fullconnectneuralnetwork)网络、textcnn(textconvolutionneuralnetwork,文本卷积神经网络)或rnn(recurrentneuralnetwork,循环神经网络)等现有的神经网络结构。[0177]该可选的实施例中,所述初始文件分类模型中编码器的输入是所述样本数据,所述初始文件分类模型中解码器的输出是所述样本数据对应的预测概率列表,所述预测概率列表中第一个维度的数值用以表征所述样本数据属于dml类别的概率,所述预测概率列表中第二个维度的数值用以表征所述样本数据属于ddl类别的概率,示例性的,所述预测概率列表的形式可以是[0.2,0.8],该预测概率列表表明所述样本数据属于dml类别的概率为0.2,且所述样本数据属于ddl类别的概率为0.8。[0178]示例性的,如图4所示为所述文件分类模型的结构示意图。[0179]该可选的实施例中,为了使所述样本数据对应的预测概率列表与所述样本数据对应的标签数据的概率列表尽可能的相似,可依据预设的损失函数迭代更新所述初始文件分类模型的参数以获得目标文件分类模型,所述预设的损失函数可以是交叉熵函数,所述交叉熵函数满足以下关系式:[0180][0181]其中,loss代表所述交叉熵函数的损失值,所述损失值越小则表明所述样本数据对应的预测概率列表与所述标签数据对应的概率列表之间的相似性越高;i代表所述类别标签的索引,且i∈{dml,ddl};p(i)代表所述标签数据中i类别的概率;q(i)代表所述预测概率列表中i类别的概率。[0182]该可选的实施例中,可将所述样本数据依次送入所述初始文件分类模型以获取预测概率列表,并依据所述预测概率列表与标签数据对应的概率列表计算损失值,进一步可利用梯度下降法迭代更新所述初始文件分类模型中的参数,直到所述损失值不再降低,则终止迭代并获得目标文件分类模型。[0183]在一个可选的实施例中,所述依据所述训练数据集训练目标文件分类模型,包括:[0184]构建初始文件分类模型,所述初始文件分类模型包括编码器和解码器;[0185]将所述样本数据输入所述初始文件分类模型,获得所述样本文件对应的预测概率列表;[0186]将所述预测概率列表和所述标签数据对应的概率列表输入预设的损失函数获得损失值,依据所述损失值迭代更新所述初始文件分类模型中的参数以获得目标文件分类模型。[0187]该可选的实施例中,所述初始文件分类模型包括编码器和解码器,所述编码器和所述解码器的结构可以是fcnn(fullconnectneuralnetwork)网络、textcnn(textconvolutionneuralnetwork,文本卷积神经网络)或rnn(recurrentneuralnetwork,循环神经网络)等现有的神经网络结构。[0188]该可选的实施例中,所述初始文件分类模型中编码器的输入是所述样本数据,所述初始文件分类模型中解码器的输出是所述样本数据对应的预测概率列表,所述预测概率列表中第一个维度的数值用以表征所述样本数据属于dml类别的概率,所述预测概率列表中第二个维度的数值用以表征所述样本数据属于ddl类别的概率,示例性的,所述预测概率列表的形式可以是[0.2,0.8],该预测概率列表表明所述样本数据属于dml类别的概率为0.2,且所述样本数据属于ddl类别的概率为0.8。[0189]示例性的,如图4所示为所述文件分类模型的结构示意图。[0190]该可选的实施例中,为了使所述样本数据对应的预测概率列表与所述标签数据对应的概率列表尽可能的相似,可依据预设的损失函数迭代更新所述初始文件分类模型的参数以获得目标文件分类模型,所述预设的损失函数可以是交叉熵函数,所述交叉熵函数满足以下关系式:[0191][0192]其中,loss代表所述交叉熵函数的损失值,所述损失值越小则表明所述样本数据对应的预测概率列表与所述标签数据对应的概率列表之间的相似性越高;i代表所述类别的索引,且i∈{dml,ddl};p(i)代表所述标签数据中i类别的概率;q(i)代表所述分类结果中i类别的概率。[0193]该可选的实施例中,可将所述样本数据依次送入所述初始文件分类模型以获取预测概率列表,并依据所述预测概率列表与标签数据对应的概率列表计算损失值,进一步可利用梯度下降法迭代更新所述初始文件分类模型中的参数,直到所述损失值不再降低,则终止迭代并获得目标文件分类模型。[0194]在一个可选的实施例中,评估单元112用于依据预设的编码规范评估提报文件获得多个合格文件,所述合格文件代表符合所述预设的编码规范的提报文件。[0195]在一个可选的实施例中,所述依据预设的编码规范评估提报文件获得合格文件,包括:[0196]对提报文件进行分词获得提报词汇列表,所述提报词汇列表包含多个提报词汇;[0197]依据预设的编码规范评估每个提报词汇获得多个评估结果,并依据所有评估结果计算所述提报词汇列表对应的评估值;[0198]依据所述评估值将所述提报词汇列表对应的提报文件分类为合格文件和不合格文件。[0199]该可选的实施例中,可依据预设的分词工具对提报文件进行分词以获得所述提报文件对应的提报词汇列表,示例性的,所述预设的分词工具可以是jieba分词工具、ansj分词工具或hanlp分词工具等现有的分词工具,本技术对此不作限定。所述分词工具的输入是所述提报文件,所述分词工具的输出是所述提拔文件对应的提报词汇列表,所述提报词汇列表包括多个提报词汇。[0200]示例性的,当所述提报文件的内容为“selecttablefromdatabase”,则该提报文件对应的提报词汇列表为[select,table,from,database]。[0201]该可选的实施例中,可初始化设置所述提报词汇列表对应的评估值为0,并可依据预设的编码规范评估所述提报词汇列表中的每个提报词汇,若所述提报词汇不符合所述预设的编码规范则该提报词汇列表对应的评估值增加1,否则不对所述评估值做任何操作,所述预设的编码规范至少包括:[0202]若所述提报词汇是关键字则该提报词汇应为大写格式;[0203]若所述提报词汇不是关键字,则该提报词汇的首字母应大写。[0204]该可选的实施例中,可依据所述提报词汇列表对应的评估值对该提报词汇列表对应的提报文件进行分类,若所述评估值不为0,则可将所述提报文件分类为不合格文件;若所述评估值为0,则可将所述提报文件分类为合格文件。[0205]该可选的实施例中,可将不合格文件退回至开发人员并通知开发人员进行修改;并可将合格文件送入分类单元113进行分类操作。[0206]在一个可选的实施例中,分类单元113用于依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件。[0207]在一个可选的实施例中,所述依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件,包括:[0208]依据所述关键字哈希表查询所述合格文件中每个关键字对应的索引以获得所述合格文件对应的编码向量;[0209]依据所述预设的特征提取算法对所述合格文件的编码向量进行特征提取获得合格文件的编码数据;[0210]将所述合格文件的编码数据输入所述目标文件分类模型获得分类结果,并依据所述分类结果标记所述合格文件以获得分类文件。[0211]该可选的实施例中,可依据所述关键字哈希表查询所述合格文件中每个关键字对应的索引,示例性的,当所述合格文件中关键字为“select”,则从所述关键字哈希表中查询该关键字对应的索引为1。[0212]该可选的实施例中,可依据所述合格文件中关键字的排列顺序组合所述关键字的索引以获得合格文件编码向量,示例性的,当所述关键字的排列顺序为“select”、“from”、“where”、“and”,则所述合格文件对应的编码向量为[1,2,3,4]。[0213]该可选的实施例中,可依据所述预设的特征提取算法对所述合格文件的编码向量进行特征提取以获取该编码向量对应的合格文件的编码数据,所述预设的特征提取算法可以是svd奇异值分解算法、pca(principlecomponentanalysis,主成分分析)算法、ae(auto-encoder,自编码神经网络)网络等现有的特征提取算法,本技术对此不作限定。[0214]该可选的实施例中,可将所述合格文件的编码数据输入所述目标文件分类模型获得分类结果,所述分类结果为预测概率列表,所述预测概率列表具备两个维度,每个维度分别对应一个概率值,每个概率值分别用以表征所述合格文件属于dml类别的概率和属于ddl类别的概率,示例性的,当所述预测分类列表为[0.1,0.9]时,该预测分类列表用以表征对应的合格文件属于dml类别的概率为0.1,且属于ddl类别的概率为0.9。[0215]该可选的实施例中,可选取所述合格文件对应的预测分类列表中较大概率值对应的类别作为所述合格文件对应的类别,并依据所述类别对所述待合格文件进行标记获得分类文件。[0216]示例性的,当某一个合格文件经过所述目标文件分类模型进行分类后获得的分类结果为[0.1,0.9],则该合格文件属于ddl类别,则该合格文件对应的分类文件的类别为ddl。[0217]在一个可选的实施例中,执行单元114用于设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件。[0218]在一个可选的实施例中,每个分类文件对应一个提报时间,所述设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件,包括:[0219]依据所述分类文件的提报时间设置所述分类文件的时间优先级;[0220]依据所述时间优先级由高到低的顺序执行所述分类文件以获得每个分类文件对应的运行日志;[0221]遍历所述运行日志的内容以查询报错信息,若无报错信息则标记所述分类文件为待同步文件,若有报错信息则标记该分类文件并通知开发人员进行修改。[0222]该可选的实施例中,可依据所述分类文件的提报时间设置所述分类文件的时间优先级,所述提报时间用以表征所述分类文件被上传至服务器系统中的时刻,所述时间优先级用以表征所述分类文件应被执行的次序,所述提报时间与当前时刻的差值越大则该提报时间对应的分类文件的时间优先级越高。[0223]该可选的实施例中,可依据所述分类文件的时间优先级由高到低的次序执行所述分类文件以获得所述分类文件对应的运行日志,示例性的,如图5所示为所述运行日志的结构示意图。[0224]该可选的实施例中,可依据预设的遍历方法遍历所述运行日志中的每个日志词汇,并对比遍历到的每个日志词汇与预设的报错关键词以获得多个对比结果,若遍历到的日志词汇与所述报错关键词相同则遍历结果为1,若遍历到的日志词汇与所述报错关键词不同则遍历结果为0,所述预设的遍历方法可以是顺序遍历算法、随机遍历算法或二分遍历算法中的任意一种,本技术对此不作限定,所述预设的报错关键词可以是“warning”。[0225]该可选的实施例中,若所述多个对比结果中包括1,则该运行日志对应的分类文件运行失败,可标记该分类文件为“运行失败文件”并将该分类文件返还至开发人员并通知开发人员进行修改。[0226]该可选的实施例中,若遍历结束且所有对比结果都为0则未查询到报错信息,则表明该分类文件运行成功且可以将该分类文件作为待同步文件以进行数据同步操作。[0227]在一个可选的实施例中,同步单元115用于依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步。[0228]在一个可选的实施例中,所述依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步,包括:[0229]将类别为dml的待同步文件分组为实时组,并将类别为ddl的待同步文件分组为循环组;[0230]先遍历所述实时组中的所有待同步文件以完成实时同步;[0231]再遍历所述循环组中的所有待同步文件以完成循环同步。[0232]该可选的实施例中,可将类别为dml的待同步文件归类为实时组,并可将类别为ddl的待同步文件归类为循环组,所述实时组和所述循环组都至少包括一个待同步文件。[0233]该可选的实施例中,首先可依据所述实时组中每一个待同步文件的时间优先级由高到低的顺序遍历所述实时组中每一个待同步文件。为了确保所述待同步文件不会对服务器系统造成影响,可查询每次遍历到的待同步文件是否具备后置依赖表,由于所述后置依赖表是指基于待同步文件产生的数据表,因此当待同步文件同步至所述服务器集群的所有服务器节点后将对所述服务器集群中该待同步文件的所有后置依赖表产生影响,则若所述待同步文件具备后置依赖表,则将该待同步文件转移至所述循环组;若所述待同步文件不具备后置依赖表,则可将该待同步文件分发至所述服务器集群中的所有服务器系统,并在所有服务器系统中执行该待同步文件以完成同步操作。直到所述实时组中的所有待同步文件都被遍历完成则停止遍历。[0234]该可选的实施例中,可在预设的启动时刻开始遍历所述循环组中所有的待同步文件,示例性的,所述预设的启动时刻可以是服务器系统时间的18:00。[0235]该可选的实施例中,可依据所述循环组中所有待同步文件的时间优先级由高到低的顺序遍历所述循环组中所有的待同步文件,并可查询每次遍历到的待同步文件是否具备后置依赖表,若所述待同步文件具备后置依赖表,则不对该待同步文件做任何操作;若该待同步文件不具备后置依赖表,则可将该待同步文件分发至所述服务器集群中的所有服务器系统,并在所有服务器系统中执行该待同步文件以完成同步操作。[0236]该可选的实施例中,可依据预设的循环时间定时遍历所述循环组中的所有待同步文件以对所述循环组中每个待同步文件进行同步操作,直至所述循环组中的所有待同步文件都完成同步操作则停止循环,示例性的,当所述预设的循环时间为10分钟时,则每隔10分钟遍历一次所述循环组,直至所述循环组中所有的待同步文件完成同步操作则停止循环。[0237]上述基于人工智能的文件同步方法通过对历史文件进行编码获得了编码数据,并依据编码数据训练目标文件分类模型以供后续文件的分类任务,并依据预设编码规范对于提报文件进行评估以筛选出合格的文件,进一步制定每个合格文件的优先级并对于所有合格文件进行分类,最终依据合格文件的类别和优先级循环执行同步操作,从而提升了文件同步的效率。[0238]如图3所示,是本技术实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令,处理器13用执行储器中存储的计算机可读指令以实现上述任一实施例的基于人工智能的文件同步方法。[0239]在一个可选的实施例中,电子设备1还包括总线、存储在存储器12中并可在处理器13上运行的计算机程序,例如基于人工智能的文件同步程序。[0240]图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。[0241]结合图1,电子设备1中的存储器12存储多个计算机可读指令以实现一种基于人工智能的文件同步方法,处理器13可执行多个指令从而实现:[0242]对历史文件进行编码获得每个历史文件对应的编码数据;[0243]依据所述编码数据训练目标文件分类模型;[0244]依据预设的编码规范评估提报文件获得合格文件;[0245]依据所述目标文件分类模型对所述合格文件进行分类以获取分类文件;[0246]设置所述分类文件的时间优先级,依据时间优先级由高到底的顺序执行所述分类文件以获得待同步文件;[0247]依据所述待同步文件的类别将所述待同步文件分组为实时组和循环组,分别对所述实时组和循环组中的所有待同步文件进行同步操作以完成同步。[0248]具体地,处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。[0249]其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质可以是非易失性的,也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smartmediacard,smc)、安全数字(securedigital,sd)卡、闪存卡(flashcard)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于人工智能的文件同步程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。[0250]处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(centralprocessingunit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(controlunit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在存储器12内的程序或者模块(例如执行基于人工智能的文件同步程序等),以及调用存储在存储器12内的数据,以执行电子设备1的各种功能和处理数据。[0251]处理器13执行电子设备1的操作系统以及安装的各类应用程序。处理器13执行所述应用程序以实现上述各个基于人工智能的文件同步方法实施例中的步骤,例如图1所示的步骤。[0252]示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在存储器12中,并由处理器13执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如,所述计算机程序可以被分割成编码单元110、训练单元111、评估单元112、分类单元113、执行单元114、同步单元115。[0253]上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本技术各个实施例所述基于人工智能的文件同步方法的部分。[0254]电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。[0255]其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存储器及其他存储器等。[0256]进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。[0257]本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。[0258]总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现存储器12以及至少一个处理器13等之间的连接通信。[0259]本技术实施例还提供一种计算机可读存储介质(图未示),计算机可读存储介质中存储有计算机可读指令,计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于人工智能的文件同步方法。[0260]在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。[0261]所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。[0262]另外,在本技术各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。[0263]此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。[0264]最后应说明的是,以上实施例仅用以说明本技术的技术方案而非限制,尽管参照较佳实施例对本技术进行了详细说明,本领域的普通技术人员应当理解,可以对本技术的技术方案进行修改或等同替换,而不脱离本技术技术方案的精神和范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1