文件的处理方法及装置、存储介质和电子设备与流程

文档序号:36705675发布日期:2024-01-16 11:40阅读:14来源:国知局
文件的处理方法及装置、存储介质和电子设备与流程

本技术涉及金融科技领域,具体而言,涉及一种文件的处理方法及装置、存储介质和电子设备。


背景技术:

1、目前,电脑已经是人们不可或缺的一种工具。而在日常办公中,人们或多或少需要通过文档记录工作内容和备份相关材料,并常常把这些文档放在电脑桌面上。且在当文档逐渐变多后,电脑桌面将变得特别凌乱,怎么整理这些文档就变成了一件令人头疼的事情。而且,相关技术中,一般按个人习惯手工分类整理不同的文档,或者使用专门的日记软件记录内容,从而实现对文件的整理。

2、但是,如果通过手工分类整理不同的文档,当文档数量很多时,手工维护繁琐且容易出错,而且还有可能忘记历史文档存放地址。另外,使用专门的日记软件记录内容时,由于专门的日记软件有自身的记录格式,而工作中常常会使用不同格式的文件进行记录,比如常用的“word文档”、“ppt”等,格式不可能一成不变。因此,日记软件只适合个人记录一些日常内容,但并不适用需要分享给他人的文档。

3、针对相关技术中通过手工整理文件的方式整理电脑中存储的多个文件,导致整理文件的过程较为繁琐且容易出错的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术的主要目的在于提供一种文件的处理方法及装置、存储介质和电子设备,以解决相关技术中通过手工整理文件的方式整理电脑中存储的多个文件,导致整理文件的过程较为繁琐且容易出错的问题。

2、为了实现上述目的,根据本技术的一个方面,提供了一种文件的处理方法。该方法包括:从目标设备中获取待处理的n个第一文件,其中,所述目标设备用于存储文件,n为大于1的正整数;获取每个第一文件的内容信息,并基于每个第一文件的内容信息确定m个第一关键字,其中,m为大于1的正整数;确定每个第一关键字所属的第一文件和每个第一关键字在所述第一文件中出现的频率信息,并基于所述m个第一关键字、每个第一关键字所属的第一文件和每个第一关键字在所述第一文件中出现的频率信息构建倒排索引表;获取每个第一文件的属性信息,并依据所述倒排索引表和每个第一文件的属性信息确定对所述n个第一文件的处理结果。

3、进一步地,依据所述倒排索引表和每个第一文件的属性信息确定对所述n个第一文件的处理结果包括:依据所述倒排索引表确定对所述n个第一文件的第一处理结果;依据每个第一文件的属性信息确定对所述n个第一文件的第二处理结果;基于所述第一处理结果和所述第二处理结果确定所述处理结果。

4、进一步地,在依据所述倒排索引表确定对所述n个第一文件的第一处理结果之后,所述方法还包括:接收目标对象发送的目标请求,其中,所述目标请求用于请求搜索第二文件;响应所述目标请求,并获取所述第二文件的内容信息;对所述第二文件的内容信息进行分词处理,得到q个第二关键字,其中,q为大于1的正整数;基于所述倒排索引表和所述q个第二关键字确定所述n个第一文件中与所述第二文件最接近的目标文件,并获取所述目标文件的存储路径;将所述目标文件和所述目标文件的存储路径返回至所述目标对象。

5、进一步地,依据每个第一文件的属性信息确定对所述n个第一文件的第二处理结果包括:依据每个第一文件的属性信息从所述n个第一文件中确定s个第一文件和t个第一文件,其中,所述s个第一文件中每个第一文件的使用频率高于预设频率,所述t个第一文件中每个第一文件的使用频率低于所述预设频率,s和t均为小于n的正整数;将所述s个第一文件移动至目标文件夹中;按照预设时长对所述t个第一文件进行分类处理,得到所述t个第一文件对应的目录列表;基于所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件确定所述第二处理结果。

6、进一步地,在基于所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件确定所述第二处理结果之后,所述方法还包括:基于所述第二处理结果确定展示界面的内容,其中,所述展示界面的内容中至少包括:所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件,所述展示界面用于目标对象搜索文件;向所述目标对象展示所述展示界面的内容。

7、进一步地,在基于所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件确定所述第二处理结果之后,所述方法还包括:当检测到所述目标设备出现故障时,获取所述t个第一文件和所述目标文件夹中的所述s个第一文件;对所述t个第一文件和所述目标文件夹中的所述s个第一文件进行备份处理。

8、进一步地,基于每个第一文件的内容信息确定m个第一关键字包括:按照预设规则对每个第一文件的内容信息进行分词处理,得到p个第一关键字,其中,p为大于m的正整数;从所述p个第一关键字中去除w个目标文字,得到所述m个第一关键字,其中,所述目标文字的重要程度低于预设的重要程度,w为正整数。

9、为了实现上述目的,根据本技术的另一方面,提供了一种文件的处理装置。该装置包括:第一获取单元,用于从目标设备中获取待处理的n个第一文件,其中,所述目标设备用于存储文件,n为大于1的正整数;第一处理单元,用于获取每个第一文件的内容信息,并基于每个第一文件的内容信息确定m个第一关键字,其中,m为大于1的正整数;第二处理单元,用于确定每个第一关键字所属的第一文件和每个第一关键字在所述第一文件中出现的频率信息,并基于所述m个第一关键字、每个第一关键字所属的第一文件和每个第一关键字在所述第一文件中出现的频率信息构建倒排索引表;第三处理单元,用于获取每个第一文件的属性信息,并依据所述倒排索引表和每个第一文件的属性信息确定对所述n个第一文件的处理结果。

10、进一步地,所述第三处理单元包括:第一确定模块,用于依据所述倒排索引表确定对所述n个第一文件的第一处理结果;第二确定模块,用于依据每个第一文件的属性信息确定对所述n个第一文件的第二处理结果;第三确定模块,用于基于所述第一处理结果和所述第二处理结果确定所述处理结果。

11、进一步地,所述装置还包括:第一接收单元,用于在依据所述倒排索引表确定对所述n个第一文件的第一处理结果之后,接收目标对象发送的目标请求,其中,所述目标请求用于请求搜索第二文件;第一响应单元,用于响应所述目标请求,并获取所述第二文件的内容信息;第四处理单元,用于对所述第二文件的内容信息进行分词处理,得到q个第二关键字,其中,q为大于1的正整数;第五处理单元,用于基于所述倒排索引表和所述q个第二关键字确定所述n个第一文件中与所述第二文件最接近的目标文件,并获取所述目标文件的存储路径;第一返回单元,用于将所述目标文件和所述目标文件的存储路径返回至所述目标对象。

12、进一步地,所述第二确定模块包括:第一确定子模块,用于依据每个第一文件的属性信息从所述n个第一文件中确定s个第一文件和t个第一文件,其中,所述s个第一文件中每个第一文件的使用频率高于预设频率,所述t个第一文件中每个第一文件的使用频率低于所述预设频率,s和t均为小于n的正整数;第一移动子模块,用于将所述s个第一文件移动至目标文件夹中;第一处理子模块,用于按照预设时长对所述t个第一文件进行分类处理,得到所述t个第一文件对应的目录列表;第二确定子模块,用于基于所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件确定所述第二处理结果。

13、进一步地,所述装置还包括:第一确定单元,用于在基于所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件确定所述第二处理结果之后,基于所述第二处理结果确定展示界面的内容,其中,所述展示界面的内容中至少包括:所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件,所述展示界面用于目标对象搜索文件;第一展示单元,用于向所述目标对象展示所述展示界面的内容。

14、进一步地,所述装置还包括:第二获取单元,用于在基于所述目录列表、所述目标文件夹和所述目标文件夹中的所述s个第一文件确定所述第二处理结果之后,当检测到所述目标设备出现故障时,获取所述t个第一文件和所述目标文件夹中的所述s个第一文件;第六处理单元,用于对所述t个第一文件和所述目标文件夹中的所述s个第一文件进行备份处理。

15、进一步地,所述第一处理单元包括:第一处理模块,用于按照预设规则对每个第一文件的内容信息进行分词处理,得到p个第一关键字,其中,p为大于m的正整数;第一去除模块,用于从所述p个第一关键字中去除w个目标文字,得到所述m个第一关键字,其中,所述目标文字的重要程度低于预设的重要程度,w为正整数。

16、为了实现上述目的,根据本技术的另一方面,提供了一种计算机可读存储介质,所述存储介质存储程序,其中,所述程序执行上述的任意一项所述的文件的处理方法。

17、为了实现上述目的,根据本技术的另一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的任意一项所述的文件的处理方法。

18、通过本技术,采用以下步骤:从目标设备中获取待处理的n个第一文件,其中,目标设备用于存储文件,n为大于1的正整数;获取每个第一文件的内容信息,并基于每个第一文件的内容信息确定m个第一关键字,其中,m为大于1的正整数;确定每个第一关键字所属的第一文件和每个第一关键字在第一文件中出现的频率信息,并基于m个第一关键字、每个第一关键字所属的第一文件和每个第一关键字在第一文件中出现的频率信息构建倒排索引表;获取每个第一文件的属性信息,并依据倒排索引表和每个第一文件的属性信息确定对n个第一文件的处理结果,解决了相关技术中通过手工整理文件的方式整理电脑中存储的多个文件,导致整理文件的过程较为繁琐且容易出错的问题。通过从用于存储文件的设备中获取待处理的多个文件,再获取每个文件的内容信息,并基于每个文件的内容信息确定多个关键字,然后确定每个关键字所属的文件和每个关键字在文件中出现的频率信息,并基于多个关键字、每个关键字所属的文件和每个关键字在文件中出现的频率信息构建倒排索引表,再获取每个文件的属性信息,并依据倒排索引表和每个文件的属性信息对文件进行整理,从而可以自动整理文件,且无需采用手工整理文件的方式整理电脑中存储的多个文件,进而达到了简化整理文件的过程,并在整理文件的过程中不易出错的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1