一种文档管理方法与流程

文档序号:34861943发布日期:2023-07-23 11:03阅读:30来源:国知局
一种文档管理方法与流程

本申请实施例涉及电子数据管理领域,涉及但不限于一种文档管理方法、装置、设备及存储介质。


背景技术:

1、从海量文档中搜索语义相似的文档是用户的一种常见需求,也是文档管理工具必备的一种功能。文档的语义相似度可以通过构建文档的语义向量,并计算文档向量距离来度量。当文档规模较小时,可以直接计算所有存储文档与待搜索文档的距离,搜索相似文档。但当文档规模较大的情况下,上述暴力搜索的方式耗时巨大,难以实用。且使用语音相似度方法搜索出的文档,内容虽相似,但不在访问权限范围内,导致需要反复多次重定位子空间才能找到符合权限的文档。


技术实现思路

1、有鉴于此,本申请实施例提供一种文档管理方法、一种文档搜索方法和电子设备。

2、本申请实施例的技术方案是这样实现的:

3、第一方面,本申请实施例提供一种文档管理方法,所述方法包括:

4、获取待处理文档的权限参数和内容参数,其中,所述权限参数用于表征所述待处理文档的权限,所述内容参数用于表征所述待处理文档的内容;利用所述权限参数和所述内容参数确定所述待处理文档之间的相似度距离;将所述参数距离满足距离阈值的所述待处理文档划分为同一子空间,以使得所述同一子空间中存储文档的权限和内容相似。

5、第二方面,本申请实施例提供一种文档搜索方法,所述方法包括:

6、获取待搜索文档的权限参数和内容参数,其中,所述权限参数用于表征所述待搜索文档的权限,所述内容参数用于表征所述待搜索文档的内容;基于所述权限参数和所述内容参数在存储文档的子空间中确定至少一个目标子空间,其中,所述每个子空间中存储文档之间的相似度距离满足距离阈值,所述相似度距离是基于所述存储文档的权限参数和内容参数确定的;在所述至少一个目标子空间中搜索与所述待搜索文档的内容相似且权限相似的文档。

7、第三方面,本申请实施例提供一种文档管理装置,所述装置包括:

8、第一获取模块,用于获取待处理文档的权限参数和内容参数,其中,所述权限参数用于表征所述待处理文档的权限,所述内容参数用于表征所述待处理文档的内容;

9、第一确定模块,用于利用所述权限参数和所述内容参数确定所述待处理文档之间的相似度距离;

10、划分模块,用于将所述参数距离满足距离阈值的所述待处理文档划分为同一子空间,以使得所述同一子空间中存储文档的权限和内容相似。

11、第四方面,本申请实施例提供一种文档搜索装置,所述装置包括:

12、第二获取模块,用于获取待搜索文档的权限参数和内容参数,其中,所述权限参数用于表征所述待搜索文档的权限,所述内容参数用于表征所述待搜索文档的内容;

13、第二确定模块,用于基于所述权限参数和所述内容参数在存储文档的子空间中确定至少一个目标子空间,其中,所述每个子空间中存储文档之间的相似度距离满足距离阈值,所述相似度距离是基于所述存储文档的权限参数和内容参数确定的;

14、搜索模块,在所述至少一个目标子空间中搜索与所述待搜索文档的内容相似且权限相似的文档。

15、第五方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。

16、第六方面,本申请实施例提供一种存储介质,存储有可执行指令,用于处理器执行时,实现上述方法。

17、本申请实施例中,首先获取待处理文档的权限参数和内容参数,其中,所述权限参数用于表征所述待处理文档的权限,所述内容参数用于表征所述待处理文档的内容;然后利用所述权限参数和所述内容参数确定所述待处理文档之间的相似度距离;最后将所述参数距离满足距离阈值的所述待处理文档划分为同一子空间,以使得所述同一子空间中存储文档的权限和内容相似。这样,可以实现同一子空间中存储文档的内容不仅相似,且权限也相似,从而在文档搜索时能快速定位到与该待搜索文档内容和权限均相似的文档。



技术特征:

1.一种文档处理方法,所述方法包括:

2.如权利要求1所述的方法,所述获取待处理文档的权限参数,包括:

3.如权利要求2所述的方法,所述对所述路径信息进行编码,得到所述待处理文档的权限参数,包括:

4.如权利要求3所述的方法,所述对所述深度信息和所述宽度信息进行编码,得到所述待处理文档的权限参数,包括:

5.如权利要求4所述的方法,所述对所述权限参数每一维对应层级的深度信息和宽度信息进行编码,得到所述权限参数每一维取值,包括:

6.如权利要求5所述的方法,所述将所述第i维对应每一层级的深度信息进行加权求和,得到第i维深度编码,包括:

7.如权利要求1所述的方法,所述利用所述权限参数和所述内容参数确定所述待处理文档之间的相似度距离,包括:

8.一种文档搜索方法,所述方法包括:

9.如权利要求8所述的方法,所述基于所述权限参数和所述内容参数在存储文档的子空间中确定至少一个目标子空间,包括:

10.一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至9任一项所述方法中的步骤。


技术总结
本申请公开了一种文档处理方法、装置、设备及存储介质,其中,所述方法包括:获取待处理文档的权限参数和内容参数,其中,所述权限参数用于表征所述待处理文档的权限,所述内容参数用于表征所述待处理文档的内容;利用所述权限参数和所述内容参数确定所述待处理文档之间的相似度距离;将所述参数距离满足距离阈值的所述待处理文档划分为同一子空间,以使得所述同一子空间中存储文档的权限和内容相似。

技术研发人员:王孝花,崔恒,徐雁斌
受保护的技术使用者:联想(北京)有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1