技术编号:12824769
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本公开内容的实施例一般性地涉及与计算机相关的技术领域,并且更特别地涉及一种在多个文档中确定与目标文档相似的文档集合的方法和装置。背景技术相似文档搜索对于内容管理、内容搜索和内容推荐而言是非常有用的特征。在各种场景中,许多应用都需要从海量的文档中找出与目标文档相似的文档集合。典型的解决方案是逐个地计算需要确定的文档与目标文档的相似度,然后返回满足相似度准则的那些文档。例如,可以根据倒排索引来逐个地搜索关键词,将各个关键词搜索得到的文档集合的交集确定为相似的文档集合。但是,当需要确定的文档数目变得越...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。