技术编号:12596204
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本申请涉及数据处理领域,具体而言,涉及一种文本匹配方法和装置。背景技术现有技术中,可以通过哈希算法进行网页重排和文本信息匹配。现有哈希算法中的局部敏感哈希算法实现文本信息匹配。具体地,局部敏感哈希(localsensitivehash,即LSH)是一个将高维空间中的相似状态或者临近的点放入同一个桶内的hash算法,一般用于相似文本处理。而局部敏感哈希中的MinHash,用文本中的一个词的哈希值表示该文本的状态,在对两个文本做匹配时,对两个文本的状态进行匹配,即基于两个词的哈希值匹配两个文本,若两...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。