技术编号:14444302
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及语言文本处理技术领域,特别涉及一种基于多层字典树的敏感词过滤方法及系统。背景技术现有的敏感词过滤方法主要是基于单层字典树这种数据结构来实现的,其过滤敏感词的主要实现步骤如下:首先根据敏感词构建成一颗单层的字典树,然后将待过滤语句依次与构建的敏感词字典树进行匹配,匹配到敏感词则立即返回并拦截该语句,没有匹配到任何敏感词则释放该语句。这种基于单层字典树的敏感词过滤匹配方式,在一定程度上确实能够高效的匹配到特定敏感词,但是这种匹配方式容易造成误拦截。举个例子,如果敏感词库中有“韩梅梅、小梅、...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。