技术编号:18267616
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明属于文本处理技术领域,具体涉及一种基于五笔码的字符级文本分类方法。背景技术文本分类是自然语言处理中最普遍的一种应用,是对文本数据信息进行筛选、整理和组织的关键技术,得到了研究者的广泛关注。过去一段时间里,自然语言处理中文本分类领域的主流研究方向是以词为基本单位的,中文文本的预处理一般以分词为主。因此,在中文自然语言处理领域,分词成为了一个基础性的研究。然而,不同的分词算法在歧义识别、分词准确性、算法复杂度、实施难度等不同方面有一定的局限性。随着近年来深度学习在各个领域广泛应用,越来越多的研...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。