技术编号:13446223
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明属于数据挖掘领域,特别涉及一种非规范词检测及识别技术。背景技术随着Web2.0的兴起,互联网模式由专业人员织网转变为所有用户参与织网,在形式更为民主化的同时,也意味着将有大量来自用户的低成本低质量的信息产生。社交媒体是用户发布和传播信息的重要平台,允许用户不限地点、不限时间分享自己的生活和想法。Twitter是一家面向全球范围的社交网站,它的特点在于用户发表推文时有字符数量限制。这就导致了用户可能使用更便捷简短的缩写或网络词汇来表达观点,将产生大量的非规范词汇,影响相关研究者对推文的后续分...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。