技术编号:12063651
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明属于文本挖掘技术领域,更具体的说,尤其涉及一种特征提取方法及装置。背景技术随着互联网的日益普及,文本信息迅速膨胀。例如,在Internet(网络)上每天有数十万的网页更新,数百万新的网页加入,使得Internet上的信息丰富而又复杂。如何有效地组织和管理这些信息,并快速、准确、全面地从众多文本信息中挖掘出用户所需要的信息是当前文本挖掘领域面临的一大挑战。在文本挖掘领域中,文本特征提取是文本挖掘领域中的关键环节,而词作为自然语言的理解单元,会作为文本特征被提取出来。目前文本特征的提取方式是基...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。