技术编号:6384187
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及一种对网络贴文进行自动标引的系统,同时也涉及该系统实现网络贴文标引的方法,属于网页信息采集。背景技术通过计算机对目标文本进行自动分析,根据词在目标文本中出现的特点,选择一部分词作为标引词,把目标文本转化成二次文献。这种过程称为自动标引(automaticindexing)。目前,现有自动标引技术采用了多种技术方法实现,总体上可分为统计分析方法、语言分析方法、人工智能方法和混合方法。其中,绝大部分方法是基于抽词思想实现的,同时标引范围往往仅限于目标...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。