一种特征提取方法及装置与流程

文档序号:12063651阅读:来源:国知局
技术总结
本发明提供一种特征提取方法及装置,可以从待处理文本中提取各个词,并从待处理文本包含的各个主题中选取至少一个目标主题,根据各个词与各个目标主题的相关度,得到各个词与待处理文本的相关度,然后根据各个词与待处理文本的相关度,从各个词中选取至少一个词作为待处理文本的特征。例如根据各个词与待处理文本的相关度,选取与待处理文本的相关度大于其他词与待处理文本的相关度的预设个数的词作为待处理文本的特征,使得选取的特征与待处理文本的主要内容相关,也就是说在提取待处理文本的特征时,不仅考虑词自身的重要性还考虑词与待处理文本的主要内容的相关度,从而从提取的词中过滤掉与主要内容无关的词,提高特征提取的准确度。

技术研发人员:董超
受保护的技术使用者:东软集团股份有限公司
文档号码:201611192135
技术研发日:2016.12.21
技术公布日:2017.05.24

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1