一种文本信息的创新度评估方法与流程

文档序号:12863812阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种文本信息的创新度评估方法,对爬取的文本数据进行分词预处理;使用预处理数据训练LDA模型,实现以行业为主题的分类,用以把不同行业的文本进行区分,使得训练好的模型包含每个行业类别的关键词的模型文件;按照时间顺序,构建一个由预处理数据里的抽取的关键知识和技术信息组成的知识网络,并且每隔固定时间不断更新;使用按照时间排序的预处理数据,提取每一篇文献的属性信息,并构建一个文献文本结构网络,并确定各个文献的创新类型;利用训练好的LDA模型分析专利数据里面的技术和知识关键词分别属于的行业,综合文献文本结构网络的属性信息,构成多维度指标以评估创新度。

技术研发人员:郭伟;张盘龙;鹿旭东;崔立真
受保护的技术使用者:山东大学
技术研发日:2017.07.05
技术公布日:2017.11.03
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1