一种基于词条作家热度构建分类分级词表的方法及系统与流程

文档序号:18642688发布日期:2019-09-11 23:43阅读:来源:国知局

技术特征:

技术总结
本发明提供一种基于词条作家热度构建分类分级词表的方法及系统,通过按照预设分类方式,从文学语料库中提取出预设类型的词条构成分类词集;根据分类词集中各词条在同一作家的各作品中出现的频次和该作家每一作品的总字数,计算出每一词条在同一作家的各作品中的作品热度;基于每一词条在同一作家的各作品中的作品热度,以预设函数求取每一词条对应于各作家的作家热度;将同一词条所对应的各作家热度求和,得到相应词条的词条热度;根据每一词条对应的词条热度,对分类词集中所有词条进行排序并基于排序结果构建分类分级词表。本发明可以解决对于作品字数不平衡和作家作品数不平衡的文学语料库,现有分类分级词表构建方法对词条排序不合理的问题。

技术研发人员:赵慧周
受保护的技术使用者:北京语言大学
技术研发日:2019.05.20
技术公布日:2019.09.10
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1