一种基于时空多维度的热词计算方法及系统与流程

文档序号:23727834发布日期:2021-01-26 17:52阅读:来源:国知局

技术特征:
1.一种基于时空多维度的热词计算方法,其特征在于,包括以下步骤:s1将非结构化数据按照标准文档定义进行清洗转换后得到标准文档;s2对所述标准文档进行预处理并抽取出相应的关键词;s3将业务表与所述关键词进行关联并同步到相应的业务库;s4对所述业务表中的时间进行标准化处理得到时间维度;s5将所述业务表、所述关键词和所述时间维度进行关联扩充,得到所述业务表、所述关键词和所述时间维度的关联扩展信息,并通过所述关键词和所述时间维度的关联扩展信息得到历史关键词统计信息;s5将所述业务表和所述关键词的关联扩展信息以及所述历史关键词统计信息输入至热词热度分析预测模型中计算得到热词热度信息;s6将所述热词热度信息以时间维度和空间维度进行统计后展示出来。2.根据权利要求1所述的基于时空多维度的热词计算方法,其特征在于,在s1中,所述非结构化数据为非结构化警情文本。3.根据权利要求1所述的基于时空多维度的热词计算方法,其特征在于,s2具体包括:利用nlp技术对所述标准文档进行预处理,并通过无监督关键词提取网络模型抽取出相应的所述关键词。4.根据权利要求1所述的基于时空多维度的热词计算方法,其特征在于,在s3中,所述业务表为警情宽表。5.根据权利要求1所述的基于时空多维度的热词计算方法,其特征在于,在s4中,所述标准化处理包括将所述时间按照日、周、月、季度的标准时间格式进行处理。6.根据权利要求1所述的基于时空多维度的热词计算方法,其特征在于,在s5中,所述热词热度信息包括热词信息、热词周期信息、热词索引信息、热词分组信息。7.根据权利要求1所述的基于时空多维度的热词计算方法,其特征在于,在s6中,展示方式包括热词榜或新词榜,所述热词榜为某一时间范围内和相关空间范围内按照热度排名的热词列表,所述新词榜为某一时间范围内和相关空间范围内新出现的热词排名列表。8.一种基于时空多维度的热词计算系统,其特征在于,包括:标准文档转换模块,用于将非结构化数据按照标准文档定义进行清洗转换后得到标准文档;关键词提取模块,用于对所述标准文档进行预处理并抽取出相应的关键词;标准同步模块,用于将业务表与所述关键词进行关联并同步到相应的业务库;索引计算模块,用于对所述业务表中的时间进行标准化处理得到时间维度;关键词计算模块,用于将所述业务表、所述关键词和所述时间维度进行关联扩充,得到所述业务表、所述关键词和所述时间维度的关联扩展信息,并通过所述关键词和所述时间维度的关联扩展信息得到历史关键词统计信息;热词计算模块,用于将所述业务表和所述关键词的关联扩展信息以及所述历史关键词统计信息输入至热词热度分析预测模型中计算得到热词热度信息;界面展示模块,用于将所述热词热度信息以时间维度和空间维度进行统计后展示出来。9.根据权利要求8所述的基于时空多维度的热词计算系统,其特征在于,所述关键词提
取模块利用nlp技术对所述标准文档进行预处理,并通过无监督关键词提取网络模型抽取出相应的所述关键词。10.根据权利要求8所述的基于时空多维度的热词计算系统,其特征在于,所述界面展示模块通过热词榜或新词榜进行展示,所述热词榜为某一时间范围内和相关空间范围内按照热度排名的热词列表,所述新词榜为某一时间范围内和相关空间范围内新出现的热词排名列表。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1