技术总结
本发明是一种基于卷积神经网络和关键词聚类的热点事件检测方法,其特征在于:包括以下步骤:获取网络中的网络文本数据;建立初滤的关键字集合;对测试集中的网络文本进行初滤;对初滤后的测试集中的网络文本进行分词,统计分词得到的各个词在网络文本数据中的出现次数;对各个词在网络文本数据中的出现次数和在历史网络文本数据中的出现次数进行比较,确定网络文本数据中的热词;获取网络文本数据中包括热词的网络文本;训练卷积神经网络,得到事件分类模型;对处理后的测试集网络文本进行分类,对包括热词的网络文本进行聚类,利用K‑means算法将测试集中同一类型的网络文本聚类成多个事件实例簇,确定所述网络文本数据中的热点事件。
技术研发人员:贺英;云红艳;张秀华;胡欢;林莉
受保护的技术使用者:青岛大学
技术研发日:2019.06.21
技术公布日:2019.09.20