基于SinglePass算法实现无标注语料主动预测移动客服领域中突发事件的方法与流程

文档序号:15462444发布日期:2018-09-18 18:29阅读:来源:国知局
技术总结
本发明提出了一种基于SinglePsss算法实现无标注语料主动预测移动客服领域突发事件的方法。主要包括预处理、构建句子向量、基于SinglePass算法聚类、寻找突发词、计算突发词相关度、返回突发事件工单六个阶段。在预处理阶段,对客服领域中的工单数据进行分词、去停用词、训练词向量等预处理。在构建句子向量阶段,采用向量相加的方法,分别将句子中每个词的词向量相加,得到句子向量。在基于SinglePass算法聚类阶段,基于句子向量,利用SinglePass算法,对工单数据进行聚类,得到突发事件的话题。在寻找突发词阶段,基于时间序列算法(Kleinberg)得到每个话题下的突发词。在计算突发词相关度阶段,利用互信息得到突发词之间的相关度和突发话题热度。在返回突发事件工单阶段,返回突发话题热度最高文本中包含突发词相关度最高的突发词的工单,即得到突发事件。

技术研发人员:徐俊利;赵江江;薛超;范林博;赵宁;祁泽川;魏强;谭乃瑜
受保护的技术使用者:中移在线服务有限公司
技术研发日:2018.01.17
技术公布日:2018.09.18

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1