内容相似性短文本查询方法、设备、系统及存储介质与流程

文档序号:17000043发布日期:2019-03-02 01:42阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种内容相似性短文本查询方法、设备、系统及存储介质。本发明通过获取多个短文本样本,基于所述短文本样本的时间信息将所述短文本样本划分为多个类别,所述短文本为字符数目未超过预设数目阈值的文本,分别基于各类别中的短文本样本建立Rtree索引,获取当前文本,基于所述Rtree索引,利用Map‑Reduce分布式计算模型在所述短文本样本中查找若干个与所述当前文本内容相似的目标短文本,在短文本内容相似性查询中考虑时间维度,利用Map‑Reduce分布式计算模型实现了在大量文本数据下对目标文本进行高效、精确的查找。

技术研发人员:孙翀;彭媛;雷建云;夏梦;尹帆;刘晶
受保护的技术使用者:中南民族大学
技术研发日:2018.10.10
技术公布日:2019.03.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1