技术特征:
技术总结
本发明实施例公开了一种数据处理方法、装置、电子设备及存储介质,对第一数据集进行分词处理,对得到的分词进行词性分析,确定数据集中的同义词,将该同义词扩充到预定义的同义词词典中,然后从第一数据集中的各数据样本中提取关键词,根据提取的关键词构建与各个数据样本对应的代表词,根据扩充后的同义词词典对构建的代表词进行聚合处理,得到第二数据集。当第二数据集作为提示词集合应用于垂直搜索引擎时,提示词能够关联较多的内容,使得搜索结果能够满足用户实际需求,提高了对用户的辅助性。而且,由于提示词集合的数量较少,因此垂直搜索引擎能够快速展示提示词,提高搜索的便捷性。
技术研发人员:孔维斌;黄伟;朱晓华;廖成才
受保护的技术使用者:广州华多网络科技有限公司
技术研发日:2018.03.28
技术公布日:2018.09.14