用于微信公众平台的信息搜索方法及系统、装置与流程

文档序号:18740500发布日期:2019-09-21 01:42阅读:170来源:国知局
用于微信公众平台的信息搜索方法及系统、装置与流程

本发明涉及数据处理及管理领域,特别涉及一种用于微信公众平台的信息搜索方法、系统及装置。



背景技术:

随着微信用户的增多以及功能愈趋强大,腾讯公司推出了微信公众平台以给个人、企业和组织提供业务服务与用户管理能力。微信公众号是开发者或商家在微信公众平台上申请的应用账号。通过公众号,商家可在微信平台上实现和特定群体的文字、图片、语音、视频的全方位沟通、互动。

微信公众平台由于用户基数较大,现有的微信公众平台无法完全满足用户的需求。例如,目前当微信公众号的订阅用户在客户端进入某一公众号查阅文章内容时,无法按照个人需求快速、准确地搜索到满足要求的文章内容,只能点击“查看历史消息”翻阅文章图文列表。用户当然也无法向微信公众号提出问题以获得解答。



技术实现要素:

为了解决现有技术的问题,本发明实施例提供了一种用于微信公众平台的信息搜索方法,所述微信公众平台包括平台服务器,所述平台服务器包括与各微信公众号相关联的文档,所述信息搜索方法包括:

S1、接入所述平台服务器的数据接口;

S2、经由所述数据接口从所述平台服务器接收与预定微信公众号相关联的文档集合;

S3、对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构;

S4、对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减;

S5、经由所述数据接口从所述平台服务器接收所述预定微信公众号的用户输入的搜索关键词;

S6、根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档。

作为本发明实施方式的进一步改进,所述步骤S3对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构具体包括对所述文档集合执行分类处理以获得多个不同类别的文档子集,每个文档子集中的每篇文档具有相关联的分类标签以指示该篇文档所属的类别。

作为本发明实施方式的进一步改进,所述步骤S4对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减具体包括以下步骤:

S401、判断所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题是否重复;

若已重复,进入S402;若不重复,进入S5;

S402、对于重复的文档数据进行删减,更新所述文档数据。

作为本发明实施方式的进一步改进,所述步骤S401判断所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题是否重复具体包括以下步骤:

S4011、识别所述分类的文档数据的标题,对所述分类的文档数据的标题的文本进行提取;

S4012、识别所述微信公众号历史记录中文档数据的标题,对所述微信公众号历史记录中文档数据的标题的文本进行提取;

S4013、计算所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题的文本相似度;

S4014、判断所述文本相似度与预设阈值的相对大小;

若所述相似度>预设阈值,判断为重复;

若所述相似度<预设阈值,判断为不重复。

作为本发明实施方式的进一步改进,所述步骤S6中根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档具体包括以下步骤:

S601、根据所述搜索关键词确定所述搜索关键词所属的类别;

S602、根据所述搜索关键词从所述搜索关键词所属的类别的文档子集的分类形式的文档数据结构查找所述关联文档。

作为本发明实施方式的进一步改进,对所述文档集合执行分类处理以获得多个不同类别的文档子集包括:

采用SVM分类器或贝叶斯分类器对所述文档集合中的每篇文档执行文本分类;

将属于同一分类类别的文档划分为一个文档子集,并设置相应的文档子集标签。

另一方面,本发明实施例公开了一种用于微信公众平台的信息搜索系统,包括客户端装置、网络模块、服务器装置和数据库模块,所述微信公众平台包括平台服务器,所述平台服务器包括与各微信公众号相关联的文档,所述信息搜索系统包括:

接口调用模块,用于调用微信平台的接口;

文档接收模块,用于经由所述数据接口从所述平台服务器接收与预定微信公众号相关联的文档集合;

文档集合分类模块,用于对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构;

搜索关键词输入模块,用于经由所述数据接口从所述平台服务器接收所述预定微信公众号的用户输入的搜索关键词;

文档数据查重模块,用于对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减;

匹配关联模块,用于根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档;

微信公众号选择模块,用于接收从预设的微信公众号中选择的所要发布推送文档数据的微信公众号;

发布模块,用于将所要发布的推送消息发布至所述选中的微信公众号上;

所述数据库模块包括数据存储模块、数据记录模块和数据分析模块,所述客户端装置通过网络模块与服务器装置相连,服务器装置与数据库相连。

作为本发明实施方式的进一步改进,所述文档数据查重模块,包括素材标题识别子模块、相似度计算子模块、标题重复判断子模块和标题更新子模块,所述识别子模块的输出端与所述相似度计算子模块的输入端相连,所述相似度计算子模块的输出端与所述标题重复判断子模块的输入端相连。

作为本发明实施方式的进一步改进,所述匹配关联模块包括搜索关键词类别确定单元和关联文档查找单元;

所述搜索关键词类别确定单元,用于根据所述搜索关键词确定所述搜索关键词所属的类别;

所述关联文档查找单元,用于根据所述搜索关键词从所述搜索关键词所属的类别的文档子集的分类形式的文档数据结构查找所述关联文档。

再一方面,本发明实施例公开了一种用于微信公众平台的信息搜索装置,所述用于微信公众平台的信息搜索装置内存储有上述的用于微信公众平台的信息搜索系统,所述用于微信公众平台的信息搜索系统可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的用于微信公众平台的信息搜索方法的步骤。

本发明具有以下有益效果:有效解决微信公众号运营中信息分类分析和搜索的问题,微信运营者可以同时有效管理多个公众号,各账号之间的运营不再是独立的,实现了多账号之间的信息互联,提高了微信运营的效率;

增强了用户与微信公众号的互动,用户订阅公众号即为获得信息,用户可以主动地在微信公众号中检索感兴趣的内容,提高了微信公众号的实用性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种用于微信公众平台的信息搜索方法流程图;

图2是本发明实施例提供的一种用于微信公众平台的信息搜索系统结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例一种用于微信公众平台的信息搜索方法,如图1所示,所述信息搜索方法包括:

S1、接入所述平台服务器的数据接口;

S2、经由所述数据接口从所述平台服务器接收与预定微信公众号相关联的文档集合;

S3、对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构;

S4、对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减;

S5、经由所述数据接口从所述平台服务器接收所述预定微信公众号的用户输入的搜索关键词;

S6、根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档。

具体地,步骤S3对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构具体包括对所述文档集合执行分类处理以获得多个不同类别的文档子集,每个文档子集中的每篇文档具有相关联的分类标签以指示该篇文档所属的类别。

其中,步骤S4对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减具体包括以下步骤:

S401、判断所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题是否重复;

若已重复,进入S402;若不重复,进入S5;

S402、对于重复的文档数据进行删减,更新所述文档数据。

作为本发明实施方式的进一步改进,所述步骤S401判断所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题是否重复具体包括以下步骤:

S4011、识别所述分类的文档数据的标题,对所述分类的文档数据的标题的文本进行提取;

S4012、识别所述微信公众号历史记录中文档数据的标题,对所述微信公众号历史记录中文档数据的标题的文本进行提取;

S4013、计算所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题的文本相似度;

S4014、判断所述文本相似度与预设阈值的相对大小;

若所述相似度>预设阈值,判断为重复;

若所述相似度<预设阈值,判断为不重复。

进一步地,步骤S6中根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档具体包括以下步骤:

S601、根据所述搜索关键词确定所述搜索关键词所属的类别;

S602、根据所述搜索关键词从所述搜索关键词所属的类别的文档子集的分类形式的文档数据结构查找所述关联文档。

具体地,对所述文档集合执行分类处理以获得多个不同类别的文档子集包括:

采用SVM分类器或贝叶斯分类器对所述文档集合中的每篇文档执行文本分类;

将属于同一分类类别的文档划分为一个文档子集,并设置相应的文档子集标签。

另一方面,本发明实施例公开了一种用于微信公众平台的信息搜索系统,如图2所示,包括客户端装置、网络模块、服务器装置和数据库模块,所述微信公众平台包括平台服务器,平台服务器包括与各微信公众号相关联的文档,信息搜索系统包括:

接口调用模块,用于调用微信平台的接口;

文档接收模块,用于经由所述数据接口从所述平台服务器接收与预定微信公众号相关联的文档集合;

文档集合分类模块,用于对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构;

搜索关键词输入模块,用于经由所述数据接口从所述平台服务器接收所述预定微信公众号的用户输入的搜索关键词;

文档数据查重模块,用于对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减;

匹配关联模块,用于根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档;

微信公众号选择模块,用于接收从预设的微信公众号中选择的所要发布推送文档数据的微信公众号;

发布模块,用于将所要发布的推送消息发布至所述选中的微信公众号上;

所述数据库模块包括数据存储模块、数据记录模块和数据分析模块,所述客户端装置通过网络模块与服务器装置相连,服务器装置与数据库相连。

其中,文档数据查重模块,包括素材标题识别子模块、相似度计算子模块、标题重复判断子模块和标题更新子模块,所述识别子模块的输出端与所述相似度计算子模块的输入端相连,所述相似度计算子模块的输出端与所述标题重复判断子模块的输入端相连。

进一步地,匹配关联模块包括搜索关键词类别确定单元和关联文档查找单元;

搜索关键词类别确定单元,用于根据所述搜索关键词确定所述搜索关键词所属的类别;

关联文档查找单元,用于根据所述搜索关键词从所述搜索关键词所属的类别的文档子集的分类形式的文档数据结构查找所述关联文档。

再一方面,本发明实施例公开了一种用于微信公众平台的信息搜索装置,所述用于微信公众平台的信息搜索装置内存储有上述的用于微信公众平台的信息搜索系统,所述用于微信公众平台的信息搜索系统可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的用于微信公众平台的信息搜索方法的步骤。

本发明具有以下有益效果:有效解决微信公众号运营中信息分类分析和搜索的问题,微信运营者可以同时有效管理多个公众号,各账号之间的运营不再是独立的,实现了多账号之间的信息互联,提高了微信运营的效率;

增强了用户与微信公众号的互动,用户订阅公众号即为获得信息,用户可以主动地在微信公众号中检索感兴趣的内容,提高了微信公众号的实用性。

上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。

需要说明的是:上述实施例提供的一种用于微信公众平台的信息搜索系统在执行用于微信公众平台的信息搜索方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种用于微信公众平台的信息搜索系统和方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1