一种搜索网络信息的方法和系统的制作方法

文档序号:6358015阅读:110来源:国知局
专利名称:一种搜索网络信息的方法和系统的制作方法
技术领域
本发明涉及海量信息检索技术领域,尤其涉及一种网络搜索信息的方法和系统。
背景技术
在互联网平台上,为了提高用户黏度,网站通常会在用户浏览某个内容的同时,向用户自动推荐与之相关的内容。相关内容的计算方式有很多种,不同的业务系统有不同的技术实现手段,其目的是让用户浏览内容时,可以延展到更多他可能需要的内容,并引导他去进行下一步的点击浏览,来增加用户在网站中的停留时间,提高点击率,提升站点粘性。如何用最科学最合理的手段来向用户推荐有用的相关信息,不同的应用平台其出发点并不一样,或者通过人工推荐,或者通过自动关联。针对自动关联,目前较为通用的方式是通过某个关键词来直接进行相关内容查 找,例如内容A包含关键词“旅游”,则与内容A相关的内容传统方式则根据关键词“旅游”来查找,将其它也包含“旅游”关键词的内容作为内容A的相关内容。现有的相关内容方式能够准确地找到跟当前内容具备相同关键词的内容,但是只能够看到具备相同或者相似主题的内容,并不是真正意义上的“相关内容”,其对内容的关联拓展性明显不够,例如我们在浏览“旅游”相关的内容时,传统方式的相关内容分析具备较大局限性,只能获取到包含“旅游”标签的内容,那些并不包含“旅游”标签的却与之有相关性的内容却并不能显示出来,例如“导游”、“打折机票”等。现有依靠标签方式解决的相关内容过于狭隘,很多阅读场景下,我们阅读一个内容时,并不需要看到相同主题的内容,而是在意义上存在关联度的内容。

发明内容
本发明的目的在于提出一种搜索网络信息的方法和系统,能够最大限度的将与当前内容最相关的内容展示给用户,帮助用户延伸阅读。为达此目的,本发明采用以下技术方案
一种搜索网络信息的方法,包括以下步骤
A、根据当前正在浏览的网络信息,客户端将所述网络信息的标签发送给服务器端的相关内容分析模块;
B、相关内容分析模块将所述网络信息的标签发送给标签智能关联模块;
C、标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块;
D、相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息;
E、相关内容分析模块将获得的网络信息返回给客户端。步骤C中,采用随机函数,根据关联度从所有与所述网络信息的标签关联的标签中进行选择,选中概率与关联度成正比。步骤E中,相关内容分析模块将获得的网络信息组织成预设的数据格式返回给客户端。一种搜索网络信息的系统,包括客户端、相关内容分析模块、标签智能关联模块、标签数据库和内容数据库,客户端与相关内容分析模块连接,相关内容分析模块分别与标签智能关联模块和内容数据库连接,标签智能关联模块与标签数据库连接,其中,
客户端用于将网络信息的标签发送给相关内容分析模块,并接收相关内容分析模块返回的网络信息;
相关内容分析模块用于将所述网络信息的标签发送给标签智能关联模块,从标签智能关联模块获得关联度大于预定阈值的、与所述网络信息的标签关联的标签,并从内容数据库中获得标签对应的网络信息,返回给客户端;
标签智能关联模块用于从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块;
标签数据库用于存储标签及其相互之间的关联度;
内容数据库用于存储标签对应的网络信息。采用了本发明的技术方案,对内容的相关性挖掘不但停留在内容所对应标签的字面相同或相似性上,更要依靠标签与标签之间的语义关联来帮助用户推荐相关内容,并通过特有的算法分析,来从一个标签相关的大量标签之中,用更合理的方式筛选出相关的一些标签,再以此来显示相关内容,从而最大限度的将与当前内容最相关的内容展示给用户,帮助用户延伸阅读。


图I是本发明具体实施方式
中搜索网络信息的系统结构示意图。图2是本发明具体实施方式
中搜索网络信息的流程图。
具体实施例方式下面结合附图并通过具体实施方式
来进一步说明本发明的技术方案。本发明技术方案的主要思想是对内容的相关性挖掘不但停留在内容所对应标签的字面相同或相似性上,更要依靠标签与标签之间的语义关联来帮助用户推荐相关内容,并通过特有的算法分析,来从一个标签相关的大量标签之中,用更合理的方式筛选出相关的一些标签,再以此来显示相关内容。例如一个内容A有“牛顿”的标签,我们关联的相关内容所对应的标签可能只有“万有引力”、“经典力学”这些词汇,我们通过这种方式来帮助用户发掘与自己所浏览内容具备更广范围内关联的内容,去延伸阅读。所以首先需要设置一个标签数据库,将标签及其两两之间的关联度存储其中,为后续步骤所使用。下面描述如何建立这个标签数据库首先收集信息,对每一条信息设置不少于I个标签,用于标识信息;其次将每一条信息的任意两个标签分成一组,并将每一组的两个标签及其之间的对应关系存储到数据库中,并设置计数值对数据库中每一组标签出现次数进行计数。这个出现的次数就是两个标签的关联度。图I是本发明具体实施方式
中搜索网络信息的系统结构示意图。如图I所示,该系统包括客户端101、相关内容分析模块102、标签智能关联模块103、标签数据库104和内容数据库105。
客户端与相关内容分析模块连接,相关内容分析模块分别与标签智能关联模块和内容数据库连接,标签智能关联模块与标签数据库连接。客户端将网络信息的标签发送给相关内容分析模块,并接收相关内容分析模块返回的网络信息,相关内容分析模块将所述网络信息的标签发送给标签智能关联模块,从标签智能关联模块获得关联度大于预定阈值的、与所述网络信息的标签关联的标签,并从内容数据库中获得标签对应的网络信息,返回给客户端,标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块,标签数据库存储标签及其相互之间的关联度,内容数据库存储标签对应的网络信息。图2是本发明具体实施方式
中搜索网络信息的流程图。如图2所示,该流程包括以下步骤
步骤201、根据当前正在浏览的网络信息,客户端将网络信息的标签发送给服务器端的相关内容分析模块。步骤202、相关内容分析模块将网络信息的标签发送给标签智能关联模块。步骤203、标签智能关联模块从标签数据库中获取到所有与网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块。在大的数据量前提之下,由于任何一个标签的关联标签数目都会非常庞大,所以要限定取出来的数量。而即使如此,仍然会有为数众多的标签,受限于相关内容的总体数量,不可能显示过多的内容,因此要用一种合理的方式再从这些标签中进一步筛选,并最终将筛选出的标签返回给分析模块。因此采用随机函数,根据关联度从所有与网络信息的标签关联的标签中进行选择,选中概率与关联度成正比。例如表I显示了标签A、关联标签及两者的关联度。表 I
标签名相关标签名关联度权重
j示签A标签I100
fe签A标签298
j示签A标签389
¥¥T"……
i示签A标签n40
耘签六I标签m 丨35
理论上而言,标签I到m跟标签A都具备关联度,但是如果仅仅简单的取出标签1,往
往会带来体验上的错觉——浏览标签A的主题内容,得到的相关内容却全部是标签I的主
题,在本具体实施方式
中,采用特定的随机函数来进行联想读取,该随机函数随机筛选所有
相关的标签,关联度权值越大,该被筛选到的概率越大,并最终由这些标签返回给相关内容
分析模块用于进行下一步操作。步骤204、相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息。步骤205、相关内容分析模块将获得的网络信息组织成预设的数据格式返回给客户端。以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准
权利要求
1.一种搜索网络信息的方法,其特征在于,包括以下步骤 A、根据当前正在浏览的网络信息,客户端将所述网络信息的标签发送给服务器端的相关内容分析模块; B、相关内容分析模块将所述网络信息的标签发送给标签智能关联模块; C、标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块; D、相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息; E、相关内容分析模块将获得的网络信息返回给客户端。
2.根据权利要求I所述的ー种搜索网络信息的方法,其特征在于,步骤C中,采用随机函数,根据关联度从所有与所述网络信息的标签关联的标签中进行选择,选中概率与关联度成正比。
3.根据权利要求I所述的ー种搜索网络信息的方法,其特征在于,步骤E中,相关内容分析模块将获得的网络信息组织成预设的数据格式返回给客户端。
4.一种搜索网络信息的系统,其特征在于,包括客户端、相关内容分析模块、标签智能关联模块、标签数据库和内容数据库,客户端与相关内容分析模块连接,相关内容分析模块分别与标签智能关联模块和内容数据库连接,标签智能关联模块与标签数据库连接,其中, 客户端用于将网络信息的标签发送给相关内容分析模块,并接收相关内容分析模块返回的网络信息; 相关内容分析模块用于将所述网络信息的标签发送给标签智能关联模块,从标签智能关联模块获得关联度大于预定阈值的、与所述网络信息的标签关联的标签,并从内容数据库中获得标签对应的网络信息,返回给客户端; 标签智能关联模块用于从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块; 标签数据库用于存储标签及其相互之间的关联度; 内容数据库用于存储标签对应的网络信息。
全文摘要
本发明公开了一种搜索网络信息的方法和系统,根据当前正在浏览的网络信息,客户端将所述网络信息的标签发送给服务器端的相关内容分析模块;相关内容分析模块将所述网络信息的标签发送给标签智能关联模块;标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块;相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息;相关内容分析模块将获得的网络信息返回给客户端。采用了本发明的技术方案,能够最大限度的将与当前内容最相关的内容展示给用户,帮助用户延伸阅读。
文档编号G06F17/30GK102693248SQ201110093338
公开日2012年9月26日 申请日期2011年4月14日 优先权日2011年4月14日
发明者官文吉 申请人:天脉聚源(北京)传媒科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1