结合搜索的股票类UGC数据推荐方法及装置与流程

文档序号:12666485阅读:422来源:国知局
结合搜索的股票类UGC数据推荐方法及装置与流程

本发明涉及互联网应用技术领域,特别是一种结合搜索的股票类UGC数据推荐方法及装置。



背景技术:

现代网络有大量的UGC(User Gernerated Content,用户生成内容),其也被称为UCC(User Created Content,用户创建内容),如论坛帖、微信公众号、头条号、兴趣部落帖子等,其中可以包括用户录制的视频、音频,用户拍摄的图片以及用户创作的文字内容等,这些内容里不乏优质资讯,但在各家搜索引擎产品中没有被充分挖掘出来,并添加到相关结果中。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的结合搜索的股票类UGC数据推荐方法及相应的装置。

依据本发明的一方面,提供了一种结合搜索的股票类UGC数据推荐方法,包括:

当接收到关于股票的搜索查询词时,获取与所述查询词相关的股票代码行情数据以及与所述查询词匹配的股票类UGC评论数据;

将所述股票代码行情数据嵌入到搜索结果中,并将所述股票类UGC评论数据嵌入到推荐结果中。

可选地,获取与所述查询词匹配的股票类UGC评论数据,包括:

获取股票类关键词与股票类UGC评论数据的对应关系;

将所述查询词与所述对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

可选地,通过以下步骤建立所述对应关系:

获取网络中财经类相关的多个UGC网站;

基于股票类关键词生成的词表,从所述多个UGC网站中抓取相应的股票类UGC评论数据,并建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系。

可选地,所述词表包括股票onebox的词表。

可选地,通过以下步骤生成所述词表:

按照指定抓取频率从财经类网站中抓取股票类关键词;

对抓取的所述股票类关键词进行索引处理生成所述词表。

可选地,所述方法还包括:

当按照所述指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据所述下一次抓取的股票类关键词更新所述词表。

可选地,从所述多个UGC网站中抓取相应的股票类UGC评论数据,包括:

从所述多个UGC网站中筛选出至少一个优质UGC网站;

从所述至少一个优质UGC网站中抓取相应的股票类UGC评论数据。

可选地,从所述多个UGC网站中筛选出至少一个优质UGC网站,包括:

确定一个或多个衡量因子;

根据确定的所述一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。

可选地,当衡量因子包括多个时,根据确定的所述多个衡量因子衡量出所述多个UGC网站的质量情况,包括:

基于权重策略确定所述多个衡量因子各自的权重;

获取所述多个UGC网站的所述多个衡量因子各自的数值;

将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;

根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。

可选地,所述对应关系中各个股票类关键词对应的股票类UGC评论数据包括多条,则在建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,所述方法还包括:

获取股票类UGC评论数据的属性信息;

基于获取的所述属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。

可选地,所述属性信息包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数。

可选地,将所述股票类UGC评论数据嵌入到推荐结果中,包括:

从所述股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息;

将所述股票类UGC评论数据及其用户身份信息嵌入到推荐结果中。

可选地,在将所述股票类UGC评论数据嵌入到推荐结果中之后,所述方法还包括:

统计用户针对所述推荐结果中展现的所述股票类UGC评论数据的触发操作,得到统计结果;

根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据。

可选地,根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据,包括:

若所述统计结果为所述触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

可选地,确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据,包括:

通过设置展示权重的方式,使得在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

依据本发明的另一方面,还提供了一种结合搜索的股票类UGC数据推荐装置,包括:

获取模块,适于当接收到关于股票的搜索查询词时,获取与所述查询词相关的股票代码行情数据以及与所述查询词匹配的股票类UGC评论数据;

推荐模块,适于将所述股票代码行情数据嵌入到搜索结果中,并将所述股票类UGC评论数据嵌入到推荐结果中。

可选地,所述获取模块还适于:

获取股票类关键词与股票类UGC评论数据的对应关系;

将所述查询词与所述对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

可选地,所述装置还包括:

抓取模块,适于获取网络中财经类相关的多个UGC网站;基于股票类关键词生成的词表,从所述多个UGC网站中抓取相应的股票类UGC评论数据;

建立模块,适于建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系。

可选地,所述词表包括股票onebox的词表。

可选地,所述装置还包括:

生成模块,适于按照指定抓取频率从财经类网站中抓取股票类关键词;对抓取的所述股票类关键词进行索引处理生成所述词表。

可选地,所述生成模块还适于:

当按照所述指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据所述下一次抓取的股票类关键词更新所述词表。

可选地,所述抓取模块包括:

筛选单元,适于从所述多个UGC网站中筛选出至少一个优质UGC网站;

抓取单元,适于从所述至少一个优质UGC网站中抓取相应的股票类UGC评论数据。

可选地,所述筛选单元还适于:

确定一个或多个衡量因子;

根据确定的所述一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。

可选地,所述筛选单元还适于:

当衡量因子包括多个时,基于权重策略确定所述多个衡量因子各自的权重;

获取所述多个UGC网站的所述多个衡量因子各自的数值;

将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;

根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。

可选地,所述装置还包括:

排序模块,适于所述对应关系中各个股票类关键词对应的股票类UGC评论数据包括多条,在所述建立模块建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,获取股票类UGC评论数据的属性信息;

基于获取的所述属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。

可选地,所述属性信息包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数。

可选地,所述推荐模块还适于:

从所述股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息;

将所述股票类UGC评论数据及其用户身份信息嵌入到推荐结果中。

可选地,所述装置还包括:

统计模块,适于在所述推荐模块将所述股票类UGC评论数据嵌入到推荐结果中之后,统计用户针对所述推荐结果中展现的所述股票类UGC评论数据的触发操作,得到统计结果;

确定模块,适于根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据。

可选地,所述确定模块还适于:

若所述统计结果为所述触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

可选地,所述确定模块还适于:

通过设置展示权重的方式,使得在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

本发明实施例在进行股票类相关的搜索时,能够获取到与查询词相关的股票代码行情数据以及与查询词匹配的股票类UGC评论数据,并将股票代码行情数据嵌入到搜索结果中,将股票类UGC评论数据嵌入到推荐结果中,由此实现了将UGC网站上优质的股票类UGC评论数据直接透传到推荐结果中,从而利用UGC网站的优势,提高搜索引擎的利用率。进一步地,股票类UGC评论数据来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关资讯信息,降低了用户的检索成本,提升用户的检索体验。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一实施例的结合搜索的股票类UGC数据推荐方法的流程图;

图2示出了根据本发明另一实施例的结合搜索的股票类UGC数据推荐方法的流程图;

图3示出了根据本发明一实施例的包含有推荐的UGC评论数据的搜索结果页的示意图;

图4示出了根据本发明一实施例的结合搜索的股票类UGC数据推荐装置的结构示意图;以及

图5示出了根据本发明另一实施例的结合搜索的股票类UGC数据推荐装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

为解决上述技术问题,本发明实施例提供了一种结合搜索的股票类UGC数据推荐方法,该方法可以应用在个人电脑、智能手机、平板电脑等终端设备上。图1示出了根据本发明一实施例的结合搜索的股票类UGC数据推荐方法的流程图。如图1所示,该方法至少可以包括以下步骤S102至步骤S104。

步骤S102,当接收到关于股票的搜索查询词时,获取与查询词相关的股票代码行情数据以及与查询词匹配的股票类UGC评论数据。

步骤S104,将股票代码行情数据嵌入到搜索结果中,并将股票类UGC评论数据嵌入到推荐结果中。

本发明实施例在进行股票类相关的搜索时,能够获取到与查询词相关的股票代码行情数据以及与查询词匹配的股票类UGC评论数据,并将股票代码行情数据嵌入到搜索结果中,将股票类UGC评论数据嵌入到推荐结果中,由此实现了将UGC网站上优质的股票类UGC评论数据直接透传到推荐结果中,从而利用UGC网站的优势,提高搜索引擎的利用率。进一步地,股票类UGC评论数据来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关资讯信息,降低了用户的检索成本,提升用户的检索体验。

如前文介绍UGC也被成为UCC,可以包括用户创作的文字内容,用户拍摄的图片以及用户录制的视频、音频等等。此外,PGC(Professional Generated Content,专业生产内容),它是UGC的衍生概念,UGC的好处是用户可以自由上传内容,丰富网站内容,但不利的方面在于内容的质量良莠不齐。与UGC相比,PGC分类更专业,内容质量也更有保证,其内容设置及产品编辑均非常专业。其实,UGC和PGC两者并不矛盾,不但并行不悖,而且需要相辅相成。一个成熟的互联网内容向产品,不论网站还是社区、视频平台、音频平台、甚至新形态下的媒体,都需要深度和广度两个方面并行。结合自身的特点,UGC负责内容广度,主要贡献流量和参与度,而PGC维持内容深度,主要树立品牌、创造价值,两者缺一不可。由于PGC是UGC的衍生概念,在本发明实施例中不妨将PGC作为UGC的一部分。在一些关于财经类的UGC网站中存在大量UGC评论数据,这些评论数据提供给用户,能够延展阅读性,给用户提供更多的帮助。

在上文步骤S102中获取与查询词匹配的股票类UGC评论数据,本发明实施例提供了一种可选的方案,在该方案中,可以获取股票类关键词与股票类UGC评论数据的对应关系,进而将查询词与对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

进一步地,本发明实施例可以通过以下方式来建立上述对应关系,即,获取网络中财经类相关的多个UGC网站,进而基于股票类关键词生成的词表,从多个UGC网站中抓取相应的股票类UGC评论数据,并建立词表中的股票类关键词与股票类UGC评论数据之间的对应关系。这里的词表可以包括股票onebox的词表,onebox在网络领域中类似于“框计算”,用户只要在搜索框中输入服务需求,系统就能明确识别这种需求,并将该需求分配给最优的内容资源或应用提供商处理,最终精准高效地返回给用户相匹配的结果。

此外,本发明实施例也可以通过抓取的方式来生成上述词表。具体地,可以按照指定抓取频率(如1小时或1天等)从财经类网站中抓取股票类关键词,进而对抓取的股票类关键词进行索引处理生成词表。在可选的实施例中,当按照指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据下一次抓取的股票类关键词更新词表,从而一方面丰富了词表中词汇的数量,另一方面可以减少词表中重复的词汇。

在本发明的可选实施例中,在基于股票类关键词生成的词表,从多个UGC网站中抓取相应的股票类UGC评论数据时,可以将词表中的股票类关键词与多个UGC网站中的标题(title)或内容进行匹配,来抓取相应的股票类UGC评论数据,从而覆盖到全面的抓取内容。

由于UGC网站提供的内容的质量良莠不齐,本发明实施例为了增加股票类UGC评论数据的可信度,在从多个UGC网站中抓取相应的股票类UGC评论数据时,可以从多个UGC网站中筛选出至少一个优质UGC网站,进而从至少一个优质UGC网站中抓取相应的股票类UGC评论数据。

进一步地,在从网络中的多个UGC网站中筛选出关于财经类的至少一个优质UGC网站时,本发明实施例提供了一种可选的方案,在该方案中,可以收集网络中的关于财经类的多个UGC网站,进而根据一个或多个衡量因子衡量出多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。这里的衡量因子可以如网站的可信度、网站上注册的用户数、网站的访问量、网站中网页内容的更新频率等等,本发明实施例不限于此。

当衡量因子包括多个时,在根据多个衡量因子来衡量多个UGC网站的质量情况时,本发明实施例提供了一种可选的方案,在该方案中,可以基于权重策略确定多个衡量因子各自的权重,获取多个UGC网站的多个衡量因子各自的数值;随后将多个UGC网站的多个衡量因子各自的数值与权重进行加权求和,得到综合数值,进而根据多个UGC网站各自的综合数值衡量出多个UGC网站的质量情况。

例如,关于财经类的多个UGC网站为网站1、网站2、网站3、网站4和网站5,多个衡量因子为网站的可信度、网站上注册的用户数、网站的访问量、网站中网页内容的更新频率,网站1的多个衡量因子各自的数值分别为p11、p12、p13、p14,网站2的多个衡量因子各自的数值分别为p21、p22、p23、p24,网站3的多个衡量因子各自的数值分别为p31、p32、p33、p34,网站4的多个衡量因子各自的数值分别为p41、p42、p43、p44,网站5的多个衡量因子各自的数值分别为p51、p52、p53、p54。确定多个衡量因子各自的权重为w1、w2、w3、w4,将多个UGC网站的多个衡量因子各自的数值与权重进行加权求和,得到多个UGC网站的综合数值。不妨以网站1和网站2为例,加权求和后网站1的综合数值为p11×w1+p12×w2+p13×w3+p14×w4,网站2的综合数值为p21×w1+p22×w2+p23×w3+p24×w4,网站3、网站4和网站5以此类推,此处不再一一赘述。

在本发明的可选实施例中,上述建立的对应关系中的各个股票类关键词对应的股票类UGC评论数据包括多条,则在建立词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,本发明实施例还可以对这些UGC数据进行排序,从而实现优化UGC数据的目的。具体地,本发明实施例可以获取股票类UGC评论数据的属性信息,进而基于获取的属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。这里的属性信息可以是发布时间、用户阅读数、用户评论数、用户转载数,等等,本发明不限于此。例如,可以对UGC评论数据的发布时间从前往后进行排序,将发布时间靠后的UGC评论数据排序在前,将发布时间靠前的UGC评论数据排序在后,从而提升UGC评论数据的时效性。又例如,可以对UGC评论数据的用户评论数由大到小进行排序,将用户评论数多的UGC评论数据排序在前,将用户评论数少的UGC评论数据排序在后。再例如,当通过多个属性信息进行排序时,可以确定多个属性信息各自的权重,获取UGC评论数据的多个属性信息各自对应的数值,将UGC评论数据的多个属性信息各自对应的数值与权重进行加权求和,得到综合数值;进而根据得到的综合数值对UGC评论数据进行排序。

在本发明的可选实施例中,在将股票类UGC评论数据嵌入到推荐结果时,可以以文字链的形式将股票类UGC评论数据嵌入到推荐结果,用户点击文字链可以直达相应的评论页面。进一步地,本发明实施例还可以从股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息,进而将股票类UGC评论数据及其用户身份信息嵌入到推荐结果中,从而增加UGC评论数据的可信度。

在步骤S104将股票代码行情数据嵌入到搜索结果中,并将股票类UGC评论数据嵌入到推荐结果之后,本发明实施例还可以按照指定时间(如1小时等)周期判断UGC评论数据的CTR(Click To Rate,点击率),并根据判断结果进行相应的处理。具体地,本发明实施例可以统计用户针对推荐结果中展现的UGC评论数据的触发操作,得到统计结果,进而根据统计结果确定在后续搜索请求对应的页面中是否展现UGC评论数据。例如,若统计结果为触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现UGC评论数据,可以等待有新的UGC评论数据更新后重新进行展现;若统计结果为触发操作的数量大于或等于指定阈值,则确定在后续搜索请求对应的页面中展现UGC评论数据。在具体实现上,可以设置或调整UGC评论数据的展现权重,若统计结果为触发操作的数量小于指定阈值,则减小UGC评论数据的展现权重,使得在后续搜索请求对应的页面中不再展现UGC评论数据;若统计结果为触发操作的数量大于或等于指定阈值,则增大UGC评论数据的展现权重,使得在后续搜索请求对应的页面中展现UGC评论数据。需要说明的是,此处列举的实现方式仅是示意性的,在实际应用中也可以通过设置标签等方式来实现,均属于本发明的保护范围。

以上介绍了图1所示的实施例的各个环节的多种实现方式,下面将通过一具体实施例来详细介绍本发明的结合搜索的股票类UGC数据推荐方法的实现过程。

图2示出了根据本发明另一实施例的结合搜索的股票类UGC数据推荐方法的流程图。如图2所示,该方法至少可以包括以下步骤S202至步骤S208。

步骤S202,获取网络中财经类相关的多个UGC网站,从多个UGC网站中筛选出至少一个优质UGC网站。

在该步骤中,可以根据一个或多个衡量因子衡量出多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。这里的衡量因子可以如网站的可信度、网站上注册的用户数、网站的访问量、网站中网页内容的更新频率等等,本发明实施例不限于此。当衡量因子包括多个时,可以参见前文介绍的方案来衡量多个UGC网站的质量情况,此处不再赘述。这里,筛选出的至少一个优质UGC网站可以如知乎、头条号、第一财经、新浪财经等网站。

步骤S204,基于股票类关键词生成的词表,从至少一个优质UGC网站中抓取相应的股票类UGC评论数据,并建立词表中的股票类关键词与股票类UGC评论数据之间的对应关系。

在该步骤中,词表可以包括股票onebox的词表。本发明实施例也可以通过抓取的方式来生成上述词表。具体地,可以按照指定抓取频率(如1小时或1天等)从财经类网站中抓取股票类关键词,进而对抓取的股票类关键词进行索引处理生成词表。在可选的实施例中,当按照指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据下一次抓取的股票类关键词更新词表,从而一方面丰富了词表中词汇的数量,另一方面可以减少词表中重复的词汇。

在本发明的可选实施例中,上述建立的对应关系中的各个股票类关键词对应的股票类UGC评论数据包括多条,则在建立词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,本发明实施例还可以对这些UGC数据进行排序,从而实现优化UGC数据的目的。具体地,本发明实施例可以获取股票类UGC评论数据的属性信息,进而基于获取的属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。这里的属性信息可以是发布时间、用户阅读数、用户评论数、用户转载数,等等,本发明不限于此。例如,可以对UGC评论数据的发布时间从前往后进行排序,将发布时间靠后的UGC评论数据排序在前,将发布时间靠前的UGC评论数据排序在后,从而提升UGC评论数据的时效性。又例如,可以对UGC评论数据的用户评论数由大到小进行排序,将用户评论数多的UGC评论数据排序在前,将用户评论数少的UGC评论数据排序在后。再例如,当通过多个属性信息进行排序时,可以确定多个属性信息各自的权重,获取UGC评论数据的多个属性信息各自对应的数值,将UGC评论数据的多个属性信息各自对应的数值与权重进行加权求和,得到综合数值;进而根据得到的综合数值对UGC评论数据进行排序。

步骤S206,当接收到关于股票的搜索查询词时,获取与查询词相关的股票代码行情数据,以及将查询词与上述对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

步骤S208,将股票代码行情数据嵌入到搜索结果中,并将股票类UGC评论数据嵌入到搜索结果所在搜索结果页的推荐结果中。

在该步骤中,在将股票类UGC评论数据嵌入到推荐结果时,可以以文字链的形式将股票类UGC评论数据嵌入到推荐结果,用户点击文字链可以直达相应的评论页面。进一步地,本发明实施例还可以从股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息,进而将股票类UGC评论数据及其用户身份信息嵌入到推荐结果中,从而增加UGC评论数据的可信度。

当用户在搜索框中输入“大成月添利债券a”时,采用本发明实施例的方案得到的搜索结果页如图3所示,在图3中,搜索结果页的左侧区域展示有股票代码行情数据,并且搜索结果页的右侧区域展示有“大成月添利债券a”的UGC评论数据,具体以文字链的形式将这些UGC评论数据嵌入到搜索结果页的推荐结果中。

本发明实施例实现了将UGC网站上优质的股票类UGC评论数据直接透传到推荐结果中,从而利用UGC网站的优势,提高搜索引擎的利用率。进一步地,股票类UGC评论数据来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关资讯信息,降低了用户的检索成本,提升用户的检索体验。

需要说明的是,实际应用中,上述所有可选实施方式可以采用结合的方式任意组合,形成本发明的可选实施例,在此不再一一赘述。

基于上文各个实施例提供的结合搜索的股票类UGC数据推荐方法,基于同一发明构思,本发明实施例还提供了一种结合搜索的股票类UGC数据推荐装置。

图4示出了根据本发明一实施例的结合搜索的股票类UGC数据推荐装置的结构示意图。如图4所示,该装置至少可以包括获取模块410和推荐模块420。

现介绍本发明实施例的结合搜索的股票类UGC数据推荐装置的各组成或器件的功能以及各部分间的连接关系:

获取模块410,适于当接收到关于股票的搜索查询词时,获取与所述查询词相关的股票代码行情数据以及与所述查询词匹配的股票类UGC评论数据;

推荐模块420,与获取模块410相耦合,适于将所述股票代码行情数据嵌入到搜索结果中,并将所述股票类UGC评论数据嵌入到推荐结果中。

在本发明一实施例中,所述获取模块410还适于:

获取股票类关键词与股票类UGC评论数据的对应关系;

将所述查询词与所述对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

在本发明一实施例中,如图5所示,上文图4展示的装置还可以包括:

抓取模块510,与获取模块410相耦合,适于获取网络中财经类相关的多个UGC网站;基于股票类关键词生成的词表,从所述多个UGC网站中抓取相应的股票类UGC评论数据;

建立模块520,与抓取模块510相耦合,适于建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系。

在本发明一实施例中,所述词表包括股票onebox的词表。

在本发明一实施例中,如图5所示,上文图4展示的装置还可以包括:

生成模块530,与抓取模块510相耦合,适于按照指定抓取频率从财经类网站中抓取股票类关键词;对抓取的所述股票类关键词进行索引处理生成所述词表。

在本发明一实施例中,所述生成模块530还适于:

当按照所述指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据所述下一次抓取的股票类关键词更新所述词表。

在本发明一实施例中,所述抓取模块510可以包括:

筛选单元(附图中未示出),适于从所述多个UGC网站中筛选出至少一个优质UGC网站;

抓取单元(附图中未示出),与筛选单元相耦合,适于从所述至少一个优质UGC网站中抓取相应的股票类UGC评论数据。

在本发明一实施例中,所述筛选单元还适于:

确定一个或多个衡量因子;

根据确定的所述一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。

在本发明一实施例中,所述筛选单元还适于:

当衡量因子包括多个时,基于权重策略确定所述多个衡量因子各自的权重;

获取所述多个UGC网站的所述多个衡量因子各自的数值;

将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;

根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。

在本发明一实施例中,如图5所示,上文图4展示的装置还可以包括:

排序模块540,与建立模块520相耦合,适于所述对应关系中各个股票类关键词对应的股票类UGC评论数据包括多条,在所述建立模块520建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,获取股票类UGC评论数据的属性信息;

基于获取的所述属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。

在本发明一实施例中,所述属性信息包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数。

在本发明一实施例中,所述推荐模块420还适于:

从所述股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息;

将所述股票类UGC评论数据及其用户身份信息嵌入到推荐结果中。

在本发明一实施例中,如图5所示,上文图4展示的装置还可以包括:

统计模块550,与推荐模块420相耦合,适于在所述推荐模块420将所述股票类UGC评论数据嵌入到推荐结果中之后,统计用户针对所述推荐结果中展现的所述股票类UGC评论数据的触发操作,得到统计结果;

确定模块560,与统计模块550相耦合,适于根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据。

在本发明一实施例中,所述确定模块560还适于:

若所述统计结果为所述触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

在本发明一实施例中,所述确定模块560还适于:

通过设置展示权重的方式,使得在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

根据上述任意一个可选实施例或多个可选实施例的组合,本发明实施例能够达到如下有益效果:

本发明实施例在进行股票类相关的搜索时,能够获取到与查询词相关的股票代码行情数据以及与查询词匹配的股票类UGC评论数据,并将股票代码行情数据嵌入到搜索结果中,将股票类UGC评论数据嵌入到推荐结果中,由此实现了将UGC网站上优质的股票类UGC评论数据直接透传到推荐结果中,从而利用UGC网站的优势,提高搜索引擎的利用率。进一步地,股票类UGC评论数据来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关资讯信息,降低了用户的检索成本,提升用户的检索体验。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的结合搜索的股票类UGC数据推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

本发明实施例的一方面,提供了A1、一种结合搜索的股票类UGC数据推荐方法,包括:

当接收到关于股票的搜索查询词时,获取与所述查询词相关的股票代码行情数据以及与所述查询词匹配的股票类UGC评论数据;

将所述股票代码行情数据嵌入到搜索结果中,并将所述股票类UGC评论数据嵌入到推荐结果中。

A2、根据A1所述的方法,其中,获取与所述查询词匹配的股票类UGC评论数据,包括:

获取股票类关键词与股票类UGC评论数据的对应关系;

将所述查询词与所述对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

A3、根据A1或A2所述的方法,其中,通过以下步骤建立所述对应关系:

获取网络中财经类相关的多个UGC网站;

基于股票类关键词生成的词表,从所述多个UGC网站中抓取相应的股票类UGC评论数据,并建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系。

A4、根据A1-A3中任一项所述的方法,其中,所述词表包括股票onebox的词表。

A5、根据A1-A4中任一项所述的方法,其中,通过以下步骤生成所述词表:

按照指定抓取频率从财经类网站中抓取股票类关键词;

对抓取的所述股票类关键词进行索引处理生成所述词表。

A6、根据A1-A5中任一项所述的方法,其中,还包括:

当按照所述指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据所述下一次抓取的股票类关键词更新所述词表。

A7、根据A1-A6中任一项所述的方法,其中,从所述多个UGC网站中抓取相应的股票类UGC评论数据,包括:

从所述多个UGC网站中筛选出至少一个优质UGC网站;

从所述至少一个优质UGC网站中抓取相应的股票类UGC评论数据。

A8、根据A1-A7中任一项所述的方法,其中,从所述多个UGC网站中筛选出至少一个优质UGC网站,包括:

确定一个或多个衡量因子;

根据确定的所述一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。

A9、根据A1-A8中任一项所述的方法,其中,当衡量因子包括多个时,根据确定的所述多个衡量因子衡量出所述多个UGC网站的质量情况,包括:

基于权重策略确定所述多个衡量因子各自的权重;

获取所述多个UGC网站的所述多个衡量因子各自的数值;

将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;

根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。

A10、根据A1-A9中任一项所述的方法,其中,所述对应关系中各个股票类关键词对应的股票类UGC评论数据包括多条,则在建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,所述方法还包括:

获取股票类UGC评论数据的属性信息;

基于获取的所述属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。

A11、根据A1-A10中任一项所述的方法,其中,所述属性信息包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数。

A12、根据A1-A11中任一项所述的方法,其中,将所述股票类UGC评论数据嵌入到推荐结果中,包括:

从所述股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息;

将所述股票类UGC评论数据及其用户身份信息嵌入到推荐结果中。

A13、根据A1-A12中任一项所述的方法,其中,在将所述股票类UGC评论数据嵌入到推荐结果中之后,所述方法还包括:

统计用户针对所述推荐结果中展现的所述股票类UGC评论数据的触发操作,得到统计结果;

根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据。

A14、根据A1-A13中任一项所述的方法,其中,根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据,包括:

若所述统计结果为所述触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

A15、根据A1-14中任一项所述的方法,其中,确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据,包括:

通过设置展示权重的方式,使得在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

本发明实施例的另一方面,还提供了B16、一种结合搜索的股票类UGC数据推荐装置,包括:

获取模块,适于当接收到关于股票的搜索查询词时,获取与所述查询词相关的股票代码行情数据以及与所述查询词匹配的股票类UGC评论数据;

推荐模块,适于将所述股票代码行情数据嵌入到搜索结果中,并将所述股票类UGC评论数据嵌入到推荐结果中。

B17、根据B16所述的装置,其中,所述获取模块还适于:

获取股票类关键词与股票类UGC评论数据的对应关系;

将所述查询词与所述对应关系中的股票类关键词进行匹配,得到匹配的股票类关键词对应的股票类UGC评论数据。

B18、根据B16或17所述的装置,其中,还包括:

抓取模块,适于获取网络中财经类相关的多个UGC网站;基于股票类关键词生成的词表,从所述多个UGC网站中抓取相应的股票类UGC评论数据;

建立模块,适于建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系。

B19、根据B16-B18中任一项所述的装置,其中,所述词表包括股票onebox的词表。

B20、根据B16-B19中任一项所述的装置,其中,还包括:

生成模块,适于按照指定抓取频率从财经类网站中抓取股票类关键词;对抓取的所述股票类关键词进行索引处理生成所述词表。

B21、根据B16-B20中任一项所述的装置,其中,所述生成模块还适于:

当按照所述指定抓取频率下一次从财经类网站中抓取股票类关键词时,根据所述下一次抓取的股票类关键词更新所述词表。

B22、根据B16-B21中任一项所述的装置,其中,所述抓取模块包括:

筛选单元,适于从所述多个UGC网站中筛选出至少一个优质UGC网站;

抓取单元,适于从所述至少一个优质UGC网站中抓取相应的股票类UGC评论数据。

B23、根据B16-B22中任一项所述的装置,其中,所述筛选单元还适于:

确定一个或多个衡量因子;

根据确定的所述一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。

B24、根据B16-B23中任一项所述的装置,其中,所述筛选单元还适于:

当衡量因子包括多个时,基于权重策略确定所述多个衡量因子各自的权重;

获取所述多个UGC网站的所述多个衡量因子各自的数值;

将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;

根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。

B25、根据B16-B24中任一项所述的装置,其中,还包括:

排序模块,适于所述对应关系中各个股票类关键词对应的股票类UGC评论数据包括多条,在所述建立模块建立所述词表中的股票类关键词与股票类UGC评论数据之间的对应关系之后,获取股票类UGC评论数据的属性信息;

基于获取的所述属性信息,对各个股票类关键词对应的多条股票类UGC评论数据进行排序,得到排序后的股票类UGC评论数据,从而在后续匹配上股票类关键词时,提供该股票类关键词的排序后的股票类UGC评论数据。

B26、根据B16-B25中任一项所述的装置,其中,所述属性信息包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数。

B27、根据B16-B26中任一项所述的装置,其中,所述推荐模块还适于:

从所述股票类UGC评论数据中提取创建该股票类UGC评论数据的用户身份信息;

将所述股票类UGC评论数据及其用户身份信息嵌入到推荐结果中。

B28、根据B16-B27中任一项所述的装置,其中,还包括:

统计模块,适于在所述推荐模块将所述股票类UGC评论数据嵌入到推荐结果中之后,统计用户针对所述推荐结果中展现的所述股票类UGC评论数据的触发操作,得到统计结果;

确定模块,适于根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述股票类UGC评论数据。

B29、根据B16-B28中任一项所述的装置,其中,所述确定模块还适于:

若所述统计结果为所述触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

B30、根据B16-B29中任一项所述的装置,其中,所述确定模块还适于:

通过设置展示权重的方式,使得在后续搜索请求对应的页面中不再展现所述股票类UGC评论数据。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1