提供推荐内容的制作方法

文档序号:15739470发布日期:2018-10-23 22:02阅读:179来源:国知局
提供推荐内容的制作方法

如今,网络用户广泛地使用搜索服务来获得其感兴趣的网络内容。例如,当一个事件发生时,网络用户可能尝试通过搜索引擎来搜索与该事件相关的网络内容。此处,事件可以指在人类社会或自然界发生的至少具有时间属性和位置属性的各种事情。例如,事件可以是在特定时间和特定位置发生的政治事件、体育事件、娱乐事件、交通事故、自然灾害等。当从网络用户的终端设备接收到搜索查询时,搜索引擎可以向网络用户提供包含了与该事件相关的网络内容的搜索结果。例如,网络内容可以包括搜索引擎基于来自网络用户的搜索查询而确定或推荐的关于事件的一些新闻或报道。通常,搜索引擎基于相关性、新鲜度和权威性的考虑来提供网络内容。



技术实现要素:

提供本发明内容以便以简化形式介绍一组概念,这组概念将在以下的具体实施方式中做进一步描述。本发明内容并非旨在标识所保护主题的关键特征或必要特征,也不旨在用于限制所保护主题的范围。

本公开的实施例可以提供用于提供推荐内容的方法、装置和系统。

在一个方面,本公开提供了一种用于提供推荐内容的方法。可以接收搜索查询。可以基于搜索查询,从预先确定的事件集合中选择事件。可以以结构化模板来提供推荐内容,该结构化模板包括一个或多个单元。每个单元关联于事件的一个特征。事件的每个特征对应于一个搜索意图。每个单元包括一个或多个子内容,并且每个子内容与对应的推荐内容相关。

在另一个方面,本公开提供了一种用于提供推荐内容的方法。可以基于在一个时段内激增的多个搜索查询来识别事件。可以确定所述事件的一个或多个特征。所述事件的每个特征对应于一个搜索意图。所述推荐内容是以结构化模板来提供的,所述结构化模板包括一个或多个单元。每个单元关联于所述事件的一个特征,并且每个单元包括一个或多个子内容。可以使得所述子内容中的每一个与对应的推荐内容相关。

在另一个方面,本公开提供了一种用于提供推荐内容的装置。所述装置可以包括:查询接收模块,用于接收搜索查询;事件选择模块,用于基于所述搜索查询从预先确定的事件集合中选择事件;以及内容提供模块,用于以结构化模板来提供所述推荐内容,所述结构化模板包括一个或多个单元,每个单元关联于所述事件的一个特征,所述事件的每个特征对应于一个搜索意图,每个单元包括一个或多个子内容,并且每个子内容与对应的推荐内容相关。

在另一个方面,本公开提供了一种用于提供推荐内容的装置。所述装置可以包括:事件识别模块,用于基于在一个时段内激增的多个搜索查询来识别事件;特征确定模块,用于确定所述事件的一个或多个特征,所述事件的每个特征对应于一个搜索意图,所述推荐内容是以结构化模板来提供的,所述结构化模板包括一个或多个单元,每个单元关联于所述事件的一个特征,并且每个单元包括一个或多个子内容;以及内容相关模块,用于使得所述子内容中的每一个与对应的推荐内容相关。

在另一个方面,本公开提供了一种用于提供推荐内容的系统。所述系统可以包括一个或多个处理器。所述系统还可以包括存储器,该存储器连接到所述一个或多个处理器。所述存储器可以存储计算机可执行指令,当所述计算机可执行指令被执行时,使得所述一个或多个处理器执行根据本公开实施例的用于提供推荐内容的方法的任意操作。

在另一个方面,本公开提供了一种非暂时性计算机可读介质。该非暂时性计算机可读介质可以包括指令,当所述指令被运行时,使得一个或多个处理器执行根据本公开各个方面的方法的任意操作。

应当注意,以上一个或多个方面包括以下详细描述以及权利要求中具体指出的特征。下面的说明书及附图详细提出了所述一个或多个方面的特定说明性特征。这些特征仅仅指示可以实施各个方面的原理的多种方式中的一些方式,并且本公开旨在包括所有这些方面和其等同变换。

附图说明

以下将结合附图描述所公开的多个方面,这些附图被提供用以说明而非限制所公开的多个方面。

图1示出用于搜索网络内容的示例性应用场景。

图2是根据本公开实施例的用于提供推荐内容的示例性方法的流程图。

图3示出根据本公开实施例的示例性结构化模板。

图4示出根据本公开实施例的示例性网页。

图5示出根据本公开实施例的另一个示例性结构化模板。

图6示出根据本公开实施例的另一个示例性网页。

图7是根据本公开实施例的用于提供推荐内容的示例性方法的流程图。

图8是根据本公开实施例的用于识别事件的示例性处理的流程图。

图9是根据本公开实施例的用于确定话题的示例性处理的流程图。

图10示出根据本公开实施例的用于提供推荐内容的示例性装置。

图11示出根据本公开实施例的用于提供推荐内容的示例性装置。

图12示出根据本公开实施例的用于提供推荐内容的示例性系统。

具体实施方式

现在将参考多种示例性实施方式来讨论本公开。应当理解,这些实施方式的讨论仅仅用于使得本领域技术人员能够更好地理解并从而实施本公开的实施例,而并非教导对本公开的范围的任何限制。

图1示出用于搜索网络内容的示例性应用场景100。

在图1中,将网络110用于在终端设备120a和120b与搜索服务器130之间进行互联。搜索服务器130与搜索数据库140连接。

网络110可以是能够对网络实体进行互联的任何类型的网络。网络110可以是单个网络或者不同网络的组合。在覆盖范围方面,网络110可以是局域网(LAN)、城域网(MAN)或广域网(WAN)。在承载介质方面,网络110可以是有线网络或无线网络。在数据交换技术方面,网络110可以是电路交换网络、分组交换网络或报文交换网络。

终端设备120a和120b可以是任何类型的电子计算设备,其能够连接到网络110、访问网络110上的服务器或网站、处理数据或信号等。例如,终端设备120a和120b可以是台式计算机、笔记本、平板电脑、智能电话等。尽管图1中仅示出两个终端设备120a和120b,但是应当理解,可以有不同数量的终端设备连接到网络110。

搜索服务器130可以通过搜索引擎来向用户提供搜索服务。搜索数据库140可以存储由搜索服务器130用于提供搜索结果的信息。例如,当从终端设备120a接收到搜索查询时,搜索服务器130可以从搜索数据库140获得与搜索查询相关的信息,并从而向终端设备120a的用户提供作为搜索结果的内容。搜索数据库140可以与搜索服务器130相分离,或者可以被包含到搜索服务器130中。

应当理解,图1中示出的所有网络实体都是示例性的,根据具体应用需求,应用场景100中可以涉及任何其它网络实体。

在用户通过终端设备向搜索服务器提交了针对事件的搜索查询的情形下,根据传统的搜索和推荐技术,搜索服务器将会考虑相关性、新鲜度和权威性,并且向用户提供链接列表以作为搜索结果或内容推荐。与此不同,根据本公开的实施例,当确定提供给用户的内容推荐时,搜索服务器可以考虑关联于事件的用户的各种搜索意图。此处,搜索意图可以是当用户通过终端设备提交针对事件的搜索查询时,用户的各种可能的搜索目的或需求。内容推荐可以包括基于搜索意图确定的且将被推荐给用户的推荐内容。此处,推荐内容可以是,例如,文档、社交网络消息等。此外,本公开的实施例可以在终端设备处以结构化形式来呈现内容推荐。此处,结构化形式指示可以在用于呈现内容推荐的页面的相应区域中显示内容推荐的各种信息。本公开能够向用户提供期望的内容推荐,并且使得用户具有更好的用户参与度。

在一个方面,搜索意图可以包括与事件相关的话题。此处,话题可以指示从关联于事件的内容中导出的各种内容分支。这些内容分支可以分别对应于定义了事件的各个方面的多组内容。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有了解“MH 370失事”事件的各个方面及相关内容的搜索意图。相应地,本公开的实施例可以提供该事件的一个或多个话题及相关内容。所述一个或多个话题可以包括,例如,“全球搜索和救援”、“政府反应”、“遇难者及其家属”等。然而,应当理解,一些事件可能不具有话题,这是因为可能没有从关联于这些事件的内容中导出明显的内容分支。

在一个方面,搜索意图可以包括事件的关键时刻。此处,关键时刻可以指在事件的进程中的里程碑(milestone)时间点。每个关键时刻可以对应于在事件的发展期间的转折点或重要时间点。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有了解“MH 370失事”事件的关键时刻及相关内容的搜索意图。在该实例中,关键时刻可以是飞机从吉隆坡起飞的时间“2014年3月8日凌晨12:40”,另一个关键时刻可以是搜索区域从20海里扩大到50海里的时间“2014年3月9日”,再一个关键时刻可以是马来西亚警方宣布调查范围的时间“2014年3月11日”,等等。

在一个方面,搜索意图可以包括关联于事件的位置。此处,位置可以指事件发生的位置或事件关注的位置。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有了解该航班失踪事件在哪里发生的搜索意图。在该实例中,位置可以包括“马来西亚”。

在一个方面,搜索意图可以包括关联于事件的人物。此处,人物可以指在事件中涉及的人物。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有了解该事件中涉及到哪些人物以及这些人物的背景信息的搜索意图。在该实例中,人物可以包括航班机长“Zaharie Shah”。

在一个方面,搜索意图可以包括关联于事件的主题。此处,主题可以指事件的本质或核心。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有了解在该事件中发生了什么的搜索意图。在该实例中,主题可以包括“飞机失事”,其指示该事件是关于飞机失事事件的。

在一个方面,搜索意图可以包括关联于事件的、来自主流媒体的代表性文档。此处,文档可以指报道、文章、记录等。此处,主流媒体可以指向公众提供新闻和信息并且反映了普遍观点的任何新闻业实体,例如,CNN、FOX新闻等。此处,代表性文档可以是主流媒体所发布的、关联于事件的最新的、权威性的或最受关注的文档。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有读取来自主流媒体的报道的搜索意图。在该实例中,来自主流媒体的代表性文档可以是CNN发布的关于该事件的最新报道、来自FOX新闻的点击数目最高的关于该事件的报道等。

在一个方面,搜索意图可以包括来自社交网络的代表性消息。此处,社交网络可以指社交网络提供方能够用以向用户提供社交网络服务的任何网络平台。用户可以在社交网络上提交和共享各种消息,例如,推文、博客、微博、帖子等。此处,来自社交网络的代表性消息可以指社交网络上关联于事件的最新的、权威性的或最受关注的消息。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有读取来自社交网络的消息的搜索意图。在该实例中,来自社交网络的代表性消息可以是,例如,具有最大转发数目的推特(Twitter)上的推文或新浪微博(Sina Microblog)上的微博评论。

在一个方面,搜索意图可以包括关于事件的多媒体信息。此处,多媒体信息可以指在事件期间拍摄或记录的或者能够代表事件的图像、视频、音频等。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,该用户可能具有观看关联于该事件的图像或视频的搜索意图。在该实例中,关于事件的多媒体信息可以包括在“MH 370失事”事件期间拍摄的图像库或视频库。

尽管以上描述了搜索意图的一些实例,但是应当理解,搜索意图可以包括能够反映用户的任何其它可能搜索目的或需求的任何其它搜索意图。

如上所述,本公开的实施例可以基于用户的搜索意图来确定推荐内容。在一些实施方式中,本公开可以基于搜索意图,利用预先确定的事件集合来确定推荐内容。此处,事件集合可以是由各种事件形成的集合,这些事件例如为“MH 370失事”事件、“2016美国总统大选”事件等。事件集合可以包括关于世界上当前正在发生或已经发生的多个事件的信息。关于多个事件的信息可以包括,例如,关联于多个事件的多个搜索查询、多个事件的特征等。可以将事件集合存储在例如图1所示的搜索数据库140中。由此,搜索服务器130可以利用搜索数据库140中存储的事件集合中的信息来提供内容推荐。

在一个方面,事件集合可以包括关联于多个事件的多个搜索查询。例如,对于“MH 370失事”事件,事件集合可以包括关联于该事件的搜索查询“马来西亚航空航班370”、“MH 370最新新闻”、“MH 370救援”等。这些示例性的搜索查询可以被映射到“MH 370失事”事件。可以将事件集合中搜索查询与事件之间的映射用于找到与来自用户的搜索查询相对应的事件。例如,当用户正在执行关于“马来西亚航空航班370”的搜索查询时,可能在事件集合中找到完全匹配的搜索查询“马来西亚航空航班370”或者部分匹配的搜索查询“MH 370最新新闻”,从而可以将来自用户的该搜索查询映射到“MH 370失事”事件。

在一个方面,事件集合可以包括多个事件的特征。事件集合中的每个事件具有分别与关联于事件的搜索意图相对应的特征。即,事件集合中的事件的特征可以包括以下各项中的至少一个:与事件相关的话题;事件的关键时刻;关联于事件的位置;事件中涉及的人物;与事件相关的主题;来自主流媒体的代表性文档;来自社交网络的代表性消息;以及关于事件的多媒体信息。

事件的每一个特征可以具有一个或多个关联的推荐内容。可以将这些推荐内容分类为一组或更多组推荐内容。每一组推荐内容可以用于导出或获得对应的子内容。此处,子内容可以指将要在内容推荐中呈现给用户的信息。每个子内容可以与关联于该子内容的一组推荐内容相关。每个子内容可以至少包括关键字以及一个或多个提取信息。此处,关键字是对关联于子内容的一组推荐内容之间的、对应于特征的公共属性的指示,并且可以从关联于子内容的一组推荐内容中导出。此处,提取信息是关联于子内容的一组推荐内容中的每个推荐内容的提取部分。

以与“MH 370失事”事件相关的“话题”特征为例,可能存在关联于该事件的20个推荐内容。例如,通过语义向量聚类,20个推荐内容中的8个推荐内容可能是彼此语义相关的,并且可以对应于第一子内容,而20个推荐内容中的其它12个推荐内容可以是彼此语义相关的,并且可以对应于第二子内容。第一子内容可以包括关键字“全球搜索和救援”,其是对应于第一子内容的8个推荐内容中涉及的公共话题。此外,第一子内容可以包括8个提取信息,其是分别从对应于第一子内容的8个推荐内容中获得的。第一子内容中的提取信息可以是,例如,8个推荐内容中的第一内容的标题、8个推荐内容中的第二内容的第一段、8个推荐内容中的第三内容的片段、8个推荐内容中的第四内容的标题和第一段等等。类似地,第二子内容可以包括关键字“政府反应”以及从对应于第二子内容的12个推荐内容中获得的12个提取信息。

当将来自用户的搜索查询映射到事件集合中的事件时,可以基于事件的特征来进行内容推荐。例如,可以在内容推荐中将事件的每个特征的子内容呈现给用户。如上所述,事件的特征可以对应于关联于事件的搜索意图,从而呈现给用户的子内容也可以对应于这些搜索意图。在一些实施方式中,呈现给用户的事件的每个特征的子内容可以包含对推荐内容的超链接,因此,当用户点击子内容时,可以向用户显示进一步的呈现,例如完整的推荐内容。由于内容推荐适应于搜索意图,因此用户可以具有更好的用户参与度。

图2是根据本公开实施例的用于提供推荐内容的示例性方法200的流程图。在一些实施方式中,本公开可以使用接收到的搜索查询来从预先确定的事件集合中选择对应的事件,并且进而以结构化模板来提供关联于事件的推荐内容。

方法200在202处开始并且进行到204。在204处,可以接收搜索查询。

在206处,可以基于搜索查询从预先确定的事件集合中选择事件。

在一种实施方式中,可以基于搜索查询从事件集合中的多个事件中选择事件。事件集合可以包括关联于多个事件的多个搜索查询。如果从用户的终端设备接收到的搜索查询与事件集合中的多个搜索查询中的一个搜索查询相匹配,则可以选择事件集合中与该搜索查询相对应的事件。

在208处,可以以结构化模板来提供推荐内容。

此处,模板是用于向用户呈现信息的用户界面(UI)的布局模型。此处,结构化模板可以指采用了结构化形式的模板。例如,在结构化模板中,诸如网页的UI可以被划分成一个或多个区域,每个区域是结构化模板的一个单元。结构化模板可以分别在一个或多个单元中呈现信息。

在事件集合中,事件的每一个特征可以具有一个或多个相关联的推荐内容。可以通过结构化模板将这些推荐内容提供给用户。结构化模板的每个单元可以关联于事件的一个特征。结构化模板的每个单元可以包括一个或多个子内容。每个子内容可以与对应的推荐内容相关。换句话说,结构化模板的每个单元可以用于呈现事件的一个特征的一个或多个子内容。事件的每个特征可以对应于关联于事件的一个搜索意图,从而,结构化模板的每个单元也可以对应于关联于事件的一个搜索意图。通过在终端设备的显示部件上基于结构化模板来呈现子内容,用户可以获得内容推荐。

在一种实施方式中,可以基于推荐内容的规模来呈现结构化模板。此处,规模可以指推荐内容的数量或信息量。可以将规模用于确定以结构化模板对单元的的呈现方式。例如,如果单元的尺寸不足以容纳关联于该单元的事件的特征的所有子内容,则可以扩大单元的尺寸,否则,可以在单元中设置滚动条或者页面上翻/下翻按键。而如果单元的尺寸足以容纳关联于该单元的事件的特征的所有子内容,并且在该单元中存在空白区域,则可以减小该单元的尺寸,使得其它单元可以获得更多的面积来容纳其关联的子内容。

在一种实施方式中,可以利用与关于事件的社交情绪相对应的颜色来呈现结构化模板。此处,关于事件的社交情绪可以指公众关于事件的情感状态。关于事件的社交情绪可以是通过对关联于事件的推荐内容执行社交情绪分析来确定的。本公开的实施例可以采用任何类型的社交情绪分析技术来确定关于事件的社交情绪。例如,可以采用基于语言解析的社交情绪分析技术。可以通过各种方式来表示关于事件的社交情绪,例如,表示为积极的、消极的或中性的,表示为愉快的、愤怒的、悲伤的、激动的或失望的,等等。可以将关于事件的社交情绪用于确定结构化模板的单元的一种或更多种颜色。颜色可以适应于关于事件的社交情绪。例如,如果社交情绪是愉快的,则可以将一种暖色或更多种暖色的组合用于结构化模板的一个或多个单元。而如果社交情绪是悲伤的,则可以将一种暗淡的颜色或者更多种暗淡的颜色的组合用于结构化模板的一个或多个单元。

图3示出根据本公开实施例的示例性结构化模板300。

如图3所示,在结构化模板300的不同单元中示出事件的特征。在单元310中示出来自用户的搜索查询。在单元320中示出代表性文档特征的子内容。在单元320中设置上翻/下翻按键以便在子内容之间导航。在单元330中示出关键时刻特征的子内容,其包括多个关键时刻以及对应的提取信息。在单元330中设置滚动条以便在事件进程中导航。在单元340中示出代表性消息特征的子内容。在单元350中示出人物特征的子内容。在单元360中示出位置特征的子内容。

图4示出根据本公开实施例的示例性网页400。可以至少基于结构化模板300来在终端设备处将网页400呈现给用户。

用户可能提交了搜索查询“马来西亚航空航班370”。可以在网页400中将搜索结果返回给用户。在单元410中示出搜索查询。在单元420中包括来自主流媒体的代表性文档特征。例如,当前在单元420中示出了来自CNN的新闻。在单元430中包括关键时刻特征。例如,在单元430中示出了事件进程,其包括关键时刻特征的子内容。在单元440中包括来自社交网络的代表性消息特征。例如,当前在单元440中示出了来自新浪微博的微博。在单元450中包括事件中涉及的人物特征。例如,在单元450中示出了关于机长的信息。此外,在单元460中包括位置特征。例如,在单元460中示出了标记有马来西亚的地图。

图5示出根据本公开实施例的另一个示例性结构化模板500。

在单元510中示出来自用户的搜索查询。在单元520中示出话题特征的子内容。在单元530中示出关键时刻特征的子内容。在单元540中示出主题特征的子内容。在单元550中示出人物特征的子内容。在单元560中示出位置特征的子内容。

图6示出根据本公开实施例的另一个示例性网页600。可以至少基于结构化模板500来在终端设备处将网页600呈现给用户。

用户可能提交了搜索查询“马来西亚航空航班370”。可以在网页600中将搜索结果返回给用户。在单元610中示出搜索查询。在单元620中包括与事件相关的话题特征。例如,当前在单元620中示出了两个话题,即“政府反应”和“全球搜索和救援”,以及其相关的新闻。在单元630中包括关键时刻特征。例如,在单元630中示出了事件进程,其包括关键时刻特征的子内容。在单元640中包括与事件相关的主题特征。例如,在单元640中示出了主题“飞机失事”及其介绍。在单元650中包括事件中涉及的人物特征。例如,在单元650中示出了关于机长的信息。此外,在单元660中包括位置特征。例如,在单元660中示出了标记有马来西亚的地图。

应当理解,图3和图5中的结构化模板以及图4和图6中的网页仅仅是示例性的。根据实际的应用需求,可以采用具有任何其它布置和任何其它单元的结构化模板来呈现推荐内容。此外,尽管未在图3至图6中示出,还可以根据关于事件的社交情绪来设置模板中的单元的颜色。

图7是根据本公开实施例的用于提供推荐内容的示例性方法700的流程图。在一些方面,方法700可以用于建立事件集合。该事件集合可以进而用于向正在执行搜索查询的用户提供推荐内容。尽管以下针对事件集合中的一个事件描述了方法700,应当理解,也可以通过相同的方式将该方法应用于事件集合中的任何其它事件。

方法700在702处开始并且进行到704。在704处,可以基于在一个时段内激增(spiking)的多个搜索查询来识别事件。

通常,如果事件发生或发展,网络用户可能尝试通过搜索引擎来搜索事件的相关信息,因此,与该事件相关联的搜索查询的频率可能在一个时段内显著增加,即,该搜索查询在一个时段内激增。此处,时段可以是人为地、经验性地定义的,或者是通过参考例如新闻网站的更新时间间隔而定义的。本公开的实施例可以使用在一个时段内激增的搜索查询来确定是否发生了相应事件。例如,如果在诸如10小时的一个时段内,搜索查询“马来西亚航空航班370”、“马来西亚飞机失事”、“MH 370最新新闻”、“MH 370救援”等是激增的,则可以将这些搜索查询用于识别“MH 370失事”事件。后面将会结合图8来更详细地讨论在704处识别事件的处理。

在706处,可以确定事件的一个或多个特征。

如上所述,事件的每个特征可以对应于一个搜索意图。可以以包括一个或多个单元的结构化模板来提供推荐内容。结构化模板的每个单元可以关联于事件的一个特征,每个单元可以包括事件的该特征的一个或多个子内容。

确定事件的特征可以指确定特征的一个或多个子内容。进而,确定特征的子内容可以包括确定子内容中的关键字以及一个或多个提取信息。可以从关联于子内容的推荐内容中导出子内容的关键字。可以从关联于子内容的推荐内容中分别获得子内容中的一个或多个提取信息。

在一些实施方式中,考虑到随着事件的发展,在网络上可能持续地出现新的搜索查询或新的内容,事件的特征也可以被动态地更新。例如,可以在事件的特征的更新期间考虑新的内容。

后面将会更详细地讨论在706处对事件的特征的确定。

在708处,可以使得子内容中的每一个与对应的推荐内容相关。

708处的相关可以指在每个子内容与关联于该子内容的推荐内容之间建立映射关系。可以将子内容的关键字映射到关联于该子内容的所有推荐内容,并且将子内容中的提取信息映射到对应的推荐内容。例如,子内容中的每个提取信息可以包含对相应推荐内容的超链接,从而,当用户点击一个提取信息时,可以将关联于该提取信息的完整内容显示给用户。

图8是根据本公开实施例的用于识别事件的示例性处理800的流程图。在一些实施方式中,本公开可以使用网络上激增的搜索查询来识别事件。所识别的事件可以进而用于例如建立事件集合。

在802处,可以获得在一个时段内激增的搜索查询。

可以采用各种方式来获得搜索查询。例如,搜索引擎提供方通常会维护搜索查询的统计数据,可以将该统计数据用于确定在一个时段内激增的那些搜索查询。

在另一种实施方式中,802处的搜索查询的获得可以基于激增的文档。此处,激增的文档可以指在一个时段内在网络上显著增加的各种文档。例如,在确认了航班MH 370已经消失之后,可能在5个小时之内在网络上出现关于MH 370的大量文档,例如,新闻,这些激增的文档可以指示非常可能发生了相关事件。802处的获得可以包括检测激增的文档,并且将激增的文档合成为搜索查询。例如,可以将标题-至-查询转换技术用于基于激增的文档的标题来获得搜索查询。

在804处,可以对搜索查询执行第一过滤,以便滤除由周期性波动引起的搜索查询。

周期性波动可以指示周期性发生的且不是由于事件发生而触发的网络业务量的改变。例如,用户倾向于在每天上午6点至8点查询“今日天气”,从而,在每天的该时段都可能发生大量的相关搜索查询。然而,这些搜索查询很可能并不与事件相关,因此,可以将这些搜索查询从本公开关注的搜索查询中排除。

可以将基于趋势分析的方式用于从802处获得的搜索查询中滤除由周期性波动引起的搜索查询。对于每个搜索查询,可以获得在多个时段内与搜索查询匹配的内容数目。例如,可以获得在过去一小时内、在过去一天内以及在过去两周内与查询匹配的内容数目。然后,可以基于所获得的数目对所有搜索查询进行排序。例如,在针对搜索查询获得了在过去一小时内、在过去一天内以及在过去两周内的匹配内容的数目的情况下,可以按照下式将这些搜索查询排序:

然后,可以保留排名最高的一个或多个搜索查询,而排名较低的查询则可以被去除。应当理解,以上公式(1)及其内的参数都是示例性的,根据具体应用需求,在该方式中可以采用任何其它形式的排序公式以及任何其它周期性的数目。

在806处,可以获得关联于已被执行了第一过滤的搜索查询的内容。本公开可以采用各种方式来获得关联于已被执行了第一过滤的搜索查询的内容。例如,可以利用网络抓取器来从网络中抓取内容。

此外,在806处,可以对已被执行了第一过滤的搜索查询执行第二过滤,以便滤除时间敏感的搜索查询。第二过滤可以至少基于关联于已被执行了第一过滤的搜索查询的内容。

在一些情形下,搜索查询可能包括一些并非与事件相关的时间敏感的搜索查询。此处,时间敏感的搜索查询可以指通常在特定的时间点或附近发生的搜索查询。例如,当临近12月25日圣诞节,网络上可能出现大量的关于“圣诞树”的搜索查询。这些搜素查询是时间敏感的,即,发生在12月25日附近,但是可能并不针对事件。因此,从已被执行了第一过滤的搜索查询中滤除时间敏感的搜索查询可能是有利的。

本公开可以采用各种方式来执行第二过滤。在一些实施方式中,第二过滤可以基于内容以及搜索查询的统计数据。例如,对于某一搜索查询,可以利用在过去一小时、过去一天以及过去一周内的搜索查询的数目来定义特征向量X。可以利用在过去一小时、过去一天以及过去一周内的匹配文档或匹配文档标题的数目来定义特征向量Y。可以利用在过去一小时、过去一天以及过去一周内的匹配推文标签(hashtag)的数目来定义特征向量Z。然后,可以定义激活函数F(X,Y,Z)=1或0,其中,F=1指示搜索查询可以触发事件,即,与事件相关,而F=0指示搜索查询不可以触发事件,即,与非事件相关。激活函数F可以是经验性决定的或者通过机器学习而获得的。相关的代价函数可以是,例如,在一个时间窗口内对搜索结果的总点击数目的倒数。应当理解,可以将任何其它特征向量提供给激活函数F,例如,在不同时段内的推文转发数目、在不同时段内对匹配文档的点击数目等。

在808处,可以基于已被执行了第二过滤的搜索查询来识别一个或多个事件。

本公开可以采用各种方式来基于已被执行了第二过滤的搜索查询确定一个或多个事件。

在一种实施方式中,可以将一个搜索查询用于识别一个事件。即,一个事件具有一个对应的搜索查询。

在另一种实施方式中,可以将两个或更多个搜索查询用于识别一个事件。即,一个事件具有两个或更多个对应的搜索查询。在这种情况下,可能需要将搜索查询分类成不同的组,每个组包含两个或更多个搜索查询并且对应于一个事件。在一些情形下,可以将关联于搜索查询的诸如文档和/或社交网络消息的内容用于执行分类。例如,可以分别针对关联于每个搜索查询的内容来生成语义向量,然后可以对语义向量执行语义分析。语义分析可以将语义向量分成一个或多个语义向量集合,每一个集合包括彼此相关的语义向量。可以将对应于同一语义向量集合中的语义向量的内容以及关联于这些内容的搜索查询分类到一个组,并且用于识别一个事件。

应当理解,804处的第一过滤和806处的第二过滤是可选的,根据具体应用需求,可以从处理800中省略第一过滤和第二过滤中的任意一个或两者。例如,如果省略了804处的第一过滤,则在806处,可以获得关联于802处获得的搜索查询的内容,并且对802处获得的搜索查询执行第二过滤。如果省略了806处的第二过滤,则在808处,可以基于已执行了804处的第一过滤的搜索查询来识别一个或多个事件。如果省略了804处的第一过滤和806处的第二过滤两者,则在808处,可以基于802处获得的搜索查询来识别一个或多个事件。

下面,将会讨论对事件集合中的事件的特征的确定。如上所述,确定事件的特征可以包括确定特征的一个或多个子内容,并且确定特征的子内容可以包括确定子内容中的关键字以及一个或多个提取信息。

事件的特征可以是与事件相关的话题。话题特征可以包括关联于话题特征的一个或多个子内容。关联于话题特征的每个子内容可以包括关键字以及一个或多个提取信息。

关联于话题特征的一个或多个子内容的关键字可以是与事件相关的一个或多个话题。本公开可以采用各种方式来生成与事件相关的话题。图9是根据本公开实施例的用于生成话题的示例性处理900的流程图。处理900可以基于语义向量聚类方式来生成话题。

在902处,可以分别针对关联于事件的推荐内容来生成语义向量。此处,语义向量可以指内容的语义含义的向量表示。可以采用用于生成语义向量的各种方式。例如,在一种实施方式中,可以将卷积深度结构化语义模型(CDSSM)深度学习技术用于生成关联于事件的推荐内容的语义向量。

在904处,可以将语义向量聚类成多个语义向量聚类。例如,可以将近邻传播聚类技术用于对语义向量进行聚类。可选地,也可以利用任何其它技术,例如K-Means聚类、K-最近邻(KNN)聚类等,来对语义向量进行聚类。由于每个推荐的内容可以对应于一个语义向量,通过如上所述对语义向量进行聚类,关联于事件的推荐内容也可以被相应地进行聚类。

在906处,可以基于多个语义向量聚类来生成与事件相关的话题。一些语义向量聚类可能彼此语义相关,并且同时不与其它语义向量聚类语义相关。在一些实施方式中,可以将彼此语义相关的那些语义向量聚类用于生成一个对应的话题。通过这种方式,可以为事件生成一个或多个话题。

通过图9中的处理900,可以生成与事件相关的一个或多个话题,并且可以将一个或多个话题分别用作关联于话题特征的一个或多个子内容的关键字。此外,通过处理900,用于生成子内容的关键字的那些推荐内容也可以与该子内容相关。

可以从用于生成关联于话题特征的子内容中被包括作为关键字的话题的那些推荐内容里,分别获得该子内容的提取信息。提取信息可以是,例如,对应的推荐内容的标题、对应的推荐内容的片段、对应的推荐内容的标签、对应的推荐内容的摘要、整个对应的推荐内容等。此外,在一些实施方式中,可以利用例如点击数目、发布日期等预定标准来对关联于子内容的推荐内容进行排序。从而,可以以对应的排列次序来向用户呈现提取信息。

事件的特征可以是事件的关键时刻。关键时刻特征可以包括关联于关键时刻特征的一个或多个子内容。关联于关键时刻特征的每个子内容可以包括关键字以及一个或多个提取信息。

关联于关键时刻特征的子内容的关键字可以是事件进程中的关键时刻。本公开可以采用各种方式来确定事件的关键时刻。在一种实施方式中,可以基于关联于事件的推荐内容的统计数据来执行用于平滑和趋势检测的局部回归。统计数据可以是推荐内容的任何类型的数量信息,例如,点击数目、文档数量等。通过局部回归,可以获得针对事件的进程曲线模型。此外,局部回归也可以确保模型是连续的。然后,可以基于局部回归的结果来执行局部优化检测。可以利用局部优化检测来获得局部优化点,其中,局部优化点可以是,例如,在进程曲线模型中不具有一阶导数的点。可以将局部优化点标识为事件的关键时刻。可以将关键时刻分别用作关联于关键时刻特征的一个或多个子内容的关键字。

可以从用于生成关联于关键时刻特征的子内容中被包括作为关键字的关键时刻的那些推荐内容里,分别获得该子内容的提取信息。提取信息可以是,例如,对应的推荐内容的标题、片段、标签、摘要、或整个对应的推荐内容等。此外,在一些实施方式中,可以利用例如时间接近度、点击数目等预定标准来对关联于子内容的推荐内容进行排序。从而,可以以对应的排列次序来向用户呈现提取信息。

可以以时间线的形式来呈现关联于关键时刻特征的一个或多个子内容,其中,时间线中的每个节点可以指示子内容中包括的关键时刻,并且关键时刻可以与子内容中的提取信息一起呈现。

事件的特征可以是关联于事件的位置、事件中涉及的人物以及与事件相关的主题中的任意一个。位置特征可以包括关联于位置特征的一个或多个子内容,关联于位置特征的每个子内容的关键字可以是关联于事件的位置。人物特征可以包括关联于人物特征的一个或多个子内容,关联于人物特征的每个子内容的关键字可以是关联于事件的人物。主题特征可以包括关联于主题特征的一个或多个子内容,关联于主题特征的每个子内容的关键字可以是关联于事件的主题。

可以从关联于事件的推荐内容中检测关联于事件的位置、人物和主题。本公开可以采用各种方式来检测位置、人物和主题。在一种实施方式中,可以采用命名实体识别(NER)算法来从推荐内容中识别位置、人物和主题。可选地,可以进一步应用跨内容投票机制。例如,如果“城市A”具有投票分数100,即,从100个文档/推文中识别出“城市A”,而“城市B”具有投票分数5,即,仅从5个文档/推文中识别出“城市B”,则将“城市A”,而不是“城市B”,确定为关联于事件的位置。可以将以上确定的位置、人物和主题分别用作关联于位置特征、人物特征和主题特征的一个或多个子内容的关键字。

可以从用于生成关联于位置特征的子内容中被包括作为关键字的位置的那些推荐内容里,获得该子内容的提取信息。也可以从网络上的任何内容源中获得该提取信息。该提取信息可以是对应的推荐内容中包括的,例如,标记有位置的地图、位置的GPS坐标、位置的描述等。

可以从用于生成关联于人物特征的子内容中被包括作为关键字的人物的那些推荐内容里,获得该子内容的提取信息。也可以从网络上的任何内容源中获得该提取信息。该提取信息可以是对应的推荐内容中包括的,例如,人物的职业、人物的经历、人物的教育背景、人物的照片等。

可以从用于生成关联于主题特征的子内容中被包括作为关键字的主题的那些推荐内容里,获得该子内容的提取信息。也可以从网络上的任何内容源中获得该提取信息。该提取信息可以是,例如,主题的背景、主题的历史记录、主题的原因等。

事件的特征可以是来自主流媒体的关于事件的代表性文档。代表性文档特征可以包括关联于代表性文档特征的一个或多个子内容。关联于代表性文档特征的每个子内容可以包括关键字以及一个或多个提取信息。

关联于代表性文档特征的子内容的关键字可以是主流媒体的名称,例如,CNN、FOX新闻等。

可以从用于生成关联于代表性文档特征的子内容中被包括作为关键字的主流媒体名称的那些推荐内容(例如,文档)里,分别获得该子内容的提取信息。提取信息可以是,例如,对应的推荐内容的标题、片段、摘要或者整个对应的推荐内容。此外,在一些实施方式中,可以利用例如发布时间、点击数目等预定标准来对关联于子内容的推荐内容进行排序。从而,可以以对应的排列次序来向用户呈现提取信息。

事件的特征可以是来自社交网络的关于事件的代表性消息。代表性消息特征可以包括关联于代表性消息特征的一个或多个子内容。关联于代表性消息特征的每个子内容可以包括关键字以及一个或多个提取信息。

关联于代表性消息特征的子内容的关键字可以是社交网络的名称,例如,推特、新浪微博等。

可以从用于生成关联于代表性消息特征的子内容中被包括作为关键字的社交网络名称的那些推荐内容(例如,社交网络消息)里,分别获得该子内容的提取信息。提取信息可以是,例如,对应的推荐内容的片段、摘要或者整个对应的推荐内容。此外,在一些实施方式中,可以利用例如推文转发数目、点击数目、发表时间等预定标准来对关联于子内容的推荐内容进行排序。从而,可以以对应的排列次序来向用户呈现提取信息。

事件的特征可以是关于事件的多媒体信息。多媒体信息特征可以包括关联于多媒体信息特征的一个或多个子内容。关联于多媒体信息特征的每个子内容可以包括关键字以及一个或多个提取信息。

关联于多媒体信息特征的子内容的关键字可以是多媒体类型,例如,图像、视频、音频等。

可以从用于生成关联于多媒体信息特征的子内容中被包括作为关键字的多媒体类型的那些推荐内容里,分别获得该子内容的提取信息。提取信息可以是对应于该多媒体类型的图像、视频、音频等。此外,在一些实施方式中,可以利用例如点击数目、发布时间等预定标准来对关联于子内容的推荐内容进行排序。从而,可以以对应的排列次序来向用户呈现提取信息。

以上关于确定事件特征的讨论是示例性的,本公开并不局限于该讨论中的任何细节。事件集合中可以包括以上所述的在确定特征期间所获得的任何或全部信息。可以以任何形式来在事件集合中设置事件特征,也可以以以任何形式来维护或存储事件集合。此外,随着事件的发展,可以针对事件持续地获得进一步信息,从而也可以动态地更新事件集合。

图10示出根据本公开实施例的用于提供推荐内容的示例性装置1000。在一种实施方式中,装置1000可以配置用于执行根据本公开实施例的方法的操作。

装置1000可以包括查询接收模块1002、事件选择模块1004以及内容提供模块1006。查询接收模块1002可以配置用于接收搜索查询。事件选择模块1004可以配置用于基于所述搜索查询,从预先确定的事件集合中选择事件。内容提供模块1006可以配置用于以结构化模板来提供所述推荐内容,所述结构化模板包括一个或多个单元,每个单元关联于所述事件的一个特征,所述事件的每个特征对应于一个搜索意图,每个单元包括一个或多个子内容,并且每个子内容与对应的推荐内容相关。此外,装置1000也可以包括配置用于执行根据如上所述本公开实施例的用于提供推荐内容的方法的任何操作的任何其它模块。

图11示出根据本公开实施例的用于提供推荐内容的示例性装置1100。在一种实施方式中,装置1100可以配置用于执行根据本公开实施例的方法的操作。

装置1100可以包括事件识别模块1102、特征确定模块1104以及内容相关模块1106。事件识别模块1102可以配置用于基于在一个时段内激增的多个搜索查询来识别事件。特征确定模块1104可以配置用于确定所述事件的一个或多个特征,所述事件的每个特征对应于一个搜索意图,所述推荐内容是以结构化模板来提供的,所述结构化模板包括一个或多个单元,每个单元关联于所述事件的一个特征,并且每个单元包括一个或多个子内容。内容相关模块1106可以配置用于使得所述子内容中的每一个与对应的推荐内容相关。此外,装置1100也可以包括配置用于执行根据如上所述本公开实施例的用于提供推荐内容的方法的任何操作的任何其它模块。

图12示出根据本公开实施例的用于提供推荐内容的示例性系统1200。

系统1200可以包括一个或多个处理器1202。系统1200还可以包括存储器1204,其与所述一个或多个处理器1202连接。存储器1204可以存储计算机可执行指令,当所述计算机可执行指令被运行时,使得所述一个或多个处理器1202执行根据如上所述本公开实施例的用于提供结构化内容呈现的方法的任何操作。

本公开的实施例可以实施在非暂时性计算机可读介质中。该非暂时性计算机可读介质可以包括指令,当所述指令被运行时,使得一个或多个处理器执行根据如上所述本公开实施例的用于提供推荐内容的方法的任何操作。

应当理解,以上描述的方法中的所有操作都仅仅是示例性的,本公开并不限制于方法中的任何操作或这些操作的顺序,而是应当涵盖在相同或相似构思下的所有其它等同变换。

还应当理解,以上描述的装置中的所有模块都可以通过各种方式来实施。这些模块可以被实施为硬件、软件、或其组合。此外,这些模块中的任何模块可以在功能上被进一步划分成子模块或与其它模块组合。

已经结合各种装置和方法描述了处理器。这些处理器可以使用电子硬件、计算机软件或其任意组合来实施。这些处理器是实施为硬件还是软件将取决于具体的应用以及施加在系统上的总体设计约束。作为示例,本公开中给出的处理器、处理器的任意部分、或者处理器的任意组合可以实施为微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、状态机、门逻辑、分立硬件电路、以及配置用于执行在本公开中描述的各种功能的其它适合的处理部件。本公开给出的处理器、处理器的任意部分、或者处理器的任意组合的功能可以实施为由微处理器、微控制器、DSP或其它适合的平台所执行的软件。

软件应当被广泛地视为表示指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、运行线程、过程、函数等。软件可以驻留在计算机可读介质中。计算机可读介质可以包括例如存储器,存储器可以例如为磁性存储设备(如,硬盘、软盘、磁条)、光盘、智能卡、闪存设备、随机存取存储器(RAM)、只读存储器(ROM)、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、寄存器或者可移动盘。尽管在本公开给出的多个方面中将存储器示出为是与处理器分离的,但是存储器可以位于处理器内部(如,缓存或寄存器)。

以上描述被提供用于使得本领域技术人员可以实施本文所描述的各个方面。这些方面的各种修改对于本领域技术人员是显而易见的,本文限定的一般性原理可以应用于其它方面。因此,权利要求并非旨在被局限于本文示出的方面。关于本领域技术人员已知或即将获知的、对本公开所描述各个方面的元素的所有结构和功能上的等同变换,都将通过引用而明确地包含到本文中,并且旨在由权利要求所覆盖。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1