一种文章推荐方法及装置与流程

文档序号:16533446发布日期:2019-01-05 10:58阅读:144来源:国知局
一种文章推荐方法及装置与流程

本发明涉及文章推荐领域,具体而言,涉及一种文章推荐方法及装置。



背景技术:

随着信息化技术的飞速发展,网络上铺天盖地的信息,用户需要花费大量的时间从中筛选自己感兴趣的文章。目前,存在有一些文章的推荐方法,主要是通过对文章文本的属性进行分析,确定文章的特征标签,以及获取用户的基础信息以及用户点击、搜索的文章,计算用户的画像信息,然后根据文章的特征标签以及用户的画像信息的相关性,向用户推荐相关性强的内容。该种推荐方式经过文章分析、用户画像的计算处理,向用户推荐的文章可能不是用户想要阅读的文章,推荐精准度不够高。



技术实现要素:

本发明的目的在于提供一种文章推荐方法及装置,能够基于文章之间的关联关系,向用户推荐文章,能够提高文章推荐的精准度。

本发明第一方面提供一种文章推荐方法,包括:

确定目标文章以及与所述目标文章有关联的关联文章,所述关联文章包括:针对所述目标文章的辟谣文章,和/或,所述目标文章的进展文章,所述进展文章为关于所述目标文章所关注事件的进展的文章;

确定点击过所述目标文章的第一用户;

向所述第一用户推荐所述关联文章。

可选地,在确定目标文章以及与所述目标文章有关联的关联文章之前,所述方法还包括:

建立目标文章召回词库;

将跟帖命中所述目标文章召回词库的文章召回进目标文章池。

可选地,若所述关联文章为所述辟谣文章,在确定目标文章以及与所述目标文章有关联的关联文章之前,所述方法还包括:

建立辟谣文章召回词库及召回来源,所述辟谣文章召回词库的关键词包括辟谣、造谣、假新闻、流言,所述召回来源包括多个官方辟谣平台;

将命中所述辟谣文章召回词库及召回来源的文章召回进辟谣文章池。

可选地,在确定目标文章以及与所述目标文章有关联的关联文章之前,所述方法还包括:

通过文本相似识别技术在所述目标文章池中识别相似的多个目标文章;

在所述辟谣文章池中识别与所述多个目标文章对应的辟谣文章;

建立所述多个目标文章与所述辟谣文章的关联关系。

可选地,在确定目标文章以及与所述目标文章有关联的关联文章之前,所述方法还包括:

在所述辟谣文章池中确定辟谣文章;

通过文本相似识别技术在所述目标文章池中识别与所述辟谣文章相似的多个目标文章;

建立所述多个目标文章与所述辟谣文章的关联关系。

可选地,若所述关联文章为所述进展文章,所述目标文章召回词库包括热点事件词库,和/或用户定制的关注词库,在确定目标文章以及与所述目标文章有关联的关联文章之前,所述方法还包括:

通过文本相似识别技术在所述目标文章池中识别相似的多个目标文章;

为所述多个目标文章标记上相同的事件标记;

根据所述多个目标文章的上传时间,为所述多个目标文章标记上事件进展的先后顺序,建立多个目标文章之间的关联关系,其中,标记同一事件标记的多个文章中,上传时间在后的文章为上传时间在前的文章的进展文章。

可选地,在向所述第一用户推荐所述关联文章之前,所述方法还包括:

统计所述第一用户的兴趣标签;

确定兴趣标签与所述第一用户重合率大于等于阈值的第二用户,向所述第二用户推荐所述进展文章。

可选地,在向所述第一用户推荐所述关联文章之前,所述方法还包括:

统计所述第一用户的兴趣标签,以及所述第一用户对所述兴趣标签的点击率;

对所述兴趣标签的点击率按由大到小的顺序排列,取点击率排列在前的n个兴趣标签确定为目标兴趣标签,其中,n为整数且为正数;

确定兴趣标签中包括有所述目标兴趣标签中的一个或多个的第二用户,向所述第二用户推荐所述进展文章。

可选地,所述向所述第一用户推荐所述关联文章,具体为:

通过推送渠道在所述第一用户的通知栏或信息流展示所述关联文章。

本发明第二方面提供一种文章推荐装置,包括:

文章确定模块,用于确定目标文章以及与所述目标文章有关联的关联文章,所述关联文章包括:针对所述目标文章的辟谣文章,和/或,所述目标文章的进展文章,所述进展文章为关于所述目标文章所关注事件的进展的文章;

用户确定模块,用于确定点击过所述目标文章的第一用户;

推送模块,用于向所述第一用户推荐所述关联文章。

相对现有技术,本发明提供的文章推荐方法是基于文章之间的关联关系,通过某一目标文章,识别到与之关联的关联文章,且通过目标文章对用户进行了筛选,将推送关联文章的用户确定为点击过目标文章的用户,相比向所有用户推送,提高了用户的精准度,且由于推荐的关联文章与用户之前点击过的目标文章之间具有关联关系,使得推荐的文章也更加精准。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明所提供的文章推荐方法的流程图;

图2示出了本发明所提供的文章推荐方法的另一流程图;

图3示出了本发明所提供的文章推荐方法的另一流程图;

图4示出了本发明所提供的文章推荐方法的另一流程图;

图5示出了本发明所提供的文章推荐方法的另一流程图;

图6示出了本发明所提供的文章推荐方法的另一流程图;

图7示出了本发明所提供的文章推荐方法的另一流程图;

图8示出了本发明所提供的文章推荐方法的另一流程图;

图9示出了本发明所提供的文章推荐装置的示意图。

图标:

文章确定模块-200;用户确定模块-300;推送模块-400。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

第一实施例

随着互联网的发展,网络时代的信息出现爆炸式增长,用户想要阅读自己感兴趣的文章需要越来越长的时间,因此需要一种向用户直接推送其想要阅读的文章推荐方法,本申请的实施例则提供了一种文章推荐方法,参阅图1,包括有以下步骤:

s1:确定目标文章以及与所述目标文章有关联的关联文章。

在该步骤中,目标文章与关联文章相互之间预先建立有关联关系,即在确定某一个文章后,将该文章作为目标文章,同时根据该文章的关联关系可以获取到目标文章的关联文章,需要说明的是,此处关联文章包括针对所述目标文章的辟谣文章,和/或,所述目标文章的进展文章,进展文章理解为关于目标文章所关注事件的进展的文章。

由于网络上的文章信息众多,包括有一些官方新闻媒体发布的文章,以及一些个人或组织发布的文章,获取目标文章以及关联文章的来源不做任何限制,可以为任意网站的文章。

s2:确定点击过所述目标文章的第一用户。

将目标文章作为用户召回途径,在确定某个文章作为目标文章后,根据用户点击文章的实时日志,找到点击过目标文章的第一用户,这些用户点击过目标文章,因此可能想要阅读与目标文章关联的文章,将这些用户确定为向其推送关联文章的目标用户。

s3:向所述第一用户推荐所述关联文章;其中,推荐的方式包括但不限于在第一用户的通知栏或信息流展示所述关联文章。

上述方案是基于文章之间的关联关系,通过确定某一目标文章,识别文章的关联关系,获得了与该文章有关联的关联文章,且通过目标文章对用户进行了筛选,向点击过该目标文章的用户推送关联文章,相比向所有用户推送文章,本方案提高了识别用户的精准度,使得点击过目标文章的用户能够及时阅读与目标文章关联的文章,同时,采用目标文章直接召回用户的方式,确保目标文章到关联文章的信息传递不被中间处理环节丢弃,保证了关联关系传递的稳定性。

在前述中提到,步骤s1中的关联文章可以为针对所述目标文章的辟谣文章,也可以为,对目标文章所关注事件的进展文章,因此针对这两种情况,本实施例中的方案可以包括但不限于以下两种应用场景:

场景一:目标文章为谣言文章,关联文章为目标文章的辟谣文章,谣言文章与辟谣文章之间具有关联关系,确定点击过谣言文章的用户,向这些用户推送与谣言文章对应的辟谣文章。

场景二:目标文章为某一事件的文章,关联文章为该事件的进展文章,例如,目标文章中的事件进展为该事件的第n个进展,关联文章的事件进展为该事件的第n+1个进展,确定点击过事件第n个进展的文章的用户,向这些用户推送下一个事件进展的文章,即第n+1个进展的文章。

可选地,参阅图2,在步骤s1之前,所述文章推荐方法还包括:

s10:建立目标文章召回词库。

s11:将跟帖命中所述目标文章召回词库的文章召回进目标文章池。

在本方案应用在场景一时,目标文章召回词库包括谣言词库,即一些现有平台中出现频率较高的谣言词汇,同时,为了提高目标文章的准确率,建立目标文章召回词库时,可以仅保留谣言出现频率较高的文章类别,例如:健康、娱乐、社会、科学以及科技等大类;

在本方案应用在场景二时,目标文章召回词库包括当前热点事件词库,和/或,用户定制的关注词库,例如,在检测到同一时间内多个用户同时搜索的词汇,则该词库可能是当前热点事件的词汇,将其加入到热点事件词库,再例如,用户事先定制的关注词汇,后续想要继续阅读相关的文章,则将其加入到关注词库中;

当然,目标文章召回词库还可以为上述两种情况的结合,即同时建立有多个词库,包括有谣言词库、热点事件词库以及用户定制的关注词库中的一个或多个。

接下来针对上述方案的两种应用场景的具体实施方式做详细介绍。

可选地,对于场景一,在关联文章为目标文章的辟谣文章时,参阅图3,在步骤s1之前,所述方法还包括:

s120:建立辟谣文章召回词库及召回来源。

上述辟谣文章召回词库的关键词包括辟谣、造谣、假新闻、流言等辟谣关键词,召回来源可以为权威性较高的官方辟谣平台、社交平台的辟谣平台以及一些公信力较高的辟谣网站。

s121:将命中所述辟谣文章召回词库及召回来源的文章召回进辟谣文章池。

可选地,在构建好目标文章池以及辟谣文章池后,针对一个谣言,可能存在有多个谣言文章,也可能存在有多个辟谣文章,因此在步骤s1之前,需要预先建立好谣言文章与辟谣文章的关联关系,可以包括但不限于以下两种实施方式:

方式一:参阅图4,包括以下步骤:

s122:通过文本相似识别技术在所述目标文章池中识别相似的多个目标文章。

s123:在所述辟谣文章池中识别与所述多个目标文章对应的辟谣文章。

需要说明的是,在辟谣文章池中,针对某一谣言可能存在有多个辟谣文章,因此,该步骤中,可以通过机器学习的方式确定某一个最权威、最全面的文章作为该谣言对应的辟谣文章,也可以通过人工手动添加的方式选择某一辟谣文章作为该谣言对应的辟谣文章。

s126:建立所述多个目标文章与所述辟谣文章的关联关系。

方式二:参阅图5,包括以下步骤:

s124:在所述辟谣文章池中确定辟谣文章。

s125:通过文本相似识别技术在所述目标文章池中识别与所述辟谣文章相似的多个目标文章。

s126:建立所述多个目标文章与所述辟谣文章的关联关系。

上述两种方式均可以建立多个目标文章与辟谣文章的关联关系,其中,通过文本相似性计算,对文本对比识别相似度,例如关键词、分词、文章长度,召回相似度高的文章,扩大文章召回;在建立了多个目标文章与辟谣文章的关联关系后,所述方法确定多个目标文章中的某一个谣言文章作为目标文章,会根据关联关系识别对应的辟谣文章,从而向点击过谣言文章的用户推送相应的辟谣文章。

在通过谣言文章向用户推送辟谣文章的应用场景下,实现对于点击过谣言的用户的精准识别,再向这些用户推送相应的辟谣内容,使用户能够及时了解到这些谣言的辟谣信息。

可选地,对于场景二,在关联文章为目标文章的进展文章时,在建立好目标文章池后,参阅图6,在步骤s1之前,所述方法还包括:

s130:在目标文章池中识别相似的多个目标文章。

通过文本相似识别技术识别出相似的多个文章,这些文章之间具有相似的文本、语句等,因此可以认为这些相似的多个文章为同一事件的一系列进展文章。

s131:为所述多个目标文章标记上相同的事件标记。

识别到同一事件的一系列进展文章后,为这些文章打上事件标记,具有同一事件标记的所有文章,可以认为相互之间是具有关联关系的。

s132:建立多个目标文章之间的关联关系。

根据识别到的多个目标文章的上传时间,为所述多个目标文章标记上事件进展的先后顺序,建立多个目标文章之间的关联关系。需要说明的是,此时,进展文章不是某一确定的文章,随着事件进展的变化,进展文章也在逐步变化,在标记有同一事件标记的多个文章中,上传时间在后的文章为上传时间在前的文章的进展文章。

例如,某一事件的一系列进展有进展1、进展2……进展n-1以及进展n,针对当前事件的进展n,表示为进展n的文章确定为进展文章,进展n之前的文章作为目标文章。

可选地,步骤s132之后,已经建立多个目标文章间的关联关系,本实施例还提供一种方案,在确定点击过目标文章的第一用户后,在步骤s3之前,可以通过分析第一用户的兴趣标签,找到具有相同或相似兴趣的用户,扩大推送的用户范围,上述分析第一用户的兴趣标签,扩大用户范围的方案可以包括但不限于以下两种实施方式:

方式一:参阅图7,包括以下步骤:

s133:统计所述第一用户的兴趣标签。

s134:确定兴趣标签与所述第一用户重合率大于等于阈值的第二用户,向所述第二用户推荐所述进展文章。

该种方式能够找到与第一用户兴趣标签重合率高的第二用户,这些第二用户与第一用户的兴趣爱好在一定程度上十分相似,从而也向第二用户推送关联文章,因此,通过识别兴趣标签的重合率,可以将推送文章的用户扩大。

方式二:参阅图8,包括以下步骤:

s135:统计所述第一用户的兴趣标签,以及所述第一用户对所述兴趣标签的点击率;

s136:对所述兴趣标签的点击率按由大到小的顺序排列,取点击率排列在前的n个兴趣标签确定为目标兴趣标签,其中,n为整数且为正数;

s137:确定兴趣标签中包括有所述目标兴趣标签中的一个或多个的第二用户,向所述第二用户推荐所述进展文章。

该种方式通过获得第一用户的兴趣标签中的高频兴趣标签,找到具有这些高频兴趣标签的第二用户,也能达到扩大推送的用户范围的目的。

需要说明的是,在步骤s1中向第一用户推送关联文章,在步骤s134以及s137中向与第一用户具有相似兴趣爱好的第二用户推送关联文章,在第二用户中,存在有与第一用户重叠的用户,因此在向这些重叠用户推送关联文章时,这些重叠用户仅向其推荐一次关联文章,不做重复推送。

在向用户推送事件的进展文章的应用场景下,相比事件进展频繁向所有用户推荐,通过对用户的识别,提高了推荐的精准度,使得用户能够及时了解到自己所关注词汇的文章,以及对于热点事件的进展及时掌握,同时,通过对这些用户的兴趣标签进行分析,找到与这些用户具有相同兴趣爱好的另外的用户,也向另外的用户推送关联文章,扩大了推送的用户范围。

第二实施例

本实施例提供了一种文章推荐装置,该文章推荐装置用于执行上述第一实施例中的方法,参阅图9,包括:

文章确定模块200,用于确定目标文章以及与所述目标文章有关联的关联文章,所述关联文章包括:针对所述目标文章的辟谣文章,和/或,所述目标文章的进展文章,所述进展文章为关于所述目标文章所关注事件的进展的文章;

用户确定模块300,用于确定点击过所述目标文章的第一用户;

推送模块400,用于向所述第一用户推荐所述关联文章。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,笔记本电脑,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1