一种图文信息推荐方法、装置及系统与流程

文档序号:14990615发布日期:2018-07-20 22:08阅读:145来源:国知局

本发明涉及通讯技术领域,具体涉及一种图文信息推荐方法、装置及系统。



背景技术:

随着互联网技术的发展,网络逐渐成为人们获取信息的来源。因此,目前市场上阅读类应用备受用户欢迎。阅读类应用会从网络侧获取文章信息,并实向用户展示获取的文章信息。

具体地,阅读类应用的服务器会根据用户订阅的公众号以及用户兴趣,向相应的文章推送给相应的终端,该终端通过阅读类应用展示该文章,以便用户阅读。

目前的文章大部分均是图文形式,其包括图片以及图片对应的文字。因此,一般服务器推送的文章信息基本上图文信息。然而,在海量图文信息中有些图文信息包含了许多的图片,这些图文信息的数据量比较大,服务器在向终端发送这些图文信息时信息的发送速度会比较慢,降低了图文信息展示的及时性,同时大量的图片也会给用户造成不好的阅读体验。



技术实现要素:

本发明实施例提供一种图文信息推荐方法、装置及系统,可以提高图文信息的发送速度以及图文信息展示的及时性。

本发明实施例提供一种图文信息推荐方法,包括:

接收终端发送的图文信息获取请求,所述图文信息获取请求携带图文信息标识;

根据所述图文信息获取请求,向所述终端发送所述图文信息标识对应的目标图文信息;

确定所述目标图文信息是否为连载图文信息;

若是,则从候选图文信息集合中获取所述连载图文信息的后续连载图文信息;

向所述终端发送所述后续连载图文信息的封面信息,以推荐所述后续连载图文信息。

相应的,本发明实施例还提供一种图文信息推荐装置,包括:

接收单元,用于接收终端发送的图文信息获取请求,所述图文信息获取请求携带图文信息标识;

图文信息发送单元,用于根据所述图文信息获取请求,向所述终端发送所述图文信息标识对应的目标图文信息;

确定单元,用于确定所述目标图文信息是否为连载图文信息;

连载获取单元,用于所述确定单元确定所述目标图文信息为连载图文信息时,从候选图文信息集合中获取所述连载图文信息的后续连载图文信息;

封面信息发送单元,用于向所述终端发送所述后续连载图文信息的封面信息,以推荐所述后续连载图文信息。

相应的,本发明实施例还提供一种图文信息推荐系统,包括本发明实施例提供的任一图文信息推荐装置。

本发明实施例接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识,然后,根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息,确定该目标图文信息是否为连载图文信息,若是,则从候选图文信息集合中获取该连载图文信息的后续连载图文信息,向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。该方案可以识别连载图文信息,并将连载图文信息的后续连载图文信息推荐出来;采用该方案可以实现将包含大量图片的图文信息拆分成若干个连载图文信息,在向终端发送某个连载图文信息之后将该连载图文信息的后续连载图文信息推荐出来,方便用户阅读完整的原始图文信息;因此,该方案可以提升图文信息的发送速度以及图文信息的展示速度,进而提高图文信息展示的及时性以及用户的阅读体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的图文信息推荐系统的场景示意图;

图1b是本发明实施例提供的图文信息推荐方法的流程示意图;

图2a是本发明实施例提供的图文信息推荐方法的另一流程示意图;

图2b是本发明实施例提供的图文信息展示界面的示意图;

图2c是本发明实施例提供的图文信息展示界面的另一种示意图;

图2d是本发明实施例提供的推荐图文信息展示示意图;

图3a是本发明实施例提供的图文信息推荐装置的第一种结构示意图;

图3b是本发明实施例提供的图文信息推荐装置的第二种结构示意图;

图3c是本发明实施例提供的图文信息推荐装置的第三种结构示意图;

图3d是本发明实施例提供的图文信息推荐装置的第四种结构示意图;

图4是本发明实施例提供的服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种图文信息推荐方法、装置及系统。

本发明实施例提供了一种图文信息推荐系统,参见图1a,该系统包括本发明实施例所提供的任一种图文信息推荐装置,该图文信息推荐装置可以集成在服务器等网络设备中。此外,图文信息推荐系统还可以包括其他的设备,比如用户设备(如终端)等。

其中,用户设备用于向服务发送图文信息获取请求,所述图文信息获取请求携带图文信息标识;以及展示服务器返回的目标图文信息以及封面信息,等等。

服务器用于根据所述图文信息获取请求向所述终端发送所述图文信息标识对应的目标图文信息,确定所述目标图文信息是否为连载图文信息;若是,则从候选图文信息集合中获取所述连载图文信息的后续连载图文信息;向所述用户设备发送所述后续连载图文信息的封面信息,以推荐所述后续连载图文信息。

以下将分别进行详细说明。

实施例一、

本实施例将从图文信息推荐装置的角度进行描述,该图文信息推荐装置具体可以集成在服务器等设备中。

一种图文信息推荐方法,包括:接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识,然后,根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息,确定该目标图文信息是否为连载图文信息,若是,则从候选图文信息集合中获取该连载图文信息的后续连载图文信息,向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。

如图1b所示,该图文信息推荐方法的具体流程可以如下:

101、接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识。

其中,图文信息标识为图文信息的唯一标识,该图文信息标识可以由字符构成。比如,该图文信息标识可以为图文信息的url(uniformresourcelocator,统一资源定位符)等。

本实施例中,图文信息包含图片信息以及文字信息;比如,图文信息可以为图集,该图集可以为一种用户阅读的内容形式,该图集可以包括图片以及图片的文字说明。

实际应用中,终端可以通过应用程序向服务器发送图文信息获取请求,此时,服务器对该请求进行接收。

102、根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息。

具体地,在接收到图文信息获取请求之后,可以根据图文信息标识从数据源(如本地数据库、或者其他网络设备)获取该图文信息标识对应的目标图文信息,然后,发送给终端,终端在接收到目标图文信息后会展示该目标图文信息,这样用户便可以浏览该目标图文信息。

103、确定该目标图文信息是否为连载图文信息,若是,则执行步骤104,如否,则执行步骤106。

比如,可以在向终端发送目标图文信息的过程中,确定该目标图文信息是否为连载图文信息。

其中,连载图文信息为连载形式的图文信息,指的是:某个图文信息拆分成多个子图文信息分多次发布时的子图文信息。比如,当某个图文信息的标题为“xxxxx(上)”、“xxxxx(下)”、“xxxxx(上集)”、“xxxxx(下集)”、“xxxxx(第一集)”、或者“xxxxx(第二集)”时,该图文信息即为连载图文信息。

可选地,由于连载图文信息一般可以从标题中看出来,因此,本实施例可以通过图文信息的标题来确定是否为连载图文信息。具体地,步骤“确定该目标图文信息是否为连载图文信息”可以包括:

获取该目标图文信息的标题分词结果集合;

判断该标题分词结果集合中是否存在与预设连载关键词匹配的词;

若是,则确定该目标图文信息为连载图文信息。

其中,标题分词结果集合为对图文信息的标题进行分词处理后得到的分词集合。本实施例中,在接收到图文信息获取请求之前,预先对图文信息的标题进行分词处理,然后保存到相应的数据库中。此时,可以根据图文信息标识来获取目标图文信息的标题分词结果集合;即步骤“获取该目标图文信息的标题分词结果集合”可以包括:根据图文信息标识从相应数据库中提取目标图文信息的标题分词结果集合。

在一些其他实施方式中,还可以在接收到图文信息获取请求之后,对图文信息的标题进行分词处理,以得到分词结果集合;此时,步骤“获取该目标图文信息的标题分词结果集合”可以包括:对图文信息的标题进行分词处理,以得到分词结果集合。

优选地,本实施例可以采用如jieba(结巴)等分词方式对标题进行分词。

其中,预设连载关键词可以为在接收到图文信息获取请求之前预先配置的连载关键词,该连载关键词可以为一般性采用的连载词,如“上”、“下”、“上集”、“下集”、“第一集”“、”“第二集”等等,具体地可以根据实际需求设定。

本实施例中,当图文信息的标题分词结果集合中存在与预设连载关键词匹配的词时,则认为该图文信息为连载图文信息,否则认为该图文信息为非连载图文信息。

例如,图文信息的标题为“颜值爆表的她们(上)”时,在对标题分词后,可以得到标题分词结果集合{“颜值”、“爆表”、“她们”、“上”};假设连载关键词为“上”、“下”时,此时,该标题分词结果集合中存在与连载关键词匹配的词即“上”,那么便会认为该图文信息为连载图文信息。

104、从候选图文信息集合中获取该连载图文信息的后续连载图文信息。

其中,连载图文信息的后续连载图文信息为与连载图文信息属于同一个图文信息,且与连载图文信息具有顺序关系的图文信息。该顺序关系包括前后、上下、左右等等顺序关系。例如,当存在标题为“xxxxx(上)”的图文信息a、标题为“xxxxx(下)”的图文信息b时,图文信息b即为图像信息a的后续连载图文信息。

又比如,当存在标题为“xxxxx(第一集)”的图文信息c、标题为“xxxxx(第二集)”的图文信息d时,图文信息d即为图像信息c的后续连载图文信息。

优选地,考虑到连载图文信息与其后续连续图文信息的作者具有关联性,如可能为同一个作者,因此,本实施例可以通过图文信息的作者信息来初步筛选,然后,从筛选结果中进一步选取得到连载图文信息的后续连载图文信息。具体地,步骤“从候选图文信息集合中获取该连载图文信息的后续连载图文信息”可以包括:

获取该候选图文信息集合中候选图文信息的作者信息、以及该连载图文信息的作者信息;

根据该候选图文信息的作者信息以及该连载图文信息的作者信息,从该候选图文信息集合选取相应的候选图文信息,得到作者相关候选图文信息集合;

从该作者相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

比如,根据该候选图文信息的作者信息以及该连载图文信息的作者信息,从该候选图文信息集合选取与连载图文信息同一作者的候选图文信息;或者,从该候选图文信息集合选取作者与连载图文信息作者具有关联关系(如同一家媒体的作者、同一部门的作者等等)的候选图文信息。

考虑到后续连载图文信息的标题一般会带有连载关键词,且后续连载图文信息与连载图文信息所属的图文信息类型相关,本实施例可以基于连载关键词和图文信息类型来选取候选连载图文信息,即步骤“从该作者相关候选图文信息集合中选取该连载图文信息的后续连载图文信息”可以包括:

将该作者相关候选图文信息集合中标题不包含预设连载关键词的候选图文信息去除,得到去除后候选图文信息集合;

根据去除后候选图文信息集合中候选图文信息的图文信息类型、以及该连载图文信息的图文信息类型,从去除后候选图文信息集合中选取相应的候选图文信息,得到类型相关候选图文信息集合;

从该类型相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

比如,可以从去除后候选图文信息集合中选取与该连载图文信息的图文信息类型相同的候选图文信息,即在去除后候选图文信息集合找出与连载图文信息同一类型的候选图文信息。

优选地,在获取类型相关候选图文信息集合之后,可以基于集合内各候选图文信息的标签(tag)来选取后续连载图文信息。标签指的是:可以概括图文信息主要内容的关键词。一个图文信息可以有一个或者多个标签。

具体地,步骤“从该类型相关候选图文信息集合中选取该连载图文信息的后续连载图文信息”可以包括:

获取类型相关候选图文信息集合中候选图文信息的标签、以及该连载图文信息的标签;

根据该候选图文信息的标签以及该连载图文信息的标签,从类型相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

比如,可以从类型相关候选图文信息集合中选取与连载图文信息的tag重合数量最多的候选图文信息,以作为后续连载图文信息。具体地,可以将连载图文信息的标签与类型相关候选图文信息集合内候选图文信息的标签进行比较,得到每个候选图文信息的标签重合数量(即相同标签数量),然后,选取与连载图文信息的tag重合数量最多的候选图文信息,以作为后续连载图文信息。

可选地,为了能够查找到后续连载图文信息,本实施例可以在接收图文信息获取请求之前,进行一些系列的预处理,如对图文信息进行分类、以及提取图文信息的标签等。也即在接收终端发送的图文信息获取请求之前,本实施例的图文信息推荐方法还可以包括:

对图文信息集合中的图文信息进行标签提取,得到图文信息集合中每个图文信息的标签;

对该图文信息集合中的图文信息进行分类,得到图文信息集合中每个图文信息的图文信息类型。

其中,该图文信息集合可以根据实际需求选定,比如,该图文信息集合可以包括服务器上所有的图文信息,该图文信息集合大于或等于候选图文信息集合。

比如,可对图文信息集合中的图文信息进行lda(latentdirichletallocation,文档主题生成模型)分类,得到图文信息集合中每个图文信息的图文信息类型。

其中,tag的提取有多种方式,比如,步骤“对图文信息集合中的图文信息进行标签提取”可以包括:

获取图文信息集合中图文信息的正文分词结果集合、以及标题分词结果集合;

根据标题分词结果集合中词、与该正文分词结果集合中词之间的相似度,从该标题分词结果集合中选取相应的词作为该图文信息的标签。

该正文分词结果集合为对图文信息的正文内容进行分词处理后得到的分词集合。该标题分词结果信息为图文信息的标题进行分词处理后得到的分词集合。本实施例可以采用jieba分词方式,去除单词和停止词。

本实施例,词与词之间的相似度可以包括词向量之间的向量相似度,如余弦相似度等。因此,步骤“根据标题分词结果集合中词、与该正文分词结果集合中词之间的相似度,从该标题分词结果集合中选取相应的词作为该图文信息的标签”可以包括:

获取该正文分词结果集合中正文词对应的词向量、以及标题分词结果集合中标题词对应的词向量;

根据该正文分词结果集合中正文词对应的词向量,获取图文信息正文的代表词向量;

根据标题分词结果集合中标题词对应的词向量、与该代表词向量之间的向量相似度,从该标题分词结果集合选取相应的词作为该图文信息的标签。

其中,获取词向量的方式有多种,比如,可以采用对词进行word2vector向量训练,从而得到词的词向量。

具体地,可以计算标题分词结果集合内每个标题词的词向量与代表向量的向量相似度,然后,从选取向量相似度满足预设条件的标题词作为tag。

比如,当向量相似度为余弦相似度时,可以遍历标题分词结果集合的词,计算每个词的词向量与代表词向量的余弦相似度值,当该余弦相似度值大于预设阈值时,则确定该词为图文信息的tag。其中,预设阈值可以根据实际需求设定,如0.5。本实施例中,两个词向量的余弦相似度值越大越接近1,表明两个词向量的夹角越小,进而表明两个词向量越相似以及两个词向量的词越相似。

为了加快tag的提取以及提高tag的准确性,本实施例可以从正文分词结果集合选取一定数量的正文词,然后,根据选取的正文选词来获取文信息正文的代表向量;也即步骤“获取该正文分词结果集合中正文词对应的词向量”可以包括:从该正文分词结果集合中选取预设数量的目标正文词,并获取目标正文词对应的词向量;

步骤“根据该正文分词结果集合中正文词对应的词向量,获取图文信息正文的代表词向量”可以包括:根据目标正文词对应的词向量获取图文信息正文的代表词向量。

本实施例中,可以根据正文分词结果集合中词的tf-idf(termfrequency–inversedocumentfrequency,词频-逆文件频率))权重来选取预设数量的目标正文词,比如,取tf-idf权重最高的10个正文词为目标正文词。

在获取目标正文词对应的词向量之后,可以将目标正文词对应的词向量相加,并作归一化处理,从而得到代表词向量。

105、向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。

其中,封面信息可以包括:后续连载图文信息的封面图片、标题以及链接等。终端在接收到封面信息后会根据封面信息展示后续连载图文信息的封面。当用户点击该链接即可获取后续连载图文信息。

106、执行常规的推荐流程。

比如,推荐与图文信息属于同一类型或者具有类似标签的图文信息给用户。

由上可知,本发明实施例接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识,然后,根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息,确定该目标图文信息是否为连载图文信息,若是,则从候选图文信息集合中获取该连载图文信息的后续连载图文信息,向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。该方案可以识别连载图文信息,并将连载图文信息的后续连载图文信息推荐出来;采用该方案可以实现将包含大量图片的图文信息拆分成若干个连载图文信息,在向终端发送某个连载图文信息之后将该连载图文信息的后续连载图文信息推荐出来,方便用户阅读完整的原始图文信息;因此,该方案可以提升图文信息的发送速度以及图文信息的展示速度,进而提高图文信息展示的及时性以及用户的阅读体验。

实施例二、

根据实施例一所描述的方法,以下将举例作进一步详细说明。

本发明实施例以图文信息推荐装置集成在服务器中为例,且结合图1a所示的系统来介绍本发明提供的图文信息推荐方法。

如图2a所示,一种图文信息推荐方法,具体流程可以如下:

201、终端向服务器发送图文信息获取请求,该图文信息获取请求携带图文信息标识。

参考图2b,在即时通讯应用中展示多个图文信息的封面信息(封面图片、标题、链接);当用户需要浏览某个图文信息时可以点击该图文信息的封面链接,以触发终端向服务器发送图文信息获取请求,该图文信息获取请求携带当前点击的图文信息的图文信息标识。

比如,当用户点击标题为“颜值爆表的她们,偏偏爱上了排球!真该为她们点赞!”的封面时,终端会向服务器发送该图文信息的获取请求,该请求携带标题为“颜值爆表的她们,偏偏爱上了排球!真该为她们点赞!”的图文信息的标识。

202、服务器根据图文信息获取请求获取图文标识对应的目标图文信息,并向终端返回该目标图文信息。

比如,服务器会查找标题为“颜值爆表的她们,偏偏爱上了排球!真该为她们点赞!(上)”的图文内容,然后,将该图文内容发送给终端。终端接收该图文内容后进行展示,参考图2c。

203、服务器获取目标图文信息的标题分词结果集合。

其中,标题分词结果集合为对图文信息的标题进行分词处理后得到的分词集合。比如,可以为采用jieba分词处理后得到的分词集合。

比如,服务器可以在接收到图文信息获取请求之前,预先对图文信息的标题进行分词处理,然后保存到相应的数据库中,此时服务器可以根据图文信息标识从数据库中提取标题分词结果集合。

又比如,服务器可以此时对标题进行分词,得到分词结果集合。

204、服务器判断该标题分词结果集合中是否存在与预设连载关键词匹配的词,若是,则执行步骤205,若否,则执行步骤211。

其中,预设连载关键词可以为在接收到图文信息获取请求之前预先配置的连载关键词,该连载关键词可以为一般性采用的连载词,如“上”、“下”、“上集”、“下集”、“第一集”“、”“第二集”等等,具体地可以根据实际需求设定。

本实施例中,当图文信息的标题分词结果集合中存在与预设连载关键词匹配的词时,则认为该图文信息为连载图文信息,否则认为该图文信息为非连载图文信息。

例如,以标题为“颜值爆表的她们,偏偏爱上了排球!真该为她们点赞!(上)”的图文内容为例,在对标题分词后,可以得到标题分词结果集合{“颜值”、“爆表”、“她们”、“爱上”、“排球”、“点赞”、“上”};假设连载关键词为“上”、“下”时,此时,该标题分词结果集合中存在与连载关键词匹配的词即“上”,那么便会认为该图文信息为连载图文信息。

205、服务器确定该目标图文信息为连载图文信息,从候选图文信息集合m中选取与该连载图文信息作者相同的候选图文信息,得到作者相关候选图文信息集合m1。

具体地,可以获取候选图文信息集合m中候选图文信息的作者信息、以及连载图文信息的作者信息,然后,将连载图文信息的作者信息分别与候选图文信息的作者信息进行比较,得到相同作者的候选图文信息。

206、服务器将该作者相关候选图文信息集合m1中标题不包含预设连载关键词的候选图文信息去除,得到去除后候选图文信息集合m2。

207、服务器在到去除后候选图文信息集合m2中选取与该连载图文信息类型相同的候选图文信息,得到类型相关候选图文信息集合m3。

可选地,在步骤201之前,服务器可以预先对图文信息进行分类,比如,可以对图文信息进行lda(latentdirichletallocation,文档主题生成模型)分类等。此外,服务器可以获取m2中候选图文信息的图文信息类型,以及连载图文信息的图文信息类型,然后,进行类型比较,得到与连载图文信息类型相同的候选图文信息。

208、服务器从类型相关候选图文信息集合m3中选取与连载图文信息的tag重合数量最多的候选图文信息,以作为该连载图文信息的后续连载图文信息。

可选地,在步骤201之前,服务器还可以预先对图文信息进行tag提取,tag的提取方式可以如下:

获取图文信息的正文分词结果集合wordtxt以及标题分词结果集合wordtitle;

从正文分词结果集合wordtxt中选取tf-idf权重最高的10个词,得到wordtxt’;

对wordtitle内标题词、以及wordtxt’正文词进行word2vector向量训练,从而得到标题词的词向量、正文词的词向量;

将wordtxt’中正文词的词向量向量相加,并归一化,得到图文信息正文的代表词向量;

遍历wordtitle中的标题词,将每个标题词的词向量和该代表词向量求余弦,如果余弦值>0.5,则认为该标题词为图文信息的tag。

在预先提取图文信息的tag情况下,此时,服务器可以获取m3中候选图文信息的tag、以及连载图文信息的tag,然后,将连载图文信息的tag与m3中候选图文信息的tag进行比较,得到与连载图文信息的tag重合数量最多的候选图文信息。

209、服务器向终端发送该后续连载图文信息的封面信息。

其中,封面信息可以包括:后续连载图文信息的封面图片、标题以及链接等。

210、终端根据该封面信息展示后续连载图文的封面。

比如,服务器最终查找到标题为“颜值爆表的她们,偏偏爱上了排球!真该为她们点赞!(下)”的后续连载图文信息;此时,服务将该后续连载图文信息的封面信息发送给终端。参考图2d,终端上即时通讯应用可以在界面上形成该后续连载图文信息的封面。

211、服务器执行常规的图文信息推荐流程。

由上可知,本发明实施例接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识,然后,根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息,确定该目标图文信息是否为连载图文信息,若是,则从候选图文信息集合中获取该连载图文信息的后续连载图文信息,向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。该方案可以识别连载图文信息,并将连载图文信息的后续连载图文信息推荐出来;采用该方案可以实现将包含大量图片的图文信息拆分成若干个连载图文信息,在向终端发送某个连载图文信息之后将该连载图文信息的后续连载图文信息推荐出来,方便用户阅读完整的原始图文信息;因此,该方案可以提升图文信息的发送速度以及图文信息的展示速度,进而提高图文信息展示的及时性、图文信息的转化率以及用户的阅读体验。

实施例三、

为了更好地实施以上方法,本发明实施例还提供图文信息推荐装置,如图3a所示,该图文信息推荐装置包括:接收单元301、图文信息发送单元302、确定单元303、连载获取单元304和结封面信息发送单元305,如下:

(1)接收单元301;

接收单元301,用于接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识。

其中,图文信息标识为图文信息的唯一标识,该图文信息标识可以由字符构成。比如,该图文信息标识可以为图文信息的url(uniformresourcelocator,统一资源定位符)等。

本实施例中,图文信息包含图片信息以及文字信息;比如,图文信息可以为图集,该图集可以为一种用户阅读的内容形式,该图集可以包括图片以及图片的文字说明。

(2)图文信息发送单元302;

图文信息发送单元302,用于根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息。

比如,图文信息发送单元302,可以用于据图文信息标识从数据源(如本地数据库、或者其他网络设备)获取该图文信息标识对应的目标图文信息,然后,发送给终端。

(3)确定单元303;

确定单元303,用于确定该目标图文信息是否为连载图文信息。

具体地,确定单元303,可以用于在图文信息发送跟单元向终端发送目标图文信息的过程中,确定该目标图文信息是否为连载图文信息。

其中,连载图文信息为连载形式的图文信息,指的是:某个图文信息拆分成多个子图文信息分多次发布时的子图文信息。比如,当某个图文信息的标题为“xxxxx(上)”、“xxxxx(下)”、“xxxxx(上集)”、“xxxxx(下集)”、“xxxxx(第一集)”、或者“xxxxx(第二集)”时,该图文信息即为连载图文信息。

可选地,由于连载图文信息一般可以从标题中看出来,因此,本实施例可以通过图文信息的标题来确定是否为连载图文信息。比如,参考图3b,该确定单元303可以包括:

分词获取子单元3031,用于获取该目标图文信息的标题分词结果集合;

判断子单元3032,用于判断该标题分词结果集合中是否存在与预设连载关键词匹配的词;

确定子单元3033,用于当该判断子单元3032判断为是时,确定该目标图文信息为连载图文信息。

其中,标题分词结果集合为对图文信息的标题进行分词处理后得到的分词集合。

其中,预设连载关键词可以为在接收到图文信息获取请求之前预先配置的连载关键词,该连载关键词可以为一般性采用的连载词,如“上”、“下”、“上集”、“下集”、“第一集”“、”“第二集”等等,具体地可以根据实际需求设定。

(4)连载获取单元304;

连载获取单元304,用于在该确定单元303确定该目标图文信息为连载图文信息时,从候选图文信息集合中获取该连载图文信息的后续连载图文信息。

其中,连载图文信息的后续连载图文信息为与连载图文信息属于同一个图文信息,且与连载图文信息具有顺序关系的图文信息。该顺序关系包括前后、上下、左右等等顺序关系。例如,当存在标题为“xxxxx(上)”的图文信息a、标题为“xxxxx(下)”的图文信息b时,图文信息b即为图像信息a的后续连载图文信息。

优选地,考虑到连载图文信息与其后续连续图文信息的作者具有关联性,如可能为同一个作者,因此,本实施例可以通过图文信息的作者信息来初步筛选,然后,从筛选结果中进一步选取得到连载图文信息的后续连载图文信息。比如,参考图3c,连载获取单元304可以包括:

作者信息获取子单元3041,获取该候选图文信息集合中候选图文信息的作者信息、以及该连载图文信息的作者信息;

作者选取子单3042,用于根据该候选图文信息的作者信息以及该连载图文信息的作者信息,从该候选图文信息集合选取相应的候选图文信息,得到作者相关候选图文信息集合;

连载信息获取子单元3043,用于从该作者相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

其中,连载信息获取子单元3043,可以具体用于:将该作者相关候选图文信息集合中标题不包含预设连载关键词的候选图文信息去除,得到去除后候选图文信息集合;

根据去除后候选图文信息集合中候选图文信息的图文信息类型、以及该连载图文信息的图文信息类型,从去除后候选图文信息集合中选取相应的候选图文信息,得到类型相关候选图文信息集合;

从该类型相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

比如,可以从去除后候选图文信息集合中选取与该连载图文信息的图文信息类型相同的候选图文信息。

优选地,该连载信息获取子单元3043,可以具体用于获取类型相关候选图文信息集合中候选图文信息的标签、以及该连载图文信息的标签;根据该候选图文信息的标签以及该连载图文信息的标签,从类型相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

比如,可以从类型相关候选图文信息集合中选取与连载图文信息的tag重合数量最多的候选图文信息,以作为后续连载图文信息。

(5)封面信息发送单元305;

封面信息发送单元305,用于向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。

其中,封面信息可以包括:后续连载图文信息的封面图片、标题以及链接等。

可选地,参考图3d,本实施例图文信息推荐装置还可以包括:

标签提取单元306,用于在接收单元301接收图文信息获取请求之前,对图文信息集合中的图文信息进行标签提取,得到图文信息集合中每个图文信息的标签;

分类单元307,用于在接收单元301接收图文信息获取请求之前,对该图文信息集合中的图文信息进行分类,得到图文信息集合中每个图文信息的图文信息类型。

比如,分类单元307可以采用ida模型对图文信息进行分类。

比如,标签提取单元306可以用于:

获取图文信息集合中图文信息的正文分词结果集合、以及标题分词结果集合;

根据标题分词结果集合中词、与该正文分词结果集合中词之间的相似度,从该标题分词结果集合中选取相应的词作为该图文信息的标签。

本实施例,词与词之间的相似度可以包括词向量之间的向量相似度,如余弦相似度等。因此,“根据标题分词结果集合中词、与该正文分词结果集合中词之间的相似度,从该标题分词结果集合中选取相应的词作为该图文信息的标签”的过程可以包括:

获取该正文分词结果集合中正文词对应的词向量、以及标题分词结果集合中标题词对应的词向量;

根据该正文分词结果集合中正文词对应的词向量,获取图文信息正文的代表词向量;

根据标题分词结果集合中标题词对应的词向量、与该代表词向量之间的向量相似度,从该标题分词结果集合选取相应的词作为该图文信息的标签。

其中,获取词向量的方式有多种,比如,可以采用对词进行word2vector向量训练,从而得到词的词向量。

具体地,可以计算标题分词结果集合内每个标题词的词向量与代表向量的向量相似度,然后,从选取向量相似度满足预设条件的标题词作为tag。

比如,当向量相似度为余弦相似度时,可以遍历标题分词结果集合的词,计算每个词的词向量与代表词向量的余弦相似度值,当该余弦相似度值大于预设阈值时,则确定该词为图文信息的tag。其中,预设阈值可以根据实际需求设定,如0.5。本实施例中,两个词向量的余弦相似度值越大越接近1,表明两个词向量的夹角越小,进而表明两个词向量越相似以及两个词向量的词越相似。

为了加快tag的提取以及提高tag的准确性,本实施例可以从正文分词结果集合选取一定数量的正文词,然后,根据选取的正文选词来获取文信息正文的代表向量。比如,标签提取单元306,可以用于从该正文分词结果集合中选取预设数量的目标正文词,并获取目标正文词对应的词向量,根据目标正文词对应的词向量获取图文信息正文的代表词向量。

具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。

该图文信息推荐装置具体可以集成在服务器等设备中。

由上可知,本发明实施例通过接收单元301接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识,然后,由图文信息发送单元302根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息,由确定单元303确定该目标图文信息是否为连载图文信息,若是,则由连载获取单元304从候选图文信息集合中获取该连载图文信息的后续连载图文信息,由封面信息发送单元305向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。该方案可以识别连载图文信息,并将连载图文信息的后续连载图文信息推荐出来;采用该方案可以实现将包含大量图片的图文信息拆分成若干个连载图文信息,在向终端发送某个连载图文信息之后将该连载图文信息的后续连载图文信息推荐出来,方便用户阅读完整的原始图文信息;因此,该方案可以提升图文信息的发送速度以及图文信息的展示速度,进而提高图文信息展示的及时性以及用户的阅读体验。

实施例四、

相应的,本发明实施例还提供了一种服务器,如图4所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:

该服务器400可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、射频(radiofrequency,rf)电路403、电源404、输入单元405、以及显示单元406等部件。本领域技术人员可以理解,图4中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块。处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。

rf电路403可用于收发信息过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器401处理。另外,将涉及上行的数据发送给基站。

服务器还包括给各个部件供电的电源404(比如电池)。优选的,电源可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源404还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该服务器还可包括输入单元405,该输入单元405可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

该服务器还可包括显示单元406,该显示单元406可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元408可包括显示面板,可选的,可以采用液晶显示器(lcd,liquidcrystaldisplay)、有机发光二极管(oled,organiclight-emittingdiode)等形式来配置显示面板。

具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:

接收终端发送的图文信息获取请求,该图文信息获取请求携带图文信息标识,然后,根据该图文信息获取请求,向该终端发送该图文信息标识对应的目标图文信息,确定该目标图文信息是否为连载图文信息,若是,则从候选图文信息集合中获取该连载图文信息的后续连载图文信息,向该终端发送该后续连载图文信息的封面信息,以推荐该后续连载图文信息。该方案可以识别连载图文信息,并将连载图文信息的后续连载图文信息推荐出来。

比如,确定该目标图文信息是否为连载图文信息,包括

获取该目标图文信息的标题分词结果集合;

判断该标题分词结果集合中是否存在与预设连载关键词匹配的词;

若是,则确定该目标图文信息为连载图文信息。

比如,从候选图文信息集合中获取该连载图文信息的后续连载图文信息,包括:

获取该候选图文信息集合中候选图文信息的作者信息、以及该连载图文信息的作者信息;

根据该候选图文信息的作者信息以及该连载图文信息的作者信息,从该候选图文信息集合选取相应的候选图文信息,得到作者相关候选图文信息集合;

从该作者相关候选图文信息集合中选取该连载图文信息的后续连载图文信息。

具体的操作步骤或过程,可以参考前面图文信息推荐方法实施例的详细描述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(rom,readonlymemory)、随机存取记忆体(ram,randomaccessmemory)、磁盘或光盘等。

以上对本发明实施例所提供的一种图文信息推荐方法、装置及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1