实现文本信息实时推荐的系统及方法与流程

文档序号:11216470阅读:417来源:国知局
实现文本信息实时推荐的系统及方法与流程

本公开涉及互联网应用技术领域,特别涉及一种实现文本信息实时推荐的系统及方法。



背景技术:

目前文本信息推荐系统通过收集用户的历史浏览记录,并根据用户的历史浏览记录在后台进行计算,并将计算结果中与用户的历史浏览记录相似的文本信息推荐给用户,从而实现文本信息的推荐功能。

但在上述文本信息推荐系统中,会出现由于需要在后台根据用户的历史浏览记录计算出相似的文本信息,因此在用户浏览文本信息时,无法根据用户当前浏览的文本信息实时进行文本信息的推荐。



技术实现要素:

为了解决相关技术中存在无法根据用户当前浏览的文本信息实时进行文本信息的推荐的问题,本公开提供了一种实现文本信息实时推荐的系统及方法。

一种实现文本信息实时推荐的系统,所述系统包括:

在线数据服务模块,用于根据用户对文本信息的实时浏览信息,向用户返回与所述实时浏览信息相似的文本信息;

用户实时浏览行为收集模块,其与所述在线数据服务模块相连接,所述用户实时浏览行为收集模块用于根据用户对文本信息的用户行为,存储用户对文本信息的实时浏览信息;

离线数据计算模块,其与所述在线数据服务模块相连接,所述离线数据计算模块用于预先存储与热门文本信息相似的文本信息,并在所述热门文本信息与所述实时浏览信息相匹配时,将所述文本信息上传到所述在线数据服务模块作为与所述实时浏览信息相似的文本信息;

在线实时计算模块,其与所述在线数据服务模块相连接,所述在线实时计算模块用于在所述离线数据计算模块存储的所述热门文本信息未能与所述实时浏览信息相匹配时,计算出与所述实时浏览信息最相似的所述热门文本信息,并将所述热门文本信息上传到所述在线数据服务模块作为与所述实时浏览信息相似的文本信息。

一种实现文本信息实时推荐的方法,所述方法包括:

根据用户对文本信息的用户行为,存储用户对文本信息的实时浏览信息;

预先存储与热门文本信息相似的文本信息,并在所述热门文本信息与所述实时浏览信息相匹配时,将所述文本信息作为与所述实时浏览信息相似的文本信息;

在预先存储的所述热门文本信息未能与所述实时浏览信息相匹配时,计算出与所述实时浏览信息最相似的所述文本信息,将所述热门文本信息作为与所述实时浏览信息相似的文本信息;

向用户返回与所述实时浏览信息相似的文本信息。

本公开的实施例提供的技术方案可以包括以下有益效果:

在线数据服务模块,用于根据用户对文本信息的实时浏览信息,向用户返回与实时浏览信息相似的文本信息;用户实时浏览行为收集模块,用于根据用户对文本信息的用户行为,存储用户对文本信息的实时浏览信息;离线数据计算模块,用于预先存储与热门文本信息相似的文本信息,并在热门文本信息与实时浏览信息相匹配时,将文本信息上传到在线数据服务模块作为与实时浏览信息相似的文本信息;在线实时计算模块,用于在离线数据计算模块存储的热门文本信息未能与实时浏览信息相匹配时,计算出与实时浏览信息最相似的热门文本信息,并将热门文本信息上传到在线数据服务模块作为与实时浏览信息相似的文本信息。通过上述实现文本信息实时推荐的系统,实现了根据用户当前浏览的文本信息实时进行文本信息的推荐。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种实现文本信息实时推荐的系统装置框图;

图2是图1对应实施例的用户实时浏览行为收集模块在一个实施例的框图;

图3是图1对应实施例的离线数据计算模块在一个实施例的框图;

图4是图1对应实施例的在线实时计算模块在一个实施例的框图;

图5是根据一示例性实施例示出的一种实现文本信息实时推荐的方法流程图。

具体实施方式

这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种实现文本信息实时推荐的系统装置框图。如图1所示,该实现文本信息实时推荐的系统包括但不限于:在线数据服务模块110,用户实时浏览行为收集模块130,离线数据计算模块150和在线实时计算模块170。

在线数据服务模块110,用于根据用户对文本信息的实时浏览信息,向用户返回与实时浏览信息相似的文本信息。

其中,文本信息为该装置中供给用户浏览的文字信息。用户对文本信息的实时浏览信息根据用户对文本信息的用户行为获得,实时浏览信息中包含着用户浏览的文本信息,从而在线数据服务模块110根据实时浏览信息得知用户的喜好文本信息,实现向用户推荐文本信息。

与实时浏览信息相似的文本信息为文本信息内容与实时浏览信息相似的文本信息。该文本信息与用户对文本信息的用户行为相符,从而在线数据服务模块110向用户返回与实时浏览信息相似的文本信息,使推荐的文本信息具有时效性和准确性。

用户实时浏览行为收集模块130与在线数据服务模块110相连接。该用户实时浏览行为收集模块130用于根据用户对文本信息的用户行为,存储用户对文本信息的实时浏览信息。

其中,用户实时浏览行为收集模块130和在线数据服务模块110相连接。用户行为是用户对文本信息的点击,浏览等操作。当用户进行对文本信息的用户行为时,用户实时浏览行为收集模块130获取用户行为的信息,并将该用户行为存储到用户实时浏览行为收集模块130中,作为用户对文本信息的实时浏览信息。在线数据服务模块110可以调用用户实时浏览行为收集模块130中存储的实时浏览信息作为推荐文本信息的参考。

离线数据计算模块150与在线数据服务模块110相连接,离线数据计算模块150用于预先存储与热门文本信息相似的文本信息,并在热门文本信息与实时浏览信息相匹配时,将文本信息上传到在线数据服务模块110作为与实时浏览信息相似的文本信息。

其中,离线数据计算模块150与在线数据服务模块110相连接。热门文本信息为历史点击量高或者时效性强的文本信息。离线数据计算模块150预先存储于热门文本信息相似的文本信息,根据在线数据服务模块110调用用户实时浏览行为收集模块130中的实时浏览信息,比较实时浏览信息与热门文本信息相似的文本信息,当热门文本信息和实时浏览信息相同,即热门文本信息和实时浏览信息相匹配时,将热门文本信息相似的文本信息上传到在线数据服务模块110,从而作为实时浏览信息相似的文本信息返回给用户。

在线实时计算模块170与在线数据服务模块110相连接,在线实时计算模块170用于在离线数据计算模块150存储的热门文本信息未能与实时浏览信息相匹配时,计算出与实时浏览信息最相似的热门文本信息,并将热门文本信息上传到在线数据服务模块110作为与实时浏览信息相似的文本信息。

其中,在线实时计算模块170与在线数据服务模块110相连接。当离线数据计算模块150存储的文本信息未上传到在线数据服务模块110时,即判定离线数据计算模块150存储的热门文本信息未能与实时浏览信息相匹配。此时计算出与实时浏览信息最相似的热门文本信息,并将该热门文本信息上传到在线数据服务模块110作为与实时浏览信息相似的文本信息。

该实现文本信息实时推荐的系统先通过用户实时浏览行为收集模块130,根据用户对文本信息的用户行为获取用户对文本信息的实时浏览信息。得到实时浏览信息之后,将实时浏览信息与离线数据计算模块150中存储的热门文本信息相比较,当热门文本信息与实时浏览信息相匹配时,则将预先得到的热门文本信息作为在线数据服务模块110向用户返回的与实时浏览信息相似的文本信息,当热门文本信息与实时浏览信息不匹配时,则在线实时计算模块170计算出与实时浏览信息最相似的热门文本信息,并将最相似的热门文本信息作为在线数据服务模块110向用户返回的与实时浏览信息相似的文本信息。从而根据该实现文本信息实时推荐的系统,实现了根据用户当前浏览的文本信息实时进行文本信息的推荐。

此实施例实现了根据用户当前浏览的文本信息实时进行文本信息的推荐。

图2是图1对应实施例的用户实时浏览行为收集模块在一个实施例的框图。如图2所示,该用户实时浏览行为收集模块130包括但不限于:用户行为清理单元131和用户浏览数据单元133。

用户行为清理单元131用于根据用户对文本信息的用户行为,得到用户对文本信息的实时浏览信息。

其中,用户行为为用户对文本信息的操作,例如点击,浏览等行为。用户行为清理单元131从所有用户的用户行为日志中,找到用户对文本信息的用户行为日志,并将用户进行用户行为的文本信息,作为用户对文本信息的实时浏览信息。

用户浏览数据单元133与用户行为清理单元131相连接,用户浏览数据单元133用于存储用户对文本信息的实时浏览信息。

其中,用户浏览数据单元133与用户行为清理单元131相连接。用户浏览数据单元133获取到用户行为清理单元131得到的用户对文本信息的实时浏览信息。并将该实时浏览信息存储到用户浏览数据单元133中,从而便于在线数据服务模块110获得用户对文本信息的实时浏览信息。

此实施例实现了存储用户对文本信息的实时浏览信息的功能。

图3是图1对应实施例的离线数据计算模块在一个实施例的框图。如图3所示,该离线数据计算模块150包括但不限于:文本语料训练单元151,自然语言处理单元153,相似文本计算单元155和判断上传单元157。

文本语料训练单元151用于预先选取热门文本信息。

其中,文本语料训练单元151用于预先选择热门文本信息。热门文本信息可以包括历史点击量高或者时效性强的文本信息。获取的热门文本信息经由自然语言处理单元153进行进一步处理。

自然语言处理单元153与文本语料训练单元151相连接,自然语言处理单元153用于根据热门文本信息生成热门文本信息对应的文本数学向量。

其中,自然语言处理单元153与文本语料训练单元151相连接。自然语言处理单元153读取文本语料训练单元151获得的热门文本信息,在一个实施例的具体实现中,利用文本处理开源工具,如word2vec计算出热门文本信息的词向量,同时处理每个词语的idf值。处理热门文本信息时首先标注文本信息段落属性如标题、内容、评论等,分别对每个段落进行分词获得文本信息段落里的词语,在从预先处理好的数据中获取文本信息的每个词的词向量进行处理乘上每个词的idf值再乘上预设的段落权重获得单个词语的新向量,将文本信息的每个词语新向量相加获得文章的文本数学向量。

获得文本数学向量的公式描述为:

文本向量数学=单词词向量1+单词词向量2+单词词向量3….+单词词向量n,其中单词词向量=word2vec词向量*词idf值*段落权重。

相似文本计算单元155与自然语言处理单元153相连接,相似文本计算单元155用于根据文本数学向量,找到与热门文本信息相似的文本信息进行存储。

其中,相似文本计算单元155与自然语言处理单元153相连接。相似文本计算单元155接收自然语言处理单元153处理得到的文本数学向量。在一个示例性实施例的具体实现中,相似文本计算单元155利用大数据技术,如map/reduce,利用集群计算文本数学向量间夹角。当文本数学向量间夹角越小,即表示两个文本数学向量越相似。计算文本数学向量间夹角的余弦值,取余弦值最大,即夹角最小的几个文本信息并存储。存储的文本信息可供在线数据服务模块110进行调用。

存储的文本信息的存储数据为热门文本信息的id及对应的相似文本信息id,相比文本形式存储占用存储空间更小节约资源。

判断上传单元157与相似文本计算单元155相连接,判断上传单元157用于判断热门文本信息和实时浏览信息是否匹配,若为是,则将与热门文本信息相似的文本信息上传到在线数据服务模块110作为与实时浏览信息相似的文本信息。

其中,判断上传单元157与相似文本计算单元155相连接,判断上传单元157获取相似文本计算单元155中存储的文本信息id。判断热门文本信息id和实时浏览信息id是否相同,即是否相匹配,若结果为是,则将与热门文本信息相似的文本信息作为与实时浏览信息相似的文本信息,上传到在线数据服务模块110

此实施例实现了上传与史浏览信息相似的文本信息。

在一个示例性实施例中,在线数据服务模块110进一步用于:

根据与热门文本信息相似的文本信息的热门程度,决定文本信息的显示排列顺序。

其中,根据点击率和用户收藏文本信息的次数,判断文本信息的热门程度。根据文本信息的热门程度,决定文本信息的显示排列顺序,从而保证用户首先浏览到热门程度最高的文本信息,保证文本信息推荐的准确性。

此实施例实现了根据文本信息的热门程度,决定文本信息的显示排列顺序,保证文本信息推荐的准确性的功能。

图4是图1对应实施例的在线实时计算模块在一个实施例的框图。如图4所示,该在线实时计算模块170包括但不限于:计算单元171和上传单元173。

计算单元171用于计算热门文本信息对应的文本数学向量和实时浏览信息的文本数学向量的相似度。

其中,计算单元171获取到热门文本信息对应的文本书序向量。计算热门文本信息对应的文本数学向量和实时浏览信息的文本数学向量间夹角的余弦值,从而获取文本数学向量间的相似度。夹角的余弦值越大,即夹角越小,相似度越高。

上传单元173与计算单元171相连接,上传单元173用于将相似度最大的热门文本信息上传到在线数据服务模块110作为与实时浏览信息相似的文本信息。

其中,上传单元173用于将相似度最高,即文本数学向量间夹角的余弦值最大的热门文本信息上传到在线数据服务模块110作为与实时浏览信息相似的文本信息。

此实施例实现在热门文本信息未能与实时浏览信息相匹配时,获取与实时浏览信息相似的文本信息。

在一个示例性实施例中,自然语言处理单元153进一步用于:

计算实时浏览信息的文本数学向量,并将实时浏览信息的文本数学向量上传给在线数据服务模块110。

其中,自然语言处理单元153计算出存储的实时浏览信息的文本数学向量,并将实时浏览信息的文本数学向量上传给在线数据服务模块110,从而使计算单元171能够获取实时浏览信息的文本数学向量。

此实施例实现了,计算出实时浏览信息的文本数学向量。

在一个示例性实施例中,计算单元171进一步用于:

从在线数据服务模块110读取实时浏览信息的文本数学向量。

其中,计算单元171读取在线数据服务模块110获得的自然语言处理单元153计算出的实时浏览信息的文本数学向量,从而实现计算热门文本信息对应的文本数学向量和实时浏览信息的文本数学向量的相似度。

此实施例实现了计算单元获取实时浏览信息的文本数学向量。

图5是根据一示例性实施例示出的一种实现文本信息实时推荐的方法流程图。如图5所示,该实现文本信息实时推荐的方法可以包括以下步骤。

在步骤210中,根据用户对文本信息的用户行为,存储用户对文本信息的实时浏览信息。

在步骤230中,预先存储与热门文本信息相似的文本信息,并在热门文本信息与实时浏览信息相匹配时,将文本信息作为与实时浏览信息相似的文本信息。

在步骤250中,在预先存储的热门文本信息未能与实时浏览信息相匹配时,计算出与实时浏览信息最相似的文本信息,将热门文本信息作为与实时浏览信息相似的文本信息。

在步骤270中,向用户返回与实时浏览信息相似的文本信息。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1