用于推送信息的方法和装置与流程

文档序号:11254069阅读:280来源:国知局
用于推送信息的方法和装置与流程

本申请涉及计算机技术领域,具体涉及一种用于推送信息的方法和装置。



背景技术:

随着网络科技的发展,目前许多产品,例如,搜索引擎、博客(blog)、sns(socialnetworksite,社会性网络服务)、rss(reallysimplesyndication,简易信息聚合)等等,都使用了信息流(feed)系统来发布信息流数据。信息流数据是指消息来源,也可被称为源料、馈送、信息提供、供稿、摘要、源、新闻订阅、网源等等,网站可通过它将最新信息传播给用户,用户能够订阅网站的先决条件是网站可提供持续更新的信息。信息流展现形式的优势在于让用户每次查询可以看到最新的数据,体验比传统的打开即显示的展现形式要好很多。

在现有技术中,用户进入承载信息流数据的页面时,除用户自身订阅的信息外,服务器还会向用户推送其他信息,例如,该网站近期举办活动的活动信息或广告信息。然而,服务器向用户推送的其他信息,通常不是该用户所需的,存在缺乏针对性的问题。



技术实现要素:

本申请的目的在于提出一种改进的用于推送信息的方法和装置,来解决以上背景技术部分提到的技术问题。

第一方面,本申请实施例提供了一种用于推送信息的方法,该方法包括:接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;根据查询用信息进行查询,得到第一信息流数据;获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;基于搜索记录和/或浏览记录,确定关键词;确定预设信息流数据集合中与关键词匹配的第二信息流数据;基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;向终端推送待推送数据。

在本实施例中,基于搜索记录和/或浏览记录,确定关键词,包括:获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容;对搜索语句和/或内容进行内容解析,得到备选词集合;对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面,第一概率确定模型用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;基于第一概率从备选词集合中选取关键词。

在本实施例中,预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及基于第一概率从备选词集合中选取关键词,包括:对于备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数;从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。

在本实施例中,对搜索语句和/或内容进行内容解析,得到备选词集合,包括:对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;将核心词以及得到的扩展词确定为关键词。

在本实施例中,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,包括:响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,第二概率确定模型用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与第二概率确定该第二信息流数据的分值;从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。

第二方面,本申请实施例提供了一种用于推送信息的装置,该装置包括:接收单元,用于接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;查询单元,用于根据查询用信息进行查询,得到第一信息流数据;获取单元,用于获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;第一确定单元,用于基于搜索记录和/或浏览记录,确定关键词;第二确定单元,用于确定预设信息流数据集合中与关键词匹配的第二信息流数据;生成单元,用于基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;推送单元,用于向终端推送待推送数据。

在本实施例中,第一确定单元,包括:获取子单元,用于获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容;解析子单元,用于对搜索语句和/或内容进行内容解析,得到备选词集合;第一确定子单元,用于对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面,第一概率确定模型用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;第一选取子单元,用于基于第一概率从备选词集合中选取关键词。

在本实施例中,预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及第一选取子单元,包括:第一确定模块,用于对于备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数;选择模块,用于从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。

在本实施例中,解析子单元,包括:分析模块,用于对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;扩展模块,用于对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;第二确定模块,用于将核心词以及得到的扩展词确定为关键词。

在本实施例中,生成单元,包括:第二确定子单元,用于响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,第二概率确定模型用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与第二概率确定该第二信息流数据的分值;第二选取子单元,用于从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合子单元,用于聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。

第三方面,本申请实施例提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面上述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面上述的方法。

本申请实施例提供的用于推送信息的方法和装置,通过接收终端发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据,实现了富于针对性的信息推送。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请可以应用于其中的示例性系统架构图;

图2是根据本申请的用于推送信息的方法的一个实施例的示意性流程图;

图3是根据本申请的用于推送信息的方法的又一个实施例的示意性流程图;

图4是根据本申请的用于推送信息的方法的应用场景的示意图;

图5是根据本申请的用于推送信息的装置的一个实施例的示例性结构图;

图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于推送信息的方法或用于推送信息的装置的实施例的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持文字输入的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的使用了信息流系统的应用提供支持的后台服务器。服务器105可以接收终端设备101、102、103发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端设备101、102、103推送待推送数据。

需要说明的是,本申请实施例所提供的用于推送信息的方法可以由服务器105执行,相应地,用于推送信息的装置可以设置于服务器105中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,示出了根据本申请的用于推送信息的方法的一个实施例的流程200。该用于推送信息的方法,包括以下步骤:

步骤201,接收终端发送的信息流数据获取请求。

在本实施例中,用于推送信息的方法运行于其上的电子设备(例如图1所示的服务器)可以接收终端发送的信息流数据获取请求。

信息流数据获取请求可以是使用了信息流数据系统的应用开启时终端发送的请求,也可以是响应于用户的特定操作终端发送的请求,例如查询操作、打开信息流数据显示页面的操作、刷新显示信息流数据的页面的操作。作为示例,用户在搜索栏中输入了查询语句后,可以通过点击查询按钮或按下回车键的方式通过终端向服务器发送信息流数据获取请求;用户在浏览显示信息流数据的页面时,可以通过下滑的手势或点击用于指示刷新操作的区域,向服务器发送的信息流数据获取请求,以获取未读的信息流数据。

通过对信息流数据显示的区域的点击操作,可以进入其指向的页面,信息流数据可以理解为针对其指向的页面进行整合得到的数据,可以包括其指向的页面的内容的标题、其指向的页面链接和其指向的页面的内容的描述信息等,例如,搜索结果页面中的搜索结果,社交类应用中用户发布的消息、动态。

信息流数据获取请求包括查询用信息,查询用信息可以是用于指示如何获取第一信息流数据的信息,第一信息流数据可以是用户订阅或查询的信息流数据。作为示例,查询用信息可以是用户输入的查询语句,也可以是与终端关联的账户的账户信息,例如账户标识,通过账户标识可以在数据库中获取该账户的订阅列表或关注列表,以此可进一步获取列表中账户发布的数据。

步骤202,根据查询用信息进行查询,得到第一信息流数据。

在本实施例中,上述电子设备可以根据步骤201中获取的查询用信息进行查询,得到第一信息流数据。作为示例,上述电子设备可以在相应数据库中查询与用户输入的查询语句匹配的信息流数据作为第一信息流数据;上述电子设备也可以首先查询与发送信息流数据获取请求的终端关联的账户的关注列表,得到其关注的账户的标识,之后根据其关注的账户的标识查询其关注的账户发布的信息,将其关注的账户发布的信息中未向该终端推送过的信息作为第一信息流数据。

步骤203,获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。

在本实施例中,上述电子设备可以获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。与终端关联的账户可以是终端上当前登陆的账户,也可以是根据终端的设备信息或其他关联信息建立的账户,例如,根据imei(internationalmobileequipmentidentity,国际移动设备身份码),或sim(subscriberidentificationmodule,客户识别模块)建立的账户。预定时间段可以是最近的一段时间,例如,过去几周,过去几天。预定时间段具体可根据实际需要设置,搜索记录和/或浏览记录较多时,可以适当缩短预定时间段。搜索记录可以是与终端关联的账户在搜索引擎中的搜索记录,也可以是与终端关联的账户在其他应用中的搜索记录。浏览记录可以是用户在使用了信息流数据系统的应用中访问过的,信息流数据所指向的页面的记录。

步骤204,基于搜索记录和/或浏览记录,确定关键词。

在本实施例中,上述电子设备可以基于步骤203中获取的搜索记录和/或浏览记录,确定关键词。上述电子设备可以直接从搜索记录中提取用户输入的搜索词,或从浏览记录提取用户浏览过的页面的标题或标签,对搜索词、标题或标签进行切分等操作得到关键词。在得到的词过多时,还可以进一步进行一些筛选的操作,避免关键词过多影响信息后续步骤的执行效率。

步骤205,确定预设信息流数据集合中与关键词匹配的第二信息流数据。

在本实施例中,上述电子设备可以确定预设信息流数据集合中与步骤204中确定的关键词匹配的第二信息流数据。预设信息流数据集合可以是预先存储在与上述电子设备关联的数据库的信息流数据集合,可以是一些推广用信息流数据的集合,例如,广告数据。上述电子设备可以根据关键词生成查询消息(query),向存储有预设信息流数据集合的数据库发送所生成的查询消息,将数据库返回的信息流数据确定为与关键词匹配的第二信息流数据。与关键词匹配的第二信息流数据可以是包括关键词或关键词的扩展词的信息流数据。也可以预先为信息流数据集合中的各个信息流数据设置有标签,作为示例,企业需要发布推广信息,在获取其提供的推广信息的同时,可以获取为其设置的标签。例如,某品牌欲推广某款手机,在提供了对款手机的介绍信息的同时,还可以将手机、双摄像头、该品牌的名称以及其他手机品牌的名称设置为标签。

步骤206,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据。

在本实施例中,上述电子设备可以基于第一信息流数据和步骤205中确定的第二信息流数据,生成待推送数据。上述电子设备可以根据终端页面的布局信息聚合第一信息流数据和所确定的第二信息流数据,生成待推送数据。布局信息可以用于指示页面显示的信息流数据的个数,第一信息流数据和所确定的第二信息流数据的分布,例如,每隔一定数目的第一信息流数据,插入一个所确定的第二信息流数据。

步骤207,向终端推送待推送数据。

在本实施例中,上述电子设备可以通过网络向终端推送步骤206中生成的待推送数据,以供终端进行显示。

本申请的上述实施例提供的方法通过接收终端发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据,实现了富于针对性的信息推送。

在本实施例的一些可选实现方式中,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,包括:响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率;从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。

在本实现方式中,预设数目可以是终端页面的布局信息中指示页面中显示的第二信息流数据的数目,具体可以根据实际需要设置。与信息流数据的对应的属性值可以是用于表征其特征的一个参数值,例如,信息流数据是广告数据,与广告数据对应的属性值可以是客户对该条广告数据的出价,也可以是该条广告数据被点击的次数或被推送的次数等。

第二概率确定模型可以用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息。与该终端关联的账户的账户信息可以是年龄、职业、所在地、兴趣爱好、关注的账户、订阅的栏目等信息。第二信息流数据的特征信息可以是用于表征第二信息流数据的核心内容的信息,可以通过对第二信息流数据进行语义分析得到,特征信息也可以是预先针对第二信息流数据所设置的,例如,第二信息流数据是推广信息,其特征信息可以是提供推广信息的一方为其设置的标签。

作为示例,上述电子设备可以将历史记录中记录的上述各个信息项作为输入,将根据历史记录统计得到的接收到访问该第二信息流数据所指向的页面的请求的比例作为输出,训练初始的朴素贝叶斯模型(naivebayesianmodel,nbm)或支持向量机(supportvectormachine,svm)等用于分类的模型,得到第二概率确定模型。第二概率确定模型也可以是技术人员基于对大量的上述信息项和第二概率的统计而预先制定的、存储有多个信息项与第二概率的对应关系的对应关系表;同样可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对信息项中的一个或多个进行量化与计算,得到的用于表征第二概率的计算结果的计算公式,例如,该计算公式可以是用于计算账户信息与特征信息的相关度的公式,若得到的相关度高,则第二概率大。

在本实现方式中,根据所获取的属性值与第二概率确定该第二信息流数据的分值,可以是计算所获取的属性值与第二概率的乘积,作为该第二信息流数据的分值,也可以对属性值进行归一化处理,按照预设权重对归一化处理得到的值与第二概率进行加权求和,得到该第二信息流数据的分值。

请参考图3,图3是根据本实施例的用于推送信息的方法的又一个实施例的流程示意图。

在图3中,该用于推送信息的方法的流程300,包括以下步骤:

步骤301,接收终端发送的信息流数据获取请求。

在本实施例中,用于推送信息的方法运行于其上的电子设备(例如图1所示的服务器)可以接收终端发送的信息流数据获取请求。

步骤302,根据查询用信息进行查询,得到第一信息流数据。

在本实施例中,上述电子设备可以根据步骤301中获取的查询用信息进行查询,得到第一信息流数据。

步骤303,获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。

在本实施例中,上述电子设备可以获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。

步骤304,获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容。

在本实施例中,上述电子设备可以获取步骤303中得到的搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容。

步骤305,对搜索语句和/或内容进行内容解析,得到备选词集合。

在本实施例中,上述电子设备可以对步骤304获取的搜索语句和/或内容进行内容解析,得到备选词集合。对搜索语句和/或内容进行内容解析,得到备选词集合,可以包括:对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;将核心词以及得到的扩展词确定为关键词。作为示例,扩展操作中,核心词“孩子”可以具有同义词“儿童”;核心词“中药”可以具有近义词“草药”,“出席”可以具有近义词“参加”;核心词“感冒”可以具有“发烧”或“流感”之类的关联词,生产同一产品的不同品牌的品牌名称、同一品牌旗下的不同产品的名称也可以互为关联词。

作为示例,统计分析可以是对搜索语句和/或内容中存在的各个词语的出现频率进行统计和排序,之后,再选取出现频率排序靠前的一个或多个词语作为关键词。语义分析可以是首先对内容进行全切分方法等处理,把内容分割成词;再对所得到的词进行重要性计算(例如采用词频-逆向文件频率方法(termfrequency-inversedocumentfrequency,tf-idf)),基于重要性计算的结果来得到关键词。通过扩展操作使得关键词更加丰富,进一步提高了信息推送的准确度。

步骤306,对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据,并基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率。

在本实施例中,上述电子设备可以对于步骤305中得到的备选词集合中的每个备选词,首先,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;之后获取第一概率模型所需的输入数据,并将其导入预先训练的第一概率确定模型,以确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面。

第一概率确定模型可以用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息。备选词所属的行业的行业信息可以是用于表征备选词的所属行业或领域的信息,例如汽车行业、手机行业。备选词的来源信息用于表征备选词的来源,例如,来源于用户输入的搜索语句,或浏览记录。

作为示例,上述电子设备可以将历史记录中记录的上述各个信息项作为输入,将根据历史记录统计得到的接收到访问该第二信息流数据所指向的页面的请求的比例作为输出,训练初始的朴素贝叶斯模型或支持向量机等用于分类的模型,得到第一概率确定模型。第一概率确定模型也可以是技术人员基于对大量的上述信息项和第一概率的统计而预先制定的、存储有多个信息项与第一概率的对应关系的对应关系表;同样可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对信息项中的一个或多个进行量化与计算,得到的用于表征第一概率的计算结果的计算公式,例如,该计算公式可以是用于计算与该终端关联的账户的账户信息中兴趣爱好或职业与备选词所属的行业的行业信息的相关度的公式,若得到的相关度高,则第一概率大。

步骤307,对于备选词集合中的每个备选词,执行分数确定操作。

在本实施例中,针对预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值。上述电子设备对步骤305中得到的备选词集合中的每个备选词,执行的分数确定操作,可以包括:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值,和步骤306中确定的该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数。

在本实施例中,可能存在多个与备选词匹配的第二信息流数据,每个第二信息流数据都存在与其对应的属性值,可以将多个属性值的平均值作为与该备选词对应的属性值,也可以将最高的一个属性值作为与该备选词对应的属性值。采用一种多目标融合的方法得到各个备选词对应的分数。可以通过分析两者的均值、设置一组初始权重,然后根据实际需要,不断进行调整。最终获得一组较优的权重。例如,可以通过以下公式计算备选词对应的分数:

s=w1×p+w2×v+w3×p×v;(1)

其中,s表示备选词对应的分数,p表示备选词对应的第一概率,v表示备选词的对应的属性值,w1表示针对第一概率所设置的权重,w2表示针对属性值所设置的权重,w3表示针对第一概率与属性值的乘积所设置的权重。

步骤308,从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。

在本实施例中,上述电子设备可以从备选词集合的各个备选词中,按照步骤307中得到的分数由大到小的顺序,选择预定数目个备选词作为关键词。预定数目可以根据系统能承受的运算量确定,预定数目过大,会影响信息推送的效率。作为示例,预定数目可以是2。

步骤309,确定预设信息流数据集合中与关键词匹配的第二信息流数据。

在本实施例中,上述电子设备可以确定预设信息流数据集合中与步骤308中确定的关键词匹配的第二信息流数据。

步骤310,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据。

在本实施例中,上述电子设备可以基于第一信息流数据和步骤309中确定的第二信息流数据,生成待推送数据。

步骤311,向终端推送待推送数据。

在本实施例中,上述电子设备可以通过网络向终端推送步骤310中生成的待推送数据,以供终端进行显示。

步骤301~步骤303、步骤309~步骤311的实现细节和技术效果可以参考步骤201~步骤203、步骤205~步骤207中的说明,在此不再赘述。

从图3中可以看出,与图2对应的实施例相比,本实施例中的用于推送信息的方法的流程300突出了确定关键词的步骤。由此,本实施例描述的方案可以确定出与用户需求的贴合度更高的关键词,从而实现了更有效的信息推送。

继续参见图4,图4是根据本实施例的用于推送信息的方法的应用场景的一个示意图。在图4的应用场景中,当前页面中已无用户未读过的信息流数据,用户通过按住下滑的手势操作,通过终端向服务器发送信息流数据获取请求。服务器通过请求中包括的账户标识,查询到用户的订阅列表,根据订阅列表获取到用户订阅的未读的信息流数据,作为第一信息流数据。服务器还通过账户标识到了用户在预定时间段内的搜索记录和/或浏览记录,发现用户检索过“某品牌手机价格”、“某品牌手机发布时间”,用户浏览过标题为“不得不买某品牌手机的十大原因”、“手机性能对比”的网页。可以将“某品牌”、“手机”、价位接近的其他手机品牌、某品牌旗下的其他产品的产品名称确定为关键词,以在预先设置的推广数据的集合中查询与关键词匹配的第二信息流数据。最后,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据。

进一步参考图5,作为对上述方法的实现,本申请提供了一种用于推送信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图5所示,本实施例的用于推送信息的装置500包括:接收单元501,查询单元502,获取单元503,第一确定单元504,第二确定单元505,生成单元506,推送单元507,其中,接收单元501,用于接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;查询单元502,用于根据查询用信息进行查询,得到第一信息流数据;获取单元503,用于获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;第一确定单元504,用于基于搜索记录和/或浏览记录,确定关键词;第二确定单元505,用于确定预设信息流数据集合中与关键词匹配的第二信息流数据;生成单元506,用于基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;推送单元507,用于向终端推送待推送数据。

在本实施例中,接收单元501,查询单元502,获取单元503,第一确定单元504,第二确定单元505,生成单元506,推送单元507的具体处理可以参考图2对应实施例步骤201、步骤202、步骤203、步骤204、步骤205、步骤206、步骤207的详细描述,在此不再赘述。

在本实施例的一些可选实现方式中,第一确定单元504,包括:获取子单元(图中未示出),用于获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容;解析子单元(图中未示出),用于对搜索语句和/或内容进行内容解析,得到备选词集合;第一确定子单元(图中未示出),用于对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面,第一概率确定模型用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;第一选取子单元(图中未示出),用于基于第一概率从备选词集合中选取关键词。

在本实施例的一些可选实现方式中,预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及第一选取子单元(图中未示出),包括:第一确定模块(图中未示出),用于对于备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数;选择模块(图中未示出),用于从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。

在本实施例的一些可选实现方式中,解析子单元(图中未示出),包括:分析模块(图中未示出),用于对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;扩展模块(图中未示出),用于对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;第二确定模块(图中未示出),用于将核心词以及得到的扩展词确定为关键词。

在本实施例的一些可选实现方式中,生成单元506,包括:第二确定子单元(图中未示出),用于响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,第二概率确定模型用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与第二概率确定该第二信息流数据的分值;第二选取子单元(图中未示出),用于从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合子单元(图中未示出),用于聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。

从图5中可以看出,本实施例中用于推送信息的装置500通过接收终端发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据,实现了富于针对性的信息推送。

下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有系统600操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。

以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口606。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元,查询单元,获取单元,第一确定单元,第二确定单元,生成单元,推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“接收终端发送的信息流数据获取请求的单元”。

作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入服务器中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;根据查询用信息进行查询,得到第一信息流数据;获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;基于搜索记录和/或浏览记录,确定关键词;确定预设信息流数据集合中与关键词匹配的第二信息流数据;基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;向终端推送待推送数据。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1