一种确定推送信息的方法及装置制造方法

文档序号:6491550阅读:169来源:国知局
一种确定推送信息的方法及装置制造方法
【专利摘要】本申请公开了一种确定推送信息的方法及装置,所述推送信息为描述推送对象的数据信息,该方法包括:当检测到用户浏览网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;获取所述至少一个对象聚类对应的目标关键词,根据所述目标关键词从信息推送系统中获取推送信息。本申请公开的方法和装置可以提高推送的信息与用户的潜在需求的一致性,提高了信息推送的精确度。
【专利说明】一种确定推送信息的方法及装置
【技术领域】
[0001]本申请涉及电子信息【技术领域】,尤其涉及一种确定推送信息的方法及装置。
【背景技术】
[0002]目前网络系统会根据用户的网络行为主动获取一些数据推荐给用户,例如:用户在使用搜索引擎进行搜索时,除了搜索引擎会根据用户输入的关键词在搜索引擎服务器中查询获取到相应搜索结果并反馈给用户外,搜索引擎还会根据接收到的搜索关键词,从信息推送系统或其他系统中获取与所述搜索关键词对应的查询结果,并将所述查询结果作为推荐数据主动推送给用户。但是因为现有的信息推送系统中包括大量的数据,所以导致想要搜索到与用户搜索关键词密切相关的推荐数据具有很大的难度,在现有技术的方案中,如果要获得正确的推荐数据则主要的问题在于如何获取准确的关键词。
[0003]现有技术中,对应不同的应用场景,获取推荐数据的关键词的具体方法包括以下几种方式:
[0004]a,在搜索查询场景:直接使用用户输入的查询关键词(querywords)作为获取推荐数据的关键词;
[0005]b,在上下文场景:当用户浏览具体介绍某个推送对象的网页内容/资讯内容/博客文章时,提取对应当前浏览对象(即所述推送对象)预存的相关关键词作为获取推荐数据的关键词;如果没有,也可以将当前浏览对象的标题进行分词处理得到相应的关键词;
[0006]C,在其他场景(也可以称之为一般性场景):当用户刚刚进入网站首页等此类场景中时,用户既没有输入关键词、也没有当前浏览对象时,会使用用户以往的查询关键词作为输入关键词来获取推荐数据。
[0007]在现有技术方案中,对于所述上下文场景来说,基于当前浏览对象得到的关键词,往往过于细化,很可能查询不到足够的推荐数据;如果用户想要获取到想要的推荐数据则需要多次查询信息推送系统,从而造成用户的重复操作,并导致系统的无意义访问量增加,进一步导致系统资源的浪费。
[0008]对于一般性场景,在进行搜索时,是使用用户以往的查询关键词,因为用户对商品的需求会随时间有所变化,所以该种方式并不一定能准确的反应用户的真实需求。比如,部分用户可能并没有查询关键词;部分用户虽然有查询关键词,这些关键词能从信息推送系统中获取足够多的推荐数据,但是因为用户需求发生变化所以导致信息推送系统推送给用户的大部分数据是无意义的,所以导致信息推送系统向用户发送无意义数据时浪费了大量的系统资源。
[0009]通过上述三种商品信息的获取方案获取到的推荐数据并不能完全的符合用户当时的需求,在这种情况下会浪费大量的网络资源发送无意义的推荐数据的同时并不能有效推送用户确切需要的推荐数据。

【发明内容】
[0010]本申请提供一种确定推送信息的方法及装置,本申请所提供的方法和装置用于解决现有技术中获取到的推荐数据并不能完全的符合用户当时的需求,在这种情况下会浪费大量的网络资源发送无意义的推荐数据的同时并不能有效推送用户确切需要的推荐数据的问题。
[0011]针对上述问题本申请提供一种确定推送信息的方法,所述推送信息为描述推送对象的数据信息,该方法包括:
[0012]当检测到用户浏览任一网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;
[0013]确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;
[0014]获取所述至少一个对象聚类对应的目标关键词组,根据所述目标关键词组从信息推送系统中获取推送信息。
[0015]根据上述方法本申请还提供一种确定推送信息的装置,所述推送信息为描述推送对象的数据信息,该装置包括:
[0016]基准推送对象确定模块,当检测到用户浏览任一网页内容时,用于根据预存的用户信息和/或网页内容信息确定基准推送对象;
[0017]对象聚类确定模块,用于确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;
[0018]推送信息确定模块,用于获取所述至少一个对象聚类对应的目标关键词组,根据所述目标关键词组从信息推送系统中获取推送信息。
[0019]上述技术方案中的一个或两个,至少具有如下技术效果:
[0020]本申请实施例所提供的方法和装置能够基于内容相关与行为相关,对推送对象进行分类,使得每个推送对象都归在某个聚类中,然后对于聚类提取关键词,可以提高推送的信息与用户的潜在需求的一致性,提高了信息推送的精确度。能够在推送适量数据的情况下,满足用户的需求,减少信息推送系统的数据发送量,减少了数据推送过程中带宽资源的浪费。另外,由于本申请实施例只是对一个聚类中的推送对象提取关键词,而无需对所有的基准推送对象都提取关键词,因此,提取出的关键词数量少,加快了后续关键词的排序过程,提高了获取到目标关键词的速度。
【专利附图】

【附图说明】
[0021]图1为本申请实施例一种确定推送信息的方法的流程图;
[0022]图2为本申请实施例中计算文本相关性值的方法流程图;
[0023]图3为本申请实施例中计算行为相关性值的方法流程图;[0024]图4为本申请实施例一种确定推送信息的装置的结构示意图。
【具体实施方式】
[0025]本申请实施例提供一种确定推送信息的方法,所述推送信息为描述推送对象的数据信息,该方法包括:当检测到用户浏览任一网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;获取所述至少一个对象聚类对应的目标关键词组,根据所述目标关键词组从信息推送系统中获取推送信息。
[0026]本申请实施例所提供的方法根据待推送信息的特性将推送信息进行聚类,然后根据聚类中每个推送对象的关键词提取聚类的关键词。当需要向用户推送信息时,则可根据用户当前浏览网页内容的上下文场景以及其他场景确定推送对象,然后确定基准推送对象对应的对象聚类,从而根据对象聚类对应的关键词确定需要向用户推送的信息。通过本申请提供的方法能够基于内容相关与行为相关,对推送对象进行分类,使得每个推送对象都归在某个聚类中,然后对于聚类提取关键词,可以提高推送的信息与用户的潜在需求的一致性,同时能够保证推送信息的数量和类型更多样化。以下结合说明书附图对本申请所提供的方法做进一步的说明:
[0027]如图1所示,本申请实施例提供一种确定推送信息的方法,下面结合说明书附图对本申请的【具体实施方式】进行详细说明:
[0028]在本申请实施例中,系统向用户推送的信息可以是介绍某一推送对象的描述信息等,所以所述推送信息可以是描述推送对象的数据信息,该方法具体包括:
[0029]步骤101,当检测到用户浏览任一网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;
[0030]所述基准推送对象是指分析用户当前浏览的内容后初步选定的推送对象。如果推送对象是商品,则当用户在浏览某一电子商店中某个商品的介绍网页,所述基准推送对象为预设的与所述商品相关的商品或者预存的与所述用户对应的相关商品。
[0031]在本申请实施例中所述用户浏览任一网页内容包括:
[0032]A,在上下文场景:当用户浏览某个包括推送对象信息的网页内容(如果推送对象是商品,则当用户在浏览某一电子商店中某个商品的介绍网页/介绍商品的资讯内容/介绍商品的博客文章)时,提取用户当前浏览的网页内容中的推送对象。
[0033]B,在其他场景(也可以称之为一般性场景):当用户在没有特定推送对象的网站首页等场景中,用户既没有输入关键词、也没有当前浏览对象时,如果能够获取到用户的识别信息则获取用户最近关注的推送对象,即根据预存的用户信息确定基准推送对象包括:获取所述用户对应的用户标识;根据所述用户标识获取预存的该用户标识对应的基准推送对象。
[0034]在该实施例中以推送对象是商品为例说明“确定用户关注的推送对象”的具体实现方式,具体包括:[0035]首选,通过用户对推送对象(商品)的操作行为以及操作行为发生的时间计算得到用户对于每个商品的关注度;
[0036]操作行为对关注度的影响:对于用户对推送对象(即商品)的不同操作行为(例如:点击、收藏、交易),不同的行为对应不同的权重(例如:交易权重>收藏权重>点击权重);
[0037]操作行为发生的时间对关注的影响:行为发生的日期距离当前日期之差进行分段(例如,最近I周,距离当前2周,距离当前3周等),不同的时间段分别对应不同的时间衰减系数(例如最近一周为1.0,距离当前2周的为0.8,距离当前3周的为0.6......);
[0038]将所述操作行为权重和时间衰减系数综合计算得到用户对每个商品的关注度。
[0039]其次,根据关注度由大到小的顺序进行排序,根据排序确定多个商品为用户最近关注的商品(即该实施例中的基准推送对象)。
[0040]步骤102,确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类得到的多个推送对象的集合;
[0041]在本申请实施例中将具有一定特性的推送对象聚合到一个聚类中,具体在实现对象聚类操作时,需要考虑推送对象的文本相关性和行为相关性,具体实现时包括:
[0042]其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值(因为本发明实施例所分析的对象为推送对象,所以该实施例中行为相关性值是根据多个用户对同一推送对象所执行的操作行为生成的),并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;
[0043]所述对象聚类的关键词组是从聚类中的多个推送对象所对应的关键词组中筛选得到,具体实现包括:
[0044]获取对象聚类中每个推送对象对应的关键词组;
[0045]确定所述关键词组中每个关键词重复出现的次数,并根据所述重复出现的次数对关键词进行排序;
[0046]根据所述排序从关键词中选取K个关键词作为所述对象聚类的关键词组,其中,K为正整数。
[0047]在本发明实施例中,重复出现的次数可以使用TF-1DF数值体现,计算每个关键词的 TF-1DF((term frequency inverse document frequency))数值的具体实现方式可以是:
[0048]首先计算tf数值,
【权利要求】
1.一种确定推送信息的方法,其特征在于,所述推送信息为描述推送对象的数据信息,该方法包括: 当检测到用户浏览网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象; 确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中推送对象对应的关键词得到该对象聚类的关键词; 获取所述至少一个对象聚类对应的目标关键词,根据所述目标关键词从信息推送系统中获取推送信息。
2.如权利要求1所述的方法,其特征在于,所述根据推送对象对应文本介绍信息得到推送对象的文本相关性值包括: 对所述推送对象对应文本介绍信息进行分词处理,得到每个推送对象的第一关键词组,该第一关键词组中包括多个关键词; 根据各推送对象的第一关键词组之间的相似度,计算得到各推送对象之间的文本相关性值。
3.如权利要求1所述的方法,其特征在于,所述根据用户对推送对象的操作行为得到推送对象的行为相关性值包括: 获取每个推送对象对应的操作行为数据; 根据预设的每类操作行为与行为值之间的对应关系,确定每个推送对象对应的行为值; 基于每个推送对象对应的行为值进行相关性计算,得到推送对象与推送对象之间的行为相关性值。
4.如权利要求1-3任一所述的方法,其特征在于,根据预存的用户信息确定基准推送对象包括: 获取所述用户对应的用户标识; 根据所述用户标识获取预存的该用户标识对应的基准推送对象。
5.如权利要求1所述的方法,其特征在于,根据对象聚类中推送对象对应的关键词得到该对象聚类的关键词包括: 获取对象聚类中推送对象对应的关键词; 确定所述关键词中每个关键词重复出现的次数,并根据所述重复出现的次数对关键词进行排序; 根据所述排序从关键词中选取K个关键词作为所述对象聚类的关键词,其中,K为正整数。
6.一种确定推送信息的装置,其特征在于,所述推送信息为描述推送对象的数据信息,该装置包括: 基准推送对象确定模块,当检测到用户浏览网页内容时,用于根据预存的用户信息和/或网页内容信息确定基准推送对象;对象聚类确定模块,用于确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中推送对象对应的关键词得到该对象聚类的关键词; 推送信息确定模块,用于获取所述至少一个对象聚类对应的目标关键词,根据所述目标关键词从信息推送系统中获取推送信息。
7.如权利要求6所述的装置,其特征在于,所述对象聚类确定模块根据推送对象对应文本介绍信息得到推送对象的文本相关性值包括: 对所述推 送对象对应文本介绍信息进行分词处理,得到每个推送对象的第一关键词组,该第一关键词组中包括多个关键词; 根据各推送对象的第一关键词组之间的相似度,计算得到各推送对象之间的文本相关性值。
8.如权利要求6所述的装置,其特征在于,所述对象聚类确定模块根据用户对推送对象的操作行为得到推送对象的行为相关性值包括: 获取每个推送对象对应的操作行为数据; 根据预设的每类操作行为与行为值之间的对应关系,确定每个推送对象对应的行为值; 基于每个推送对象对应的行为值进行相关性计算,得到推送对象与推送对象之间的行为相关性值。
9.如权利要求6-8任一所述的装置,其特征在于,基准推送对象确定模块根据预存的用户信息确定基准推送对象包括: 获取所述用户对应的用户标识; 根据所述用户标识获取预存的该用户标识对应的基准推送对象。
10.如权利要求6所述的装置,其特征在于,所述对象聚类确定模块根据对象聚类中推送对象对应的关键词组得到该对象聚类的关键词包括: 获取对象聚类中推送对象对应的关键词; 确定所述关键词中每个关键词重复出现的次数,并根据所述重复出现的次数对关键词进行排序; 根据所述排序从关键词中选取K个关键词作为所述对象聚类的关键词,其中,K为正整数。
【文档编号】G06F17/27GK103838756SQ201210483611
【公开日】2014年6月4日 申请日期:2012年11月23日 优先权日:2012年11月23日
【发明者】杨志雄, 苏煜, 邓中华 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1