移动应用信息推送方法和装置制造方法

文档序号:6514567阅读:402来源:国知局
移动应用信息推送方法和装置制造方法
【专利摘要】本发明公开了一种移动应用信息推送方法和装置,其中,所述移动应用信息推送方法包括:获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。本发明实现了根据客户端浏览的网页,捕捉到客户端当前的兴趣点,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
【专利说明】移动应用信息推送方法和装置
【技术领域】
[0001]本发明涉及计算机技术,尤其涉及一种移动应用信息推送方法和装置。
【背景技术】
[0002]随着计算机技术的不断发展,现有的移动应用的数量以百万计,但很多移动应用一直沉睡在移动应用商店中无人问津,使得这些移动应用无法被需要它的用户接触到并下载。因此,移动应用的分发机制一直是一个业界普遍关注的重要问题。
[0003]现有技术中,相比于移动应用搜索和各种应用排行榜,一般采用主动推送的方式更容易使不活跃的移动应用接触到用户,吸引用户去下载和使用,满足用户的潜在需求。该主动推送的过程为:根据用户属性给用户推荐一个或几个字符条,让用户去选择,然后根据用户选择的字符条,推荐给用户与这些文字描述相关联的移动应用;或者根据移动应用的类别,用户在移动应用商店中查看或下载移动应用的信息,以及用户使用移动应用的时长信息,来计算移动应用之间的相似度和与用户的推荐度。
[0004]但是,当根据用户属性进行推送时,用户需要主动选择某一字符条,然后再展现相关联的移动应用,使得这种推送方式较为繁琐,还有,字符条中的信息量有限,依据它推荐出来的移动应用不一定满足用户的需求或兴趣点;当根据移动应用的类别进行推送时,该推送方法依赖于用户查看、下载、使用移动应用的信息,当无法得到这些信息的时候,则无法采用该推送方法,使得该推送方法的局限性很大,而且,该推送方法的依据是用户的历史行为,而不能捕捉用户当前的兴趣点。

【发明内容】

[0005]有鉴于此,本发明实施例的目的在于提出一种移动应用信息推送方法和装置,以更加准确、便捷地获取客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
[0006]第一方面,本发明实施例提供了一种移动应用信息推送方法,所述方法包括:
[0007]获取客户端浏览的网页;
[0008]解析所述网页,得到网页内容;
[0009]计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息;
[0010]根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
[0011]第二方面,本发明实施例提供了 一种移动应用信息推送装置,所述装置包括:
[0012]获取模块,用于获取客户端浏览的网页;
[0013]解析模块,用于解析所述网页,得到网页内容;
[0014]处理模块,用于计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息;
[0015]推送模块,用于根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
[0016]本发明实施例获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息,实现了根据客户端浏览的网页,向客户端推送与网页相对应的移动应用,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
【专利附图】

【附图说明】
[0017]图1是本发明第一实施例的移动应用信息推送方法的流程图;
[0018]图2是本发明第二实施例的移动应用信息推送方法的流程图;
[0019]图3是本发明第三实施例的移动应用信息推送方法的流程图;
[0020]图4是本发明第四实施例的移动应用信息推送方法的流程图;
[0021]图5是本发明第五实施例的移动应用信息推送装置的示意图;
[0022]图6是本发明第六实施例的移动应用信息推送装置中处理模块的示意图;
[0023]图7是本发明第七实施例的移动应用信息推送装置中处理模块的示意图;
[0024]图8是本发明第八实施例的移动应用信息推送装置中处理模块的示意图。
【具体实施方式】
[0025]为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
[0026]本发明实施例提供的移动应用信息推送方法,通过获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息,实现了根据客户端浏览的网页,捕捉到客户端当前的兴趣点,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
[0027]图1是本发明第一实施例的移动应用信息推送方法的流程图。如图1所示,所述方法包括:
[0028]步骤110、获取客户端浏览的网页。
[0029]具体地,获取客户端浏览的网页的方式有很多,可以从浏览器获得客户端当前浏览的网页,也可以从网页所属的服务器获得客户端当前浏览的网页。如,当用户使用百度浏览器访问网页时,通过百度浏览器获得用户正在浏览的网页;或者,通过与各个网站合作,并在网站上嵌入调用移动应用推荐应用程序编程接口(Application ProgrammingInterface, API)的代码,从而获得用户正在浏览的网页。
[0030]步骤120、解析客户端浏览的网页,得到该网页的网页内容。
[0031]具体地,首先,对客户端浏览的超文本标记语言(Hypertext MarkupLanguage,HTML)网页进行解析,生成对应的HTML DOM树,其中,DOM是文档对象化模型(DocumentObject Model)的简称,DOM树是指通过DOM将HTML页面进行解析,并生成的HTMLtree树状结构和对应访问方法。
[0032]然后,遍历HTML DOM树,并从HTML DOM树中提取所需要的文字信息即网页内容,t匕如,标题、正文等。其中,网页上不同区域的文字可以采用不同的权重,比如,网页正文文本的权重为1、网页标题文本的权重为10,该权重代表了网页不同区域文本的重要性。
[0033]步骤130、计算网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据计算出的相似度选取与网页内容对应的移动应用描述信息。
[0034]具体地,移动应用数据库中包括各个移动应用信息,以及各个移动应用信息对应的移动应用描述信息,其中,将网页内容与移动应用数据库中各个移动应用描述信息进行相似度计算,目的是找到与网页内容相似度高的移动应用信息,使得这些移动应用信息更能出激发出用户下载移动应用的潜在需求。
[0035]步骤140、根据选取的移动应用描述信息向客户端推送相应的移动应用信息。其中,推送的移动应用信息至少包括移动应用的链接和描述,还可包括移动应用的图标或封面,其中,在计算机上链接可以是二维码。
[0036]具体地,向客户端推送相应的移动应用信息,是以客户端当前浏览的网页为依据,使得这些移动应用信息更能出激发出用户下载移动应用的潜在需求。
[0037]在本实施例的一个优选实施方式中,步骤110之前还包括:建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
[0038]其中,建立移动应用数据库的过程具体如下:`[0039](I)获取各个移动应用的移动应用描述信息,比如,在移动商店中的介绍信息中获取移动应用描述信息,或者通过静态解析技术从移动应用程序中提取的描述信息。
[0040]( 2 )提取各个移动应用的移动应用描述信息的移动应用关键词,计算所述关键词的权重,并根据所述移动应用关键词权重获得所述移动应用描述信息的权重向量信息。比如,对移动应用的描述信息进行移动应用关键词提取时,保留与该移动应用密切相关的词语,并根据词频 _ 逆向文件频率(Term Fequency -1nverse Document Frequency, TF-1DF)方法对每个关键词赋予权重,并删除权重较小的关键词。其中,TF-1DF是一种用于资讯检索与资讯探勘的常用加权技术。TF-1DF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
[0041]若对第m个移动应用描述信息中每一个关键词给予一个编号,则第m个移动应用描述信息可以表不成一个权重向量app文字m,如公式(I)所不。
[0042]app文字m= (b” b2,...,b”...,bn)公式(I)
[0043]其中,I3i表示第i个移动应用关键词的权重,η表示移动应用关键词的总数量。
[0044]另外,还可以对提取出的各个移动应用的移动应用描述信息的关键词建立移动应用关键词索引,该索引可以是倒排索引,也可以正排索引。其中,建立索引的目的是用于提高网页内容与移动应用描述信息的匹配效率。[0045](3)提取各个移动应用的移动应用描述信息的移动应用主题,计算所述移动应用主题的概率,并根据所有移动应用主题概率获得所述移动应用描述信息的概率分布向量。
[0046]具体地,采用主题模型计算移动应用主题的概率,比如,采用概率潜语义分析(probabilitistic Latent Semantic Analysis,pLSA)获取移动应用的描述信息的主题概率分布。其中,主题概率分布可以对一段文字的宏观描述,从而有效地避免无关词语偶然命中所带来的推送错误。PLSA是基于双模式和共现的数据分析方法延伸的经典的统计学方法。
[0047]若对第m个移动应用描述信息中每一个移动应用主题给予一个编号,则第m个移动应用描述信息还可以表示成一个概率向量app±jgm,如公式(2)所示。
[0048]app主题m= (tb” tb2,...,tb”...,tbn)公式(2)
[0049]其中,tbi表示第i个移动应用主题出现的概率,η表示网页主题的总数量。
[0050]上述(2)和(3)可以以任意顺序执行,也可以只执行(2)和(3)中的任意一个。
[0051]另外,上述(2)还可以对提取出的移动应用关键词建立移动应用关键词索引,该索引可以是倒排索引,也可以正排索弓丨。其中,建立索引的目的是用于提高网页内容与移动应用描述信息的匹配效率。
[0052]图2是本发明第二实施例的移动应用信息推送方法的流程图。如图2所示,所述方法包括:
[0053]步骤210和步骤220、与步骤110和步骤120相同,在这里不再赘述。
[0054]步骤230、提取网页内容的网页关键词。
[0055]具体地,提取网页内容的网页关键词是将网页内容中反映段落语义的描述性词语提取出来的过程。因为,网页内容有很多文字,但并不是所有文字都是有用的,比如,一些常用的词语“可以”、“已经”等出现频率非常高,但不反映文字段落的内容语义,所以只提取所需的关键词。
[0056]步骤240、计算网页关键词的权重。
[0057]具体地,根据TF-1DF计算提取出来的每个网页关键词的权重。
[0058]若对每一个网页关键词给予一个编号,则该网页内容可以表示成一个权重向量page文字,如公式(3)所示。
[0059]page文字=(a” a2,...,a”...,an)公式(3)
[0060]其中,表示第i个网页关键词的权重,n表示网页关键词的总数量。
[0061]步骤250、根据网页关键词的权重和移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度。
[0062]具体地,根据公式(I)和公式(3)计算网页内容与第m个移动应用描述信息的文字相似度的过程如公式(4)所示。
[0063]
【权利要求】
1.一种移动应用信息推送方法,其特征在于,所述方法包括: 获取客户端浏览的网页; 解析所述网页,得到网页内容; 计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息; 根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
2.根据权利要求1所述的移动应用信息推送方法,其特征在于,所述获取客户端浏览的网页之前,还包括: 建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
3.根据权利要求2所述的移动应用信息推送方法,其特征在于,所述计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括: 提取所述网页内容的网页关键词; 计算所述网页关键词的权重; 根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度; 根据计算出的所述文字相似度选取与所述网页内容对应的移动应用描述信息。
4.根据权利要求2所述的移动应用信息推送方法,其特征在于,所述计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括: 提取网页内容的网页主题; 计算所述网页主题的概率; 根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度; 根据计算出的所述主题相似度选取与所述网页内容对应的移动应用描述信息。
5.根据权利要求2所述的移动应用信息推送方法,其特征在于,所述计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括: 提取所述网页内容的网页关键词和网页主题; 计算所述网页关键词的权重和所述网页主题的概率; 根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;以及,根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度;确定所述文字相似度的权重和所述主题相似度的权重; 根据所述文字相似度和主题相似度、以及所述文字相似度的权重和所述主题相似度的权重,计算所述网页内容与各个移动应用描述信息的相似度; 根据计算出的所述网页内容与各个移动应用描述信息的相似度选取与所述网页内容对应的移动应用描述信息。
6.根据权利要求3或5所述的移动应用信息推送方法,其特征在于,所述移动应用数据库还包括移动应用关键词索引,所述根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度,包括: 在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
7.根据权利要求1所述的移动应用信息推送方法,其特征在于,所述根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括: 将所述计算出的相似度进行从大到小的排序后,选取前η个相似度对应的移动应用描述信息,所述选取的前η个移动应用描述信息为与所述网页内容对应的移动应用描述信息;或者,将所述计算出的相似度进行从小到大的排序后,选取后η个相似度对应的移动应用描述信息,所述选取的后η个移动应用描述信息为与所述网页内容对应的移动应用描述信息。`
8.一种移动应用信息推送装置,其特征在于,所述装置包括: 获取模块,用于获取客户端浏览的网页; 解析模块,用于解析所述网页,得到网页内容; 处理模块,用于计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息; 推送模块,用于根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
9.根据权利要求8所述的移动应用信息推送装置,其特征在于,所述装置还包括: 建立模块,用于建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
10.根据权利要求9所述的移动应用信息推送装置,其特征在于,所述处理模块包括: 第一提取单元,用于提取所述网页内容的网页关键词; 第一计算单元,用于计算所述网页关键词的权重,根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与所述移动应用数据库中各个移动应用描述信息的文字相似度; 第一选取单元,用于根据计算出的所述文字相似度选取与所述网页内容对应的移动应用描述信息。
11.根据权利要求10所述的移动应用信息推送装置,其特征在于,所述移动应用数据库还包括移动应用关键词索引,所述第一计算单元还用于在所述应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
12.根据权利要求9所述的移动应用信息推送装置,其特征在于,所述处理模块包括: 第二提取单元,用于提取网页内容的网页主题; 第二计算单元,用于计算所述网页主题的概率;根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与所述移动应用数据库中各个移动应用描述信息的主题相似度; 第二选取单元,用于根据计算出的所述主题相似度选取与所述网页内容对应的移动应用描述信息。
13.根据权利要求9所述的移动应用信息推送装置,其特征在于,所述处理模块包括: 第三提取单元,用于提取所述网页内容的网页关键词和网页内容的网页主题; 第三计算单元,用于计算所述网页主题的概率;根据所述网页关键词的权重和所述移 动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;以及,根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度; 确定单元,用于确定所述文字相似度的权重和所述主题相似度的权重; 第四计算单元,用于根据所述文字相似度和主题相似度、以及所述文字相似度的权重和所述主题相似度的权重,计算所述网页内容与各个移动应用描述信息的相似度; 第三选取单元,用于根据计算出的所述网页内容与各个移动应用描述信息的相似度选取与所述网页内容对应的移动应用描述信息。
14.根据权利要求13所述的移动应用信息推送装置,其特征在于,所述移动应用数据库还包括移动应用关键词索引,所述第三计算单元还用于在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
15.根据权利要求8所述的移动应用信息推送装置,其特征在于,所述处理模块具体用于将所述计算出的相似度进行从大到小的排序后,选取前η个相似度对应的移动应用描述信息,所述选取的前η个移动应用描述信息为与所述网页内容对应的移动应用描述信息;或者,将所述计算出的相似度进行从小到大的排序后,选取后η个相似度对应的移动应用描述信息,所述选取的后η个移动应用描述信息为与所述网页内容对应的移动应用描述信息。
【文档编号】G06F17/30GK103530339SQ201310463741
【公开日】2014年1月22日 申请日期:2013年10月8日 优先权日:2013年10月8日
【发明者】刘峰, 刘亦梁, 罗威, 王维煜 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1