一种针对页面动态元素的推荐方法和系统的制作方法

文档序号:6543265阅读:243来源:国知局
一种针对页面动态元素的推荐方法和系统的制作方法
【专利摘要】本申请提供了一种针对页面动态元素的推荐方法和系统,涉及网络【技术领域】。所述方法包括:判断用户触发的当前页面中是否存在动态元素;如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。本发明在查询深度上更紧密的靠近了用户本身的注意力的关注点,可使用户更便捷的从服务器获得与关注点相关的信息,可更精确、更实时的对用户的关注点进行跟踪。
【专利说明】一种针对页面动态元素的推荐方法和系统
【技术领域】
[0001]本申请涉及网络【技术领域】,特别是涉及一种针对页面动态元素的推荐方法和系统。
【背景技术】
[0002]用户在通过浏览器进行网页浏览时,服务提供商为了向用户提供更多的信息量,往往利用服务器向用户推荐一些查询串附在浏览器的底边。现有技术中,用户进行页面浏览时,浏览器对当前页面进行页面分析,查找到对应的关键词,再将关键词上传至用于服务器中,由该服务器进行分析计算,通过数据模型得到关键词相关的推荐查询串,如上传的关键词为“天气”、“北京”,则由服务器对关键词进行分析,在数据模型中查询“天气”、“北京”相关的相关词,如“雾霾”、“七天”,并将相关词连同关键词组成推荐查询串以链接的形式返回给客户端“北京未来7天天气”、“北京天气查询”、“北京天气pm2.5”等附在底边栏,待用户触发某推荐查询串时,将该推荐查询串发送至默认的搜索引擎中,从而让用户获得了更多的与当前页面相关的信息。
[0003]在上述过程中,当用户查看某个页面时,往往首先由浏览器对当前页面的页面内容进行分析,如将页面的标题、文本、评论等分别赋予不同的权重参数,并按文本内容进行切分,从得到的各分词中按频率进行筛选,并按权重参数对当前页面的文本内容进行提取,从而得到关键词和对应的相关度。
[0004]将关键词和对应的相关度分别上传至用于推荐的服务器端,并结合网页库中的索引进行分析,匹配相关的推荐查询串,将排前的推荐查询串下发至客户端或直接嵌入至当前页面。当用户点击对应的推荐查询串时,直接将推荐查询串发送至默认的搜索引擎,得到的搜索结果为与当前页面相关的多个条目链接,从而向用户提供了一定的网络信息。
[0005]但是,上述过程中,只基于静态页面的主体内容进行分析,静态页面对应的文本内容固定不变,所以静态页面包括的信息容量有限,在文本分析的过程中,得到推荐的推荐查询串固定不变,一旦用户在阅读的过程中关注点发生变化,往往不能及时反映用户当前的关注点。

【发明内容】

[0006]本申请所要解决的技术问题是提供一种针对页面动态元素的推荐方法和系统,以解决现有技术中只针对静态页面的主题内容进行分析,无法跟随用户关注的动态内容进行词串推荐,导致服务器的推荐查询串不能及时与网页中的动态内容对应,以至推荐查询串不够精确的问题。
[0007]为了解决上述问题,本申请公开了一种针对页面动态元素的推荐方法,其特征在于,包括:
[0008]判断用户触发的当前页面中是否存在动态元素;
[0009]如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
[0010]根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
[0011]优选的,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词,包括:
[0012]获取所述动态元素的播放内容对应的文本内容;
[0013]根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
[0014]根据所述目标文本提取各个关键词。
[0015]优选的,所述获取对应所述动态元素的播放内容对应的文本内容,包括:
[0016]获取所述动态元素对应的属性信息,并根据所述属性信息从第二服务器获取对应的文本内容。
[0017]优选的,所述获取对应所述动态元素的播放内容对应的文本内容,包括:
[0018]根据所述当前 页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
[0019]优选的,所述根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本,包括:
[0020]对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
[0021]根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
[0022]以所述进度比例为基准确定阈值范围,计算所述阈值范围内的η个语义单元,并将所述η个语义单元作为对应所述播放进度的目标文本;其中,N、η为整数,且0〈η〈Ν。
[0023]优选的,所述计算当前播放的时长占播放总时长的进度比例,包括:
[0024]每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
[0025]优选的,还包括:
[0026]当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
[0027]将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
[0028]优选的,还包括:
[0029]当接收到用户关闭所述弹出框的动作时,重新根据所述父页面的内容获取关键
ο
[0030]优选的,还包括:
[0031]结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
[0032]本发明还公开了一种针对页面动态元素的推荐系统,包括:
[0033]动态判断模块,适于判断用户触发的当前页面中是否存在动态元素;
[0034]关键词提取模块,适于如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
[0035]推荐查询串展示模块,适于根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
[0036]优选的,所述关键词提取模块包括:
[0037]文本内容获取模块,适于从取所述动态元素的播放内容对应的文本内容;
[0038]目标文本获取模块,适于根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
[0039]第二关键词提取模块,适于根据所述目标文本提取各个关键词。
[0040]优选的,所述目标文本获取模块包括:
[0041]语义单元分析模块,适于对对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
[0042]播放进度计算模块,适于根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
[0043]第一目标文本获取模块,适于以所述进度比例为基准确定阈值范围,计算所述阈值范围内的η个语义单元,并将所述η个语义单元作为对应所述播放进度的目标文本;其中,队11为整数,且0〈11〈叱
[0044]优选的,还包括:
[0045]弹出框提取模块,适于当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
[0046]第三关键词提取模块,适于将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
[0047]优选的,还包括:
[0048]优化模块,适于结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
[0049]与现有技术相比,本申请包括以下优点:
[0050]首先,相对现有技术,其只是对页面的静态内容进行分析,获取关键词提供给搜索引擎以得到相关联的推荐查询串,其只能直接针对页面中的静态文本进行语义分析得到关键词,上传至服务器以获取推荐查询串,该种方式其搜索范围窄,无法为在更深的查询深度和更广的查询广度上,为用户提供更优质的搜索服务。而本发明可针对用户当前浏览的网页,针对其中动态元素(动态元素包括视频、flash、弹框等非静态的、固化于网页中的内容),获取动态元素的播放内容对应的各个关键词,从第一服务器获推荐查询串,其在查询广度上拓宽了推荐查询串的推荐来源,在查询深度上更紧密的及时靠近了用户本身的注意力的关注点(比如用户在网页中观看电视剧时,其关注点是随着剧情的发展而改变的)。
[0051]其次,由于本发明可以基于动态元素的播放内容获得个关键词,继而从服务器获得推荐查询串,其推荐查询串更精确的跟随用户的兴趣和关注点的,因此,在此基础之上,用户不用进行大量的文字输入和页面操作,即可更便捷的从服务器获得与关注点相关的信肩、O[0052]再次,由于本发明针对的是动态元素的内容,其信息容量很大,相对于现有技术中的静态分析的对象,其可不断根据动态元素的内容获得新的推荐查询词串,对比现有技术的推荐查询词串固定不变的状态,本发明更精确、更实时的对用户的关注点进行跟踪。
【专利附图】

【附图说明】
[0053]图1是本发明实施例一的一种针对页面动态元素的推荐方法的流程示意图;
[0054]图2是本发明实施例二的一种针对页面动态元素的推荐方法的流程示意图;
[0055]图3是本发明实施例三的一种针对页面动态元素的推荐方法的流程示意图;
[0056]图4是本发明实施例四的一种针对页面动态元素的推荐系统的结构示意图;
[0057]图5是本发明实施例五的一种针对页面动态元素的推荐系统的结构示意图。
【具体实施方式】
[0058]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和【具体实施方式】对本申请作进一步详细的说明。
[0059]【背景技术】中的方案,针对现有的搜索推荐往往只基于静态页面的主体内容进行分析,其一般只是单纯的、静态的分析用户当前触发的页面中的html文档中的文本信息,而静态页面对应的文本内容固定不变,所以静态页面包括的信息容量有限,在文本分析的过程中,得到关键词也固定不变,进而得到的推荐查询串也不会改变。那么在用户的页面一直处于打开状态时,其关键词知道用户关闭该页面或者访问其他页面时才会有所改变,但是当用户访问的页面中存在动态元素时(比如视频、flash、弹出框等),用户浏览时,其内容是存在变化的,从而用户的兴趣和关注点也存在变化,这种情况下,【背景技术】得到的推荐查询串无法随着用户在浏览动态元素时,随之而相应进行跟踪,无法更深更广的针对动态内容获得精确度和契合度更高的推荐查询串。
[0060]本发明的核心思想之一是:本发明针对动态元素的播放内容获取初始的关键词,然后再基于这些关键词去服务器获取推荐查询串,从而使推荐查询串可以根据动态元素的播放内容实时进行更新,以跟踪用户在播放过程中的关注点,在查询深度和广度上进一步提高服务商的搜索服务效率和质量,降低用户对查询的繁琐操作过程。
[0061]实施例一
[0062]参照图1,示出了本发明实施例一的一种针对页面动态元素的推荐方法的流程示意图,具体可以包括:
[0063]步骤110,判断用户触发的当前页面中是否存在动态元素;
[0064]在本发明实施例中,可对用户触发的当前页面进行解析,判断页面中是否存在动态元素。其中,解析当前页面,判断是否存在动态元素存在多种方式,本发明不对其加以限制。比如,针对各网站的网页预置解析模板,比如针对土豆网的各种类型网页预置解析模板,当用户触发土豆网的网页时,即可采用相应的解析模板进行解析。又比如,提取动态元素的核心特征或者特征组合,解析网页代码中是否存在该种特征或者特征组合,如果存在,则认为存在动态元素,比如对于富媒体对象的动态元素,其往往以.flv,.MP4等后缀进行结尾,那么当在网页中解析到上述特征后,即可判断网页中存在动态元素。
[0065]当然,还可直接根据服预置的页面链接的属性进行链接分析,比如可以预先对各视频网站播放视频的URL记录为存在动态元素,那么本发明实施例则可将当前页面的URL与前述记录的URL进行比较,如果匹配则说明存在动态元素。另外基于链接的判断还可以采用其他方法,比如基于各网站设置URL的正则表达式,然后对当前网页的URL以这些正则表达式进行判断。
[0066]本发明实施例中所述的动态元素,其可以理解为使页面展示内容发生实质变化的元素,比如网页中的富媒体对象,即视频等富媒体对象,当播放时,其页面的展示内容实质上在变化,用户的主要关注点关注在视频当前播放的内容;又比如页面中的弹出框,页面中的弹出框提供了一种快捷信息的展示途径,但在弹出框弹出时,页面中的内容将发生变化,用户的主要关注点关注在弹出框中的文本内容;等等其他类似元素。
[0067]步骤120,如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
[0068]当判断出用户触发的网页中有动态元素后,在用户观看动态元素的播放内容的过程中,针对在动态元素中当前展示的播放内容,获取对应的各个关键词。在本发明实施例中,根据动态元素的播放进度,不断对播放内容进行分析,可分别得到所述播放内容在当前播放进度下对应的各个关键词。
[0069]本发明实施例为了使获取的关键词可以更精准的跟踪用户兴趣点,则根据当前的播放内容去提取关键词。
[0070]在本发明实施例中,如果判断出不存在动态元素,则可停止后续操作步骤。
[0071]在本发明实施例中,针对所述播放内容获取各个关键词可采用各种通用的方法,本申请不对其加以限制。比如:
[0072]子步骤S11,对当前的播放内容对应的目标文本进行分词。分词的方法有很多种,比如下面几种方法:
[0073]1、基于字符串匹配的分词方法:是指按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。实际使用的分词系统,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。
[0074]2、基于统计的分词方法:是指中文信息中由于字与字相邻共现的频率或概率能够较好的反映成词的可信度,所以可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息,以及计算两个汉字X、Y的相邻共现概率。互现信息可以体现汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典。
[0075]子步骤S12,从分词后的结果中选择关键词。选择关键词的方式可采用多种方法,本发明可米用 TF/IDF (term frequency -1nverse document frequency 是一种用于资讯检索与资讯探勘的常用加权技术)选择关键词。TF/IDF算法基于计算该词语的全局重要性。比如对于一个电视剧来说,用户当前观看某一集时,对于当前播放内容的对应的当前的文本内容,进行分词后得到η个词,那么首先统计这η个词在当前观看剧集的剧情文本中各自的出现次数Ni,还统计包括这些词的剧情文本份数Mi,然后以每个词的的出现次数Ni和当前剧情文档中的词的总数计算TFi,以Mi和剧情文档总数计算IDFi,最后即可计算TFADFi,其权重的意义大致为:对区别文档最有意义的词语应该是那些在文档中出现频率高,而在整个文档集合的其他文档中出现频率少的词语。那么选择权重大的词为关键词。
[0076]tWn,对于电视剧《甄嫘传》播放的某一集,分集介绍中对应的文本内容到“甄嫘无意中发现碎玉轩海棠树不开花的秘密一树底下被人埋了大量麝香”进度时,获取上述文本,然后进行分词,然后利用上述TF/IDF算法,则可选择“麝香”作为关键词。
[0077]如此,本发明实施例在获取了各个关键词后,可将其上传至第一服务器,然后即可由第一服务器执行步骤130。
[0078]步骤130,根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
[0079]在本发明实施例中,第一服务器收到客户端(比如通过浏览器)上传的各个关键词后,会基于各个关键词进行分析,通过数据模型查询相关的推荐查询串,然后将推荐查询串以链接的形式返回给客户端或直接嵌入至当前页面,如此则可在动态元素当前展示的播放内容附近,对推荐查询串进行对应的展示,以方便用户进行点击。在本发明实施例中,推荐查询串可以采用链接的形式展示的前述用户触发的页面中,当用户点击该推荐查询串时,浏览器即可基于其对应的链接向其指向的服务器发送http请求。
[0080]在本发明实施例中,也可采用多种基于各关键词获取推荐查询串的方法,本发明不对其加以限制。本发明可采用主题模型(Latent Dirichlet Allocation)对各关键词进行主题相关性计算,获得与相应主题相关的推荐查询串。主题模型公式大致可以理解为:
[0081]
【权利要求】
1.一种针对页面动态元素的推荐方法,其特征在于,包括: 判断用户触发的当前页面中是否存在动态元素; 如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词; 根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
2.根据权利要求1所述的方法,其特征在于,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词,包括: 获取所述动态元素的播放内容对应的文本内容; 根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本; 根据所述目标文本提取各个关键词。
3.根据权利要求2所述的方法,其特征在于,所述获取对应所述动态元素的播放内容对应的文本内容,包括: 获取所述动态元素对应的属性信息,并根据所述属性信息从第二服务器获取对应的文本内容。
4.根据权利要求2所述的方法,其特征在于,所述获取对应所述动态元素的播放内容对应的文本内容,包括: 根据所述当前页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
5.根据权利要求2所述的方法,其特征在于,所述根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本,包括: 对所述文本内容进行切分,获得按文档顺序排列的N个语义单元; 根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例; 以所述进度比例为基准确定阈值范围,计算所述阈值范围内的η个语义单元,并将所述η个语义单元作为对应所述播放进度的目标文本;其中,Ν、η为整数,且0〈η〈Ν。
6.根据权利要求5所述的方法,其特征在于,所述计算当前播放的时长占播放总时长的进度比例,包括: 每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
7.根据权利要求1或2所述的方法,其特征在于,还包括: 当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框; 将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
8.根据权利要求7所述的方法,其特征在于,还包括: 当接收到用户关闭所述弹出框的动作时,重新根据所述父页面的内容获取关键词。
9.根据权利要求1所述的方法,其特征在于,还包括:结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
10.一种针对页面动态元素的推荐系统,其特征在于,包括: 动态判断模块,适于判断用户触发的当前页面中是否存在动态元素; 关键词提取模块,适于如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词; 推荐查询串展示模块,适于根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
11.根据权利要求10所述的系统,其特征在于,所述关键词提取模块包括: 文本内容获取模块,适于从取所述动态元素的播放内容对应的文本内容; 目标文本获取模块,适于根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本; 第二关键词提取模块,适于根据所述目标文本提取各个关键词。
12.根据权利要求11所述的系统,其特征在于,所述目标文本获取模块包括: 语义单元分析模块,适于对对所述文本内容进行切分,获得按文档顺序排列的N个语义单元; 播放进度计算模块,适于根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例; 第一目标文本获取模块,适于以所述进度比例为基准确定阈值范围,计算所述阈值范围内的η个语义单元,并将所述η个语义单元作为对应所述播放进度的目标文本;其中,N、η为整数,且0〈η〈Ν。
13.根据权利要求10或11所述的系统,其特征在于,还包括: 弹出框提取模块,适于当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框; 第三关键词提取模块,适于将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
14.根据权利要求10所述的系统,其特征在于,还包括: 优化模块,适于结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
【文档编号】G06F17/30GK103942285SQ201410140686
【公开日】2014年7月23日 申请日期:2014年4月9日 优先权日:2014年4月9日
【发明者】柴思远, 张阔, 王灿辉 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1