商品推荐方法及系统的制作方法

文档序号:6491570阅读:179来源:国知局
商品推荐方法及系统的制作方法
【专利摘要】本发明提供了一种商品推荐方法,包括以下步骤:获取与当前商品的商品页具有链接关系的相关商品的商品页;根据所述链接关系计算当前商品与相关商品的第一关联度;获取与所述当前商品相关的信息页,确定在所述信息页中与当前商品具有共现关系的相关商品;根据所述共现关系计算当前商品与所述相关商品的第二关联度;根据第一关联度与第二关联度确定当前商品与所述相关商品的第三关联度;基于所述第三关联度确定当前商品的推荐商品。本发明还提供了一种实现前述方法的商品推荐系统。本发明的商品推荐方法及系统,能够降低商品推荐时数据处理量,并提高处理效率。
【专利说明】商品推荐方法及系统
【技术领域】
[0001]本申请涉及计算机数据处理【技术领域】,特别是涉及一种商品推荐方法及系统。
【背景技术】
[0002]随着电子商务的不断发展,越来越多的用户选择在网上进行购物。用户通过浏览器访问电子商务网站,就可以方便地选择自己所需要的商品。在很多情况下,电子商务网站会向用户进行商品推荐,例如,用户购买了某一种商品之后,会向其推荐与该商品相似或者关联的商品,又如,还可以向用户推荐新的上架的商品,打折的商品,热销的商品等等。通过商品推荐,一方面可以提高电子商务网站的销量,另一方面,主动推荐可以避免用户因为频繁搜索查找而产生的不必要的搜索请求,减轻网站服务器的负担。
[0003]一般来说,目前互联网上的电子商务网站是基于商品销售排行、用户对商品的评价评分或者对用户在电子商务网站的其他行为数据的分析来进行商品推荐。此种通过挖掘用户在网站中的行为数据的方式可以实现商品推荐,但是如果要实现精准的推荐,往往需要对大量的用户行为数据进行分析,因为如果只是依照少量的用户行为数据并无法准确的分析出用户行为,也就无法得到合适的推荐商品,为此,网站服务器所需要处理的数据量较大,效率较低。另外,因为商品和用户行为数据的不断更新,网站服务器需要实时进行数据维护和调整才能保证推荐信息的准确性,这无疑会增加网站服务器的负担。

【发明内容】

[0004]本申请提供一种商品推荐方法及系统,能够解决商品推荐时数据处理量大,效率低的问题。
[0005]为了解决上述问题,本申请公开了一种商品推荐方法,包括以下步骤:
[0006]获取与当如商品的商品页具有链接关系的相关商品的商品页;
[0007]根据所述链接关系计算当前商品与相关商品的第一关联度;
[0008]获取与所述当前商品相关的信息页,确定在所述信息页中与当前商品具有共现关系的相关商品;
[0009]根据所述共现关系计算当前商品与所述相关商品的第二关联度;
[0010]根据第一关联度与第二关联度确定当前商品与所述相关商品的第三关联度;
[0011]基于所述第三关联度确定当前商品的推荐商品。
[0012]进一步地,其中,与当如商品的商品页具有链接关系的相关商品的商品页包括当前商品的商品页所链接出去的页面及链接到当前商品的商品页的页面。
[0013]进一步地,获取与当如商品的商品页具有链接关系的相关商品的商品页的方法包括:
[0014]提取与当如商品的商品页具有链接关系的相关商品的商品页中包含的商品属性信息;
[0015]将所述提取的商品属性信息与预存商品库中所归属的商品的属性信息进行匹配。[0016]进一步地,获取与当前商品的商品页具有链接关系的相关商品的商品页的方法还包括:
[0017]获取所述预存商品库中所归属的商品和当前商品的种类,若属于相同种类或种类差异在预定范围内,则确定所述预存商品库中所归属的商品为相关商品,反之,则忽略所述商品。
[0018]进一步地,计算当前商品与相关商品的第一关联度的方法包括:
[0019]统计相关商品与当前商品的商品页之间产生链接关系的次数,根据所述次数确定
第一关联度。
[0020]进一步地,与所述当前商品相关的信息页包括与当前商品相关的商品页和/或资讯页和/或评测页。
[0021]进一步地,所述第三关联度为第一关联度及第二关联度的加权和。
[0022]本申请还公开了一种商品推荐系统,包括:
[0023]链接信息获取模块,用于获取当前商品所在的商品页的链接信息,确定与当前商品的商品页具有链接关系的相关商品的商品页;
[0024]第一关联度计算模块,用于根据所述链接关系计算当前商品与相关商品的第一关联度;
[0025]页面信息分析模块,用于获取与所述当前商品相关的信息页,确定在所述信息页中与当如商品具有共现关系的相关商品;
[0026]第二关联度计算模块,用于根据所述共现关系计算当前商品与所述相关商品的第
二关联度;
[0027]第三关联度计算模块,用于基于第一关联度及第二关联度计算确定各相关商品与所述当前商品的第三关联度;及
[0028]推荐模块,用于基于所述第三关联度确定当前商品的推荐商品。
[0029]进一步地,所述链接信息获取模块包括:
[0030]属性信息提取子模块,用于提取所述接入页和指出页的链接信息中包含的商品属性信息;
[0031]匹配子模块,用于将所述提取的商品属性信息与预存商品库中所归属的商品的属性信息进行匹配。
[0032]进一步地,所述链接信息获取模块还包括:
[0033]判断子模块,用于获取所述预存商品库中所归属的商品和当前商品的种类,若属于相同种类或种类差异在预定范围内,则确定所述预存商品库中所归属的商品为相关商品,反之,则忽略所述商品。
[0034]进一步地,第三关联度计算模块用于分别为第一关联度及第二关联度设定权重,将第一关联度及第二关联度的加权和作为所述第三关联度。
[0035]与现有技术相比,本申请包括以下优点:
[0036]本申请的商品推荐方法及系统通过对与商品相关的页面的链接信息和页面信息进行分析,并与预存商品库中的商品进行匹配的方式来确定两个商品之间的关联度,并依照关联度的高低进行商品推荐,此种方式无需依赖于用户行为数据,仅需要对商品所在的相关页的页面信息进行分析即可,因此所需要处理的数据量较小,可以降低网站服务器在商品推荐时的数据处理量和时间,提高处理效率。即使商品出现更新,例如增加或者减少时,也仅仅需要根据相关页进行处理,与随时发生变化的用户行为数据相比,商品的商品页、资讯页或评测页的数量和信息通常会相对固定,其变化量也是相对较小的数量,因此,其维护和更新所需要的工作量也较小,能够降低网站服务器的负担。
[0037]优选地,在进行初始关联度统计时,将与商品的商品页相关的商品和与商品的资讯页和/或评测页的商品分别作为统计原始数据,然后根据一定的权重进行叠加,从而得到最终的关联度,此种统计方式可以保证数据的有效性,避免过多的无效数据,从而减少实时处理的工作量并提高最终结果的准确性。
[0038]另外,在确定目标商品时,通过在预存的商品库中对商品进打分类,并将目标商品与当前商品的种类进行比较,当二者差异较大,超过预定范围,忽略该目标商品。通过此种方式,可以很好的屏蔽无关数据,从而提高推荐的精准度,并减少不必要的计算。
[0039]当然,实施本申请的任一商品不一定需要同时达到以上所述的所有优点。
【专利附图】

【附图说明】
[0040]图1是本申请的商品推荐实现的系统架构图;
[0041]图2是本申请的商品推荐方法实施例一的流程图;
[0042]图3是本申请的商品推荐系统实施例一的结构示意图。
【具体实施方式】
[0043]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和【具体实施方式】对本申请作进一步详细的说明。
[0044]参照图1,示出实现本申请的商品推荐系统的应用架构图,包括商品推荐系统(月艮务器)和客户端。下面对本申请的商品推荐方法及系统进行详细的说明。
[0045]参照图2,示出本申请的一种商品推荐方法实施例一,包括以下步骤:
[0046]步骤101,获取与当如商品的商品页具有链接关系的相关商品的商品页。
[0047]与当如商品的商品页具有链接关系的相关商品的商品页包括当如商品的商品页所链接出去的页面及链接到当前商品的商品信息页的页面。其中,具有链接关系的商品页所展示的商品往往在产品属性、功能上具有相关的关系,因此可以认为是相关的商品。商品页可以是展示商品信息的页面,包括对商品的描述及相关商品的链接信息。
[0048]商品页的页面数据中包含有各种元素,例如图片,视频、链接出去的1X1*1等等。当前商品的商品页所链接出去的页面可以通过对证1进行分析得到,因为证1具有固定的模式,因此可以利用常规的匹配方法获取其中所包含的信息。例如,可以通过正则表达式(指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串)等方法来将商品页中的证1中的链接信息提取出来。通过此种方式,在获取到当前商品所在的商品页的页面数据后,可以分析页面中所包含的所有链接出去的证1,从而确定该商品页的链接信息指向的指出页,即该商品页链接出去的VI所指向的其他商品的商品页。
[0049]进而,使用爬虫技术,可以找到全网的商品页数据。通过分析每一商品页的链接出去的页面地址,可以确定链入到当前商品页的所有其他商品的商品页。
[0050]其中,当前商品对应的商品页可能会有多个,其具体数量根据服务器能够获取到的数量为准。例如,对于商品a,可能在A网站和B网站都有进行销售,这时在两家网站都会有相应的商品页。此外,同一件商品也可由多个商品页进行展不。相应地,同一商品在不同网站的商品页所对应的接入页和指出页也可能不同。接入页即在相关商品的商品页中可以通过页面中的链接地址指向到当前商品页的页面。指出页即当前商品页通过页面中的链接地址所指向的页面。步骤102,根据所述链接关系计算当前商品与相关商品的第一关联度。
[0051]本申请的预存的商品数据库会存储不同的商品以及与所述商品相关的属性信息,例如品牌、型号等等。在获取到某个页面的链接关系后,可以基于链接关系对应的商品页所包含的商品描述、点评或者资讯等商品属性信息,与预存商品库中所归属的商品的属性信息进行匹配,并最终确定该页面与预存商品库中所归属的商品的对应关系,即当前商品与相关商品的对应关系。
[0052]可以理解,指向商品页的链接可能是一个,也可能是多个,同样的,商品页指出的链接也可能是一个或者多个。因此,最终确定的目标商品可能是一个,也可能是多个,这根据实际情况决定。
[0053]另外,因为服务器能够获取到的数据来源较多,预存商品库中所归属的同一个商品可能会与多个页面对应。其中,多个商品页可能对应预存商品库中的同一个商品,不同商品页指出或接入的不同页面也可能对应预存商品库中的同一个商品。
[0054]相关商品与当前商品的第一关联度可以通过统计相关商品与当前商品的商品页之间产生链接关系的次数来确定。
[0055]例如,假设当前商品a在三个网站中的商品页分别为A1、A2和A3。其中,AI有B1、B2两个接入页,指向B3 —个指出页;A2有Cl和C2两个接入页,指向C3和C4两个指出页;A3有Dl —个接入页,指向D2、D3和D4三个指出页。页面B1、B2、B3对应的目标商品分别为b、c、d ;页面Cl、C2、C3和C4对应的目标商品分别为e、C、d、f ;页面Dl、D2、D3和D4对应的目标商品分别为d、c、e、b。那么,在当前商品a所在三个商品页Al、A2和A3的所有指出页和接入页所对应的目标商品中,b出现的次数为2、c出现的次数为3、d出现的次数为
3、e出现的次数为2、f出现的次数为I。也即,当前商品a和目标商品b、C、d、e、f的产生链接关系的次数分别为2、3、3、2、I。
[0056]可以直接将产生链接关系的次数作为当前商品与相关商品的第一关联度,也可以确定一个权重值,将产生链接关系的次数与权重值的乘积作为二者的第一关联度。具体的可以根据实际应用时的计算规则来确定,本申请对此并不限制。
[0057]优选地,为了减少数据处理的数量,并提高推荐精准度,还可以在前述步骤102的基础上,在通过接入页和指出页确定相关商品时进行优化处理。具体包括:在预存的商品数据库中对商品进行分类,若某个接入页和指出页对应的商品与当前商品属于相同种类或者种类差异在预定范围内,确定该商品为相关商品,若属于不同的种类或者种类差异超过预定范围,则忽略该商品。其中,种类超过预定范围可以根据实际情况判定,例如不属于同一大类。比如,当前商品属于手机,若接入页或指出页对应的相关商品属于电子产品,或者手机配件等种类,则可以认为二者具有一定的关联度。若某一商品属于书包或者文具等种类,则可以认为该商品与当前商品种类差异较大,超过预定范围,忽略该商品。通过此种方式,可以很好的屏蔽无关数据,从而提高推荐的精准度,并减少不必要的计算。
[0058]步骤103,获取与所述当前商品相关的信息页,确定在所述信息页中与当前商品具有共现关系的所述相关商品。
[0059]与所述当前商品相关联的信息页是指涉及到当前商品的所有页面,包括商品的商品页、资讯页、评测页等。只要在这些信息页的页面信息中出现的其他商品都可以认为是与当前商品具有共现关系的商品。例如,一款手机所在的信息页的页面信息中,除了该款手机,还可能包括其他款手机或者手机配件等商品,那么这些其他款手机或者手机配件就可以认为是与该款手机在所述信息页的页面信息中具有共现关系。与当前商品具有共现关系的商品也可以认为是当前商品的相关商品。步骤104,根据所述共现关系计算当前商品与所述相关商品的第~ 关联度。
[0060]当前商品与相关商品之间的第二关联度也可以采用当前商品与相关商品的共现关系来确定。即统计在信息页的页面信息中,当前商品与每个相关商品共同出现的次数。同样的,可以直接将共现次数作为当前商品与相关商品的第二关联度,也可以确定一个权重值,将共现次数与权重值的乘积作为二者的第二关联度。具体的可以根据实际应用时的计算规则来确定,本申请对此并不限制。
[0061]一般来说,在资讯页和/或评测页的页面信息中所提及的商品之间的关联度会较高,因为通常习惯是将两种或几种具有一定相似度或相关度的商品进行比较或者评论。
[0062]因此在步骤103中,优选地,信息页也可以仅包括资讯页和/或评测页。在此种情况下,为了提高处理效率和准确性,服务器中还可以预先对商品的信息页进行分类,例如分为:商品页、资讯页、评测页等等。在分类完成后,可以为每一类别添加标识,以便后续区分和识别。在后续处理时,根据预先的分类便可以直接获取到相关信息并进行统计。例如,统计当前商品和相关商品的第一关联度时,仅考虑商品页的数据,统计当前商品和相关商品的第二关联度时,仅考虑资讯页和/或评测页的数据,因为预先已经进行分类,可以直接根据分类标识获取到各页面的类别,而不需要在统计时才进行分类和区别。通过此种方式可以保证数据的有效性,避免统计过程中加入过多的无效数据,从而可以减少实时处理的工作量,并提高处理效率和最终结果的准确性。
[0063]步骤105,根据第一关联度与第二关联度确定当前商品与所述相关商品的第三关联度。
[0064]其中,第三关联度可以是第一关联度与第二关联度的加权和。
[0065]因为步骤102和步骤103的相关商品可能部分重叠,在确定第三关联度时,可以直接将重叠的二者相加,也可以通过分别乘以权重后相加的方式来计算,这根据实际的计算公式需要来决定。
[0066]例如,当前商品为X,相关商品分别为a、b、c。假设,当前商品X与相关商品a、b、c的商品页发生链接关系的次数分别为3、3、2,X与a、b、c共现的次数分别为3、4、3。因此,当前商品X与商品a、b、c的第一关联度分别为3、3、2,当前商品X与商品a、b、c的第二关联度分别为3、4、3。
[0067]第三关联度可以是第一关联度与第二关联度直接相加所得和,即,X和a、b、c的第三关联度分别为6、7、5。可以理解的,也可以分别为第一关联度与第二关联度设定权重,第三关联度则为第一关联度与第二关联度的加权和。假设当前商品与相关商品的第一关联度的权重为0.3,当前商品与相关商品的第二关联度的权重为0.7,那么X和a、b、c、d的第三关联度分别为 3X0.3+3X0.7=3,3X0.3+4X0.7=3.7,2X0.3+3X0.7=2.7。[0068]步骤106,基于第三关联度确定当前商品的推荐商品。
[0069]可以根据第三关联度的数值从大到小对各相关商品进行排序,将预定数量的排序在前的相关商品作为当前商品的推荐商品,并进行推荐。也可以预设一阈值,将第三关联度大于或等于该阈值的相关商品作为当前商品的推荐商品。
[0070]本申请通过对与商品相关的页面的链接信息和页面信息进行分析,并与预存的商品数据库中的商品进行匹配的方式来确定两个商品之间的关联度,并依照关联度的高低进行商品推荐,此种方式无需依赖于用户行为数据,仅需要对商品所在页面的信息进行分析即可,因此所需要处理的数据量较小,可以大大降低网站服务器在商品推荐时的数据处理量和时间,提高处理效率。即使商品出现更新,例如增加或者减少时,也仅仅需要根据相关页面进行处理,与随时发生变化的用户行为数据相比,商品的商品页、资讯页或评测页的数量和信息通常会相对固定,其变化量也是相对较小的数量,因此,其维护和更新所需要的工作量也较小,能够降低网站服务器的负担。
[0071]参照图3,示出本申请的商品推荐系统实施例一,包括链接信息获取模块10、第一关联度计算模块20、页面信息分析模块30、第二关联度计算模块40、第三关联度计算模块50和推荐模块60。
[0072]链接信息获取模块10,用于获取当前商品所在的商品页的链接信息,确定与当前商品的商品页具有链接关系的相关商品的商品页。
[0073]第一关联度计算模块20,用于根据所述链接关系计算当前商品与相关商品的第一关联度。
[0074]页面信息分析模块30,用于获取与所述当前商品相关的信息页,确定在所述信息页中与当如商品具有共现关系的相关商品。
[0075]第二关联度计算模块40,用于根据所述共现关系计算当前商品与所述相关商品的
第二关联度。
[0076]第三关联度计算模块50,用于基于第一关联度及第二关联度计算确定各相关商品与所述当前商品的第三关联度。
[0077]优选地,第三关联度计算模块50用于分别为第一关联度及第二关联度设定权重,将第一关联度及第二关联度的加权和作为所述第三关联度。
[0078]推荐模块60,用于基于所述第三关联度确定当前商品的推荐商品。优选地,该链接信息获取模块10包括属性信息提取子模块和匹配子模块。其中,属性信息提取子模块,用于提取所述接入页和指出页的链接信息中包含的商品属性信息;匹配子模块,用于将所述提取的商品属性信息与预存商品库中所归属的商品的属性信息进行匹配。
[0079]优选地,该链接信息获取模块10还包括判断子模块,用于获取所述预存商品库中所归属的商品和当前商品的种类,若属于相同种类或种类差异在预定范围内,则确定所述预存商品库中所归属的商品为相关商品,反之,则忽略所述商品。
[0080]本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0081]本申请是参照根据本申请实施例的方法、设备(装置?、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0082]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0083]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0084]以上对本申请所提供的商品推荐方法及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
【权利要求】
1.一种商品推荐方法,其特征在于,包括以下步骤: 获取与当如商品的商品页具有链接关系的相关商品的商品页; 根据所述链接关系计算当前商品与相关商品的第一关联度; 获取与所述当前商品相关的信息页,确定在所述信息页中与当前商品具有共现关系的相关商品; 根据所述共现关系计算当前商品与所述相关商品的第二关联度; 根据第一关联度与第二关联度确定当前商品与所述相关商品的第三关联度; 基于所述第三关联度确定当前商品的推荐商品。
2.如权利要求1所述的商品推荐方法,其特征在于,其中,与当前商品的商品页具有链接关系的相关商品的商品页包括当前商品的商品页所链接出去的页面及链接到当前商品的商品页的页面。
3.如权利要求1所述的商品推荐方法,其特征在于,获取与当前商品的商品页具有链接关系的相关商品的商品页的方法包括: 提取与当前商品的商品页具有链接关系的相关商品的商品页中包含的商品属性信息; 将所述提取的商品属性信息与预存商品库中所归属的商品的属性信息进行匹配。
4.如权利要求3所述的商品推荐方法,其特征在于,获取与当前商品的商品页具有链接关系的相关商品的商品页的方法还包括: 获取所述预存商品库中所归属的商品和当前商品的种类,若属于相同种类或种类差异在预定沮围内,则确定所述预存商品库中所归属的商品为相关商品,反之,则忽略所述商品O
5.如权利要求1所述的商品推荐方法,其特征在于,计算当前商品与相关商品的第一关联度的方法包括: 统计相关商品与当前商品的商品页之间产生链接关系的次数,根据所述次数确定第一关联度。
6.如权利要求1所述的商品推荐方法,其特征在于,与所述当前商品相关的信息页包括与当前商品相关的商品页和/或资讯页和/或评测页。
7.如权利要求1所述的商品推荐方法,其特征在于,所述第三关联度为第一关联度及第二关联度的加权和。
8.—种商品推荐系统,其特征在于,包括: 链接信息获取模块,用于获取当前商品所在的商品页的链接信息,确定与当前商品的商品页具有链接关系的相关商品的商品页; 第一关联度计算模块,用于根据所述链接关系计算当前商品与相关商品的第一关联度; 页面信息分析模块,用于获取与所述当前商品相关的信息页,确定在所述信息页中与当iu商品具有共现关系的相关商品; 第二关联度计算模块,用于根据所述共现关系计算当前商品与所述相关商品的第二关联度; 第三关联度计算模块,用于基于第一关联度及第二关联度计算确定各相关商品与所述当前商品的第三关联度;及 推荐模块,用于基于所述第三关联度确定当前商品的推荐商品。
9.如权利要求8所述的商品推荐系统,其特征在于,所述链接信息获取模块包括: 属性信息提取子模块,用于提取所述接入页和指出页的链接信息中包含的商品属性信息; 匹配子模块,用于将所述提取的商品属性信息与预存商品库中所归属的商品的属性信息进行匹配。
10.如权利要求9所述的商品推荐系统,其特征在于,所述链接信息获取模块还包括: 判断子模块,用于获取所述预存商品库中所归属的商品和当前商品的种类,若属于相同种类或种类差异在预定范围内,则确定所述预存商品库中所归属的商品为相关商品,反之,则忽略所述商品。
11.如权利要求8所述的商品推荐系统,其特征在于,第三关联度计算模块用于分别为第一关联度及第二关联度设定权重,将第一关联度及第二关联度的加权和作为所述第三关联度。
【文档编号】G06Q30/02GK103839172SQ201210484777
【公开日】2014年6月4日 申请日期:2012年11月23日 优先权日:2012年11月23日
【发明者】刘佳, 陈维, 赵文峰, 孙牧 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1