一种基于回归模型的电子商务推荐方法

文档序号:6603191阅读:171来源:国知局
专利名称:一种基于回归模型的电子商务推荐方法
技术领域
本发明涉及一种统计技术,具体说,涉及一种基于回归模型的电子商务推荐方法。
背景技术
电子商务的蓬勃发展使得商家和消费者都面临着比传统的实体店铺销售模式更加丰富的选择。但同时,海量的商品信息很容易造成消费者的迷茫,缺乏与消费者的直接接触,使得商家很难把握消费者的偏好。为了解决这种困境,网上推荐技术得到了快速发展。 目前,网页推荐技术已经被广泛应用在国内外各大电子商务网站之中,如Amazon等,商家可以根据用户过往的购买历史和评分,向其推荐用户最可能接受的新的产品。推荐方法是推荐系统的核心,因为推荐方法直接决定推荐系统的准确性。而目前国内推荐系统的推荐方法单一,不能综合运用多种模型方法。根据产生推荐所需要的数据来源和数据的使用方法,目前的推荐技术可以分为五类,包括基于内容的推荐、协同过滤、 基于人口统计的推荐、基于效用的推荐和基于知识的推荐。其中,协同过滤(Collaborative FilteringRecommendation)是目前推荐系统中应用最多、最广的。基于协同的推荐是指推荐系统根据目标客户与其他客户之间的相关性进行推荐,当系统发现一个或一组客户与目标客户的消费偏好相似时,系统就可以根据这些用户的消费行为来预测目标用户的消费行为。协同过滤问题是预测用户对于某个过去没有评价过的对象的喜爱程度,预测的依据是过去用户群体对一系列对象的历史评价记录。协同推荐技术最大的优点是完全不需要任何被推荐项的内容,因此,在难以分析被评价对象的内容,如图像,音乐,视频等时,它是非常好的选择。
sim (i,j)=主要采用的模型为hARuj二尺,)(Ruj - R)— 用户土和
V^lARtij 一 WV^uiR^-Rf
j之间的相似性方法如下首先得到用户i和评分过的所有项,然后通过上述公式计算它们之间的相似性。 其中,Ii、j表示用户i和j共同评分过的项目集合,Ii和Ij分别表示用户i和用户j评分过的项目集合,Ru, i和Ru, j分别表示用户i和用户j对项目c的评分,Ri和Rj分别表示用户i和用户j对项目的评分。计算完用户之间的相似度后,对一个用户u,产生一个按照相似度大小排列的“邻居”集合N= {Ul,U2,「,Ut},0彡t彡m,u不属于N,从Ul到Ut, sim(u,Ui) (1 ^ i ^ t)从大到小排列。根据上一步相似度计算的结果,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N = 10。现有技术存在的问题如下(一)新用户问题推荐系统中对用户的分类是依据目标用户与其它用户的比较,这种比较主要是基于不断累积的用户评价,所以做出较少评价的用户群(如新用户)将难以分类。(二)稀疏性问题随着电子 商务系统规模的扩大,用户数目和商品数目呈指数级的增加,每个用户一般只对很少的对象进行评价,使得整个数据矩阵变得非常稀疏,导致很多推荐算法难以计算用户间的相似性,难以找到相似的邻居用户。特别是协同过滤技术,它依赖的是用户间评价的交集,当用户评价较少时,协同过滤无法为用户找到它的邻居集进行推荐。

发明内容
本发明所解决的技术问题是提供一种基于回归模型的电子商务推荐方法,解决了协同过滤模型新用户和数据稀疏性的问题。技术方案如下一种基于回归模型的电子商务推荐方法,包括建立回归模型,所述回归模型包括偏好结构模型;根据所述回归模型和偏好结构得出特定用户所在的群体对于特定类别产品的过往评价,根据所述过往评价对所述特定类别产品的将来评价进行预测。进一步所述建立回归模型包括喜爱程度参数、评价架构和偏好结构模型,所述偏好结构模型根据所述喜爱程度参数和评价架构得出。进一步所述喜爱程度参数Zij = βΧ+ε⑴其中,i代表用户,j代表产品。进一步所述评价架构Pr (Yij= κ) =Pr(Kk_1<ZiJ^ κ k),其中评分为 Yjj,Yij =k代表用户i对于产品j的评分为k。进一步所述偏好结构模型Gj = MAGpNGpSDGj),其中,AGj代表G类产品的平均得分,NGj代表对G类产品的评价数量,SDGj代表对G类产品评价的标准差;D类人群对产品 j的偏好可表示为=Di = g(Ai; Oi, Gdi),其中,Ai代表年龄,Oi代表职业,Gdi代表性别。与现有技术相比,本发明技术方案带来的技术效果包括1、本发明采用回归模型建立推荐系统,解决了协同过滤模型新用户和数据稀疏性的问题。2、作为一种参数化、个性化的推荐模型,本发明可以建立每个用户的偏好结构,并进行预测。同时,基于回归模型的推荐方法可以很好地解决新用户和数据稀疏性问题,即使用户没有评过分,也可以根据用户所在的群体对于产品的过往评价以及产品类别的评价进行预测。当用户评价较少时,也不会影响到预测的准确性。


图1是本发明中协同过滤方法和回归模型方法对比的内部效度图;图2是本发明中协同过滤方法和回归模型方法对比的外部效度图。
具体实施例方式本发明采用回归模型建立推荐系统,解决了协同过滤模型新用户和数据稀疏性的问题。下面结合附图和优选实施例对本发明技术方案做详细描述。
步骤一建立回归模型。用户对某产品的偏好由用户对于此类产品的偏好和用户所在的人口类别对于该产品的偏好决定,用户对产品的评价可以用定序数据(1,2,3,4,5)来表示。观察到的评分为Yi j,Yij = k代表用户i对于产品j的评分为k ;Zij代表用户i对于产品j喜爱程度 (连续变量,哑变量)。X代表所有影响Zij的协变量。(1)建立用户i对于产品j喜爱程度参数ZijJij = β X+Sij, i代表用户,j代表
产品;(2)建立用户对产品的评价架构,用以下公式表示Pr (Yij = κ) = Pr(Kk_1 < Zjj 彡 κ k),其中评分为 Yi j,Yij = k 代表用户 i 对于
产品j的评分为k。
权利要求
1.一种基于回归模型的电子商务推荐方法,包括建立回归模型,所述回归模型包括偏好结构模型;根据所述回归模型和偏好结构得出特定用户所在的群体对于特定类别产品的过往评价,根据所述过往评价对所述特定类别产品的将来评价进行预测。
2.如权利要求1所述的基于回归模型的电子商务推荐方法,其特征在于所述建立回归模型包括喜爱程度参数、评价架构和偏好结构模型,所述偏好结构模型根据所述喜爱程度参数和评价架构得出。
3.如权利要求2所述的基于回归模型的电子商务推荐方法,其特征O在于所述喜爱程度参数Zu = βΧ+ε⑴其中,i代表用户,j代表产品。
4.如权利要求2所述的基于回归模型的电子商务推荐方法,其特征在于所述评价架构PHYij = κ) = pr (κ < Zij ^ κ k),其中评分为Yij,Yij = k代表用户i对于产品j 的评分为k。
5.如权利要求2所述的基于回归模型的电子商务推荐方法,其特征在于所述偏好结构模型G^ = f (AGj,NGj,SDGj),其中,AGj代表G类产品的平均得分,NGj代表对G类产品的评价数量,SDGj代表对G类产品评价的标准差;D类人群对产品j的偏好可表示为=Di = g(Ai; Oi, Gdi),其中,Ai代表年龄,Oi代表职业,Gdi代表性别。
全文摘要
本发明公开了一种基于回归模型的电子商务推荐方法,包括建立回归模型,所述回归模型包括偏好结构模型;根据所述回归模型和偏好结构得出特定用户所在的群体对于特定类别产品的过往评价,根据所述过往评价对所述特定类别产品的将来评价进行预测。本发明采用回归模型建立推荐系统,解决了协同过滤模型新用户和数据稀疏性的问题;作为一种参数化、个性化的推荐模型,本发明可以建立每个用户的偏好结构,并进行预测;同时,基于回归模型的推荐方法可以很好地解决新用户和数据稀疏性问题,即使用户没有评过分,也可以根据用户所在的群体对于产品的过往评价以及产品类别的评价进行预测;当用户评价较少时,也不会影响到预测的准确性。
文档编号G06Q30/00GK102262764SQ20101018550
公开日2011年11月30日 申请日期2010年5月28日 优先权日2010年5月28日
发明者王希 申请人:王希
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1