一种基于交易网络的商家推荐方法

文档序号:6372764阅读:222来源:国知局
专利名称:一种基于交易网络的商家推荐方法
技术领域
本发明涉及电子商务领域中的商家推荐,特别涉及存在大量历史交易数据的情况下,充分发掘买家和卖家的交易偏好,构成用户簇;同时引入社会网络因素,为买家或卖家划分社团;通过随机行走完成商 家推荐。
背景技术
推荐系统已应用到信息检索、新闻传媒、电子商务、社会网络服务等诸多领域。在电子商务领域,良好的推荐系统能够有效提升用户体验(包括买家和卖家),增加用户黏着度,促进更多交易行为的发生。目前众多的电子商务网站,如淘宝、大众点评、亚马逊、亿贝、京东等都建立了各自的推荐系统,在商品层面进行有效的统计、建模、挖掘和推荐工作,取得了良好成果。目前的推荐技术大致可分为三大类基于内容的推荐、协同过滤、以及混合推荐。基于内容的推荐为用户(买家)推荐与其之前的选择相类似的物品(商品);协同过滤为用户推荐与其偏好最相近的用户所选择过的物品;混合方式采用多种推荐方法的组合为用户推荐物品,一种策略是结合基于内容和协同过滤为用户提供推荐,另一种目前比较流行的策略是在协同过滤中引入社会网络技术为用户推荐物品。目前电子商务网站在交易过程中主要承担平台和中介的角色,每一次交易实际发生在买家和卖家之间。现有的推荐系统在为买家发掘商品、促进买家体验和交易量方面已取得良好成果;但对卖家的关注度仍然不够,实际是较少考虑到社会网络因素的影响。已有市场调查报告显示超过65%的买家更倾向于同信任的卖家进行交易,并建立所谓“老客”、“回头客”等相对稳固的信任交易关系;考虑到在线商品交易中更高的劣质商品风险和质保代价,合理的商家推荐是当前电子商务领域需要立即考虑的问题。现有的推荐方法和技术尚未考虑商家推荐的问题,有效的商家推荐方法将填补这一空白。

发明内容
本发明主要目的是针对传统推荐系统没有考虑商家推荐的问题,提出一种基于交易网络的商家推荐方法,通过在买家和卖家之间建立偏好相似的用户簇,根据交易网络的连接模式划分社团,通过随机行走完成商家推荐。为实现本发明所述目的,本发明采用如下的步骤
1)整理交易数据并建立交易网络,包含两个工作其一为每个用户(包括买家和卖家)建立和维护偏好向量;其二根据历史交易记录在用户之间建立交易网络;
2)根据用户交易历史对用户聚类;采用期望最大化算法EM,通过用户偏好向量进行用户聚类,形成偏好相似的用户簇;
3)对交易网络进行社团划分;采用K均值算法KM,根据交易网络中各(用户)节点的连接模式划分社团;4)应用随机行走方法实现商家推荐,从买家(目标用户)出发,在社团间随机行走,根据用户簇决定停止概率,完成商家推荐。上述步骤I)中用户的偏好向量用数组表示令in表示电子商务网站中商品类别的数量;用户《<的偏好向量为二-■ );其中元素^ (I < k < M )的定义如下
{] H1 IMHiglit or sold fomnich! it irs ofk
0r tIn*rwiHo。上述步骤I)中的交易网络是一个有向图U= (d/),其中;/表示电子商务网站中的用户集合;有向边集合£ C F X反映用户之间的交易历史,对于任意两个用户 和"j ^ P),有向边< rH >€ E表示用户h曾经从用户购买过商品;/:丑—N是一个映射,其中W为自然数集,作用是为£中的每一条有向边赋予权重;简化处理有向边
>■的权重表示为叫代表_向w,购买商品的次数,若< .<-+ >i E, IjiiJ u<tJ 二 U,另有
=()。上述步骤2)中的EM算法包含两个阶段E-Step (Expectation)根据用户簇的当前组成计算每个簇的中心点;M-Step (Maximization)将每个用户重新分配到从属概率最高的用户簇;
2. I)考虑E-Step,计算用户族的中心点A.; ~ (:.a. .Va ,1,其中in表不商品类别的数量,元素¥的计算公式如下
印―=士 ^吨.
I '。病
其中|4|表示用户簇4的规模,即簇中包含的用户数量是用户Uf的偏好向量_中的对应元素,〃;必须属于4 ;
2.2)考虑M-St印,用户+ , 属于用户簇Z,的从属概率由 (W1IZi)表示,为计算引入背景向量〃=(办取..…知),其中元素ft的计算公式如下
—i ( . = TTTT 乙
I' I ,er
其中f/为用户集合;再引入平滑因子A,A可设为0. 01,取值范围0. OOfO. 06,交易数据越稀疏,A取值越大;计算用户簇4的特征向量朽=..…朽《),其中元素朽n 的计算公式如下
PA:: U. — ^}Sjk + Mk进一步计算系数向量4 - 1 .4、…為其中元素‘的计算公式如下
fpIy^J1A'
= m---Ig -—-—■
I — Pjp I — Aift
基于上述,计算用户化属于用户簇4的从属概率坪,公式如下
权利要求
1.一种基于交易网络的商家推荐方法,其特征在于包括以下步骤 1)整理交易数据并建立交易网络,包括为每个用户,即买家和卖家,建立和维护偏好向量;并根据历史交易记录在用户之间建立交易网络; 2)根据用户交易历史对用户聚类;采用期望最大化算法EM,通过用户偏好向量进行用户聚类,形成偏好相似的用户簇; 3)对交易网络进行社团划分;采用K均值算法KM,根据交易网络中各用户节点的连接模式划分社团; 4)应用随机行走方法实现商家推荐,从买家出发,在社团间随机行走,根据用户簇决定停止概率,完成商家推荐。
2.根据权利要求I所述的基于交易网络的商家推荐方法,其特征在于,上述步骤I)中用户的偏好向量用数组表示令■表不电子商务网站中商品类别的数量;用户《.f的偏好向量为二 ;其中兀素S A 5 W )的定义如下
3.根据权利要求I所述的基于交易网络的商家推荐方法,其特征在于,上述步骤I)中的交易网络是一个有向图DV =(〖/.£./),其中£/表示电子商务网站中的用户集合;有向边集合I' X反映用户之间的交易历史,对于任意两个用户 和e f+「),有向边< H >€ £'表示用户Uf曾经从用户~购买过商品;/ : E ^ N是一个映射,其中N为自然数集,作用是为E中的每一条有向边赋予权重;简化处理有向边< >的权重表示为 ,代表 向+";:购买商品的次数,若< “,+■技j >f ,则.另有二 O。
4.根据权利要求I、2或3所述的基于交易网络的商家推荐方法,其特征在于,上述步骤2)中的EM算法包含两个阶段=E-Step根据用户簇的当前组成计算每个簇的中心点;M_Step将每个用户重新分配到从属概率最高的用户簇;具体过程为 .2.I)考虑E-St印,计算用户簇Zf的中心点<,:(―二…. ,),其中m表示商品类别的数量,元素%1的计算公式如下
5.根据权利要求4所述的基于交易网络的商家推荐方法,其特征在于,上述步骤2)中采用EM算法完成用户聚类的过程是首先根据电子商务网站中的用户总数设置用户簇的数量,保证用户簇规模的平均范围为50(T3000个用户;随机设定个用户簇,对每一个用户,以均一概率分配到某一个簇中;然后开始迭代第一步执行EM算法为每一个用户重新分配用户簇;第二步对过大和过小的用户簇做处理,过程是 · 2.3)判定过小的用户簇设定用户簇规模的最小值e,一般= 30 ;如果存在用户簇&的规模小于e,则解散I,其成员以均一概率分配到其他用户簇中; ·2.4)判定过大的用户簇计算所有用户簇规模取对数后的均值,用M Ig P:)表示,再计算用户簇规模取对数后的方差值,用〃表示,如果用户簇4满足以下公式则4过大,在其中随机设定2个用户簇,&的每个成员以均一概率1/2分配到一个新簇中; 迭代结束时判断用户簇的组成是否发生变化如果发生变化,则进入下一次迭代;如果没有发生变化,则迭代结束,输出聚类好的用户簇。
6.根据权利要求I、2或3所述的基于交易网络的商家推荐方法,其特征在于,上述步骤·3)中的KM算法包含两个阶段K-Step将每个用户重新分配到匹配度最高的社团;M_Step根据社团的当前组成计算每个社团的特征向量;具体过程为 ·3.I)考虑M-Step,计算社团C,.的特征向量Cr = hi, d .…其中》为用户总数;元素I.. (I. < k < )的计算公式如下
7.根据权利要求6所述的基于交易网络的商家推荐方法,其特征在于,上述步骤3)中采用KM算法完成交易网络中社团划分的过程是首先根据电子商务网站中的用户总数设置社团的数量保证社团规模的平均值范围为50(T3000个用户;然后初始化社团对交易网络中的用户节点按度数,即出度+入度排序,等分为个区间;从每个区间随机选择10 30个用户节点;每个用户节点单独作为一个社团,社团特征向量等于用户特征向量;每次选择两个特征向量的欧氏距离最近的社团,将这两个社团合并为一个社团,重新计算新社团的特征向量;重复上述操作,直至剩余个社团;然后迭代执行KM算法,迭代过程的收敛条件是一次迭代后,每个用户同社团的从属关系没有发生改变;最后输出社团划分结果。
8.根据权利要求I、2或3所述的基于交易网络的商家推荐方法,其特征在于,上述步骤4)中应用随机行走方法实现商家推荐的过程是首先确定推荐的商家数量Y , N =3^20 ;然后从目标用户^出发随机行走,选择下一个用户& ;判定随机行走是否终止;如果未能终止,则将 作为当前用户 继续随机行走;如果过程终止,输出为推荐的商家;上述过程重复』V次,最后输出所推荐的一组商家。
9.根据权利要求8所述的基于交易网络的商家推荐方法,其特征在于, 上述步骤4)中的随机行走过程包含两个阶段其一是按概率选择一个社团G ;其二是按概率从G中选择一个用户; .4.I)令当前用户为U4,计算选择社团C:,.的概率IUD),公式如下
10.根据权利要求9所述的基于交易网络的商家推荐方法,其特征在于,上述步骤4)中计算随机行走的终止概率#分四种情况,其中令所选用户为…,目标用户为 情况I. 1 不是卖家,或者已经同%交易过,不需要再推荐;此时G = U ; 情况2. %和《 属于同一个用户簇,此时^二 I,即随机行走立即终止; 情况3. 1%所属用户簇各与《 所属用户簇瓦不相同,此时计算%对石的隶属度/^名),公式如下
全文摘要
本发明公开了一种基于交易网络的商家推荐方法,其步骤为(1)整理交易数据并建立交易网络;(2)根据用户交易历史对用户聚类;(3)对交易网络进行社团划分;(4)应用随机行走方法实现商家推荐。本发明可广泛应用于各类电子商务网站中的商家(卖家)推荐,为广大买家推荐合适的卖家;充分利用买家和卖家的历史交易数据,发掘买家和卖家的偏好特征,分析买家和卖家交易的相似性,合理应用随机行走方法,有效提高商家推荐的准确性和针对性。所采用的计算方法简单高效,切合电子商务网站海量交易数据、同时买家和卖家交易信息稀疏的特性,有较好的扩展性和适用性;有效填补目前电子商务网站商家推荐方面的空白。
文档编号G06Q30/02GK102750647SQ201210219288
公开日2012年10月24日 申请日期2012年6月29日 优先权日2012年6月29日
发明者汤九斌, 蒋智威, 许鼎鼎, 陈道蓄, 顾庆 申请人:南京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1