一种集成属性和结构相似性的个性化商品推荐方法和系统的制作方法

文档序号:6561612阅读:719来源:国知局
专利名称:一种集成属性和结构相似性的个性化商品推荐方法和系统的制作方法
技术领域
本发明涉及计算机互联网技术领域,尤其涉及电子商务领域,特别是一种集成属性和结构相似性的个性化商品推荐方法和系统。
背景技术
随着电子商务的不断发展,商品个数和种类快速增长,为了能够尽快找到所需要的商品,用户希望一种类似导购员的功能来帮助其选购合适的商品或服务,个性化推荐系统应运而生。个性化推荐基于海量数据分析和挖掘技术,根据用户的行为习惯和兴趣特点, 向用户推荐其感兴趣的商品和信息。目前几乎所有的大型电子商务网站都不同程度将个性化推荐技术融入到系统中,其中,协同过滤技术的应用较为广泛。基于协同过滤进行推荐首先收集代表用户兴趣的信息,然后选择近邻用户,最后对目标用户的兴趣进行预测生成推荐结果。其核心问题是寻找与目标用户兴趣相近的一组用户,这组用户与目标用户之间的相似性通过收集并比较代表两个用户兴趣的行为选择矢量得到。目前,比较行为选择矢量的相似性计算方法主要包括泊松相关系数和余弦相似性, 它们一般基于用户项目评分矩阵,其特点是计算简便,容易理解。但是,这种基于评分矩阵的方法在对用户或项目进行相似性度量时因为矩阵稀疏而使系统很难发现相同兴趣的用户。此外,通过评分对用户兴趣进行建模不能全面真实地刻画用户兴趣,会丢失部分信息。 为了保留数据中更多潜在的反映用户兴趣的信息,一些方法将用户和项目映射到网络作为节点,利用节点结构相似性进行协同推荐。另外,一些基于内容过滤的方法利用用户和项目的属性描述信息度量用户或项目间的相似性,进而进行商品推荐。但是,上述基于结构相似性和基于属性相似性的两种计算方法在进行推荐时都会损失部分信息,依据相似性增强假设两个对象之间的相似性不仅依赖于自身属性还依赖于和它们相关的其它对象之间的相似性。因此,在进行推荐时如何结合属性描述信息和节点结构信息,提出一种全面有效的刻画用户之间兴趣的相似性度量方法,并据此进行最近邻的选择以提高推荐准确性是一个需要解决的问题。

发明内容
为了解决上述问题,本发明提出一种集成属性和结构相似性的个性化商品推荐方法,该推荐方法又包括以下步骤收集电子商务平台的用户、商品基本信息和用户历史购买事务记录;对数据进行预处理,获取用户的基本特征、统计特征和行为特征;将用户和商品作为带有属性信息的节点映射到网络,依据用户和商品间的购买关系建立信息网络图;在信息网络图中利用结合属性和结构相似性的度量方法对用户节点对间的兴趣偏好进行度量;以节点对间的相似性作为输入对用户进行聚类,以此缩小最近邻居的选择范围从而提高推荐速度;从活动用户所在的簇中选取最近邻的M个用户作为其最近邻居用户并生成近邻集;对于活动用户在候选商品数据库中未购买过的商品进行预测评分;对活动用户进行 Top-N推荐,以此作为推荐的候选商品集返回。
作为本发明的一个实施例,数据的收集包括用户的基本信息,商品的基本信息,用户购买商品的事务数据即评论数据。用户的基本信息是指用户在网上进行购物时所提交的注册信息,包括用户注册时的姓名,注册时间,当前级别,来自区域。商品的基本信息是指商品上架时的描述信息如商品编号,商品名称,商品品牌,商品所属领域,商品所属类型,商品上架时间。用户购买商品的事务数据包括商品编号,用户姓名,购买时间,评论时间,评论优点,评论缺点,评论标题,评论主要内容,评分。作为本发明的一个实施例,数据的预处理,包括去除噪音数据,填充空缺数值项, 数据规整,用户特征抽取。其中用户特征抽取是指对用户历史购买事务数据进行统计后获取统计特征和行为特征,这些特征包括用户的历史购买次数,热衷的品牌数,购买时间和评论时间的平均时间间隔,平均消费金额,注册时间与购买新商品的时间间隔,商品上架时间与购买时间的时间间隔,发表评论的有用次数和无用次数,评论为差评的比例,在当前购买商品所属的类别、类型、领域中购买商品的比例,评论中优点、缺点的平均长度,整条评论的平均长度,评论中不足点评论为默认评论所占的比例。作为本发明的一个实施例,用户商品信息网络图的构建是将数据映射到网络。依据预处理后的数据和信息,将用户和商品表示为网络图中带有属性的节点,如果用户购买了某一个商品则用户和该商品节点间有一条有向连接边,边的方向是从商品指向用户。作为本发明的一个实施例,用户间相似性度量方法基于图中节点的属性信息和结构信息。如果用户的属性值越相似且用户的历史购买记录越相似则用户间距离越近,进而表明用户间的兴趣和偏好越相似。本推荐方法中用户间相似性的计算公式是
权利要求
1.一种集成属性和结构相似性的个性化商品推荐方法,其特征在于,包括步骤 步骤A、收集电子商务平台的用户基本信息,商品基本信息,用户历史购买记录信息; 步骤B、收集数据后,对数据进行预处理并抽取用户的属性特征,数据的预处理是指对数据中不完整的、含噪声的、不一致的数据利用相应的技术进行处理,用户的属性特征包括基本属性,行为特征和统计特征,获取用户所有特征后对用户建立模型;步骤C、利用用户和商品的属性特征,用户和商品间的购买关系,将用户和商品映射到网络形成节点,并构建用户、商品信息网络图;步骤D、集成属性和结构相似性度量方法对步骤C中构建的用户模型进行兴趣偏好度量;步骤E、以用户节点对间的相似性作为输入,利用聚类技术对用户节点进行聚类,从而缩小最近邻居的搜索范围,以此提高推荐速度;步骤F、依据聚类结果,生成最近邻居集合,对节点对间相似性进行降序排序,返回排序靠前的M个邻居用户;步骤G、利用权相加法和步骤F中返回的M个邻居用户对目标商品的评分预测活动用户对未评价商品的评分;步骤H、对所有目标商品的预测评分进行排序,向活动用户推荐评分靠前的N个商品。
2.根据权利要求1所述的方法,其特征在于,所述步骤D具体包括以下步骤步骤D1、输入步骤C所构建的用户商品信息网络图,网络图中包括带有属性特征信息的用户节点,商品节点以及它们之间的连接关系;步骤D2、计算网络图中用户节点对间的属性相似性,依据属性类型的不同选择不同的属性值匹配方法;步骤D3、计算网络图中用户节点对间的结构相似性,结构相似性的计算依赖于用户节点对的入度邻居节点间相似性的平均值;步骤D4、选取合适的权衡因子,利用步骤D2和D3的结果对属性相似性和结构相似性加权求和以获取网络图中用户节点对间的最终相似性得分;
3.根据权利要求1所述的方法,其特征在于,所述步骤E具体包括以下步骤 步骤E1、输入用户、商品信息网络图中所有用户节点对间的相似性得分; 步骤E2、在信息网络图中随机选择K个用户节点作为聚类中心;步骤E3、以步骤El中用户节点对的相似性为依据,将其它非簇中心用户对象分配到与某个聚类中心最相似的簇中;步骤E4、重新选择聚类中心,选择的方法是在每个簇中顺序选取一个用户对象,计算用选取的对象代替原来的簇中心后的消耗和代价E,选择E最小的那个用户对象代替原来簇中心作为新的簇中心,重复本步骤直到所有用户簇簇中心不再发生变化为止;步骤E5、以步骤E4中的聚类结果为输入,对用户簇中所有用户与当前活动用户的相似性进行降序排序,选取排序靠前的M个用户作为最近邻居用户集合。
4.根据权利要求1所述的方法,其特征在于,所述步骤F具体包括以下步骤 步骤F1、输入步骤E中所产生的活动用户的近邻集和用户对商品的评分;步骤F2、利用权相加法对近邻集中所有用户对活动用户未评分商品的评分加权和预测活动用户对目标商品的评分;步骤F3、返回活动用户对所有目标商品的预测评分。
5. 一种集成属性和结构相似性的个性化商品推荐系统,其特征在于,所述部件和模块包括用户终端,共享信息服务器,用户和商品信息收集器,用户基本信息数据库,商品基本信息数据库,用户历史交易数据库,用户偏好模型处理器,数据映射转换器,用户偏好度量器,用户匹配度数据库,推荐加速器和个性化推荐处理器,其特征在于所述终端,主要指PC机,还可以是移动手持设备等一切具有网络通信功能的电子设备;所述共享信息服务器,是指存储电子商务平台所有公用信息和知识的计算机; 所述用户和商品信息收集器,收集用户在电子商务平台上的原始注册信息,对注册信息进行处理存入用户基本信息数据库,收集器还收集了网站上所有上架商品的基本信息, 对商品基本信息进行预处理存入商品基本信息数据库,此外,还包括用户在电子商务网站上的评论行为,信息收集器监视用户的评论行为并将数据处理后存入用户历史交易数据库;所述用户基本信息数据库,是指用于存放用户和商品信息收集器所输出的用户基本信息如用户姓名,来自区域,当前级别,注册时间,以此作为用户偏好模型的输入之一;所述商品基本信息数据库,是指用于存放用户和商品信息收集器所输出的商品基本信息,如商品编号,商品名称,商品品牌,商品所属领域,商品所属类型,商品上架时间;所述用户历史交易数据库,是指用于存放用户和商品信息收集器所输出的用户购买商品的事务数据,其中隐含着用户的行为特征,用户和商品间的购买关系等信息,其信息包括商品编号,用户姓名,购买时间,评论时间,评论优点,评论缺点,评论标题,评论主要内容,评分,如果某一用户对某一商品发表了评论则表示该用户购买了这件商品,用户和商品间的这种购买关系和用户购买商品所表现出来的行为特征分别将作为数据映射转换器和用户偏好模型处理器的输入;所述用户偏好模型处理器,是指利用用户基本信息数据库,商品基本信息数据库和用户历史交易数据库的数据抽取用户各种类型的特征如基本属性特征,统计特征和行为特征等对用户兴趣和偏好建立模型,以此模型来描述一个用户,称之为建立用户模型;所述数据映射转换器,是指利用建立好的用户偏好模型将带有属性信息的用户和商品作为节点映射到网络,依据用户和商品间的购买关系将用户节点和商品节点用有向边进行连接,从而构建信息网络图,由此实现将原始数据转换和映射到网络图中的节点和连接边;所述用户偏好度量器,是指利用集成属性和结构相似性的方法对处于信息网络图中的用户节点对进行兴趣偏好度量,度量值依赖于节点的属性描述信息和结构背景信息,此处的结构背景信息是指用户节点的入度邻居节点的相异情况,度量的结果将作为用户匹配度数据库的输入;所述用户匹配度数据库,是指用于存放用户节点对之间的相似性值,此数据将反映用户间兴趣偏好的相似性情况并且用户匹配度数据库中的数据还将作为活动用户选择最近邻居的依据;所述推荐加速器,是指以用户匹配度数据库中的数据作为输入,利用聚类技术大大缩小用户最近邻居搜索范围,从而提高推荐效率;所述个性化推荐处理器,是指基于用户偏好模型和用户匹配度数据库中的数据,利用权相加法对活动用户在候选商品数据库中未购买过的商品进行评分,活动用户的评分依赖于推荐加速器中所产生的最近邻居用户对目标项目的评分,然后对商品的预测评分进行排序,向活动用户推荐评分靠前的N个商品,系统能实时反馈用户提出的商品推荐请求,将推荐结果返回所述用户端。
6.如权利要求5所述的个性化商品推荐系统,其特征在于,所述用户偏好度量器中的用户偏好相似性计算方法,包括以下步骤步骤I、针对用户节点的属性信息,利用属性相似性计算方法得到用户节点对间的属性相似性;步骤J、针对用户节点的结构背景信息,利用结构相似性计算方法得到用户节点对间的结构相似性;步骤K、针对集成属性相似和结构相似的用户节点对,结合前面两种相似性度量值并调节权重因子计算最终用户对之间的偏好相似性。
全文摘要
本发明公开了一种集成属性和结构相似性的个性化商品推荐方法。该方法集成属性和结构相似性信息,将用户和商品作为带有特征信息的节点映射到网络,依据顾客和商品间的购买关系建立信息网络图,在信息网络图中利用集成属性和结构相似性度量用户节点对间的兴趣偏好,并以此选择最近邻,以提高推荐准确性。在上述推荐方法的基础上,本发明还公开了一种集成属性和结构相似性度量的个性化商品推荐系统。该系统在信息网络图中利用集成属性相似和节点结构背景相似的计算方法对用户兴趣偏好进行准确度量,推荐过程中利用聚类技术提高最近邻居的生成效率。该方法和系统能够用于电子商务应用中,为用户提供个性化的商品推荐。
文档编号G06Q30/00GK102254028SQ201110216438
公开日2011年11月23日 申请日期2011年7月22日 优先权日2011年7月22日
发明者文灿, 王金龙 申请人:青岛理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1