一种访问对象的数据处理方法及装置的制造方法

文档序号:9524191阅读:672来源:国知局
一种访问对象的数据处理方法及装置的制造方法
【技术领域】
[0001]本发明属于通信技术领域,尤其涉及一种访问对象的数据处理方法及装置。
【背景技术】
[0002]随着网络的不断推进,用户在访问网络时对网络各项功能的要求越来越高,譬如以网络购物为例,用户一般会希望网站推荐与其所需要商品的同类商品或相关商品,从而通过比较查询的方式可更方便地购买到需要的商品。
[0003]目前在网络购物中,协同过滤推荐(CollaborativeFiltering recommendat1n)正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤通过分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
[0004]但是基于该方式,在商品到商品的协同过滤中,由于没有考虑到商品本身的特性而导致商品相关度的计算结果不准确,如对于一些新推出的商品,可能由于暂时无用户购买或收藏而导致不会马上被推荐出来,其需要经过一定时间的才可能被推荐出来,也就是说没有考虑到新推出的商品的相关性,从而导致商品相关度的计算结果和相关商品的推荐不全面,不够准确。
[0005]因此,需解决现有技术在协同过滤中,由于访问对象(如商品)的考虑不全面,尤其是对于一些新推出的商品,导致访问对象之间的相关度信息计算不准确的问题。

【发明内容】

[0006]本发明的目的在于提供一种访问对象的数据处理方法及装置,旨在解决现有技术中在协同过滤中,由于访问对象(如商品)的考虑不全面,尤其是对于新录入的访问对象,导致访问对象之间的相关度信息计算不准确的问题。
[0007]为解决上述技术问题,本发明实施例提供以下技术方案:
[0008]一种访问对象的数据处理方法,所述方法包括:
[0009]获取访问对象的标题名,将所述标题名划分为至少两个分词;
[0010]获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;
[0011]在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;
[0012]根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及
[0013]根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。
[0014]为解决上述技术问题,本发明实施例提供以下技术方案:
[0015]一种访问对象的数据处理装置,所述装置包括:
[0016]分词获取模块,用于获取访问对象的标题名,将所述标题名划分为至少两个分词;
[0017]多元组生成模块,用于获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;
[0018]协同过滤分值生成模块,用于在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;以及
[0019]相关度生成模块,用于根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及
[0020]推荐控制模块,用于根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。
[0021]相对于现有技术,本实施例将访问对象的标题名划分为至少两个分词,并根据所述至少两个分词访问频率信息,生成包含携带访问频率信息的至少两个分词的多元组;其次,针对两个访问对象的多元组,对共同包含的第一分词进行协同过滤分析并生成第一分词协同过滤分值;最后,根据第一分词的协同过滤分值和第一分词携带的访问频率信息,从而生成两个访问对象相互之间的相关度,将相关的访问对象进行推荐;本发明实施例中,由于利用了访问对象的标题名以及访问对象标题名分词的访问频率信息,对访问对象进行了全面的考虑,尤其是对新录入的访问对象,不仅可以客观地体现出了访问对象之间的相关性,而且提高访问对象之间的相关度信息计算的准确率。
【附图说明】
[0022]图1是本发明实施例提供的访问对象的数据处理系统的结构示意图;
[0023]图2是本发明第一实施例提供的访问对象的数据处理方法的流程示意图;
[0024]图3为本发明第二实施例提供的访问对象的数据处理方法的流程示意图;
[0025]图4a为本发明实施例提供的访问对象的数据处理方法具体应用流程示意图;
[0026]图4b为本发明实施例提供的具体应用中访问对象的示意图;
[0027]图5为本发明实施例提供的访问对象的数据处理装置的结构示意图;
[0028]图6为本发明实施例提供的访问对象的数据处理装置的另一结构示意图。
【具体实施方式】
[0029]请参照图式,其中相同的组件符号代表相同的组件,本发明的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本发明具体实施例,其不应被视为限制本发明未在此详述的其它具体实施例。
[0030]在以下的说明中,本发明的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本发明原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
[0031]本发明的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本发明的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境,其中包括了任何的上述系统或装置。
[0032]本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法优选的以软件的方式进行实施,当然也可在硬件上进行实施,均在本发明保护范围之内。
[0033]请参阅图1,图1为本发明实施例提供的访问对象的数据处理系统的结构示意图,所述访问对象的数据处理系统包括客户端11以及服务器12。
[0034]其中所述客户端11是使用者为了利用网络服务而使用的通信终端装置,其可通过通信网路与所述服务器12连接。所述客户端11不仅可以由桌上型计算机构成,还可以由笔记型计算机、工作站、掌上型计算机、UMPC(Ultra Mobile Personal Computer:超移动个人计算机)、平板PC、个人数字助理(Personal Digital Assistant, PDA)、连网板(webpad)、可携式电话等具备储存单元并安装有微处理器而具有运算能力的终端机构成。
[0035]其中所述客户端11与所述服务器12之间的所述通信网路可以包括将局域网络(Local Area Network, LAN)、都会网络(Metropolitan Area Network, MAN)、广域网络(Wide Area Network, WAN)、因特网等包括在内的数据通信网络,还包括电话网络等,不分有线和无线,使用任何通信方式均无关。
[0036]而所述服务器12存储有多个访问对象以及对应的所述访问对象的信息,访问对象可以为商品或者为音视频或者业务数据等等,所述访问对象的信息可以包括:访问对象的标题名、标题名的分词信息、以及标题名分词的访问频率信息等。
[0037]本发明实施例中,所述服务器12获取访问对象,并利用现有的分词方法,对所述访问对象的标题名进行划分,得到标题分词;并根据所述分词的访问频率信息生成与所述访问对象唯一对应的多元组,其后根据访问对象的多元组之间的处理和计算,生成所述访问对象相互之间的相关度。当所述客户端11当前访问一访问对象,所述服务器12获取所述访问对象,并根据访问对象相互之间的相关度,获取了与其相关的访问对象并推荐至所述客户端11。由于利用了访问对象的标题名以及访问对象标题名分词的访问频率信息,对访问对象进行了全面的考虑,尤其是对于新录入的访问对象,不仅可以客观地体现出了访问对象之间的相关性,而且提高访问对象之间的相关度信息计算的准确率。
[0038]请参阅图2,图2是本发明第一实施例提供的访问对象的数据处理方法的流程示意图。
[0039]在步骤S201中,获取访问对象的标题名,将所述标题名划分为至少两个分词。
[0040]可以理解的是,所述访问对象可以为商品或者为音视频或者如ERP(Enterprise
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1