一种访问对象的数据处理方法及装置的制造方法_3

文档序号：9524191阅读：来源：国知局

= 0.8，d=0.2, e = 0.3, f = 0.4, g = 0.7)，提取所述访问对象A和访问对象B共同包含的第一分词及所述第一分词携带的访问频率信息。
[0073]在步骤S306中，对所述第一分词进行协同过滤分析，生成所述第一分词的协同过滤分值。
[0074]可以理解的是，第一分词为两个访问对象多元组共同包含的分词中的至少一个，具体的，所述第一分词的选取数量可以由用户进行预设定；假设用户需要以共同包含的第一分词d和e为主要参考，对多元组之间的相关性进行衡量，则可以仅仅对d和e进行协同过滤分析，并生成对应的协同过滤分值；在一些较为精准的场合，用户可以以所有的共同包含的第一分词a、c、d和e为主要参考，对多元组之间的相关性进行衡量，对a、c、d和e均进行协同过滤分析，生成对应的协同过滤分值，本实施例对此不作具体限定。
[0075]在步骤S307中，对于每个所述第一分词，对所述第一分词的协同过滤分值与所述第一分词携带的访问频率信息进行求积计算，生成分词相关值。
[0076]在步骤S308中，对每个所述第一分词的所述分词相关值进行求和计算，生成分词总和，以作为所述两个访问对象相互之间的相关度。
[0077]在所述步骤S307和所述步骤S308中，所述服务器12根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息，生成所述两个访问对象相互之间的相关度。
[0078]假设针对于所述访问对象A和访问对象B，对第一分词a、c、d和e均进行协同过滤分析，并生成分词对应的协同过滤分值为Pa = 0.05,Pc = 0.03,Pd = 0.01和Pe = 0.04，其后对Pa和分词a携带的访问频率信息进行求积计算，生成分词a相关值，如此类推，对Pc和分词c携带的访问频率信息进行求积计算，生成分词c相关值，对Pd和分词d携带的访问频率信息进行求积计算，生成分词d相关值，对Pe和分词e携带的访问频率信息进行求积计算，生成分词e相关值。
[0079]其后，对分词a相关值、分词c相关值、分词c相关值和分词e相关值进行求和进行，生成分词总和，以作为访问对象A和访问对象B相互之间的相关度:P =a*Pa+c*Pc+d*Pd+e*Pe = 0.2*0.05+0.8*0.03+0.2*0.01+0.3*0.04 = 0.048。
[0080]在步骤S309中，根据当前访问的访问对象，以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。
[0081 ] 可具体的，所述服务器12获取所述客户端11当前访问的访问对象，根据所述当前访问的访问对象，以及根据基于所述步骤301至所述步骤308生成的访问对象之间的相关度，获取到与所述当前访问的访问对象相关的访问对象并推荐至所述客户端11，其中所述相关的访问对象按照其与当前访问对象相互之间的相关度由大到小的顺序进行排列。
[0082]进一步的，所述服务器12在可以将与所述客户端11当前访问的访问对象相关度小于预设阈值的访问对象进行删除，将与所述客户端11当前访问的访问对象相关度大于或等于所述预设阈值的访问对象进行推荐。或者是，所述服务器12根据访问对象之间的相关度，向所述客户端11推荐与所述当前访问的访问对象相关度最大的访问对象；本发明对访问对象之间的相关度的应用不作具体限定。
[0083]本发明实施例中，若所述访问对象优选为商品，则基于所述步骤301至所述步骤308的数据处理方法可以获取商品之间的相关度，在网络购物时根据商品之间的相关度，可以向用户推荐相关度较高的商品；若所述访问对象优选为企业资源计划系统中的个人资料，基于所述步骤301至所述步骤308的数据处理方法可以获取人才之间的相关度，在安排任务或查询相关人才资料时，可以根据所述人才之间的相关度进行针对性的处理等等。
[0084]由上述可知，本实施例中，将访问对象的标题名划分为至少两个分词，并根据所述至少两个分词访问频率信息，生成包含携带访问频率信息的至少两个分词的多元组；其次，针对两个访问对象的多元组，对共同包含的第一分词进行协同过滤分析并生成第一分词协同过滤分值；最后，根据第一分词的协同过滤分值和第一分词携带的访问频率信息，从而生成两个访问对象相互之间的相关度，将相关的访问对象进行推荐；本发明实施例中，由于利用了访问对象的标题名以及访问对象标题名分词的访问频率信息，对访问对象进行了全面的考虑，尤其是对于新录入的访问对象，不仅可以客观地体现出了访问对象之间的相关性，而且提高访问对象之间的相关度信息计算的准确率。进一步的，可以根据访问对象相互之间的相关度，可以应用于商品的推荐、人才资料的统计、信息的针对性查询等，用途广泛，并且由于对访问对象进行了全面的考虑，提高了相关度计算的准确率，因此商品推荐、资料统计、信息查询的结果也更加准确，满足用户需求。
[0085]请参阅图4a，图4a为一本发明实施例的访问对象的数据处理方法的具体应用场景，在该场景中，所述访问对象优选为商品；所述方法包括:
[0086]在步骤S401中，获取商品的标题名，将所述标题名划分为至少两个分词。
[0087]对于所述服务器12存储的每一个访问对象(商品)，获取所述商品的标题名；可参考图4b,图4b为该应用场景中一向品的标题名意。
[0088]在步骤S402中，判断出所述标题名中的有效分词。
[0089]将该商品的标题名进行有效判定，确定出标题名中的有效分词，其中，如图4b所不的向品标题名的划分分词结果可以表不为C(apple、平果、iphone4、8G、GSM、WCDMA、手机、黑色)，其中，一个商品的标题名唯一对应一个划分分词的结果。
[0090]在步骤S403中，获取各个分词对应的分词词频统计比值，生成与所述商品一一对应的多元组。
[0091]以“手机”分词为例，假设在最近一个月内，购物网站A —共有100W次包含“手机”的页面访问量，其中，有90W次标题名包含“手机”的页面访问量，则“手机”分词对应的分词词频统计比值为900/1000 = 0.9，同样地，对商品标题名其他分词做同样处理，可以得到携带分词词频统计比值的多元组，C (apple = 0.1、苹果=0.2、iphone4 = 0.4、8G = 0.5、GSM = 0.6.WCDMA = 0.7、手机=0.9、黑色=0.3)。
[0092]在步骤S404中，对于两个商品，提取对应多元组中共同包含的第一分词及其携带的访问频率信息，并对所述第一分词进行协同过滤分析，生成所述第一分词的协同过滤分值。
[0093]假设，对于商品1按步骤401至步骤403的方法生成的多元组为Cl (a = 0.l、b =0.1、c = 0.3、d = 0.4、e = 0.5)，对于商品2按步骤401至步骤403的方法生成的多元组为 C2 (a = 0.1、c = 0.3、d = 0.4、e = 0.5、f = 0.6);
[0094]对于在商品1多兀组Cl和商品2多兀组C2共同包含的第一分词a、c、d和e,米用传统的协同过滤分析方法做协同过滤分析，得到a、c、d、e四个第一分词的协同过滤分值为:(Pa = 0.02、Pc = 0.02、Pd = 0.03、Pe = 0.04)。
[0095]在步骤S405中，根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息，生成商品相互之间的相关度。
[0096]基于以下公式计算商品1和商品2相互之间的相关度:
[0097]P = a*Pa+c*Pc+d*Pd+e*Pe = 0.1*0.02+0.3*0.02+0.4*0.03+0.5*0.04 = 0.04。
[0098]在步骤S406中，根据当前访问的商品，以及所述当前访问的商品对应的相关度将相应的访问对象进行推荐。
[0099]譬如，所述客户端11的用户有获取商品1相关商品的需求时，所述服务器12可以根据上述访问对象的数据处理方法，以及根据所述客户端11当前访问的商品1，获取到与所述当前访问的商品1相关的商品(如商品2)并向客户端11推荐，例如，可以按照相关商品与当前访问的商品1相互之间的相关度由大到小的顺序进行排列并向客户端11推荐；或者是，可以将与所述客户端11当前访问的商品1相关度小于预设阈值的商品进行删除，将与所述客户端11当前访问的访问对象相关度大于或等于所述预设阈值的商品进行推荐；或者是，向所述客户端11推荐与所述当前访问的商品1相关度最大的商品。
[0100]可以理解的是，所述步骤401至步骤406可以按照前述实施例相关描述进行具体实现，此处不再赘述。
[0101]由上述可知，本实施例中，由于利用了访问商品的标题名以及商品的标题名分词的访问频率信息，对商品进行了全面的考虑，即使是新推出的商品，最终也可以获取到商品之间的相关度，并将相关的商品进行推荐，不仅可以客观地体现出了商品之间的相关性，而且提高商品之间的相关度计算的准确率，进一步的，向客户端11进行商品推荐的结果也更加准确，满足用户需求。
[0102]为便于更好的实施本发明实施例提供的访问对象的数据处理方法，本发明实施例还提供一种基于上述访问对象的处理方法的装置。其中名词的含义与上述访问对象的处理的方法中相同，具体实现细节可以参考方法实施例中的说明。请参阅图5，图5为本发明实施例提供的访问对象的处理装置的结构示意图，其中所述访问对象的数据处理装置包括分词获取模

完整全部详细技术资料下载

当前第3页1 2 3 4 5