一种访问对象的数据处理方法及装置的制造方法_4

文档序号:9524191阅读:来源:国知局
块51、多元组生成模块52、协同过滤分值生成模块53、相关度生成模块54以及推荐控制模块55。
[0103]其中所述分词获取模块51获取访问对象的标题名,将所述标题名划分为至少两个分词。所述多元组生成模块52获取所述分词获取模块51获取的所述至少两个分词对应的访问频率信息,并生成与所述访问对象--对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词。
[0104]所述协同过滤分值生成模块53在两个访问对象的所述多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个。所述相关度生成模块54根据所述协同过滤分值生成模块53获取的第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度。所述推荐控制模块55根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。
[0105]可以理解的是,所述访问对象可以为商品或者为音视频或者如ERP系统中的个人资料等业务数据。本发明实施例中,所述分词获取模块51可以采用现有的分词方法,对所述标题名进行划分,得到至少两个分词。其中,一个访问对象的标题名唯一对应一个划分分词的结果。
[0106]对于每个访问对象,在获取到携带有访问频率信息的多元组后,所述协同过滤分值生成模块53可以针对其中任意两个访问对象的多元组进行分析,以了解该两个访问对象之间的相关性,其中,所述第一分词为所述多元组分词中的至少一个,所述第一分词的选取数量可以由用户预设定。
[0107]由上述可知,本实施例中,将访问对象的标题名划分为至少两个分词,并根据所述至少两个分词访问频率信息,生成包含携带访问频率信息的至少两个分词的多元组;其次,针对两个访问对象的多元组,对共同包含的第一分词进行协同过滤分析并生成第一分词协同过滤分值;最后,根据第一分词的协同过滤分值和第一分词携带的访问频率信息,从而生成两个访问对象相互之间的相关度,将相关的访问对象进行推荐;本发明实施例中,由于利用了访问对象的标题名以及访问对象标题名分词的访问频率信息,对访问对象进行了全面的考虑,尤其是对新录入的访问对象,不仅可以客观地体现出了访问对象之间的相关性,而且提高访问对象之间的相关度信息计算的准确率。
[0108]请参阅图6,图6为本发明实施例提供的访问对象的处理装置的另一结构示意图,所述处理装置包括分词获取模块61、判断模块65、多元组生成模块62、协同过滤分值生成模块63、相关度生成模块64和推荐控制模块66。
[0109]其中所述分词获取模块61获取访问对象的标题名,将所述标题名划分为至少两个分词。所述判断模块65判断所述至少两个分词是否有效,若有效,则所述多元组生成模块62执行获取所述至少两个分词对应的访问频率信息的步骤。
[0110]优选的,由于所述访问对象的标题名存在一些符号,如“()”等,因此对于每一个访问对象,需要对划分后的分词进行有效判定,对于有效的分词才进行分词访问频率信息的获取并以此组成多元组。
[0111]如图6所示,该实施例中,所述判断模块65可以包括:对比单元651将所述至少两个分词中的每个分词与预置的分词数据库一一进行对比;第一判断单元652若在所述分词数据库中查询到所述分词,则判断出所述分词有效;第二判断单元653若在所述分词数据库中没有查询到所述分词,则判断出所述分词无效。
[0112]进一步的,所述分词对应的访问频率信息可以具体为一个分词词频统计比值,所述多元组生成模块62可以包括:第一统计单元621对于所述至少两个分词中的每个分词,在预设时间段内统计包含所述分词的页面访问次数;第二统计单元622在所述预设时间段内统计包含所述分词的标题的页面访问次数;访问频率信息获取单元623将所述包含所述分词的标题的页面访问次数与所述包含所述分词的页面访问次数的比值,作为所述分词的访问频率信息;多元组生成单元624生成与所述访问对象--对应的多元组。
[0113]可具体的,假设,所述访问对象A的标题名的分词a、b、c、d和e判定为全部有效,则访问对象A的标题名分词结果表示为A(a、b、c、d、e),获取的分词的访问频率信息为a =0.2, b = 0.5, c = 0.8, d = 0.2, e = 0.3,则所述多元组生成单元624生成访问对象A的唯一对应的多元组可以表示为A(a = 0.2, b = 0.5, c = 0.8, d = 0.2, e = 0.3)。
[0114]所述协同过滤分值生成模块63在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个。
[0115]可具体的,假设所述多元组生成单元624获取到的访问对象A唯一对应的多元组为A(a = 0.2,b = 0.5,c = 0.8,d = 0.2,e = 0.3),获取到的访问对象B唯一对应的多元组为 B(a = 0.2, c = 0.8, d = 0.2, e = 0.3, f = 0.4, g = 0.7),提取所述访问对象 A 和访问对象B共同包含的第一分词及所述第一分词携带的访问频率信息。
[0116]更进一步的,所述相关度生成模块64可以包括:分词相关值生成单元641对于每个所述第一分词,对所述第一分词的协同过滤分值与所述第一分词携带的访问频率信息进行求积计算,生成分词相关值;相关度生成单元642对每个所述第一分词的所述分词相关值进行求和计算,生成分词总和,以作为所述两个访问对象相互之间的相关度。
[0117]可具体的,假设针对于所述访问对象A和访问对象B,对第一分词a、c、d和e均进行协同过滤分析,并生成分词对应的协同过滤分值为Pa = 0.05、Pc = 0.03、Pd = 0.01和Pe = 0.04,其后对Pa和分词a携带的访问频率信息进行求积计算,生成分词a相关值,如此类推,对Pc和分词c携带的访问频率信息进行求积计算,生成分词c相关值,对Pd和分词d携带的访问频率信息进行求积计算,生成分词d相关值,对Pe和分词e携带的访问频率信息进行求积计算,生成分词e相关值。其后,对分词a相关值、分词c相关值、分词c相关值和分词e相关值进行求和进行,生成分词总和,以作为访问对象A和访问对象B相互之间的相关度 P = a*Pa+c*Pc+d*Pd+e*Pe。
[0118]优选的,在本发明实施例中,所述推荐控制模块66可以包括访问对象获取单元661和推荐控制单元662,其中,所述访问对象获取单元661获取客户端当前访问的访问对象;所述推荐控制单元662根据所述当前访问的访问对象,获取与所述当前访问的访问对象相关的访问对象并推荐至所述客户端,其中,所述相关的访问对象按照其与当前访问对象相互之间的相关度由大到小的顺序进行排列;或者是,所述推荐控制单元662将与所述客户端当前访问的访问对象相关度小于预设阈值的访问对象进行删除,将与所述客户端当前访问的访问对象相关度大于或等于所述预设阈值的访问对象进行推荐;或者是,所述推荐控制单元662向所述客户端推荐与所述当前访问的访问对象相关度最大的访问对象。
[0119]本发明实施例中,若所述访问对象优选为商品,则基于所述步分词获取模块61、判断模块65、多元组生成模块62、协同过滤分值生成模块63以及相关度生成模块64,可以获取商品之间的相关度,在网络购物时根据商品之间的相关度,可以通过所述推荐控制模块66向客户端推荐相关度较高的商品;若所述访问对象优选为企业资源计划系统中的个人资料,基于所述分词获取模块61、判断模块65、多元组生成模块62、协同过滤分值生成模块63以及相关度生成模块64可以获取人才之间的相关度,在安排任务或查询相关人才资料时,可以通过所述推荐控制模块66根据所述人才之间的相关度进行针对性的推荐等等,此处对具体应用场景不作限定。
[0120]由上述可知,本实施例中,将访问对象的标题名划分为至少两个分词,并根据所述至少两个分词访问频率信息,生成包含携带访问频率信息的至少两个分词的多元组;其次,针对两个访问对象的多元组,对共同包含的第一分词进行协同过滤分析并生成第一分词协同过滤分值;最后,根据第一分词的协同过滤分值和第一分词携带的访问频率信息,从而生成两个访问对象相互之间的相关度,将相关的访问对象进行推荐;本发明实施例中,由于利用了访问对象的标题名以及访问对象标题名分词的访问频率信息,对访问对象进行了全面的考虑,尤其是对于新录入的访问对象,不仅可以客观地体现出了访问对象之间的相关性,而且提高访问对象之间的相关度信息计算的准确率。进一步的,可以根据访问对象相互之间的相关度,可以应用于商品的推荐、人才资料的统计、信息的针对性查询等,用途广泛,并且由于对访问对象进行了全面的考虑,提高了相关度计算的准确率,因此商品推荐、资料统计、信息查询的结果也更加准确,满足用户需求。
[0121]在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对访问对象的数据处理方法的详细描述,此处不再赘述。
[0122]本发明实施例提供的所述访问对象的数据处理装置,譬如为计算机、平板电脑、具有触摸功能的手机等等,所述访问对象的数据处理装置与上文实施例中的访问对象的数据处理方法属于同一构
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1