一种访问对象的数据处理方法及装置的制造方法_5

文档序号:9524191阅读:来源:国知局
思,在所述访问对象的数据处理装置上可以运行所述访问对象的数据处理方法实施例中提供的任一方法,其具体实现过程详见所述访问对象的数据处理方法实施例,此处不再赘述。
[0123]需要说明的是,对本发明所述访问对象的数据处理方法而言,本领域普通测试人员可以理解实现本发明实施例所述访问对象的数据处理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在终端的存储器中,并被该终端内的至少一个处理器执行,在执行过程中可包括如所述访问对象的数据处理方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
[0124]对本发明实施例的所述访问对象的数据处理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光舟坐
ΓΤΤΤ.ο
[0125]综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通测试人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。
【主权项】
1.一种访问对象的数据处理方法,其特征在于,所述方法包括: 获取访问对象的标题名,将所述标题名划分为至少两个分词; 获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词; 在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个; 根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及 根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。2.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述将所述访问对象的标题名划分为至少两个分词的步骤之后,还包括: 判断所述至少两个分词是否有效,若有效,则执行所述获取所述至少两个分词对应的访问频率信息的步骤。3.根据权利要求2所述的访问对象的数据处理方法,其特征在于,所述判断所述至少两个分词是否有效的步骤,包括: 将所述至少两个分词中的每个分词与预置的分词数据库一一进行对比; 若在所述分词数据库中查询到所述分词,则判断出所述分词有效;以及 若在所述分词数据库中没有查询到所述分词,则判断出所述分词无效。4.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述获取所述至少两个分词对应的访问频率信息的步骤,包括: 对于所述至少两个分词中的每个分词,在预设时间段内统计包含所述分词的页面访问次数; 在所述预设时间段内统计包含所述分词的标题的页面访问次数;以及将所述包含所述分词的标题的页面访问次数与所述包含所述分词的页面访问次数的比值,作为所述分词的访问频率信息。5.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度的步骤,包括: 对于每个所述第一分词,对所述第一分词的协同过滤分值与所述第一分词携带的访问频率信息进行求积计算,生成分词相关值;以及 对每个所述第一分词的所述分词相关值进行求和计算,生成分词总和,以作为所述两个访问对象相互之间的相关度。6.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐的步骤,包括: 获取客户端当前访问的访问对象;以及 根据所述当前访问的访问对象,获取与所述当前访问的访问对象相关的访问对象并推荐至所述客户端,所述相关的访问对象按照其与当前访问对象相互之间的相关度由大到小的顺序进行排列。7.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐的步骤,包括:获取客户端当前访问的访问对象;以及将与所述客户端当前访问的访问对象相关度小于预设阈值的访问对象进行删除,将与所述客户端当前访问的访问对象相关度大于或等于所述预设阈值的访问对象进行推荐。8.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐的步骤,包括:获取客户端当前访问的访问对象;以及向所述客户端推荐与所述当前访问的访问对象相关度最大的访问对象。9.一种访问对象的数据处理装置,其特征在于,所述装置包括:分词获取模块,用于获取访问对象的标题名,将所述标题名划分为至少两个分词;多元组生成模块,用于获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;协同过滤分值生成模块,用于在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;相关度生成模块,用于根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及推荐控制模块,用于根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。10.根据权利要求9所述的访问对象的数据处理装置,其特征在于,所述装置还包括:判断模块,用于判断所述至少两个分词是否有效,若有效,则所述多元组生成模块执行所述获取所述至少两个分词对应的访问频率信息的步骤。11.根据权利要求10所述的访问对象的数据处理装置,其特征在于,所述判断模块包括:对比单元,用于将所述至少两个分词中的每个分词与预置的分词数据库一一进行对比;第一判断单元,用于若在所述分词数据库中查询到所述分词,则判断出所述分词有效;以及第二判断单元,用于若在所述分词数据库中没有查询到所述分词,则判断出所述分词无效。12.根据权利要求9所述的访问对象的数据处理装置,其特征在于,所述多元组生成模块包括:第一统计单元,用于对于所述至少两个分词中的每个分词,在预设时间段内统计包含所述分词的页面访问次数; 第二统计单元,用于在所述预设时间段内统计包含所述分词的标题的页面访问次数; 访问频率信息获取单元,用于将所述包含所述分词的标题的页面访问次数与所述包含所述分词的页面访问次数的比值,作为所述分词的访问频率信息;以及 多元组生成单元,用于生成与所述访问对象一一对应的多元组。13.根据权利要求9所述的访问对象的数据处理装置,其特征在于,所述相关度生成模块包括: 分词相关值生成单元,用于对于每个所述第一分词,对所述第一分词的协同过滤分值与所述第一分词携带的访问频率信息进行求积计算,生成分词相关值;以及 相关度生成单元,用于对每个所述第一分词的所述分词相关值进行求和计算,生成分词总和,以作为所述两个访问对象相互之间的相关度。14.根据权利要求9至13任一项所述的访问对象的数据处理装置,其特征在于,所述推荐控制模块包括: 访问对象获取单元,用于获取客户端当前访问的访问对象;以及 推荐控制单元,用于根据所述当前访问的访问对象,获取与所述当前访问的访问对象相关的访问对象并推荐至所述客户端,其中,所述相关的访问对象按照其与当前访问对象相互之间的相关度由大到小的顺序进行排列。15.根据权利要求14所述的访问对象的数据处理装置,其特征在于,所述推荐控制单元,还用于将与所述客户端当前访问的访问对象相关度小于预设阈值的访问对象进行删除,将与所述客户端当前访问的访问对象相关度大于或等于所述预设阈值的访问对象进行推荐。16.根据权利要求15所述的访问对象的数据处理装置,其特征在于,所述推荐控制单元,还用于向所述客户端推荐与所述当前访问的访问对象相关度最大的访问对象。
【专利摘要】本发明公开了一种访问对象的数据处理方法及装置,所述方法包括:获取访问对象的标题名,将标题名划分为至少两个分词;获取至少两个分词对应的访问频率信息,并生成包含携带访问频率信息的至少两个分词的多元组;在两个访问对象的多元组中,提取共同包含的第一分词及其携带的访问频率信息,并对第一分词进行协同过滤分析生成协同过滤分值;根据第一分词的协同过滤分值和其携带的访问频率信息,生成两个访问对象相互之间的相关度;根据当前访问的访问对象及其对应的相关度将相应的访问对象进行推荐。本实施例中避免了由于访问对象的考虑不全面,尤其是对于新录入的访问对象,导致访问对象之间的相关度计算不准确的问题,提高了计算结果的准确性。
【IPC分类】G06F17/30
【公开号】CN105279155
【申请号】CN201410229507
【发明人】郁其雨, 谢启明, 付运伟, 李永安, 王炫聪
【申请人】腾讯科技(深圳)有限公司
【公开日】2016年1月27日
【申请日】2014年5月28日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1