一种相似用户识别方法及装置的制造方法_3

文档序号:9727470阅读:来源:国知局
;并根据所述第一计算单元反馈的计算结果,动态调整从所述第一消息队列中获取数据的数量;
[0104]存储单元,用于将所述预设格式的数据存储于预先建立的数据库中。
[0105]作为一种【具体实施方式】,上述确定模块200可以具体包括:
[0106]第二消息队列单元,用于将所述用户信息以及所述状态信息缓存至第二消息队列中,按照先进先出的规则将缓存数据发送至指定的第二计算单元;
[0107]第二弹性计算单元,用于计算所述第二消息队列中的缓存数据量,动态调整所述第二计算单元的数量;并根据所述第二计算单元反馈的计算结果,动态调整从所述第二消息队列中获取数据的数量;
[0108]确定单元,用于根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值。
[0109]作为一种【具体实施方式】,上述识别模块300可以具体包括:
[0110]第三消息队列单元,用于将所述当前用户的各当前权重数值以及所述目标用户的各权重数值缓存至第三消息队列中,按照先进先出的规则将缓存数据发送至指定的第三计算单元;
[0111]第三弹性计算单元,用于计算所述第三消息队列中的缓存数据量,动态调整所述第三计算单元的数量;并根据所述第三计算单元反馈的计算结果,动态调整从所述第三消息队列中获取数据的数量;
[0112]识别单元,用于将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度。
[0113]综上,本发明所提供的相似用户识别方法及装置,基于特性因子的权重关系对相似度进行计算,识别准确率更高。同时,采用消息队列对数据进行缓存,使得数据读取速度更快,并通过弹性计算动态调整计算单元的数目,使得计算单元的利用率高,从而使得整体识别方法的处理速度快、效率高。
[0114]本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
[0115]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1.一种相似用户识别方法,其特征在于,包括: 采集当前用户的用户信息以及状态信息; 通过所述用户信息以及所述状态信息,根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值,所述特性因子为满足预设数据规则的标签信息; 将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度。2.如权利要求1所述的相似用户识别方法,其特征在于,所述分别确定所述当前用户的各特性因子对应的当前权重数值包括: 根据预设规则对预设周期内的数值进行筛选,选取的数值作为所述当前用户的各特性因子对应的当前权重数值。3.如权利要求1所述的相似用户识别方法,其特征在于,所述采集当前用户的用户信息以及状态信息包括: 通过数据适配器周期性采集可穿戴设备、机器爬虫程序或人工手动输入的当前用户的用户信息以及状态信息。4.如权利要求3所述的相似用户识别方法,其特征在于,在采集当前用户的用户信息以及状态信息之后还包括: 将所述用户信息以及所述状态信息转换为预设格式的数据; 将所述预设格式的数据缓存至第一消息队列中,按照先进先出的规则将缓存数据发送至指定的第一计算单元; 计算所述第一消息队列的缓存数据量,动态调整所述第一计算单元的数量;并根据所述第一计算单元反馈的计算结果,动态调整从所述第一消息队列中获取数据的数量; 将所述预设格式的数据存储于预先建立的数据库中。5.如权利要求4所述的相似用户识别方法,其特征在于,所述通过所述用户信息以及所述状态信息,根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值包括: 将所述用户信息以及所述状态信息缓存至第二消息队列中,按照先进先出的规则将缓存数据发送至指定的第二计算单元; 计算所述第二消息队列中的缓存数据量,动态调整所述第二计算单元的数量;并根据所述第二计算单元反馈的计算结果,动态调整从所述第二消息队列中获取数据的数量; 根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值。6.如权利要求1至5任一项所述的相似用户识别方法,其特征在于,所述将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度包括: 将所述当前用户的各当前权重数值以及所述目标用户的各权重数值缓存至第三消息队列中,按照先进先出的规则将缓存数据发送至指定的第三计算单元; 计算所述第三消息队列中的缓存数据量,动态调整所述第三计算单元的数量;并根据所述第三计算单元反馈的计算结果,动态调整从所述第三消息队列中获取数据的数量; 将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度。7.一种相似用户识别装置,其特征在于,包括: 采集模块,用于采集当前用户的用户信息以及状态信息; 确定模块,用于通过所述用户信息以及所述状态信息,根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值,所述特性因子为满足预设数据规则的标签信息; 识别模块,用于将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度。8.如权利要求7所述的相似用户识别装置,其特征在于,所述采集模块还包括: 转换单元,用于将所述用户信息以及所述状态信息转换为预设格式的数据; 第一消息队列单元,用于将所述预设格式的数据缓存至第一消息队列中,按照先进先出的规则将缓存数据发送至指定的第一计算单元; 第一弹性计算单元,用于计算所述第一消息队列的缓存数据量,动态调整所述第一计算单元的数量;并根据所述第一计算单元反馈的计算结果,动态调整从所述第一消息队列中获取数据的数量; 存储单元,用于将所述预设格式的数据存储于预先建立的数据库中。9.如权利要求8所述的相似用户识别装置,其特征在于,所述确定模块包括: 第二消息队列单元,用于将所述用户信息以及所述状态信息缓存至第二消息队列中,按照先进先出的规则将缓存数据发送至指定的第二计算单元; 第二弹性计算单元,用于计算所述第二消息队列中的缓存数据量,动态调整所述第二计算单元的数量;并根据所述第二计算单元反馈的计算结果,动态调整从所述第二消息队列中获取数据的数量; 确定单元,用于根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值。10.如权利要求7至9任一项所述的相似用户识别装置,其特征在于,所述识别模块包括: 第三消息队列单元,用于将所述当前用户的各当前权重数值以及所述目标用户的各权重数值缓存至第三消息队列中,按照先进先出的规则将缓存数据发送至指定的第三计算单元; 第三弹性计算单元,用于计算所述第三消息队列中的缓存数据量,动态调整所述第三计算单元的数量;并根据所述第三计算单元反馈的计算结果,动态调整从所述第三消息队列中获取数据的数量; 识别单元,用于将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度。
【专利摘要】本发明公开了一种相似用户识别方法及装置,该方法包括:采集当前用户的用户信息以及状态信息;通过所述用户信息以及所述状态信息,根据预先定义的特性因子以及权重数值的对应关系,分别确定所述当前用户的各特性因子对应的当前权重数值,所述特性因子为满足预设数据规则的标签信息;将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较,确定所述当前用户与所述目标用户的相似度。本发明提供了一种通过特性因子的权重关系对当前用户以及目标用户进行比较,得到二者相似度的方法及装置,与现有技术相比,本申请所提供的方法及装置效率较高、识别准确度较高。
【IPC分类】G06F17/30
【公开号】CN105488194
【申请号】CN201510888068
【发明人】刘文义, 柳鹏
【申请人】山东金佳园科技股份有限公司
【公开日】2016年4月13日
【申请日】2015年12月3日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1