挖掘信息模板的方法及装置的制造方法_6

文档序号:9708392阅读:来源:国知局
息模板。2.根据权利要求1所述的方法,其特征在于,所述获取建模信息集合,包括: 获取多条待处理信息,每条待处理信息至少包括发送端标识; 将所述多条待处理信息划分为不同的信息集合,每个信息集合中的待处理信息具有相同发送端标识; 根据任一条待处理信息的发送端标识,从对应的信息集合中,获取第一预设数量的待处理信息; 将所述第一预设数量的待处理信息组成所述建模信息集合。3.根据权利要求1所述的方法,其特征在于,所述分别对所述多条建模信息所包含的数值信息进行加密,得到多条加密信息,包括: 对于任一条建模信息,根据所述建模信息的接收端标识,获取所述建模信息的地域标识; 对所述建模信息的接收端标识进行加密,得到所述建模信息的第一特征码; 根据所述建模信息中包含的数值信息的类型,对所述建模信息中的数值信息进行加密,得到所述建模信息的第二特征码; 将所述建模信息的地域标识、第一特征码、第二特征码及接收时间组成一条加密信息。4.根据权利要求1所述的方法,其特征在于,所述对所述多条加密信息进行聚类,得到至少一个信息模板,包括: 对所述多条加密信息中满足第一合并条件的加密信息分别进行合并,得到多条第一合并信息; 对所述多条第一合并信息中满足第二合并条件的加密信息分别进行合并,得到多条第二合并信息; 对所述多条第二合并信息进行聚类,得到至少一个信息模板。5.根据权利要求4所述的方法,其特征在于,所述对所述多条加密信息中满足第一合并条件的加密信息分别进行合并,得到多条第一合并信息,包括: 从所述多条加密信息中,获取多个第一目标加密信息组,每个第一目标加密信息组中的加密信息具有相同的地域标识、第一特征码及第二特征码; 对于任一第一目标加密信息组中的加密信息,按照接收时间由晚到早的顺序进行排序; 保存所述第一目标加密信息组中接收时间最晚的加密信息,并删除所述第一目标加密信息组中其余的加密信息,得到一条第一合并信息。6.根据权利要求4所述的方法,其特征在于,所述对所述多条第一合并信息中满足第二合并条件的加密信息分别进行合并,得到多条第二合并信息,包括: 从所述多条第一合并信息中,获取多个第二目标加密信息组,每个第二目标加密信息组中的第一合并信息具有相同的地域标识及第二特征码; 对于任一第二目标加密信息组,获取所述第二目标加密信息组中第一合并信息的数量及所述第二目标加密信息组中第一合并信息的最晚接收时间; 将所述第二目标加密信息组的地域标识、所述第二目标信息组中第一合并信息的数量、所述第二目标加密信息组的第二特征码及所述第二目标加密信息组中第一合并信息的最晚接收时间组成一条第二合并信息。7.根据权利要求4所述的方法,其特征在于,所述对所述多条第二合并信息进行聚类,得到至少一个信息模板,包括: 将所述多条第二合并信息划分为多个第三目标加密信息组,每个第三目标加密信息组中的第二合并信息具有相同的地域标识; 对于任一第三目标加密信息组,获取所述第三目标加密信息组中任一第二合并信息所合并的第一合并信息的数量,如果所述第二合并信息所合并的第一合并信息的数量大于第一阈值,则将所述第二合并信息对应的信息内容、所述第二合并信息合并的第一合并信息的数量、所述第三目标加密信息组的最晚接收时间组成的一个条目; 将所述第三目标加密信息组中具有相信息内容的多个条目进行合并,得到一个信息模板,所述信息模板适用的加密信息数量为多个条目所合并的加密信息数量之和,所述信息模板的接收时间为多个条目的最晚接收时间。8.根据权利要求2所述的方法,其特征在于,所述对所述多条加密信息进行聚类,得到至少一个信息模板之后,还包括: 对每个信息模板进行覆盖率验证; 根据验证结果,从所述至少一个信息模板中,确定出实际信息模板。9.根据权利要求8所述的方法,其特征在于,所述对每个信息模板进行覆盖率验证,包括: 获取测试信息集合,所述测试信息集合包括多条测试信息; 对所述多条测试信息分别进行处理,得到多个第一测试信息组; 根据所述多个第一测试信息组,对每个信息模板进行覆盖率验证。10.根据权利要求9所述的方法,其特征在于,所述获取测试信息集合,包括: 从所述待处理信息的发送端标识对应的信息集合中剩余的待处理信息中,获取第二预设数量的待处理信息,得到所述测试信息集合。11.根据权利要求9所述的方法,其特征在于,所述对所述多条测试信息分别进行处理,得到多个第一测试信息组,包括: 对所述多条测试信息进行加密处理,得到多条测试加密信息; 对所述多条测试加密信息中满足第三合并条件的测试加密信息分别进行合并,得到多条第三合并信息; 将所述多条第三合并信息划分为多个第一测试信息组,每个第一测试信息组中的第三合并信息具有相同的地域标识。12.根据权利要求11所述的方法,其特征在于,所述对所述多条测试信息进行加密处理,得到多条测试加密信息,包括: 对于任一条测试信息,根据所述测试信息的接收端标识,获取所述测试信息的地域标识; 对所述测试信息的接收端标识进行加密,得到所述测试信息的第一特征码; 将所述测试信息的地域标识、第一特征码及所述测试信息的信息内容组成一条测试加密信息。13.根据权利要求11所述的方法,其特征在于,所述对所述多条测试加密信息进行合并,得到多条第三合并信息,包括: 从所述多条测试加密信息中,获取多个第二测试信息组,每个第二测试信息组中的测试加密信息具有相同的地域标识及信息内容; 获取任一第二测试信息组中测试加密信息的数量; 将所述第二测试信息组的地域标识、所述第二测试信息组中测试加密信息的数量、所述第二测试信息组的信息内容组成一条测试合并信息。14.根据权利要求9所述的方法,其特征在于,所述根据所述多个第一测试信息组,对每个信息模板进行覆盖率验证,包括: 对于任一信息模板,获取每个第一测试信息组与所述信息模板相匹配的信息数量; 如果所述信息模板与任一第一测试信息组相匹配的信息数量大于第二阈值,则获取所述相匹配的信息数量与所述第一测试信息组包含的测试信息数量的比值。15.根据权利要求14所述的方法,其特征在于,所述根据验证结果,从所述至少一个信息模板中,确定出实际信息模板,包括: 如果所述相匹配的信息数量与所述第一测试信息组包含的测试信息数量的比值在预设范围内,则将所述信息模板作为实际信息模板。16.一种挖掘信息模板的装置,其特征在于,所述装置包括: 获取模块,用于获取建模信息集合,所述建模信息集合包含多条建模信息; 加密模块,用于分别对所述多条建模信息所包含的数值信息进行加密,得到多条加密信息; 聚类模块,用于对所述多条加密信息进行聚类,得到至少一个信息模板。17.根据权利要求16所述的装置,其特征在于,所述获取模块,用于获取多条待处理信息,每条待处理信息至少包括发送端标识;将所述多条待处理信息划分为不同的信息集合,每个信息集合中的待处理信息具有相同发送端标识;根据任一条待处理信息的发送端标识,从对应的信息集合中,获取第一预设数量的待处理信息;将所述第一预设数量的待处理信息组成所述建模信息集合。18.根据权利要求16所述的装置,其特征在于,所述加密模块,用于对于任一条建模信息,根据所述建模信息的接收端标识,获取所述建模信息的地域标识;对所述建模信息的接收端标识进行加密,得到所述建模信息的第一特征码;根据所述建模信息中包含的数值信息的类型,对所述建模信息中的数值信息进行加密,得到所述建模信息的第二特征码;将所述建模信息的地域标识、第一特征码、第二特征码及接收时间组成一条加密信息。19.根据权利要求16所述的装置,其特征在于,所述聚类模块,用于对所述多条加密信息中满足第一合并条件的加密信息分别进行合并,得到多条第一合并信息;对所述多条第一合并信息中满足第二合并条件的加密信息分别进行合并,得到多条第二合并信息;对所述多条第二合并信息进行聚类,得到至少一个信息模板。20.根据权利要求19所述的装置,其特征在于,所述聚类模块,还用于从所述多条加密信息中,获取多个第一目标加密信息组,每个第一目标加密信息组中的加密信息具有相同的地域标识、第一特征码及第二特征码;对于任一第一目标加密信息组中的加密信息,按照接收时间由晚到早的顺序进行排序;保存所述第一目标加密信息组中接收时间最晚的加密信息,并删除所述第一目标加密信息组中其余的加密信息,得到一条第一合并信息。21.根据权利要求19所述的装置,其特征在于,所述聚类模块,还用于从所述多条第一合并信息中,获取多个第二目标加密信息组,每个第二目标加密信息组中的第一合并信息具有相同的地域标识及第二特征码;对于任一第二目标加密信息组,获取所述第二目标加密信息组中第一合并信息的数量及所述第二目标加密信息组中第一合并信息的最晚接收时间;将所述第二目标加密信息组的地域标识、所述第二目标加密信息组中第一合并信息的数量、所述第二目标加密信息组的第二特征码及所述第二目标加密信息组中第一合并信息的最晚接收时间组成一条第二合并信息。22.根据权利要求19所述的装置,其特征在于,所述聚类模块,还用于将所述多条第二合并信息划分为多个第三目标加密信息组,每个第三目标加密信息组中的第二合并信息具有相同的地域标识;对于任一第三目标加密信息组,获取所述第三目标加密信息组中任一第二合并信息所合并的第一合并信息的数量,当所述第二合并信息所合并的第一合并信息的数量大于第一阈值时,将所述第二合并信息对应的信息内容、所述第二合并信息合并的第一合并信息的数量、所述第三目标加密信息组的最晚接收时间组成的一个条目;将所述第三目标加密信息组中具有相信息内容的多个条目进行合并,得到一个信息模板,所述信息模板适用的加密信息数量为多个条目所合并的加密信息数量之和,所述信息模板的接收时间为多个条目的最晚接收时间。23.根据权利要求17所述的装置,其特征在于,所述装置还包括: 验证模块,用于对每个信息模板进行覆盖率验证; 确定模块,用于根据验证结果,从所述至少一个信息模板中,确定出实际信息模板。24.根据权利要求23所述的装置,其特征在于,所述验证模块,还用于获取测试信息集合,所述测试信息集合包括多条测试信息;对所述多条测试信息分别进行处理,得到多个第一测试信息组;根据所述多个第一测试信息组,对每个信息模板进行覆盖率验证。25.根据权利要求24所述的装置,其特征在于,所述验证模块,用于从所述待处理信息的发送端标识对应的信息集合中剩余的待处理信息中,获取第二预设数量的待处理信息,得到所述测试信息集合。26.根据权利要求24所述的装置,其特征在于,所述验证模块,用于对所述多条测试信息进行加密处理,得到多条测试加密信息;对所述多条测试加密信息中满足第三合并条件的测试加密信息分别进行合并,得到多条第三合并信息;将所述多条第三合并信息划分为多个第一测试信息组,每个第一测试信息组中的第三合并信息具有相同的地域标识。27.根据权利要求24所述的装置,其特征在于,所述验证模块,用于对于任一条测试信息,根据所述测试信息的接收端标识,获取所述测试信息的地域标识;对所述测试信息的接收端标识进行加密,得到所述测试信息的第一特征码;将所述测试信息的地域标识、第一特征码及所述测试信息的信息内容组成一条测试加密信息。28.根据权利要求24所述的装置,其特征在于,所述验证模块,用于从所述多条测试加密信息中,获取多个第二测试信息组,每个第二测试信息组中的测试加密信息具有相同的地域标识及信息内容;获取任一第二测试信息组中测试加密信息的数量;将所述第二测试信息组的地域标识、所述第二测试信息组中测试加密信息的数量、所述第二测试信息组的信息内容组成一条测试合并信息。29.根据权利要求24所述的装置,其特征在于,所述验证模块,用于对于任一信息模板,获取每个第一测试信息组与所述信息模板相匹配的信息数量;当所述信息模板与任一第一测试信息组相匹配的信息数量大于第二阈值时,获取所述相匹配的信息数量与所述第一测试信息组包含的测试信息数量的比值。30.根据权利要求29所述的装置,其特征在于,所述确定模块,用于当所述相匹配的信息数量与所述第一测试信息组包含的测试信息数量的比值在预设范围内时,将所述信息模板作为实际信息模板。31.一种挖掘信息模板的装置,其特征在于,包括: 处理器; 用于存储处理器可执行的指令的存储器; 其中,所述处理器被配置为: 获取建模信息集合,所述建模信息集合包含多条建模信息; 分别对所述多条建模信息所包含的数值信息进行加密,得到多条加密信息; 对所述多条加密信息进行聚类,得到至少一个信息模板。
【专利摘要】本公开是关于一种挖掘信息模板的方法及装置,属于信息技术领域。该方法包括:获取建模信息集合,建模信息集合包含多条建模信息;分别对多条建模信息所包含的数值信息进行加密,得到多条加密信息;对多条加密信息进行聚类,得到至少一个信息模板。本公开通过对多条建模信息进行学习,挖掘出信息模板,同时在进行模板挖掘过程,对建模信息中包含的数值信息进行加密,避免挖掘出的模板泄露用户隐私,从而提供了一种更为科学的信息模板挖掘方法。
【IPC分类】G06F17/30
【公开号】CN105468694
【申请号】CN201510791533
【发明人】汪平仄, 张涛, 陈志军
【申请人】小米科技有限责任公司
【公开日】2016年4月6日
【申请日】2015年11月17日
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1