一种应用聚类方法和装置与流程

文档序号:12008832阅读:来源:国知局
一种应用聚类方法和装置与流程

技术特征:
1.一种应用聚类方法,该方法包括以下步骤:a)初始化所需的信息资源,获取待聚类的多个应用外部名称;b)基于已初始化的信息,下载应用并对其进行解析,获取所解析的应用内部名称;c)对所获取的应用外部名称以及所解析的应用内部名称分别进行预处理;d)根据预处理结果,确定应用聚类的方式并进行应用聚类;其中,步骤d)具体包括:根据所述应用外部名称对所述多个应用进行聚类,以获得第一聚类结果;根据第一聚类结果中的所解析的应用内部名称,对所述第一聚类结果中的各类进行合并,以获得第二聚类结果。2.根据权利要求1所述的方法,其中,所述初始化包括:加载同义词表;加载应用信息列表,包括应用名称和应用下载链接;初始化所述应用外部名称和所解析的应用内部名称的映射表;初始化应用聚类结果存储表。3.根据权利要求1或2所述的方法,其中,所述预处理具体包括:分别过滤所述应用外部名称以及所解析的应用内部名称的版本信息;对已过滤的应用外部名称以及所解析的应用内部名称进行切词、去除停用词或/和字词替换处理;对经过切词处理并过滤的结果进行散列计算。4.根据权利要求1或2所述的方法,还包括:遍历所有应用列表,依次进行步骤a)、b)、c)和d)的操作。5.一种应用聚类装置,包括:信息初始化模块,用于初始化所需的信息资源,获取待聚类的多个应用外部名称;应用获取模块,基于已初始化的信息,下载应用并对其进行解析,获取所解析的应用内部名称;名称预处理模块,用于对所获取的应用外部名称以及所解析的应用内部名称分别进行预处理;应用聚类模块,根据预处理结果,确定应用聚类的方式并进行应用聚类;其中,所述应用聚类模块的工作过程具体包括:根据所述应用外部名称对所述多个应用进行聚类,以获得第一聚类结果;根据第一聚类结果中的所解析的应用内部名称,对所述第一聚类结果中的各类进行合并,以获得第二聚类结果。6.根据权利要求5所述的装置,其中,所述信息初始化模块的初始化过程包括:加载同义词表;加载应用信息列表,包括应用名称和应用下载链接;初始化所述应用外部名称和所解析的应用内部名称的映射表;初始化应用聚类结果存储表。7.根据权利要求5或6所述的装置,其中,所述预处理具体包括:分别过滤所述应用外部名称以及所解析的应用内部名称的版本信息;对已过滤的应用外部名称以及所解析的应用内部名称进行切词、去除停用词或/和字词替换处理;对经过切词处理并过滤的结果进行散列计算。8.根据权利要求5或6所述的装置,还包括:应用遍历模块,用于遍历所有的应用列表。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1