一种信息资源分类方法及系统与流程

文档序号:11950557阅读:来源:国知局

技术特征:

1.一种信息资源分类方法,其特征在于,包括:

获取与预设一级类目的标题对应的待分类信息资源;

对所述待分类信息资源进行聚类分析处理,获取至少一个关键词以及分别与所述至少一个关键词关联的数据;

分别获取所述至少一个关键词在所述待分类信息资源中的出现率;

根据所述出现率,结合预设类目数据结构,对所述至少一个关键词进行分类,获取所述一级类目所属的下级类目。

2.根据权利要求1所述的方法,其特征在于,在所述根据所述出现率,结合预设类目数据结构,对所述至少一个关键词进行分类的步骤之前,该方法还包括:

构建预设层数的数据结构;

分别对各层数据结构设置不同的出现率范围,生成类目数据结构。

3.根据权利要求2所述的方法,其特征在于,所述根据所述出现率,结合预设类目数据结构,对所述至少一个关键词进行分类的步骤具体包括:

根据各层数据结构对应的出现率范围和关键词的出现率,判断各关键词所属的数据结构的层数。

4.根据权利要求3所述的方法,其特征在于,所述类目数据结构还包括二级类目数据结构和三级类目数据结构;

相应地,所述根据各层数据结构对应的出现率范围和关键词的出现率,判断各关键词所属的数据结构的层数的步骤具体包括:

判断关键词的出现率是否属于第一出现率范围内,若是则将所述关键词分配至二级类目数据结构;

若否,则将所述关键词分配至三级类目数据结构。

5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述待分类信息资源进行聚类分析处理的步骤具体包括:

采用网格聚类分析和/或密度聚类分析对所述待分类信息资源进行聚类分析处理。

6.一种信息资源分类系统,其特征在于,包括:

第一获取模块,用于获取与预设一级类目的标题对应的待分类信息资源;

聚类模块,用于对所述待分类信息资源进行聚类分析处理,获取至少一个关键词以及分别与所述至少一个关键词关联的数据;

第二获取模块,用于分别获取所述至少一个关键词在所述待分类信息资源中的出现率;

分类模块,用于根据所述出现率,结合预设类目数据结构,对所述至少一个关键词进行分类,获取所述一级类目所属的下级类目。

7.根据权利要求6所述的系统,其特征在于,该系统还包括:生成模块;

所述生成模块,用于在所述根据所述出现率,结合预设类目数据结构,对所述至少一个关键词进行分类之前,构建预设层数的数据结构;分别对各层数据结构设置不同的出现率范围,生成类目数据结构。

8.根据权利要求7所述的系统,其特征在于,所述分类模块,具体用于根据各层数据结构对应的出现率范围和关键词的出现率,判断各关键词所属的数据结构的层数。

9.根据权利要求8所述的系统,其特征在于,所述类目数据结构包括二级类目数据结构和三级类目数据结构;

相应地,所述分类模块,还用于判断关键词的出现率是否属于第一出现率范围内,若是则将所述关键词分配至二级类目数据结构;

若否,则将所述关键词分配至三级类目数据结构。

10.根据权利要求6-9所述的系统,其特征在于,所述聚类模块,还用于采用网格聚类分析和/或密度聚类分析对所述待分类信息资源进行聚类分析处理。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1