文本的归类方法及系统与流程

文档序号:13682893阅读:来源:国知局
技术特征:
1.一种文本的归类方法,其特征在于,所述方法包括:获取文本的标题和所述文本的网址;将所述标题分解为第一专题和副题;将所述第一专题与专题库里至少一部分专题进行匹配;获取与所述第一专题匹配的第二专题,所述第二专题包含在所述专题库里;将所述标题存储于所述第二专题的目录内,并将所述文本的所述标题与所述文本的网址对应关联,便于用户检索到与所述第二专题同类的文本。2.根据权利要求1所述的方法,其特征在于,在所述将所述第一专题与专题库里至少一部分专题进行匹配之后,所述方法还包括:当所述第一专题与所述专题库里至少一部分专题均匹配不上时,将所述第一专题存储于所述专题库,以便将与所述第一专题同类的标题存储于所述专题库中的第一专题的目录内。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:提取所述专题库里所有专题的关键字;计算所述关键字的重复率;将所述重复率大于阈值的关键字对应的第三专题作为推荐的专题;将所述推荐的专题以目录的形式展示给客户端。4.根据权利要求1所述的方法,其特征在于,所述文本为用户发表的文本或网站内已发表的所有文本,其中,所述文本为文章或帖子。5.根据权利要求1所述的方法,其特征在于,所述第一专题、所述第二专题和所述第三专题均包括符号和符号标记的文字。6.根据权利要求1所述的方法,其特征在于,所述专题库里所有专题包括下面的至少一种:自定义的专题,从所述所有文本的标题中选取的专题。7.一种文本的归类系统,其特征在于,所述系统包括:获取单元,用于获取文本的标题和所述文本的网址;解析单元,用于将所述标题分解为第一专题和副题;匹配单元,用于将所述第一专题与专题库里至少一部分专题进行匹配;所述获取单元,还用于获取与所述第一专题匹配的第二专题,所述第二专题包含在所述专题库里;存储单元,用于将所述标题存储于所述第二专题的目录内,并将所述文本的所述标题与所述文本的网址对应关联,便于用户检索到与所述第二专题同类的文本。8.根据权利要求7所述的系统,其特征在于,所述存储单元,还用于当所述第一专题与所述专题库里至少一部分专题均匹配不上时,将所述第一专题存储于所述专题库,以便将与所述第一专题同类的标题存储于所述专题库中的第一专题的目录内。9.根据权利要求7所述的系统,其特征在于,所述系统还包括:提取单元,用于提取所述专题库里所有专题的关键字;计算单元,用于计算所述关键字的重复率;推荐单元,用于将所述重复率大于阈值的关键字对应的第三专题作为推荐的专题;展示单元,用于将所述推荐的专题以目录的形式展示给客户端。10.根据权利要求7所述的系统,其特征在于,所述文本为用户发表的文本或网站内已发表的所有文本,其中,所述文本为文章或帖子。11.根据权利要求7所述的系统,其特征在于,所述第一专题、所述第二专题和所述第三专题均包括符号和符号标记的文字。12.根据权利要求7所述的系统,其特征在于,所述专题库里所有专题包括下面的至少一种:自定义的专题,从所述所有文本的标题中选取的专题。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1