文件推荐方法和装置的制造方法_3

文档序号:8380956阅读:来源:国知局
键词的类型对应的权重级别,按照权重级别从高到低的顺序为所述每 个关键词分配权重,使得权重级别高的关键词所分配的权重大于权重级别低的关键词所分 配的权重;或, 按照所述每个关键词的出现频率从高到低的顺序为所述每个关键词分配权重,使得出 现频率高的关键词所分配的权重大于出现频率低的关键词所分配的权重;或, 根据所述每个关键词的类型对应的权重级别,按照权重级别从高到低的顺序为所述每 个关键词分配权重,使得权重级别高的关键词所分配的权重大于权重级别低的关键词所分 配的权重; 根据所述每个关键词的出现频率,对所述每个关键词所分配的权重进行调整。
5. 根据权利要求3所述的方法,其特征在于,所述关键词的类型包括名词、动词或虚 词,名词的权重级别高于动词和虚词的权重级别; 所述关键词的出现频率为所述关键词在已存储的文件名称中出现的频率,或者,所述 关键词的出现频率为所述关键词在已存储的指定类别的文件名称中出现的频率,所述指定 类别为所述当前打开文件所属的类别。
6. 根据权利要求5所述的方法,其特征在于,名词中姓名的权重级别高于其他名词的 权重级别。
7. 根据权利要求1所述的方法,其特征在于,根据所述每个第二名称包括的匹配关键 词在所述第一名称中的权重,确定待推荐的第二名称包括: 根据所述每个第二名称包括的匹配关键词在所述第一名称中的权重,确定所述每个第 二名称的权重; 按照所述每个第二名称的权重从大到小的顺序,将预设数目的第二名称确定为所述待 推荐的第二名称。
8. 根据权利要求7所述的方法,其特征在于,根据所述每个第二名称包括的匹配关键 词在所述第一名称中的权重,确定所述每个第二名称的权重包括: 将所述每个第二名称包括的匹配关键词在所述第一名称中的权重的和值确定为所述 每个第二名称的权重;或, 根据所述每个第二名称所指示文件的发布时间,确定所述每个第二名称的时间权重, 按照预设比例,对所述每个第二名称包括的匹配关键词在所述第一名称中的权重的和值以 及所述时间权重进行加权计算,得到加权和值,将所述加权和值确定为所述每个第二名称 的权重。
9. 一种文件推荐装置,其特征在于,所述装置包括: 第一分词模块,用于对第一名称进行分词,得到第一关键词集合,所述第一名称为当前 打开文件的名称,所述第一关键词集合包括所述第一名称分词得到的至少一个关键词; 第二集合获取模块,用于根据预设对应关系,获取至少一个第二名称和所述至少一个 第二名称对应的第二关键词集合,所述第二名称为所述第一关键词集合中的关键词对应的 文件名称,所述预设对应关系包括关键词与包含所述关键词的文件名称之间的对应关系; 匹配模块,用于获取所述第一关键词集合和每个第二名称对应的第二关键词集合中相 同的关键词,将所述相同的关键词作为匹配关键词; 权重获取模块,用于获取所述每个第二名称包括的匹配关键词在所述第一名称中的权 重; 名称确定模块,用于根据所述每个第二名称包括的匹配关键词在所述第一名称中的权 重,确定待推荐的第二名称; 推荐模块,用于推荐所述确定的第二名称所指示的文件。
10. 根据权利要求9所述的装置,其特征在于,所述第二集合获取模块包括: 第二名称获取单元,用于根据所述预设对应关系,获取所述至少一个第二名称; 第二分词单元,用于对于所述至少一个第二名称中的每个第二名称,对所述第二名称 进行分词,得到第二关键词集合,所述第二关键词集合包括所述第二名称分词得到的至少 一个关键词。
11. 根据权利要求9所述的装置,其特征在于,所述装置还包括: 第一权重获取模块,用于根据所述第一关键词集合中每个关键词的类型和出现频率中 的至少一项,获取所述每个关键词在所述第一名称中的权重。
12. 根据权利要求11所述的装置,其特征在于,所述第一权重获取模块包括: 第一权重获取单元,用于根据所述每个关键词的类型对应的权重级别,按照权重级别 从高到低的顺序为所述每个关键词分配权重,使得权重级别高的关键词所分配的权重大于 权重级别低的关键词所分配的权重;或, 第二权重获取单元,用于按照所述每个关键词的出现频率从高到低的顺序为所述每个 关键词分配权重,使得出现频率高的关键词所分配的权重大于出现频率低的关键词所分配 的权重;或, 第三权重获取单元,用于根据所述每个关键词的类型对应的权重级别,按照权重级别 从高到低的顺序为所述每个关键词分配权重,使得权重级别高的关键词所分配的权重大于 权重级别低的关键词所分配的权重; 调整单元,用于根据所述每个关键词的出现频率,对所述每个关键词所分配的权重进 行调整。
13. 根据权利要求11所述的装置,其特征在于,所述关键词的类型包括名词、动词或虚 词,名词的权重级别高于动词和虚词的权重级别; 所述关键词的出现频率为所述关键词在已存储的文件名称中出现的频率,或者,所述 关键词的出现频率为所述关键词在已存储的指定类别的文件名称中出现的频率,所述指定 类别为所述当前打开文件所属的类别。
14. 根据权利要求13所述的装置,其特征在于,名词中姓名的权重级别高于其他名词 的权重级别。
15. 根据权利要求9所述的装置,其特征在于,所述名称确定模块包括: 权重确定单元,用于根据所述每个第二名称包括的匹配关键词在所述第一名称中的权 重,确定所述每个第二名称的权重; 待推荐名称确定单元,用于按照所述每个第二名称的权重从大到小的顺序,将预设数 目的第二名称确定为所述待推荐的第二名称。
16. 根据权利要求15所述的装置,其特征在于,所述权重确定单元用于将所述每个第 二名称包括的匹配关键词在所述第一名称中的权重的和值确定为所述每个第二名称的权 重;或, 所述权重确定单元用于根据所述每个第二名称所指示文件的发布时间,确定所述每个 第二名称的时间权重,按照预设比例,对所述每个第二名称包括的匹配关键词在所述第一 名称中的权重的和值以及所述时间权重进行加权计算,得到加权和值,将所述加权和值确 定为所述每个第二名称的权重。
【专利摘要】本发明公开了一种文件推荐方法和装置,属于网络技术领域。所述方法包括:对第一名称进行分词得到第一关键词集合;根据预设对应关系,获取至少一个第二名称和第二关键词集合,所述预设对应关系包括关键词与包含所述关键词的文件名称之间的对应关系;获取所述第一关键词集合和每个第二名称对应的第二关键词集合中相同的关键词作为匹配关键词;获取所述每个第二名称包括的匹配关键词在所述第一名称中的权重;确定待推荐的第二名称;推荐所述确定的第二名称所指示的文件。本发明通过根据匹配关键词的词性确定权重,根据权重从多个备选的第二名称中确定待推荐的第二名称,提高了最终推荐的文件名称与当前打开文件的名称的相关度,提高了推荐成功率。
【IPC分类】G06F17-30
【公开号】CN104699696
【申请号】CN201310652678
【发明人】尹程果
【申请人】深圳市腾讯计算机系统有限公司
【公开日】2015年6月10日
【申请日】2013年12月5日
【公告号】WO2015081909A1
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1