一种为文本信息匹配资源的方法及装置与流程

文档序号:12121164阅读:来源:国知局

技术特征:

1.一种为文本信息匹配资源的方法,其特征在于,包括:

依据所述文本信息,获取文本关键字;

依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源;其中,所述资源标签与所述资源相对应。

2.按照权利要求1所述方法,其特征在于,所述文本关键字与资源标签的相似度的确定包括:

从词向量库中分别获取所述文本关键字的第一词向量和所述资源标签的第二词向量;所述词向量库中包含至少一个分词的词向量;

计算所述第一词向量与所述第二词向量的余弦相似度,作为所述文本关键字与所述资源标签的相似度。

3.按照权利要求2所述方法,其特征在于,所述词向量库中词向量的获得包括:

获取用于训练词向量的训练语料;

对所述训练语料进行分词,获得分词集合;

依据所述分词集合中各分词的出现频次和/或与其他分词的共现关系,确定各分词的词向量;所述词向量中每一个元素表示对应分词的出现频次和/或与其他分词的共现频次。

4.按照权利要求1所述方法,其特征在于,依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源,包括:

对所述文本关键字与所述资源标签的相似度进行排序;

将相似度最高的预设个资源标签输出,用以确定与所述文本信息相匹配的资源。

5.按照权利要求1所述方法,其特征在于,依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源,包括:

依据所述文本关键字与所述资源标签的相似度、以及相对应的资源标签在所属资源项中的权重,计算所述文本关键字与所述资源项的匹配程度;其中,所述资源项中包含至少一个所述资源标签;

依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源;其中,所述资源项中包含至少一个所述资源。

6.按照权利要求5所述方法,其特征在于,计算所述文本关键字与所述资源项的匹配程度,包括:

计算所述相似度与所述权重的乘积之和,作为所述文本关键字与相对应的资源标签所属资源项的匹配程度。

7.按照权利要求5所述方法,其特征在于,依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源,包括:

对所述文本关键字与所述资源项的匹配程度进行排序;

将最匹配的预设个资源项输出,用以确定与所述文本信息相匹配的资源。

8.按照权利要求7所述方法,其特征在于,将最匹配的预设个资源项输出,用以确定与所述文本信息相匹配的资源,具体为:

将最匹配的预设个资源项输出,作为备选资源项向用户推荐;

将用户在所述备选资源项中选取的资源项所对应的资源确定为与所述文本信息相匹配的资源。

9.按照权利要求8所述方法,其特征在于,所述资源标签在所属资源项中的权重的确定包括:

对所述资源标签在所属资源项中的权重设定初始值;

依据用户在所述备选资源项中选取的资源项,调整所述资源项中的资源标签和/或调整资源标签在所属资源项中的权重。

10.按照权利要求5所述方法,其特征在于,所述方法还包括:

获取用户的使用信息,所述使用信息包括用户的历史偏好信息、个人信息和/或同类用户的标签信息;

则在计算所述文本关键字与所述资源项的匹配程度之后,在依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源之前,还包括:

依据用户的所述使用信息,对所述文本关键字与所述资源项的匹配程度进行调整,得到更新后的匹配程度。

11.按照权利要求1所述方法,其特征在于,依据所述文本信息,获取文本关键字,包括:

获取所述文本信息;

对所述文本信息进行分词,得到所述文本关键字。

12.按照权利要求1~11之任一所述方法,其特征在于,所述资源的类别包括图片、照片、音乐、语音、音效、动作、表情、动画和/或视频。

13.一种为文本信息匹配资源的装置,其特征在于,包括:

获取模块,用于依据所述文本信息,获取文本关键字;

匹配模块,用于依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源;其中,所述资源标签与所述资源相对应。

14.按照权利要求13所述装置,其特征在于,所述匹配模块包括:

计算模块,用于依据所述文本关键字与所述资源标签的相似度、以及相对应的资源标签在所属资源项中的权重,计算所述文本关键字与所述资源项的匹配程度;其中,所述资源项中包含至少一个所述资源标签;

资源确定模块,用于依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源;其中,所述资源项中包含至少一个所述资源。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1