聚合类应用的推荐、多方推荐源聚合的方法、系统和装置的制造方法_5

文档序号：9249253阅读：来源：国知局

；针对每一候选文本，遍历所述分词结果中的词，以从所述分词结果中选取特征词以及所述特征词对应的词频，并归一化所述词频；封装所述特征词和其所归一化后的词频，形成每一候选文本对应的特征向量；存储所述候选文本对应的特征向量。6.根据权利要求4所述的方法，其特征在于，所述根据所述特征向量进行对应候选文本的内容校验，以得到推荐文本的步骤包括: 根据当前请求内容校验的多个候选文本由存储的所述特征向量中提取相应的特征向量和所述内容所在的完整文本对应的特征向量；将所述完整文本对应的特征向量分别与所述多个候选文本对应的特征向量进行匹配，以得到与所述完整文本最为匹配的候选文本，所述候选文本即为推荐文本。7.根据权利要求3所述的方法，其特征在于，所述方法还包括: 判断所述推荐文本是否失效，若为是，则返回所述获取内容相同的多个候选文本的步骤。8.根据权利要求6所述的方法，其特征在于，所述根据当前请求内容校验的多个候选文本由存储的所述特征向量中提取相应的特征向量和所述内容所在的完整文本对应的特征向量的步骤之前，所述方法还包括: 获取所述内容所在的完整文本；通过预先构建的词典对所述完整文本进行特征向量统计，以得到所述完整文本对应的特征向3；，并存储。9.根据权利要求1所述的方法，其特征在于，所述方法还包括: 随机选取预设数量的样本，对所述样本进行特征选取得到多个特征词，以通过所述多个特征词形成词典。10.根据权利要求9所述的方法，其特征在于，所述随机选取预设数量的样本，对所述样本进行特征选取得到多个特征词，以通过所述多个特征词形成词典的步骤包括: 从存储的文本中随机选取预设数量的样本；在所述预设数量的样本中计算得到高频的特征词，并通过新词发现算法筛选所述特征词；存储筛选后的特征词，以形成包含所述筛选后的特征词的词典。11.一种多方推荐源的聚合方法，其特征在于，包括: 由多方推荐源获取内容相同的多个候选文本；通过预先构建的词典对所述多个候选文本进行特征向量统计，以得到每一候选文本对应的特征向量，并存储所述候选文本对应的特征向量；根据所述特征向量进行对应候选文本的内容校验，以得到推荐文本；为所述内容存储所述推荐文本。12.根据权利要求11所述的方法，其特征在于，所述通过预先构建的词典对所述多个候选文本进行特征向量统计，以得到每一候选文本对应的特征向量，并存储所述候选文本对应的特征向量的步骤包括: 加载所述预先构建的词典，通过所述词典分别对所述多个候选文本进行分词，以得到每一候选文本对应的分词结果；针对每一候选文本，遍历所述分词结果中的词，以从所述分词结果中选取特征词以及所述特征词对应的词频，并归一化所述词频；封装所述特征词和其所归一化后的词频，形成每一候选文本对应的特征向量；存储所述候选文本对应的特征向量。13.根据权利要求11所述的方法，其特征在于，所述根据所述特征向量进行对应候选文本的内容校验，以得到推荐文本的步骤包括: 根据当前请求内容校验的多个候选文本由存储的所述特征向量中提取相应的特征向量和所述内容所在的完整文本对应的特征向量；将所述完整文本对应的特征向量分别与所述多个候选文本对应的特征向量进行匹配，以得到与所述完整文本最为匹配的候选文本，所述候选文本即为推荐文本。14.根据权利要求11所述的方法，其特征在于，所述方法还包括: 判断所述推荐文本是否失效，若为是，则返回由多方推荐源获取内容相同的多个候选文本的步骤。15.根据权利要求13所述的方法，其特征在于，所述根据当前请求内容校验的多个候选文本由存储的所述特征向量中提取相应的特征向量和所述内容所在的完整文本对应的特征向量的步骤之前，所述方法还包括: 获取所述内容所在的完整文本；通过预先构建的词典对所述完整文本进行特征向量统计，以得到所述完整文本对应的特征向3；，并存储。16.根据权利要求11所述的方法，其特征在于，所述方法还包括: 随机选取预设数量的样本，对所述样本进行特征选取得到多个特征词，以通过所述多个特征词形成词典。17.根据权利要求16所述的方法，其特征在于，所述随机选取预设数量的样本，对所述样本进行特征选取得到多个特征词，以通过所述多个特征词形成词典的步骤包括: 从存储的文本中随机选取预设数量的样本；在所述预设数量的样本中计算得到高频的特征词，并通过新词发现算法筛选所述特征词；存储筛选后的特征词，以形成包含所述筛选后的特征词的词典。18.—种聚合类应用的推荐系统，其特征在于，包括聚合类应用客户端，所述聚合类应用客户端包括: 请求发起模块，用于根据触发的内容获取操作发起内容获取请求；接收模块，用于接收根据所述内容获取请求返回的推荐文本，所述推荐文本是通过预先构建的词典对所述内容获取请求相关的多个候选文本统计特征向量和根据所述特征向量对所述多个候选文本进行内容校验得到的；加载模块，用于加载所述返回的推荐文本，以进行内容显示。19.根据权利要求18所述的系统，其特征在于，所述系统还包括: 查找装置，用于在存储的推荐文本中进行查找，以得到与所述内容获取请求相关的推荐文本，并向所述聚合类应用客户端返回所述推荐文本。20.根据权利要求19所述的系统，其特征在于，所述系统还包括: 文本获取装置，用于获取内容相同的多个候选文本；统计装置，用于通过预先构建的词典对多个所述候选文本进行特征向量统计，以得到每一候选文本对应的特征向量，并存储所述候选文本对应的特征向量。21.根据权利要求19所述的系统，其特征在于，所述系统还包括: 内容校验装置，用于根据所述特征向量进行对应候选文本的内容校验，以得到推荐文本；离线存储装置，用于为所述内容存储所述推荐文本。22.根据权利要求20所述的系统，其特征在于，所述统计装置包括: 分词引擎，用于加载预先构建的词典，通过所述词典分别对所述多个候选文本进行分词，以得到每一候选文本对应的分词结果；遍历模块，用于针对每一候选文本，遍历所述分词结果中的词，以从所述分词结果中选取特征词以及所述特征词对应的词频，并归一化所述词频；封装模块，用于封装所述特征词和其所归一化后的词频，形成每一候选文本对应的特征向量；向量存储模块，用于存储所述候选文本对应的特征向量。23.根据权利要求21所述的系统，其特征在于，所述内容校验装置包括: 向量提取模块，用于根据当前请求内容校验的特征向量分别与所述多个候选文本对应的特征向量进行匹配，以得到与所述完整文本最为匹配的候选文本；匹配模块，用于将所述完整文本对应的特征向量分别与所述多个候选文本对应的特征向量进行匹配，以得到与所述完整文本最为匹配的候选文本，所述候选文本即为推荐文本。24.根据权利要求20所述的系统，其特征在于，所述系统还包括: 有效性判断装置，用于判断推荐文本是否失效，若为是，则通知所述文本获取装置。25.根据权利要求23所述的系统，其特征在于，系统还包括: 完整文本获取装置，用于获取所述内容所在的完整文本；完整文本向量统计装置，用于通过预先构建的词典对所述完整文本进行特征向量统计，以得到所述完整文本对应的特征向量，并存储。26.根据权利要求20所述的系统，其特征在于，所述系统还包括: 词典构建装置，用于随机选取预设数量的样本，对所述样本进行特征选取得到多个特征词，以通过所述多个特征词形成词典。27.根据权利要求26所述的系统，其特征在于，所述词典构建装置包括: 样本选取模块，用于从存储的文本中随机选取预设数量的样本；特征运算模块，用于在所述预设数量的样本中计算得到高频的特征词，并通过新词发现算法筛选所述特征词；特征词存储模块，用于存储筛选后的特征词，以形成包含所述筛选后的特征词的词典。28.一种多方推荐源的聚合装置，其特征在于，包括: 文本获取装置，用于由多方推荐源获取内容相同的多个候选文本；统计装置，用于通过预先构建的词典对多个所述候选文本进行特征向量统计，以得到每一候选文本对应的特征向量，并存储所述候选文本对应的特征向量；内容校验装置，用于根据所述特征向量进行对应候选文本的内容校验，以得到推荐文本；离线存储装置，用于为所述内容存储所述推荐文本。29.根据权利要求28所述的装置，其特征在于，所述统计装置包括: 分词引擎，用于加载所述预先构建的词典，通过所述词典分别对所述多个候选文本进行分词，以得到每一候选文本对应的分词结果；结果遍历模块，用于针对每一候选文本，遍历所述分词结果中的词，以从所述分词结果中选取特征词以及所述特征词对应的词频，并归一化所述词频；封装模块，用于封装所述特征词和其所归一化后的词频，形成每一候选文本对应的特征向量；向量存储模块，用于存储所述候选文本对应的特征向量。30.根据权利要求28所述的装置，其特征在于，所述内容校验装置包括: 向量提取模块，用于根据当前请求内容校验的多个候选文本由存储的所述特征向量中提取相应的特征向量和所述内容所在的完整文本对应的特征向量；匹配模块，用于将所述完整文本对应的特征向量分别与所述多个候选文本对应的特征向量进行匹配，以得到与所述完整文本最为匹配的候选文本。31.根据权利要求28所述的装置，其特征在于，所述装置还包括: 有效性判断装置，用于判断推荐文本是否失效，若为是，则通知所述文本获取装置。32.根据权利要求30所述的装置，其特征在于，所述装置还包括: 完整文本获取装置，用于获取所述内容所在的完整文本；完整文本向量统计装置，用于通过预先构建的词典对所述完整文本进行特征向量统计，以得到所述完整文本对应的特征向量，并存储。33.根据权利要求27所述的装置，其特征在于，所述装置还包括: 词典构建装置，用于随机选取预设数量的样本，对所述样本进行特征选取得到多个特征词，以通过所述多个特征词形成词典。34.根据权利要求33所述的装置，其特征在于，所述词典构建装置包括: 样本选取模块，用于从存储的文本中随机选取预设数量的样本；特征运算模块，用于在所述预设数量的样本中计算得到高频的特征词，并通过新词发现算法筛选所述特征词；特征词存储模块，用于存储筛选后的特征词，以形成包含所述筛选后的特征词的词典。
【专利摘要】本发明提供了一种聚合类应用的推荐方法，包括：根据聚合类应用中触发的内容获取操作发起内容获取请求；接收根据所述内容获取请求返回的推荐文本，所述推荐文本是通过预先构建的词典对所述内容获取请求相关的多个候选文本统计特征向量和根据所述特征向量对所述多个候选文本进行内容校验得到的；加载所述返回的推荐文本，以进行所述聚合类应用中的内容显示。此外，还提供了一种与该方法匹配的多方推荐源聚合的方法、系统和装置。上述聚合类应用的推荐、多方推荐源聚合的方法、系统和装置能在多方推荐源所提供的候选文本进行的选取过程中减少误判，提高内容提供的准确性。
【IPC分类】G06F17/30
【公开号】CN104965853
【申请号】CN201510238077
【发明人】荆宁, 张红林, 王剑
【申请人】腾讯科技（深圳）有限公司
【公开日】2015年10月7日
【申请日】2015年5月11日

完整全部详细技术资料下载

当前第5页1 2 3 4 5