多新闻之间相关性计算方法和装置的制造方法

文档序号:9865491阅读:460来源:国知局
多新闻之间相关性计算方法和装置的制造方法
【技术领域】
[0001] 本发明设及计算机技术领域,具体而言,设及一种多新闻之间相关性计算方法和 装置。
【背景技术】
[0002] 在互联网领域,当为一个新闻出现时,通常需要为该新闻查找相关的新闻,W-并 推送给用户。
[0003] 目前的现有技术中,通常是按照一个新闻中的字面内容来查找相关新闻。运种查 找相关新闻的方式中存在较大的缺陷:因为相关的两个新闻之间可能语义相同而字面内容 不同,则根据现有技术无法找到语义相同而字面内容不同的新闻作为相关新闻。

【发明内容】

[0004] 鉴于上述问题,提出了本发明W便提供一种克服上述问题或者至少部分地解决上 述问题的多新闻之间相关性计算方法和装置。
[0005] 依据本发明的一种多新闻之间相关性计算方法,包括:确定第一新闻与第二新闻 的一级关联关系;确定所述第二新闻与第Ξ新闻的一级关联关系;根据所述第一新闻与所 述第二新闻的一级关联关系、所述第二新闻与所述第Ξ新闻的一级关联关系,建立所述第 一新闻与所述第Ξ新闻之间的二级关联关系。
[0006] 可选地,前述的方法,确定第一新闻与第二新闻的一级关联关系,具体包括:根据 所述第一新闻的特征属性设置第一向量,根据所述第二新闻的特征属性设置第二向量,计 算所述第一向量和所述第二向量的余弦相似度作为所述第一新闻与所述第二新闻的一级 关联关系;确定所述第二新闻与第Ξ新闻的一级关联关系,具体包括:根据所述第Ξ新闻的 特征属性设置第Ξ向量,计算所述第二向量和所述第Ξ向量的余弦相似度作为所述第二新 闻与所述第Ξ新闻的一级关联关系。
[0007] 可选地,前述的方法,根据所述第一新闻与所述第二新闻的一级关联关系、所述第 二新闻与所述第Ξ新闻的一级关联关系,建立所述第一新闻与所述第Ξ新闻之间的二级关 联关系,具体包括:根据所述第一新闻与所述第二新闻的一级关联关系、所述第二新闻与所 述第Ξ新闻的一级关联关系,计算所述第一新闻与所述第Ξ新闻的信息赌;根据所述第一 新闻与所述第Ξ新闻的信息赌,确定所述第一新闻与所述第Ξ新闻的二级关联关系。
[000引可选地,前述的方法,所述第二新闻为多个;在确定所述第二新闻与第Ξ新闻的一 级关联关系之前,还包括:根据预设规则,为每个第二新闻查找相应的第Ξ新闻;根据所述 第一新闻与所述第Ξ新闻的信息赌,确定所述第一新闻与所述第Ξ新闻的二级关联关系, 具体包括:根据每个第Ξ新闻对应的第二新闻在全部第二新闻中的占比,计算所述每个第 Ξ新闻的权重值;根据所述每个第Ξ新闻的权重值、所述每个第Ξ新闻对应的信息赌,计算 所述每个第Ξ新闻与所述第一新闻的二级关联关系。
[0009]可选地,前述的方法,所述第Ξ新闻为多个;所述方法还包括:根据所述多个第Ξ 新闻与所述第一新闻的二级关联关系,对所述多个第Ξ新闻进行排序。
[0010] 依据本发明的一种多新闻之间相关性计算装置,包括:第一关联关系确定模块,用 于确定第一新闻与第二新闻的一级关联关系;第二关联关系确定模块,确定所述第二新闻 与第Ξ新闻的一级关联关系;第Ξ关联关系确定模块,根据所述第一新闻与所述第二新闻 的一级关联关系、所述第二新闻与所述第Ξ新闻的一级关联关系,建立所述第一新闻与所 述第Ξ新闻之间的二级关联关系。
[0011] 可选地,前述的装置,所述第一关联关系确定模块根据所述第一新闻的特征属性 设置第一向量,根据所述第二新闻的特征属性设置第二向量,计算所述第一向量和所述第 二向量的余弦相似度作为所述第一新闻与所述第二新闻的一级关联关系;
[0012] 所述第二关联关系确定模块根据所述第Ξ新闻的特征属性设置第Ξ向量,计算所 述第二向量和所述第Ξ向量的余弦相似度作为所述第二新闻与所述第Ξ新闻的一级关联 关系。
[0013] 可选地,前述的装置,所述第Ξ关联关系确定模块根据所述第一新闻与所述第二 新闻的一级关联关系、所述第二新闻与所述第Ξ新闻的一级关联关系,计算所述第一新闻 与所述第Ξ新闻的信息赌;W及根据所述第一新闻与所述第Ξ新闻的信息赌,确定所述第 一新闻与所述第Ξ新闻的二级关联关系。
[0014] 可选地,前述的装置,所述第二新闻为多个;所述装置还包括:查找模块,用于根据 预设规则,为每个第二新闻查找相应的第Ξ新闻;所述第Ξ关联关系确定模块根据每个第 Ξ新闻对应的第二新闻在全部第二新闻中的占比,计算所述每个第Ξ新闻的权重值;W及 根据所述每个第Ξ新闻的权重值、所述每个第Ξ新闻对应的信息赌,计算所述每个第Ξ新 闻与所述第一新闻的二级关联关系。
[0015] 可选地,前述的装置,所述第Ξ新闻为多个;所述装置还包括:排序模块,用于根据 所述多个第Ξ新闻与所述第一新闻的二级关联关系,对所述多个第Ξ新闻进行排序。
[0016] 根据W上技术方案,本发明的多新闻之间相关性计算方法和装置至少具有W下优 占 . y ?、、·
[0017] 在本发明的技术方案中,第一新闻与第二新闻之间的一级关联关系反映了第一新 闻与第二新闻的字面内容之间的相似程度,第二新闻与第Ξ新闻之间的一级关联关系反映 了第一新闻与第二新闻的字面内容之间的相似程度,但计算得到的第一新闻与第Ξ新闻之 间的二级关联关系不再受到字面内容的限制,因为第二新闻与第一新闻字面相似的部分、 和第二新闻与第Ξ新闻字面相似的部分可W不同,其实际上反映的是第一新闻与第Ξ新闻 的语义相似程度,所W根据本发明的建立二级关联关系,可W查找到字面不同但语义相似 的新闻。
[0018] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予W实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,W下特举本发明的【具体实施方式】。
【附图说明】
[0019] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0020] 图1示出了根据本发明的一个实施例的多新闻之间相关性计算方法的流程图;
[0021] 图2示出了根据本发明的一个实施例的多新闻之间相关性计算方法的流程图;
[0022] 图3示出了根据本发明的一个实施例的多新闻之间相关性计算方法的原理图;
[0023] 图4示出了根据本发明的一个实施例的多新闻之间相关性计算装置的框图;
[0024] 图5示出了根据本发明的一个实施例的多新闻之间相关性计算装置的框图。
【具体实施方式】
[0025] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开 的示例性实施例,然而应当理解,可各种形式实现本公开而不应被运里阐述的实施例 所限制。相反,提供运些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围 完整的传达给本领域的技术人员。
[0026] 如图1所示,本发明的一个实施例中提供了一种多新闻之间相关性计算方法,包 括:
[0027] 步骤110,确定第一新闻与第二新闻的一级关联关系。在本实施例中,第一新闻与 第二新闻之间的一级关联关系反映了第一新闻与第二新闻的字面内容之间的相似程度。 [00%]步骤120,确定第二新闻与第Ξ新闻的一级关联关系。第二新闻与第Ξ新闻之间的 一级关联关系反映了第一新闻与第二新闻的字面内容之间的相似程度。
[0029] 步骤130,根据第一新闻与第二新闻的一级关联关系、第二新闻与第Ξ新闻的一级 关联关系,建立第一新闻与第Ξ新闻之间的二级关联关系。根据本实施的技术方案,计算得 到的第一新闻与第Ξ新闻之间的二级关联关系不再受到字面内容的限制,因为第二新闻与 第一新闻字面相似的部分、和第二新闻与第Ξ新闻字面相似的部分可W不同,其实际上反 映的是第一新闻与第Ξ新闻的语义相似程度,所W根据本发明的建立二级关联关系,可W 查找到字面不同但语义相似的新闻。
[0030] 本发明的一个实施例中还提供了一种多新闻之间相关性计算方法,相比于前述的 实施例,本实施例的多新闻之间相关性计算方法,步骤110,具体包括:
[0031] 根据第一新闻的特征属性设置第一向量,根据第二新闻的特征属性设置第二向 量,计算第一向量和第二向量的余弦相似度作为第一新闻与第二新
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1