呈现人物关联词的方法和装置的制作方法

文档序号:6584414阅读:223来源:国知局
专利名称:呈现人物关联词的方法和装置的制作方法
技术领域
本发明涉及互联网通信技术领域,特别涉及一种呈现人物关联词的方法和装置。
背景技术
随着互联网技术的快速发展,互联网在人们日常生活中的作用也日益增大,人们 可以通过互联网在线听音乐、看电影、阅读新闻报道等。目前,大多数人通过互联网在线阅 读各种新闻报道,获取各种新闻信息、了解各个人物之间的关联关系。然而,在实现本发明的过程中,发明人发现互联网中包括的信息量非常大,互联网 中有大量的新闻报道,并且一篇新闻报道中往往涉及多个人物,如果想要了解各个人物之 间的关联关系,需要阅读很多的新闻报道,而现在人们的生活节奏很快,人们没有很多的时 间去阅读所有的新闻报道,以了解各个人物之间的关联关系。因此,如果可以从大量的新闻报道中提取出能描述各个人物之间关联关系的词或 词组呈现给人们,通过简短的词或词组描述各个人物之间的关联关系,将会帮助人们以简 要的方式浏览各个人物之间的关联关系,以简要的方式了解各个人物之间发生的事情,将 可以使人们用最少的时间,获取最大的信息量。而目前还没有这么一种技术。

发明内容
为了使人们可以通过互联网用最少的时间,获取最大的信息量,本发明实施例提 供了一种呈现人物关联词的方法和装置。所述技术方案如下一方面,本发明实施例提供了一种呈现人物关联词的方法,所述方法包括从人物关联词资源中,提取每两个对应人物之间的人物关联词,并获取所述人物 关联词的初始规则权重;根据所述初始规则权重,计算所述初始规则权重对应的人物关联词的人物关联词 权重;根据所述人物关联词权重,以及所述人物关联词权重对应的时效因子,计算所述 人物关联词的时效权重;根据所述人物关联词的时效权重,呈现每两个对应人物之间的人物关联词。其中,所述从人物关联词资源中,提取每两个对应人物之间的人物关联词,并获取 所述人物关联词的初始规则权重具体可以包括获取人物关联词资源中的每个句子中的每个词的词性;当根据每个句子中的每个词的词性判断出该句子中含有两个以上人物时,在该句 子中包含的每一个词的前后选择预设个数的词,组成人物关联词提取组;根据句子语法规则和所述人物关联词提取组中各个词的词性,从所述人物关联词 提取组中提取该句子中包含的每两个对应人物之间的人物关联词,并赋予所述人物关联词 相应的初始规则权重。其中,所述根据所述初始规则权重,计算所述初始规则权重对应的人物关联词的人物关联词权重具体可以为

将所述人物关联词的长度的权重、所述人物关联词在新闻中的词频、所述人物关 联词的逆文档频率和所述人物关联词出现在新闻标题中时增加的权重中的至少一个,与所 述人物关联词的初始规则权重进行乘积,得到所述人物关联词的人物关联词权重。其中,所述根据所述人物关联词权重,以及所述人物关联词权重对应的时效因子, 计算所述人物关联词的时效权重具体可以为将所述人物关联词权重,与所述人物关联词权重对应的时效因子进行乘积,并将 乘积结果进行累加,得到所述人物关联词的时效权重。其中,所述根据所述人物关联词的时效权重,呈现每两个对应人物之间的人物关 联词具体可以包括对所述人物关联词的时效权重进行排序;按序依次呈现每两个对应人物之间的预设个数的人物关联词。另一方面,本发明实施例提供了一种呈现人物关联词的装置,所述装置包括人物关联词提取模块,用于从人物关联词资源中,提取每两个对应人物之间的人 物关联词,并获取所述人物关联词的初始规则权重;人物关联词权重计算模块,用于在所述人物关联词提取模块获取到所述人物关联 词的初始规则权重后,根据所述初始规则权重,计算所述初始规则权重对应的人物关联词 的人物关联词权重;时效权重计算模块,用于在所述人物关联词权重计算模块计算得到人物关联词权 重后,根据所述人物关联词权重,以及所述人物关联词权重对应的时效因子,计算所述人物 关联词的时效权重;人物关联词呈现模块,用于在所述时效权重计算模块计算得到时效权重后,根据 所述人物关联词的时效权重,呈现每两个对应人物之间的人物关联词。其中,所述人物关联词提取模块具体可以包括词性获取单元,用于获取人物关联词资源中的每个句子中的每个词的词性;人物关联词提取组获取单元,用于在所述词性获取单元得到每个句子中的每个词 的词性后,当根据每个句子中的每个词的词性判断出该句子中含有两个以上人物时,在该 句子中包含的每一个词的前后选择预设个数的词,组成人物关联词提取组;人物关联词提取单元,用于在所述人物关联词提取组获取单元得到人物关联词提 取组后,根据句子语法规则和所述人物关联词提取组中各个词的词性,从所述人物关联词 提取组中提取该句子中包含的每两个对应人物之间的人物关联词,并赋予所述人物关联词 相应的初始规则权重。其中,所述人物关联词权重计算模块,具体可以用于在所述人物关联词提取模块 获取到所述人物关联词的初始规则权重后,将所述人物关联词的长度的权重、所述人物关 联词在新闻中的词频、所述人物关联词的逆文档频率和所述人物关联词出现在新闻标题中 时增加的权重中的至少一个,与所述人物关联词的初始规则权重进行乘积,得到所述人物 关联词的人物关联词权重。其中,所述时效权重计算模块,具体可以用于在所述人物关联词权重计算模块计 算得到人物关联词权重后,将所述人物关联词权重,与所述人物关联词权重对应的时效因子进行乘积,并将乘积结果进行累加,得到所述人物关联词的时效权重。其中,所述人物关联词呈现模块具体可以包括时效权重排序单元,用于在所述时效权重计算模块计算得到每两个对应人物之间 的每个人物关联词的时效权重后,对所述人物关联词的时效权重进行排序;

人物关联词呈现单元,用于在所述时效权重排序单元对所述人物关联词的时效权 重进行排序后,按序依次呈现每两个对应人物之间的预设个数的人物关联词。本发明实施例提供的技术方案的有益效果是通过从关联词资源中提取得到每两个对应人物之间的人物关联词,并根据每两个 对应人物之间的每个人物关联词的时效权重,呈现每两个对应人物之间的人物关联词,使 得可以根据两个对应人物之间的人物关联词了解到人物之间的关系,帮助用户以简要的方 式浏览人物关联关系,以简要的方式了解人物之间发生的事情,可以使用户用最少的时间, 获取最大的信息量,大大节约了用户的时间。


图1是本发明实施例1提供的一种呈现人物关联词的方法流程图;图2是本发明实施例2提供的一种呈现人物关联词的方法流程图;图3是本发明实施例3提供的一种呈现人物关联词的装置结构示意图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。实施例1本发明实施例提供了一种呈现人物关联词的方法,参见图1,具体包括101 从人物关联词资源中,提取每两个对应人物之间的人物关联词,并获取人物 关联词的初始规则权重。102 根据初始规则权重,计算该初始规则权重对应的人物关联词的人物关联词权重。103 根据人物关联词权重,以及该人物关联词权重对应的时效因子,计算人物关 联词的时效权重。104 根据人物关联词的时效权重,呈现每两个对应人物之间的人物关联词。其中,从人物关联词资源中,提取每两个对应人物之间的人物关联词,并获取人物 关联词的初始规则权重具体可以包括获取人物关联词资源中的每个句子中的每个词的词性;当根据每个句子中的每个词的词性判断出该句子中含有两个以上人物时,在该句 子中包含的每一个词的前后选择预设个数的词,组成人物关联词提取组;根据句子语法规则和人物关联词提取组中各个词的词性,从人物关联词提取组中 提取该句子中包含的每两个对应人物之间的人物关联词,并赋予人物关联词相应的初始规 则权重。其中,根据初始规则权重,计算初始规则权重对应的人物关联词的人物关联词权重具体可以为将人物关 联词的长度的权重、人物关联词在新闻中的词频、人物关联词的逆文档 频率和人物关联词出现在新闻标题中时增加的权重中的至少一个,与人物关联词的初始规 则权重进行乘积,得到人物关联词的人物关联词权重。其中,根据人物关联词权重,以及人物关联词权重对应的时效因子,计算人物关联 词的时效权重具体可以为将人物关联词权重,与人物关联词权重对应的时效因子进行乘积,并将乘积结果 进行累加,得到人物关联词的时效权重。其中,根据人物关联词的时效权重,呈现每两个对应人物之间的人物关联词具体 可以包括对人物关联词的时效权重进行排序;按序依次呈现每两个对应人物之间的预设个数的人物关联词。本发明实施例所述的呈现人物关联词的方法,通过从人物关联词资源中提取得到 每两个对应人物之间的人物关联词,并根据每两个对应人物之间的每个人物关联词的时效 权重,呈现每两个对应人物之间的人物关联词,使得可以根据两个对应人物之间的人物关 联词了解到人物之间的关系,帮助用户以简要的方式浏览人物关联关系,以简要的方式了 解人物之间发生的事情,可以使用户用最少的时间,获取最大的信息量,大大节约了用户的 时间。实施例2本发明实施例提供了一种呈现人物关联词的方法,参见图2,具体包括201 获取人物关联词资源,并将人物关联词资源中的第一个句子作为当前句子。具体地,可以通过搜素引擎对互联网中的各个网站中包括的各种新闻报道进行搜 素,将搜索到的各个网站中的各种文字新闻报道作为人物关联词资源;或者可以事先指定 几个网站,通过搜素引擎对指定的几个网站中包括的各种新闻报道进行搜素,将搜索到的 该几个网站中的各种文字新闻报道作为人物关联词资源;或者可以根据实际应用状况采用 其他的方法获取人物关联词资源。并且,一般可以将从人物关联词资源中提取的具有完整 语义的一段文字作为一个句子,具体可以通过一段文字结尾的标点符号或文字结尾的特殊 用语判断该段文字是否具有完整的语义。例如如果该段文字是汉语,那么如果该段文字结 尾的标点符号是句号、问号、或叹号等,或者该段文字结尾是语气助词,则该段文字为一个 句子。需要说明的是,本发明实施例是将人物关联词资源中的第一个句子作为当前句子 开始进行搜索计算,实际应用中还可以将人物关联词资源中的最后一个句子,或者第二个 句子等作为当前句子开始进行搜索计算,并不限于此,可以根据实际应用状况灵活设置。202 获取当前句子中的每个词的词性。具体地,可以利用各种分词系统对当前句子进行分词和词性标注,从而获取当前 句子中的每个词的词性。对于汉语其词性一般包括动词、名词、名形词、形容词、数词、量词、连词、方位词、 介词、副词、名动词、人名、名语素、简称略语、副动词、状态词、副形词、地名、处所词、非汉字 串、区别词、其他专名、时间词、代词、助词等。
203 判断当前句子中是否含有两个以上人物,如果是,则执行步骤204 ;否则,执 行步骤205。具体地,在步骤202得到当前句子中各个词的词性后,通过当前句子中包含的属 于人名的词的个数可以很容易地得出当前句子中包含的人物个数,从而可以判断出当前句 子中是否含有两个以上人物。204:根据当前句子中包含的各个词的词性和句子语法规则,从当前句子中提取每 两个对应人物之间的人物关联词,并获取每个人物关联词的初始规则权重。 其中,人物关联词是指从人物关联词资源中提取的,能描述人物之间关联关系的 词或词组。例如“陈冠希和阿娇在艳照门事件中大受打击”,这一句子中,可以提取出“艳 照门事件”、“大受打击”两个词组成的词组来描述人物陈冠希和阿娇之间的关联关系。提取 出的人物关联词应该满足下面的条件首先,需要满足“语义完整”这一要求,即能表达完整 意思;其次,人物之间的关联关系是随着时间推移而变化的,因此提取出的人物关联词还需 要满足一定的时效性。人物关联词的提取主要依赖于句子语法规则,每一个规则提取出来 的词组都会被赋予一个初始的权重值,叫做初始规则权重,记作H(W),不同规则提取出来的 词组,其对应的初始规则权重值可以相同也可以不同。并且,需要说明的是,当当前句子中 含有两个人物时,则该句子中的这两个人物就是对应的人物,提取出的关联词就是该两个 对应人物之间的人物关联词。当当前句子中含有两个以上人物时,可以对包含的各个人物 进行两两组合,将提取出的关联词作为两两对应人物之间的人物关联词;或只将提取出的 关联词作为当前句子中含有的前两个、后两个、或中间两个对应人物之间的人物关联词等。 本发明实施例中综合考虑提取人物关联词的速度和提取的人物关联词的有效性,当当前句 子中含有两个以上人物时,不对包含的各个人物进行两两组合,只将提取出的关联词作为 当前句子中含有的前两个对应人物之间的人物关联词。具体过程如下2041 将当前句子中的每一个词依次作为当前词,分别在当前词前后选择预设个 数的词,组成人物关联词提取组。本发明实施例中选择在当前词前的一个词,在当前词之后的二个词组成人物关联 词提取组,并记当前词是A、前一个词是P、后一个词是B、后二个词是C,它们的词性分别为 posA、posP、posB、posC。其中,前一个词P、后一个词B、后二个词C是分别相对当前词来界定的,例如前一 个词P是指位于当前词A之前的第一个词,后一个词B是指位于当前词A之后的第一个词、 后二个词C是指位于当前词A之后的第二个词。需要说明的是,可以根据实际应用状况,选 择由当前词前的几个词,当前词之后的几个词组成人物关联词提取组,并不限于上述的方法。2042:根据句子语法规则和人物关联词提取组中各个词的词性,从人物关联词提 取组中提取当前句子中包括的每两个对应人物之间的人物关联词,并获取每个人物关联词 的初始规则权重。以汉语为例进行详细说明,具体地,根据汉语句子语法规则和人物关联词提取组 中各个词的词性,从人物关联词提取组中提取两个对应人物之间的人物关联词,并获取每 个人物关联词的初始规则权重具体为
(1)设词性集合pos(part of speech,词性)Z= {动词、名词、名形词、形容词、数 词、量词、连词、方位词、介词、副词、名动词、人名、名语素、简称略语、副动词、状态词、副形 词、地名、处所词、非汉字串、区别词、其他专名、时间词、代词}。并人工总结出第一特殊词集 Tl = { “甚至”、“但凡”、“如果”、“可是”、“其实”…},属于第一特殊词集中的词,后面紧随 任何词组成的词组都被认为是没有意义的,如“甚至吃力”等。人工总结出第二特殊词集T2 ={ “方面”、“觉得”、“认为”、“好 像”…},属于第二特殊词集中的词,和前一个词连接组成 的词组都被认为是没有意义的,如“一致觉得”等。(2)如果A e Tl或者B e T2,则跳过当前词,将当前句子中的下一个词作为当前 词接着进行人物关联词提取;(3)如果PosAe {动词,名动词},且posB e {名词,名形词,名动词,地名,处所
词},且posCgposZ,且posC不是结构助词、时态助词或者posC是语气助词,且posP茫
{非汉字串,形语素},则AB组成的词组被提取出作为一个人物关联词W,并赋予AB组成的 词组的初始规则权重H(W)的值为χ ;例如对“李亚红、王菲等选美,年轻一代力压对手”,“力压对手”被提取出来,因为 “力压”是动词,而“对手”是名词。(4)如果posP不是动词,且posA是动词,posB是副词,且posC是形容词,且C的 后面是当前句子的结尾,则ABC组成的词组被提取出作为一个人物关联词w,并赋予ABC组 成的词组的初始规则权重H(W)的值为λ ;(5)如果posA是副词,且posB是动词,且posC不是名词,则AB组成的词组被提取 出作为一个人物关联词w,并赋予AB组成的词组的初始规则权重H(W)的值为γ ;(6)如果posAe {名词,名形词},且posB是名形词,且pOsCg {名语素、名形词、
名词},则AB组成的词组被提取出作为一个人物关联词w,并赋予AB组成的词组的初始规 则权重H(W)的值为δ ;(7)如果posA是名词,且posB是名动词,且posPS {数词、名词、介词、其他专
名},且posCS {名词、动名词、名形词},则AB组成的词组被提取出作为一个人物关联词 w,并赋予AB组成的词组的初始规则权重H(w)的值为μ ;(8)如果posAe {名词,名形词},posB e {名词,形容词},且posP不是名语素; 或者posA是动词且posB也是动词;或者posA是副词且posB是形容词;或者posA是副词 且posB是动词;或者posA是动词且posB是形容词;或者posA是副动词且posB是动词,且 之后是当前句子的结尾;则AB组成的词组被提取出作为一个人物关联词w,并赋予AB组成 的词组的初始规则权重H(W)的值为η。上述描述中,X、λ、Υ、δ、μ、η分别表示不同规则对应的初始规则权重H(W) 的值。可以根据实际应用状况设置X、λ、Υ、δ、μ、η的取值,并且,各个取值可以相同, 也可以不同。对于英语、日语等其他语言种类可以采用与汉语类似的方法进行人物关联词提 取,此处不再进行一一赘述。205:判断当前句子是否是人物关联词资源中的最后一个句子,如果是则执行 207 ;否则,执行206。
206 将当前句子的下一个句子作为当前句子,然后执行202。207:根据获取的每两个对应人物之间的每个人物关联词的初始规则权重,计算提 取出的每两个对应人物之间的每个人物关联词的人物关联词权重。人物关联词权重是用来描述和比较两个对应人物之间的多个人物关联词之间 重要性的一个值,记作F(w,d),其中w表示人物关联词,d表示提取该人物关联词时的时 间。例如F(〃艳照门",“2008-08-07" ) = 34,表示“艳照门”这个人物关联词,在 “2008-08-07”当日的新闻报道中的人物关联词权重是34。根据提取出的两个对应人物之 间的每个人物关联词的初始规则权重,可以设置多种人物关联词权重的计算公式,本发明 实施例中设置的人物关联词权重计算公式如下所示 F (w,d) = log (L (w)) *P (TF (w) *IDF (w)) *H (w) *T (w)其中,w表示人物关联词;d表示提取该人物关联词时的时间;L (w)表示人物关联 词的长度,从上述预设的人物关联词权重计算公式可以看出,本发明实施例中采用了长度 优先原则,这是基于一个基本的假设字数越多的词组一般能表达更为丰富的语义,并且本 发明实施例中采用log(L(w))的方式对L(w)在计算F(w,d)中的权重进行衡量;TF(W)表 示人物关联词在新闻中的词频;IDF(W)表示人物关联词的逆文档频率,IDF(w)可以事先通 过对已有的一些文字新闻资料进行统计得到,例如本发明实施例通过对数据库中保存的 2008年全年的文字新闻进行统计得到IDF(W) ;P表示分段函数;H(W)表示初始规则权重; T(w)表示人物关联词出现在新闻标题中时增加的权重,本发明实施例中设置T(w)的默认 值为1,当该人物关联词出现在新闻标题中时,可以赋予大于1的任意值,如2、3等,但并 不限于此,可以根据实际应用状况进行设置。并且需要说明的是,人物关联词权重计算公 式,并不限于上述的一种,可以根据实际应用状况进行设置,例如上述log(L(w))可以用 e(L(w))表示,并且可以不考虑T(w)、IDF(w)和T(W)等;或者可以直接将初始规则权重作 为人物关联词权重等等。根据本发明实施例设置的人物关联词权重计算公式可以看出,利用本发明实施例 设置的人物关联词权重计算公式计算得到的人物关联词权重越大,则表明该人物关联词权 重越重要。并且需要说明的是,可以将提取的每个人物关联词以及计算得到的每个人物关 联词的人物关联词权重以数据库的形式进行保存。208 根据计算得到的每个人物关联词的人物关联词权重,以及每个人物关联词权 重对应的时效因子,计算每个人物关联词的时效权重。其中,人物关联词权重对应的时效因子是根据人物关联词权重对应的时间与参 考时间之间的时间距离得到的,引入时效因子的目的是为了体现每个人物关联词的人物 关联词权重的时效性,时效因子的具体形式可以有多种,例如,可以将时效因子设置为T
=α [L(d0, d)]e,或将时效因子设置为Τ="77Τ^^,其中,《和β为可调整的参数;
L (d0, d)表示人物关联词权重对应的时间d与参考时间dQ之间的时间距离,例如2009年07 月29日与2009年08月01日之间的时间距离为2天。本发明实施例不对时效因子的具体形 式进行限定,同样不对α和β的具体数值进行限定,为了使计算每个人物关联词的时效权 重的方式统一,使每个人物关联词的时效权重更具参考性,在计算每个人物关联词的时效权重时,采取相同形式的时效因子,以及统一的α和β值。以时效因子为
权利要求
1.一种呈现人物关联词的方法,其特征在于,所述方法包括从人物关联词资源中,提取每两个对应人物之间的人物关联词,并获取所述人物关联 词的初始规则权重;根据所述初始规则权重,计算所述初始规则权重对应的人物关联词的人物关联词权重;根据所述人物关联词权重,以及所述人物关联词权重对应的时效因子,计算所述人物 关联词的时效权重;根据所述人物关联词的时效权重,呈现每两个对应人物之间的人物关联词。
2.根据权利要求1所述的呈现人物关联词的方法,其特征在于,所述从人物关联词资 源中,提取每两个对应人物之间的人物关联词,并获取所述人物关联词的初始规则权重具 体包括获取人物关联词资源中的每个句子中的每个词的词性;当根据每个句子中的每个词的词性判断出该句子中含有两个以上人物时,在该句子中 包含的每一个词的前后选择预设个数的词,组成人物关联词提取组;根据句子语法规则和所述人物关联词提取组中各个词的词性,从所述人物关联词提取 组中提取该句子中包含的每两个对应人物之间的人物关联词,并赋予所述人物关联词相应 的初始规则权重。
3.根据权利要求1所述的呈现人物关联词的方法,其特征在于,所述根据所述初始规 则权重,计算所述初始规则权重对应的人物关联词的人物关联词权重具体为将所述人物关联词的长度的权重、所述人物关联词在新闻中的词频、所述人物关联词 的逆文档频率和所述人物关联词出现在新闻标题中时增加的权重中的至少一个,与所述人 物关联词的初始规则权重进行乘积,得到所述人物关联词的人物关联词权重。
4.根据权利要求1所述的呈现人物关联词的方法,其特征在于,所述根据所述人物关 联词权重,以及所述人物关联词权重对应的时效因子,计算所述人物关联词的时效权重具 体为将所述人物关联词权重,与所述人物关联词权重对应的时效因子进行乘积,并将乘积 结果进行累加,得到所述人物关联词的时效权重。
5.根据权利要求1所述的呈现人物关联词的方法,其特征在于,所述根据所述人物关 联词的时效权重,呈现每两个对应人物之间的人物关联词具体包括对所述人物关联词的时效权重进行排序;按序依次呈现每两个对应人物之间的预设个数的人物关联词。
6.一种呈现人物关联词的装置,其特征在于,所述装置包括人物关联词提取模块,用于从人物关联词资源中,提取每两个对应人物之间的人物关 联词,并获取所述人物关联词的初始规则权重;人物关联词权重计算模块,用于在所述人物关联词提取模块获取到所述人物关联词的 初始规则权重后,根据所述初始规则权重,计算所述初始规则权重对应的人物关联词的人 物关联词权重;时效权重计算模块,用于在所述人物关联词权重计算模块计算得到人物关联词权重 后,根据所述人物关联词权重,以及所述人物关联词权重对应的时效因子,计算所述人物关联词的时效权重;人物关联词呈现模块,用于在所述时效权重计算模块计算得到时效权重后,根据所述 人物关联词的时效权重,呈现每两个对应人物之间的人物关联词。
7.根据权利要求6所述的呈现人物关联词的装置,其特征在于,所述人物关联词提取 模块具体包括词性获取单元,用于获取人物关联词资源中的每个句子中的每个词的词性;人物关联词提取组获取单元,用于在所述词性获取单元得到每个句子中的每个词的词 性后,当根据每个句子中的每个词的词性判断出该句子中含有两个以上人物时,在该句子 中包含的每一个词的前后选择预设个数的词,组成人物关联词提取组;人物关联词提取单元,用于在所述人物关联词提取组获取单元得到人物关联词提取组 后,根据句子语法规则和所述人物关联词提取组中各个词的词性,从所述人物关联词提取 组中提取该句子中包含的每两个对应人物之间的人物关联词,并赋予所述人物关联词相应 的初始规则权重。
8.根据权利要求6所述的呈现人物关联词的装置,其特征在于,所述人物关联词权重计算模块,具体用于在所述人物关联词提取模块获取到所述人物 关联词的初始规则权重后,将所述人物关联词的长度的权重、所述人物关联词在新闻中的 词频、所述人物关联词的逆文档频率和所述人物关联词出现在新闻标题中时增加的权重中 的至少一个,与所述人物关联词的初始规则权重进行乘积,得到所述人物关联词的人物关 联词权重。
9.根据权利要求6所述的呈现人物关联词的装置,其特征在于,所述时效权重计算模块,具体用于在所述人物关联词权重计算模块计算得到人物关联 词权重后,将所述人物关联词权重,与所述人物关联词权重对应的时效因子进行乘积,并将 乘积结果进行累加,得到所述人物关联词的时效权重。
10.根据权利要求6所述的呈现人物关联词的装置,其特征在于,所述人物关联词呈现 模块具体包括时效权重排序单元,用于在所述时效权重计算模块计算得到每两个对应人物之间的每 个人物关联词的时效权重后,对所述人物关联词的时效权重进行排序;人物关联词呈现单元,用于在所述时效权重排序单元对所述人物关联词的时效权重进 行排序后,按序依次呈现每两个对应人物之间的预设个数的人物关联词。
全文摘要
本发明公开了一种呈现人物关联词的方法和装置,属于互联网通信技术领域。方法包括从人物关联词资源中,提取每两个对应人物之间的人物关联词,并获取人物关联词的初始规则权重;根据初始规则权重,计算初始规则权重对应的人物关联词的人物关联词权重;根据人物关联词权重,以及人物关联词权重对应的时效因子,计算人物关联词的时效权重;根据人物关联词的时效权重,呈现每两个对应人物之间的人物关联词。装置包括人物关联词提取模块、人物关联词权重计算模块、时效权重计算模块和人物关联词呈现模块。本发明通过提取出两个对应人物之间的人物关联词,了解人物之间的关系,可以使用户用最少的时间,获取最大的信息量,大大节约了用户的时间。
文档编号G06F17/30GK102043817SQ20091023571
公开日2011年5月4日 申请日期2009年10月12日 优先权日2009年10月12日
发明者姜爱荣, 李务斌, 贾自艳 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1