信息获取方法及装置和信息推送方法及装置的制造方法

文档序号:10552938阅读:218来源:国知局
信息获取方法及装置和信息推送方法及装置的制造方法
【专利摘要】本发明实施例提供的一种信息获取方法及装置和信息推送方法及装置,该方法先获取待推送信息的第一主子集包含关系,第一主子集包含关系中的最下级子节点是从用户已发表的文章信息中获得的主题词,由于用户在文章信息中描述的主题词一般都是比较细节的技术领域,所以所获得第一主子集包含关系的过程为从大范围的技术领域划分至小范围的技术领域的过程,这样在推送信息时,可以依据待推送信息的第二主子集包含关系与用户的列表中第一主子集包含关系的匹配度,确定是否为该用户推动该待推送的信息。从而提高推送信息的准确性。
【专利说明】
信息获取方法及装置和信息推送方法及装置
技术领域
[0001]本发明实施例涉及通信技术领域,更具体的涉及一种信息获取方法及装置和信息推送方法及装置。
【背景技术】
[0002]目前的学术社交网络都是基于一个泛泛的研究方向,导致用户之间的学术交流并不精准。
[0003]例如,目前医学技术领域中的细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、月中瘤细胞等等,生殖细胞又包括:卵母细胞、精子,卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。可以将细胞生物一一生殖细胞一一卵母细胞一一细胞骨架这种技术领域依次包含的关系,称为以细胞骨架为最下级子节点的主子集包含关系。而学术社交网络中各个用户的领域只划分到细胞生物学,并未在进行细节划分,在进行信息推送时,如果是卵母细胞信息,则会将该信息推送至领域为细胞生物学的所有用户,显然用户可能是研究信号通路的,不是研究卵母细胞的,这时该卵母细胞信息对该用户就是无用的信息。
[0004]综上,现有技术中由于学术社交网络上用户的技术领域范围较大,而导致为各个用户推送的信息并不一定是该用户所需要的信息,导致推送信息的准确度下降。

【发明内容】

[0005]为此本发明提供一种信息推送方法和装置,以解决现有技术中由于学术社交网络上用户的技术领域范围较大而导致为各个用户推送的信息并不一定是该用户所需要的信息,导致推送信息准确度下降的问题。
[0006]为实现上述目的,本发明提供如下技术方案:
[0007]—种信息推送方法,所述信息推送方法推送的信息至少包括一个待推送信息,对于每一待推送信息,所述信息推送方法包括:
[0008]获取待推送信息的第一主子集包含关系,所述第一主子集包含关系是以所述待推送信息中的主题词为最下级子节点的第一主子集包含关系,所述第一主子集包含关系是依据主题词表确定的,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的对应关系的列表,所述待推送信息包括视频信息、会议信息或文章信息;
[0009]从用户的列表中获取第二主子集包含关系,所述第二主子集包含关系是以所述用户已发表的文章信息中的主题词为最下级子节点的第二主子集包含关系,所述第二主子集包含关系是依据所述主题词表确定的;
[0010]计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度;
[0011 ]依据所述匹配度,确定是否为所述用户推送所述待推送信息。
[0012]优选地,还包括:
[0013]将各个所述待推送信息中匹配度大于预设阈值的各个第一待推送信息,按照所述匹配度从高至低依次推送至所述用户。
[0014]其中,所述计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度具体为:
[0015]计算所述第一主子集包含关系与所述第二主子集包含关系的重叠概率,所述重叠概率为所述匹配度。
[0016]一种信息获取方法,包括:
[0017]从用户已发表的文章信息中,获取主题词;
[0018]依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,获得主子集包含关系,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的关系的列表;
[0019]将所述主子集包含关系存储至所述用户的列表中。
[0020]—种信息推送装置,所述信息推送方法推送的信息至少包括一个待推送信息,对于每一待推送信息,包括:
[0021 ]第一获取模块,用于获取待推送信息的第一主子集包含关系,所述第一主子集包含关系是以所述待推送信息中的主题词为最下级子节点的第一主子集包含关系,所述第一主子集包含关系是依据主题词表确定的,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的对应关系的列表,所述待推送信息包括视频信息、会议信息或文章信息;
[0022]第二获取模块,用于从用户的列表中获取第二主子集包含关系,所述第二主子集包含关系是以所述用户已发表的文章信息中的主题词为最下级子节点的第二主子集包含关系,所述第二主子集包含关系是依据所述主题词表确定的;
[0023]计算模块,用于计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度;
[0024]推送模块,用于依据所述匹配度,确定是否为所述用户推送所述待推送信息。
[0025]优选的,还包括:
[0026]推送信息模块,用于将各个所述待推送信息中匹配度大于预设阈值的各个第一待推送信息,按照所述匹配度从高至低依次推送至所述用户。
[0027]其中,所述计算模块包括:
[0028]计算单元,用于计算所述第一主子集包含关系与所述第二主子集包含关系的重叠概率,所述重叠概率为所述匹配度。
[0029]一种信息获取装置,包括:
[0030]获取主题词模块,用于从用户已发表的文章信息中,获取主题词;
[0031]获取主子集包含关系模块,用于依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,获得主子集包含关系,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的关系的列表;
[0032]存储模块,用于将所述主子集包含关系存储至所述用户的列表中。
[0033]经由上述的技术方案可知,与现有技术相比,本发明实施例提供的一种信息获取方法,先获取待推送信息的第一主子集包含关系,第一主子集包含关系中的最下级子节点是从用户已发表的文章信息中获得的主题词,由于用户在文章信息中描述的主题词一般都是比较细节的技术领域,所以所获得第一主子集包含关系的过程为从大范围的技术领域划分至小范围的技术领域的过程,这样在推送信息时,可以依据待推送信息的第二主子集包含关系与用户的列表中第一主子集包含关系的匹配度,确定是否为该用户推动该待推送的信息。从而提高推送信息的准确性。
【附图说明】
[0034]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0035]图1为本发明实施例提供的一种信息获取方法的流程示意图;
[0036]图2为本发明实施例提供的一种信息推送方法的流程示意图;
[0037]图3为本发明实施例提供的一种信息获取装置的结构示意图;
[0038]图4为本发明实施例提供的一种信息推送装置的结构示意图。
【具体实施方式】
[0039]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0040]请参阅图1,为本发明实施例提供的一种信息推送方法的流程示意图,所述信息推送方法推送的信息至少包括一个待推送信息,对于每一待推送信息,该方法包括:
[0041]步骤SlOl:获取待推送信息的第一主子集包含关系。
[0042]所述第一主子集包含关系是以所述待推送信息中的主题词为最下级子节点的第一主子集包含关系,所述第一主子集包含关系是依据主题词表确定的,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的对应关系的列表,所述待推送信息包括视频信息、会议信息或文章信息。
[0043]可以理解的是,不能直接从视频信息、会议信息中获得主题词,但是每一视频信息或会议信息都有与之相对应的描述内容,视频信息、会议信息的主子集包含关系的获取方法可以为:首先通过对其描述的内容获得的主题词,依据主题词表获得视频信息或会议信息的主子集包含关系。
[0044]以医学领域为例,假设主题词表包括各个医学研究方向,即主题词表包括医学主题词表,则医学主题词表包括各个医学研究方向,以及医学研究方向上下级对应关系,例如细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞等等,生殖细胞又包括:卵母细胞、精子,卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。假设用户研究的是细胞骨架即主题词为细胞骨架,则用户的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞--细胞骨架。
[0045]主子集包含关系是依据主题词表确定的,主题词表中各个技术领域及其细分技术可以组成树状结构,可以从树状结构中获得相应的主题词,再确定该主题词所在的树状结构的主子集包含关系。
[0046]步骤S102:从用户的列表中获取第二主子集包含关系。
[0047]所述第二主子集包含关系是以所述用户已发表的文章信息中的主题词为最下级子节点的第二主子集包含关系,所述第二主子集包含关系是依据所述主题词表确定的。
[0048]步骤S103:计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度。
[0049]步骤S104:依据所述匹配度,确定是否为所述用户推送所述待推送信息。
[0050]如果待推送信息为多个时,可以将各个待推送信息按照所述匹配度从高至低依次推送至用户。假设视频信息I与用户的匹配度为3/4,会议信息2与用户的匹配度为2/4,文章信息3与用户的匹配度为4/4,则首先为用户推送文章信息3,再次为用户推送视频信息1,最后为用户推送会议信息2。
[0051]可以将各个所述待推送信息中匹配度大于预设阈值的各个第一待推送信息,按照所述匹配度从高至低依次推送至所述用户,仍以上述例子进行说明,假设预设值为3/4,则可以同时为用户推送文章信息3和视频信息I,也可以首先为用户推送用户3的文章信息,再次为用户推送视频信息I。而不为用户推送会议信息2。
[0052]本发明实施例提供的信息推送方法,在计算出待推送信息与用户的匹配度后,依据匹配度确定是否为用户推送该待推送信息,从而避免了将技术领域相差太大的信息推送至研究人员的情况,提高了推送信息的准确度。
[0053]在上述信息推送方法实施例中,都是以医学技术领域作为例子进行说明的,但是上述信息推送方法实施例的技术方案并不仅限定于医学技术领域,还可以是其他技术领域,例如化学技术领域、电学技术领域等等。
[0054]本发明实施例提供的一种信息获取方法,先获取待推送信息的第一主子集包含关系,第一主子集包含关系中的最下级子节点是从用户已发表的文章信息中获得的主题词,由于用户在文章信息中描述的主题词一般都是比较细节的技术领域,所以所获得第一主子集包含关系的过程为从大范围的技术领域划分至小范围的技术领域的过程,这样在推送信息时,可以依据待推送信息的第二主子集包含关系与用户的列表中第一主子集包含关系的匹配度,确定是否为该用户推动该待推送的信息。从而提高推送信息的准确性。
[0055]本发明实施例还提供了一种信息推送方法中计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度的一种实现方法,该方法包括:计算所述第一主子集包含关系与所述第二主子集包含关系的重叠概率,所述重叠概率为所述匹配度。
[0056]假设待推送信息包括视频信息1、会议信息2、文章信息3,视频信息I的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞一一信号通路;会议信息2的主子集包含关系为细胞生物一一生殖细胞一一胚胎干细胞一一造血细胞;文章信息3的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞一一细胞骨架。
[0057]假设用户的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞一一细胞骨架,则待推送信息中视频信息I的主子集包含关系与用户的主子集包含关系的重叠概率为3/4;会议信息2的主子集包含关系与用户的主子集包含关系的重叠概率为2/4;文章信息3的主子集包含关系与用户的主子集包含关系的重叠概率为4/4。
[0058]请参阅图2,为本发明实施例提供的一种信息获取方法的流程示意图,该方法包括:
[0059]步骤S201:从用户已发表的文章信息中,获取主题词。
[0060]获得主题词的方法可以为:从所述用户已发表的文章信息中,获取所述文章信息中包含预设词汇的语句信息;获取所述语句信息中的主题词。文章信息包括论文信息、专利信息、图书信息中的一种或多种。
[0061]因为发布的论文、专利、图书要求比较严格,用户在论文、专利或图书中所描述的技能词汇都是标准的、专业的,对于同一个主题词不同的用户的描述是相同的,不存在现有技术中在学术社交网络上用户填写的五花八门的情况。具体的,可以从文章信息中的摘要、全文中获得主题词。
[0062]用户已发表的文章信息,可以是预先存储在数据库中的,也可以是通过网络爬虫的方式从不同网站,不同数据库获得的,具体的,可以通过该用户的姓名、工作单位等等信息利用网络爬虫技术获取用户已经发表的文章。
[0063]预设词汇可以是整理者阅读该用户已发表的文章,熟悉该用户的描述方式后获得的,即该用户所描述的主题词都是与哪些词汇一起出现的。例如某一用户经常在摘要中Discuss1n、use、used、using、employed、employ等词汇的后面描述主题词,也就是说Discuss1n、use、used、using、employed、employ这些词汇与主题词一般都同时出现,由于主题词的种类较多,且可能是由多个字或字符组成,在并不确定当前获得的主题词是由几个字或字符组成的情况下,直接从文章信息中获得主题词,需要服务器具备强大的数据处理能力,而预设词汇一般情况下的字或字符数比较小,且比较统一,且因此,可以先从文章信息中获得包含预设词汇的语句信息。最初的预设词汇是人为整理的,但是在整个方法运行后,可以通过机器学习,对预设词汇进行更新。
[0064]由于已知预设词汇,可以利用词汇搜索功能,对文章信息中包含该预设词汇的语句进行定位。在中文中,每一个语句结尾都有“。”,在英文中,每一个语句的结尾都有可以依据上述两个特征,来从文章信息中截取包含预设词汇的语句信息。
[0065]获取所述语句信息中的主题词,具体的可以是通过语义分析识别技术获得语句信息中的主题词。
[0066]步骤S202:依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,获得主子集包含关系。
[0067]所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的关系的列表。
[0068]假设主题词表包括各个医学研究方向,即主题词表包括医学主题词表,则医学主题词表包括医学研究方向上下级对应关系,例如细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞等等,生殖细胞又包括:卵母细胞、精子。卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。假设用户研究的是细胞骨架即主题词为细胞骨架,则用户的父节点为细胞生物,最下级子节点为细胞骨架,主子集包含关系包括:细胞生物一一生殖细胞一一卵母细胞一一细胞骨架。
[0069]步骤S203:将所述主子集包含关系存储至所述用户的列表中。
[0070]在上述信息获取方法实施例中,都是以医学技术领域作为例子进行说明的,但是上述信息获取方法实施例的技术方案并不仅限定于医学技术领域,还可以是其他技术领域,例如化学技术领域、电学技术领域等等。
[0071]本发明实施例提供的一种信息获取方法,该方法从用户已发表的文章信息中获得主题词,由于用户在文章信息中描述的主题词一般都是比较细节的技术领域,因此获得该主题词后,依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,所获得的主子集包含关系为从大范围的技术领域划分至小范围的技术领域的过程,将该主子集包含关系存储至用户的列表中,这样在推送信息时,就可以根据较小范围的技术领域对各个用户推送相应的信息,从而提高推送信息的准确性。
[0072]请参阅图3,为本发明实施例提供的一种信息推送装置的结构示意图,所述信息推送装置推送的信息至少包括一个待推送信息,对于每一待推送信息,该装置包括:第一获取模块301、第二获取模块302、计算模块303、推送模块304,其中:
[0073]第一获取模块301,用于获取待推送信息的第一主子集包含关系。
[0074]所述第一主子集包含关系是以所述待推送信息中的主题词为最下级子节点的第一主子集包含关系,所述第一主子集包含关系是依据主题词表确定的,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的对应关系的列表,所述待推送信息包括视频信息、会议信息或文章信息。
[0075]可以理解的是,不能直接从视频信息、会议信息中获得主题词,但是每一视频信息或会议信息都有与之相对应的描述内容,视频信息、会议信息的主子集包含关系的获取方法可以为:首先通过对其描述的内容获得的主题词,依据主题词表获得视频信息或会议信息的主子集包含关系。
[0076]以医学领域为例,假设主题词表包括各个医学研究方向,即主题词表包括医学主题词表,则医学主题词表包括各个医学研究方向,以及医学研究方向上下级对应关系,例如细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞等等,生殖细胞又包括:卵母细胞、精子,卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。假设用户研究的是细胞骨架即主题词为细胞骨架,则用户的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞--细胞骨架。
[0077]主子集包含关系是依据主题词表确定的,主题词表中各个技术领域及其细分技术可以组成树状结构,可以从树状结构中获得相应的主题词,再确定该主题词所在的树状结构的主子集包含关系。
[0078]第二获取模块302,用于从用户的列表中获取第二主子集包含关系,所述第二主子集包含关系是以所述用户已发表的文章信息中的主题词为最下级子节点的第二主子集包含关系,所述第二主子集包含关系是依据所述主题词表确定的。
[0079]计算模块303,用于计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度。
[0080]推送模块304,用于依据所述匹配度,确定是否为所述用户推送所述待推送信息。[0081 ]推送信息模块,用于将各个所述待推送信息按照所述匹配度从高至低依次推送至所述用户。
[0082]如果待推送信息为多个时,可以将各个待推送信息按照所述匹配度从高至低依次推送至用户。假设视频信息I与用户的匹配度为3/4,会议信息2与用户的匹配度为2/4,文章信息3与用户的匹配度为4/4,则首先为用户推送文章信息3,再次为用户推送视频信息1,最后为用户推送会议信息2。
[0083]可以将各个所述待推送信息中匹配度大于预设阈值的各个第一待推送信息,按照所述匹配度从高至低依次推送至所述用户,仍以上述例子进行说明,假设预设值为3/4,则可以同时为用户推送文章信息3和视频信息I,也可以首先为用户推送用户3的文章信息,再次为用户推送视频信息I。而不为用户推送会议信息2。
[0084]在上述信息推送装置实施例中,都是以医学技术领域作为例子进行说明的,但是上述信息推送装置实施例的技术方案并不仅限定于医学技术领域,还可以是其他技术领域,例如化学技术领域、电学技术领域等等。
[0085]本发明实施例提供的信息推送装置,第一获取模块301获取待推送信息的第一主子集包含关系,第二获取模块从用户的列表中获取第二主子集包含关系,在计算模块303计算出待推送信息与用户的匹配度后,推送模块304依据匹配度确定是否为用户推送该待推送信息,从而避免了将技术领域相差太大的信息推送至研究人员的情况,提高了推送信息的准确度。
[0086]本发明实施例还提供了一种信息推送装置中的计算模块一种实现方式,计算模块包括:计算单元,用于计算所述第一主子集包含关系与所述第二主子集包含关系的重叠概率,所述重叠概率为所述匹配度。。
[0087]假设待推送信息包括视频信息1、会议信息2、文章信息3,视频信息I的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞一一信号通路;会议信息2的主子集包含关系为细胞生物一一生殖细胞一一胚胎干细胞一一造血细胞;文章信息3的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞一一细胞骨架。
[0088]假设用户的主子集包含关系为细胞生物一一生殖细胞一一卵母细胞一一细胞骨架,则待推送信息中视频信息I的主子集包含关系与用户的主子集包含关系的重叠概率为3/4;会议信息2的主子集包含关系与用户的主子集包含关系的重叠概率为2/4;文章信息3的主子集包含关系与用户的主子集包含关系的重叠概率为4/4。
[0089]请参阅图4,为本发明实施例提供的一种信息获取装置的结构示意图,该装置包括:获取主题词模块401、获取主子集包含关系模块402、存储模块403,其中:
[0090]获取主题词模块401,用于从用户已发表的文章信息中,获取主题词。
[0091]获得主题词的方法可以为:从所述用户已发表的文章信息中,获取所述文章信息中包含预设词汇的语句信息;获取所述语句信息中的主题词。文章信息包括论文信息、专利信息、图书信息中的一种或多种。
[0092]因为发布的论文、专利、图书要求比较严格,用户在论文、专利或图书中所描述的技能词汇都是标准的、专业的,对于同一个主题词不同的用户的描述是相同的,不存在现有技术中在学术社交网络上用户填写的五花八门的情况。具体的,可以从文章信息中的摘要、全文中获得主题词。
[0093]用户已发表的文章信息,可以是预先存储在数据库中的,也可以是通过网络爬虫的方式从不同网站,不同数据库获得的,具体的,可以通过该用户的姓名、工作单位等等信息利用网络爬虫技术获取用户已经发表的文章。
[0094]预设词汇可以是整理者阅读该用户已发表的文章,熟悉该用户的描述方式后获得的,即该用户所描述的主题词都是与哪些词汇一起出现的。例如某一用户经常在摘要中Di scuss 1n、use、used、using、employed、employ等词汇的后面描述主题词,也就是说Di scuss 1n、use、used、using、employed、employ这些词汇与主题词一般都同时出现,由于主题词的种类较多,且可能是由多个字或字符组成,在并不确定当前获得的主题词是由几个字或字符组成的情况下,直接从文章信息中获得主题词,需要服务器具备强大的数据处理能力,而预设词汇一般情况下的字或字符数比较小,且比较统一,且因此,可以先从文章信息中获得包含预设词汇的语句信息。最初的预设词汇是人为整理的,但是在整个方法运行后,可以通过机器学习,对预设词汇进行更新。
[0095]由于已知预设词汇,可以利用词汇搜索功能,对文章信息中包含该预设词汇的语句进行定位。在中文中,每一个语句结尾都有“。”,在英文中,每一个语句的结尾都有可以依据上述两个特征,来从文章信息中截取包含预设词汇的语句信息。
[0096]获取所述语句信息中的主题词,具体的可以是通过语义分析识别技术获得语句信息中的主题词。
[0097]获取主子集包含关系模块402,用于依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,获得主子集包含关系。
[0098]所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的关系的列表。
[0099]假设主题词表包括各个医学研究方向,即主题词表包括医学主题词表,则医学主题词表包括医学研究方向上下级对应关系,例如细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞等等,生殖细胞又包括:卵母细胞、精子。卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。假设用户研究的是细胞骨架即主题词为细胞骨架,则用户的父节点为细胞生物,最下级子节点为细胞骨架,主子集包含关系包括:细胞生物一一生殖细胞一一卵母细胞一一细胞骨架。
[0100]存储模块403,用于将所述主子集包含关系存储至所述用户的列表中。
[0101]在上述信息获取装置实施例中,都是以医学技术领域作为例子进行说明的,但是上述信息获取装置实施例的技术方案并不仅限定于医学技术领域,还可以是其他技术领域,例如化学技术领域、电学技术领域等等。
[0102]本发明实施例提供的一种信息获取装置,获取主题词模块401从用户已发表的文章信息中获得主题词,由于用户在文章信息中描述的主题词一般都是比较细节的技术领域,因此获得该主题词后,获取主子集包含关系模块402依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,所获得的主子集包含关系为从大范围的技术领域划分至小范围的技术领域的过程,存储模块403将该主子集包含关系存储至用户的列表中,这样在推送信息时,就可以根据较小范围的技术领域对各个用户推送相应的信息,从而提高推送信息的准确性。
[0103]需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0104]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1.一种信息推送方法,其特征在于,所述信息推送方法推送的信息至少包括一个待推送信息,对于每一待推送信息,所述信息推送方法包括: 获取待推送信息的第一主子集包含关系,所述第一主子集包含关系是以所述待推送信息中的主题词为最下级子节点的第一主子集包含关系,所述第一主子集包含关系是依据主题词表确定的,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的对应关系的列表; 从用户的列表中获取第二主子集包含关系,所述第二主子集包含关系是以所述用户已发表的文章信息中的主题词为最下级子节点的第二主子集包含关系,所述第二主子集包含关系是依据所述主题词表确定的; 计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度; 依据所述匹配度,确定是否为所述用户推送所述待推送信息。2.根据权利要求1所述信息推送方法,其特征在于,还包括: 将各个所述待推送信息中匹配度大于预设阈值的各个第一待推送信息,按照所述匹配度从高至低依次推送至所述用户。3.根据权利要求1或2所述信息推送方法,其特征在于,所述计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度具体为: 计算所述第一主子集包含关系与所述第二主子集包含关系的重叠概率,所述重叠概率为所述匹配度。4.一种信息获取方法,其特征在于,包括: 从用户已发表的文章信息中,获取主题词; 依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,获得主子集包含关系,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的关系的列表; 将所述主子集包含关系存储至所述用户的列表中。5.—种信息推送装置,其特征在于,所述信息推送装置推送的信息至少包括一个待推送信息,对于每一待推送信息,包括: 第一获取模块,用于获取待推送信息的第一主子集包含关系,所述第一主子集包含关系是以所述待推送信息中的主题词为最下级子节点的第一主子集包含关系,所述第一主子集包含关系是依据主题词表确定的,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的对应关系的列表; 第二获取模块,用于从用户的列表中获取第二主子集包含关系,所述第二主子集包含关系是以所述用户已发表的文章信息中的主题词为最下级子节点的第二主子集包含关系,所述第二主子集包含关系是依据所述主题词表确定的; 计算模块,用于计算所述第一主子集包含关系与所述第二主子集包含关系的匹配度; 推送模块,用于依据所述匹配度,确定是否为所述用户推送所述待推送信息。6.根据权利要求5所述信息推送装置,其特征在于,还包括: 推送信息模块,用于将各个所述待推送信息中匹配度大于预设阈值的各个第一待推送信息,按照所述匹配度从高至低依次推送至所述用户。7.根据权利要求5或6所述信息推送装置,其特征在于,所述计算模块包括: 计算单元,用于计算所述第一主子集包含关系与所述第二主子集包含关系的重叠概率,所述重叠概率为所述匹配度。8.一种信息获取装置,其特征在于,包括: 获取主题词模块,用于从用户已发表的文章信息中,获取主题词; 获取主子集包含关系模块,用于依据主题词表,从父节点依次遍历至以所述主题词为最下级子节点的节点,获得主子集包含关系,所述主题词表包括以技术领域为节点,且各个所述节点之间依据技术领域的包含关系确定父节点和子节点的关系的列表; 存储模块,用于将所述主子集包含关系存储至所述用户的列表中。
【文档编号】G06F17/30GK105912580SQ201610201786
【公开日】2016年8月31日
【申请日】2016年3月31日
【发明人】王斐, 吴勇
【申请人】比美特医护在线(北京)科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1