推荐信息的方法和装置与流程

文档序号:15025558发布日期:2018-07-27 17:31阅读:201来源:国知局
本发明涉及互联网
技术领域
:,特别涉及一种推荐信息的方法和装置。
背景技术
::随着信息时代的到来,服务器中存储的信息越来越多;用户可以使用终端从服务器中获取用户感兴趣的信息。为了提高用户的阅读体验,服务器还可以为用户推荐用户感兴趣的信息。目前,服务器基于用户当前阅读或者历史阅读的第一信息为用户推荐信息,具体过程可以为:服务器提取第一信息包括的关键词以及推荐信息库中的每个第二信息包括的关键字,根据第一信息包括的关键字和每个第二信息包括的关键字,分别计算第一信息与每个第二信息之间的匹配度;根据第一信息与每个第二信息之间的匹配度,从推荐信息库中选择匹配度最高的第二信息,向终端发送该选择的第二信息的链接。在实现本发明的过程中,发明人发现现有技术至少存在以下问题:上述方法为用户推送的第二信息在关键字上与第一信息存在极大的相似性,甚至第一信息和第二信息是来自不同来源的互相转载;也即上述方法中并不能为用户推送与第一信息深度和广度相关的第二信息,从而导致推荐信息的准确性差。并且,当用户为专业的新闻从业者时,由于服务器无法为用户推送与该第一信息深度和广度相关的第二信息,此时用户就需要花费大量时间精力对与第一信息深度和广度相关的第二信息进行搜集挖掘,不仅浪费时间,还会造成新闻从业者这类工作对从业者经验积累以及知识广博程度的高要求,使得新闻从业者成本较高。技术实现要素:为了解决现有技术的问题,本发明提供了一种推荐信息的方法和装置。技术方案如下:第一方面,本发明实施例提供了一种推荐信息的方法,所述方法包括:根据用户输入或当前阅读的第一信息,确定第一关键词集合;根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别;根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,所述属性信息集合包括与所述每个第一关键词和所述第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;根据所述一组推荐表达式,为所述用户推荐信息。可选的,所述根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,包括:对于所述第一关键词集合中的每个第一关键词,获取所述第一关键词的信息类别;根据所述第一关键词的信息类别,从类别树中获取所述第一关键词的信息类别的祖先节点的信息类别;将所述第一关键词的信息类别和所述祖先节点的信息类别组成所述第一信息类别集合。可选的,根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,以及,根据所述第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;根据所述第二关键词集合和所述第二信息类别集合,确定实体集合,所述实体集合包括第一实体和与所述第一实体关联的第二实体,所述第一实体为所述第二关键词集合中的任一第二关键词和所述第二信息类别集合中的任一第二信息类别对应的实体;根据所述实体集合,从知识图谱中获取所述实体集合中的每个实体的属性信息组成所述属性信息集合,所述知识图谱包括实体和属性信息的对应关系。可选的,所述根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,包括:计算所述第一关键词集合中的每个第一关键词的影响度以及所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量;根据所述每个第一关键词的影响度和所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量,计算所述每个第一关键词的推荐度;根据所述每个第一关键词的推荐度,从所述第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。可选的,所述根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式,包括:将所述第一关键词集合、所述第一信息类别集合和所述属性信息集合组成推荐词库;根据预设选择规则及所述推荐词库中的推荐词,生成多个推荐表达式;根据所述多个推荐表达式的推荐度,从所述多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到所述一组推荐表达式。可选的,所述根据所述一组推荐表达式,为所述用户推荐信息,包括:对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息作为推荐信息推荐给所述用户。第二方面,本发明实施例提供了一种推荐信息的装置,所述装置包括:第一确定模块,用于根据用户输入或当前阅读的第一信息,确定第一关键词集合;第二确定模块,用于根据所述第一关键词集合中的每个第一关键词,确定第一信息类别集合,所述第一信息类别集合中包括所述每个第一关键词所属的信息类别;第三确定模块,用于根据所述第一关键词集合和所述第一信息类别集合,确定属性信息集合,所述属性信息集合包括与所述每个第一关键词和所述第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;第四确定模块,用于根据所述第一关键词集合、所述第一信息类别集合和所述属性信息集合,确定一组推荐表达式;推荐模块,用于根据所述一组推荐表达式,为所述用户推荐信息。可选的,所述第二确定模块,包括:第一获取单元,用于对于所述第一关键词集合中的每个第一关键词,获取所述第一关键词的信息类别;第二获取单元,用于根据所述第一关键词的信息类别,从类别树中获取所述第一关键词的信息类别的祖先节点的信息类别;第一组成单元,用于将所述第一关键词的信息类别和所述祖先节点的信息类别组成所述第一信息类别集合。可选的,所述第三确定模块,包括:第一确定单元,用于根据所述第一关键词集合和所述第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合;第二确定单元,用于根据所述第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;第三确定单元,用于根据所述第二关键词集合和所述第二信息类别集合,确定实体集合,所述实体集合包括第一实体和与所述第一实体关联的第二实体,所述第一实体为所述第二关键词集合中的任一第二关键词和所述第二信息类别集合中的任一第二信息类别对应的实体;第三获取单元,用于根据所述实体集合,从知识图谱中获取所述实体集合中的每个实体的属性信息组成所述属性信息集合,所述知识图谱包括实体和属性信息的对应关系。可选的,所述第一确定单元,包括:第一计算子单元,用于计算所述第一关键词集合中的每个第一关键词的影响度以及所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量;第二计算子单元,用于根据所述每个第一关键词的影响度和所述每个第一关键词所属的信息类别对所述每个第一关键词的权重增量,计算所述每个第一关键词的推荐度;选择子单元,用于根据所述每个第一关键词的推荐度,从所述第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。可选的,所述第四确定模块,包括:第二组成单元,用于将所述第一关键词集合、所述第一信息类别集合和所述属性信息集合组成推荐词库;生成单元,用于根据预设选择规则及所述推荐词库中的推荐词,生成多个推荐表达式;第一选择单元,用于根据所述多个推荐表达式的推荐度,从所述多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到所述一组推荐表达式。可选的,所述推荐模块,包括:第四确定单元,用于对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;第二选择单元,用于根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息;推荐单元,用于将所述第二预设数目个第二信息作为推荐信息推荐给所述用户。在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于一组推荐表达式包括更丰富的内容,因此,根据一组推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。附图说明图1是本发明实施例提供的一种推荐信息的方法流程图;图2是本发明实施例提供的一种推荐信息的方法流程图;图3是本发明实施例提供的一种本体树的示意图;图4是本发明实施例提供的一种知识图谱的示意图;图5是本发明实施例提供的一种实体之间关系的示意图;图6是本发明实施例提供的一种推荐信息的装置结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明实施例提供了一种推荐信息的方法,该方法应用在服务器中,参见图1,该方法包括:步骤101:根据用户输入或当前阅读的第一信息,确定第一关键词集合。步骤102:根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,第一信息类别集合中包括每个第一关键词所属的信息类别。步骤103:根据第一关键词集合和第一信息类别集合,确定属性信息集合,该属性信息集合包括与每个第一关键词和第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息。步骤104:根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式。步骤105:根据一组推荐表达式,为用户推荐信息。可选的,根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,包括:对于第一关键词集合中的每个第一关键词,获取第一关键词的信息类别;根据第一关键词的信息类别,从类别树中获取第一关键词的信息类别的祖先节点的信息类别;将第一关键词的信息类别和祖先节点的信息类别组成第一信息类别集合。可选的,根据第一关键词集合和第一信息类别集合,确定属性信息集合,包括:根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合,以及,根据第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;根据第二关键词集合和第二信息类别集合,确定实体集合,实体集合包括第一实体和与第一实体关联的第二实体,第一实体为第二关键词集合中的任一第二关键词和第二信息类别集合中的任一第二信息类别对应的实体;根据实体集合,从知识图谱中获取实体集合中的每个实体的属性信息组成属性信息集合,知识图谱包括实体和属性信息的对应关系。可选的,根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合和第二信息类别集合,包括:计算第一关键词集合中的每个第一关键词的影响度以及每个第一关键词所属的信息类别对每个第一关键词的权重增量;根据每个第一关键词的影响度和每个第一关键词所属的信息类别对每个第一关键词的权重增量,计算每个第一关键词的推荐度;根据每个第一关键词的推荐度,从第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。可选的,根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,包括:将第一关键词集合、第一信息类别集合和属性信息集合组成推荐词库;根据预设选择规则及推荐词库中的推荐词,生成多个推荐表达式;根据多个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到一组推荐表达式。可选的,根据一组推荐表达式,为用户推荐信息,包括:对于所述一组推荐表达式中的每个推荐表达式,根据所述推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;根据所述推荐表达式与匹配的每个第二信息之间的匹配度,针对每个所述推荐表达式,从所述推荐信息库中选择匹配度最高的第二预设数目个第二信息作为推荐信息推荐给所述用户。在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于推荐表达式包括更丰富的内容,因此,根据推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。本发明实施例提供了一种推荐信息的方法,该方法应用在服务器中,参见图2,该方法包括:步骤201:服务器根据用户输入或当前阅读的第一信息,确定第一关键词集合,第一关键词集合中包括多个第一关键词。当用户使用终端阅读信息时,服务器获取用户当前阅读的信息或者用户输入的信息,为了便于与后续推荐的信息进行区分,将服务器获取的该信息称为第一信息,根据第一信息为用户推荐与第一信息相关的第二信息。获取获取第一信息之后,对第一信息进行断句处理,得到第一信息包括的每个句子;对第一信息包括的每个句子进行分词处理,得到每个句子包括的第一关键词,将每个句子包括的第一关键词组成第一关键词集合。由于“的”、“了”、“么”、“吧”、“啊”之类的关键词对推荐信息起不到关键作用;因此,为了减少运算量以及提高推荐准确性,在本步骤中,服务器还可以将“的”、“了”、“么”、“吧”、“啊”这类的关键词去除。因此,服务器将每个句子包括的第一关键词组成第一关键词集合之后,还包括:服务器标注第一关键词集合中的每个第一关键词的词性;根据每个第一关键词的词性,从第一关键词集合中查找预设词性的第一关键词,将预设词性的第一关键词从第一关键词集合中去除。其中,预设词性的第一关键词可以为语气词或者助词等。为了提高推荐的深度和广度,在本步骤中,服务器还可以对第一关键词集合中的每个第一关键词进行扩展,具体过程可以为:对于第一关键词集合中的每个第一关键词,服务器获取该第一关键词的同义词和/或近义词,将第一关键词的同义词和/或近义词添加到第一关键词集合中。例如,第一关键词为“京城”,则服务器获取“京城”的同义词:“北京”和“首都”,将“北京”和“首都”添加到第一关键词集合中。再如,第一关键词为“遗失”,服务器获取“遗失”的同义词“丢失”和“失去”,将“丢失”和“失去”添加到第一关键词集合中。需要说明的是,第一信息可以为网页内容、文本内容、电子书内容、本地文档或者半结构格式(例如,xml格式(可扩展标记语言))内容的文档信息,具体可以为用户当前打开的现有文档,也可以为用户输入的文本信息,特别是针对文档撰写者、编辑者用户,用户输入一段文本信息后,根据用户输入信息,进行深度、广度挖掘,推荐有价值信息供用户参考。第一信息也可以为视频信息。如果第一信息为视频信息时,服务器根据第一信息,确定第一关键词集合的步骤可以为:服务器获取第一视频信息对应的文本内容,根据第一视频信息对应的文本内容,确定第一关键词集合。在本发明实施例中,对第一信息的数目也不作具体限定;例如,第一信息可以为一个文档或者多个文档的文档信息,也可以一个或多个视频片段对应的文本内容。终端可以为手机终端、PAD(portableandroiddevice,平板电脑)终端或者电脑终端等。在本发明实施例中,对终端不作具体限定。服务器为任一具有推荐功能的服务器;例如,新闻推送服务器等。步骤202:服务器根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,第一信息类别集合中包括每个第一关键词所属的信息类别。信息类别指信息所属的业务类别。当第一信息为新闻类信息时,第一关键词所属的信息类别可以为“新闻主题”、“新闻地域”或者“新闻事件”等。本步骤可以通过以下步骤(1)至(3)实现,包括:(1):对于第一关键词集合中的每个第一关键词,服务器获取该第一关键词的信息类别。服务器中存储多个信息类别,对于每个第一关键词,服务器根据该第一关键词,通过正则表达式,从多个信息类别中选择与该第一关键词匹配的信息类别,将选择的信息类别作为该第一关键词的信息类别。需要说明的是,在本步骤中,服务器中存储的多个信息类别为最底层的信息类别,也即服务器获取每个第一关键词的信息类别为最底层的信息类别。而第一关键词所属的信息类别是指第一关键词所属的所有信息类别,也即不仅包括该最底层的信息类别,还包括该最底层的信息类别所属的信息类别等。其中,信息类别也可以称为本体。例如,第一关键词为“A国恐怖袭击”,则服务器获取该第一关键词的信息类别为“枪击事件”。(2):服务器根据第一关键词的信息类别,从类别树中获取第一关键词的信息类别的祖先节点的信息类别。类别树中包括多个节点以及多个节点之间的关系;类别树中的一个节点为一个信息类别,并且,第一关键词的信息类别为类别树中的叶子节点。在本步骤中,服务器根据第一关键词的信息类别,从类别树中获取该信息类别的父节点的信息类别,根据该信息类别的父节点的信息类别,获取父节点的父节点的信息类别,直到获取到根节点的信息类别,从而获取第一关键词的信息类别的祖先节点的信息类别。例如,图3是本发明实施例提供的一种类别树,该类别树的第一层子节点包括“新闻主题”、“新闻地域”、“新闻事件”、“新闻人物”和“其他”;“新闻事件”又可以分为“延缓性事件”、“突发性事件”和“其他事件”;“突发事件”又可以分为:“突发信息安全事件”、“突发公共事件”和“经济安全事件”;“突发安全事件”又可以分为“自然灾害”、“事故灾害”、“公共卫生事件”和“社会安全事件”等;“社会安全事件”又可以分为“恐怖袭击”、“个人违法犯罪”、“群体事件”和“其他破坏事件”;“恐怖袭击”又可以分为“枪击事件”、“爆炸事件”、“人质事件”和“化学武器袭击”等。例如,第一关键词的信息类别为“枪击事件”,则服务器从本体树中获取“枪击事件”的祖先节点的信息类别为“新闻事件->突发事件->突发安全事件->社会安全事件->恐怖袭击”。(3):服务器将该第一关键词的信息类别和该祖先节点的信息类别组成第一信息类别集合。在本步骤中,服务器将每个第一关键词的信息类别,以及每个关键词的信息类别的祖先节点的信息类别组成第一信息类别集合。步骤203:服务器根据第一关键词集合和第一信息类别集合,确定属性信息集合,属性信息集合包括与每个第一关键词和第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息。预设关联度条件的实体可以为与每个第一关键词和第一信息类别集合中的每个第一信息类别对应的实体,和/或与该实体关联的实体。本步骤可以通过以下步骤(1)-(4)实现,包括:(1):服务器根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合。由于第一关键词集合包括的第一关键词较多,并且,有些第一关键词是通用词;因此为了减少计算量,并提高推荐准确性,在本步骤中,服务器从第一关键词集合中提取满足第一预设筛选条件的第一关键词组成第二关键词集合。第一预设筛选条件可以为推荐度最大等。本步骤具体可以通过以下步骤(1-1)至(1-3)实现,包括:(1-1):服务器计算第一关键词集合中的每个第一关键词的影响度以及每个第一关键词所属的信息类别对每个第一关键词的权重增量。对于每个第一关键词,服务器计算该第一关键词的影响度的步骤可以为:服务器统计推荐信息库中包括该第一关键词的信息的第一数目,获取推荐信息库中包括的第二信息的第二数目,根据第一数目和第二数目,通过以下公式一计算该第一关键词的影响度:公式一:其中,TFIDF(t)为第一关键词的影响度,t为第一关键词,d为第一信息,n为第一数目,N为第二数目。推荐信息库用于存储多个待推荐的第二信息。对于每个第一关键词所属的每个第一信息类别,服务器计算该第一信息类别对该第一关键词的权重增量的步骤可以为:服务器计算该第一信息类别的影响度以及该第一关键词与该第一信息类别之间相差的层级数,根据该第一信息类别的影响度以及该层级数,计算该第一信息类别对该第一关键词的权重增量。其中,服务器计算该第一信息类别的影响度的步骤可以为:服务器统计推荐信息库中包括关键词属于该第一信息类别的信息的第三数目,根据第三数目和第二数目,通过以下公式二,计算该第一信息类别的影响度:公式二:其中,TFIDF(o)为该第一信息类别的影响度,o为该第一信息类别,d为第一信息,m为第三数目,N为第二数目。例如,第一关键词为“A国恐怖袭击”,第一关键词所属的第一信息类别为“新闻事件->突发事件->突发公共安全事件->社会安全事件->恐怖袭击->枪击事件”,则“枪击事件”与“A国恐怖袭击”之间相差的层级数为1,“恐怖袭击”与“A国恐怖袭击”之间相差的层级数为2,以此类型。其中,服务器根据该第一信息类别的影响度以及该层级数,计算该第一信息类别对该第一关键词的权重增量的步骤可以为:服务器根据该第一信息类别的影响度以及该层级数,通过以下公式三,计算该第一信息类别对该第一关键词的权重增量:公式三:其中,Z(o)为该第一信息类别对该第一关键词的权重增量,lo为该层级数,TFIDF(o)为该第一信息类别的影响度。例如,第一关键词为“A国恐怖袭击”,第一关键词所属的第一信息类别为“新闻事件->突发事件->突发公共安全事件->社会安全事件->恐怖袭击->枪击事件”,则“枪击事件”对“A国恐怖袭击”的增量权重为(枪击事件),“恐怖袭击”对“A国恐怖袭击”的增量权重为(恐怖袭击)。在本发明实施例中,采用阶乘倒数作为加权的形式来确保随着信息类别的抽象程度升高其影响度下降,从而确定出第一关键词的推荐度更准确。并且,本发明实施例中,通过综合信息类别,来解决多词同义导致的统计量分散的问题,也可以从一定程度上考虑相同或者相近关键词的互相增益,以挖掘出更加合理的关键信息。(1-2):服务器根据每个第一关键词的影响度和每个第一关键词所属的信息类别对每个第一关键词的权重增量,计算每个第一关键词的推荐度。对于每个第一关键词,服务器根据第一预设权重、第二预设权重、该第一关键词的影响度和该第一关键词所属的每个信息类别对该第一关键词的权重增量,通过以下公式四,计算该第一关键词的推荐度:公式四:其中,termWeight(t)为该第一关键词的推荐度,α为第一预设权重,β为第二预设权重,o(t)为第一关键词所属的每个第一信息类别,Z(o)为每个第一信息类别的对第一关键词的权重增量。第一预设权重和第二预设权重用于调整第一关键词的影响度和该第一信息类别的影响度之间的重要性;第一预设权重和第二预设权重之和为1,并且,第一预设权重和第二预设权重可以根据需要进行设置并更改,在本发明实施例中,对第一预设权重和第二预设权重不作具体限定;例如,第一预设权重和第二预设权重都为0.5。(1-3):服务器根据每个第一关键词的推荐度,从第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。第一预设数目可以根据需要进行设置并更改,在本发明实施例中,对第一预设数目不作具体限定;例如,第一预设数目可以为5或者8等。(2):服务器根据第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合。由于第一信息类别集合中包括的信息类别较多;并且,有些信息类别比较大,针对性不强;因此为了减少计算量,并提高推荐准确性,在本步骤中,服务器从第一信息类别集合中提取满足第二预设筛选条件的第一信息类别组成第二信息类别集合。第二预设筛选条件可以为推荐度最大等。本步骤具体可以为:服务器计算第一信息类别集合中的每个第一信息类别的推荐度,根据每个第一信息类别的推荐度,从第一信息类别集合中选择推荐度最高的第三预设数目个第一信息类别组成第二信息类别集合。对于每个第一信息类别,服务器可以直接将该第一信息类别的影响度作为该第一信息类别的推荐度。第三预设数目可以根据需要进行设置并更改,在本发明实施例中,对第三预设数目不作具体限定;例如,第三预设数目可以为10或者15等。(3):服务器根据第二关键词集合和第二信息类别集合,确定实体集合,实体集合包括第一实体和与第一实体关联的第二实体,第一实体为第二关键词集合中的任一第二关键词和第二信息类别集合中的任一第二信息类别对应的实体。知识图谱中存储关键词、信息类别和实体的对应关系,以及实体与实体之间的关联关系;在本步骤中,对于第二关键词集合中的任一第二关键词,以及第二信息类别集合中的任一第二信息类别,服务器根据该第二关键词和该信息类别,从类别信息、关键词和实体的对应关系中获取该第二关键词和信息类别对应的第一实体,根据第一实体,获取与第一实体关联的第二实体。由于知识图谱中还存储实体与实体之间的关系,根据第一实体获取与第一实体关联的第二实体,从而实现了对实体的扩展,获取到了更多的实体,从而后续可以获取更多的属性信息,进一步提高了推荐信息的深度和广度。知识图谱中实体与实体之间的关系具体可以通过RDF(ResourceDescriptionFramework,资源描述框架)三元组(实体1,关系,实体2)进行描述。实体1和实体2可以为名实体(例如,人名、地名或机构名等),也可以为新闻事件。知识图谱的结构也可以类似于类别树的结构,按照信息类别对应的层次进行布局。(4):服务器根据该实体集合,从知识图谱中获取该实体集合中的每个实体的属性信息组成属性信息集合,知识图谱包括实体和属性信息的对应关系。对于该实体集合中的每个实体,服务器根据该实体,从实体和属性信息的对应关系中获取该实体对应的属性信息。其中,实体的属性信息用于描述实体对应的关键点(事件要素);如果实体为新闻概念时,实体的属性信息可以为新闻概念在新闻报道时所关注的要点。例如,实体为“恐怖袭击”,则实体的属性信息可以为“袭击者”、“受害者”、“时间”和“地点”等。例如,图4是本发明实施例提供的一个知识图谱,知识图谱中包括的实体分别为:A国、B国和C国。A国对应的属性信息包括主要民族:法兰西人和阿拉伯人,面积:105.4平方公里,重要事件:袭击事件;B国对应的属性信息包括主要民族:法兰西人、科西嘉人、布列塔尼人,袭击对象:C国;C国的属性信息包括主要民族:阿拉伯人,被轰炸国家:B国。图5是本发明实施例提供的一个知识图谱中实体与实体之间的关系。其中,A国的属性信息包括主要民族:法兰西人和阿拉伯人,面积:105.4平方公里,重要事件:袭击事件;由于A国的重要事件是袭击事件,而B国也发生过袭击事件,则A国与B国存在关联关系,B国的属性信息包括主要民族:法兰西人、科西嘉人、布列塔尼人,袭击对象:C国;由于B国袭击的是C国,则B国和C国也存在关联关系,C国的属性信息包括主要民族:阿拉伯人,被轰炸国家:B国,时间:2015年9月,袭击方式:空袭轰炸,武器:航母戴高乐号。例如,第一本体为A国,则根据第一本体,获取与第一本体关联的第二本体为B国;再如,第一本体为B国,则根据第一本体,获取与第一本体关联的第二本体为C国。步骤204:服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,一组推荐表达式中包括至少一个推荐表达式。本步骤可以通过以下步骤(1)至(3)实现,包括:(1):服务器将第一关键词集合、第一信息类别集合和属性信息集合组成推荐词库。服务器将第一关键词集合中的第一关键词、第一信息类别集合中的每个第一信息类别和属性信息集合中的属性信息组成推荐词库。由于第一关键词集合包括的第一关键词较多,且第一信息类别集合中包括的信息类别较多;并且,有些第一关键词是通用词,或者有些信息类别比较大,针对性不强;因此,在本步骤中,服务器可以获取筛选后的第二关键词集合和第二信息类别集合,将第二关键词集合、第二信息类别集合和属性信息集合组成推荐词库。(2):服务器根据预设选择规则以及推荐词库中的推荐词,生成多个推荐表达式。服务器根据预设选择规则,从推荐词库中选择多组推荐词,将多组推荐词中的每组推荐词组成一个推荐表达式,得到多个推荐表达式。其中,多个推荐表达式中的每个推荐表达式包括至少一个推荐词。预设选择规则可以根据需要进行设置并更改,在本发明实施例中,对预设选择规则不作具体限定。例如,预设选择规则包括第一选择子规则、第二选择子规则、第三选择子规则和第四选择子规则。第一选择子规则为从推荐词库中选择名实体。例如,推荐词库中包括人物名,则可以直接选择人物名作为推荐表达式。第二选择子规则为从推荐词库中选择数目较多个推荐词。例如,推荐表达式“中国+恐怖袭击”优于“恐怖袭击”。第三选择子规则为从推荐词库中选择异质属性的推荐词。例如,推荐表达式“新三板+体育产业”优于“新三板+增发”。其中,异质属性是指两个推荐词的类别不同,或者两个推荐词来自不同的集合。例如,两个推荐词分别来自关键词集合和信息类别集合等。第四选择子规则为根据推荐词库中推荐词的推荐度,从推荐词库中选择推荐度最高的推荐词。需要说明的是,推荐表达式的生成过程就是推荐词库中的推荐词进行组合的过程;为了防止组合过多,采用栈搜索策略进行剪枝,只保留推荐度最高的第四预设数目个推荐表达式,也即执行步骤(3)对推荐表达式进行筛选。(3):服务器根据多个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到一组推荐表达式。服务器分别计算多个推荐表达式中的每个推荐表达式的推荐度,根据每个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式,将该第四预设数目个推荐表达式组成一组推荐表达式。第四预设数目可以根据需要进行设置并更改,在本发明实施例中,对第四预设数目不作具体限定;例如,第四预设数目可以为5或者6等。步骤205:服务器根据一组推荐表达式,为用户推荐信息。本步骤可以通过以下步骤(1)至(3)实现,包括:(1):对于一组推荐表达式中的每个推荐表达式,服务器根据该推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度。对于推荐信息库中的每个第二信息以及一组推荐表达式中的每个推荐表达式,服务器计算该第二信息与该推荐表达式之间的匹配度的步骤可以为:服务器根据该第二信息,确定该第二信息对应的第三关键词集合;确定该推荐表达式包含的每个推荐词在第三关键词集合中出现的次数,将每个推荐词在第三关键词集合中出现的次数作为该推荐表达式与该第二信息之间的匹配度。(2):服务器根据该推荐表达式与匹配的每个第二信息之间的匹配度,针对每个推荐表达式,从推荐信息库中选择匹配度最高的第二预设数目个第二信息。第二预设数目可以根据需要进行设置并更改,在本发明实施例中,对第二预设数目不作具体限定;例如,第二预设数目可以为10或者20等。(3):服务器将该第二预设数目个第二信息作为推荐信息推荐给用户。服务器向用户的终端发送该第二预设数目个第二信息中的每个第二信息的链接。终端接收服务器发送的第二预设数目个第二信息中的每个第二信息的链接,分别显示第二预设数目个第二信息中的每个第二信息的链接,以便于用户可以通过点击该链接,从服务器中获取链接对应的第二信息。进一步地,如果推荐表达式中包括名实体的推荐词时,服务器还可以从推荐信息库中获取该推荐词对应的第二信息。在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于推荐表达式包括更丰富的内容,因此,根据推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。本发明实施例提供了一种推荐信息的装置,该装置可以应用在服务器中;用于执行以上推荐信息的方法,参见图6,该装置包括:第一确定模块301,用于根据用户输入或当前阅读的第一信息,确定第一关键词集合;第二确定模块302,用于根据第一关键词集合中的每个第一关键词,确定第一信息类别集合,第一信息类别集合中包括每个第一关键词所属的信息类别;第三确定模块303,用于根据第一关键词集合和第一信息类别集合,确定属性信息集合,属性信息集合包括与每个第一关键词和第一信息类别集合中的每个第一信息类别满足预设关联度条件的实体的属性信息;第四确定模块304,用于根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式;推荐模块305,用于根据一组推荐表达式,为用户推荐信息。可选的,第二确定模块302,包括:第一获取单元,用于对于第一关键词集合中的每个第一关键词,获取第一关键词的信息类别;第二获取单元,用于根据第一关键词的信息类别,从类别树中获取第一关键词的信息类别的祖先节点的信息类别;第一组成单元,用于将第一关键词的信息类别和祖先节点的信息类别组成第一信息类别集合。可选的,第三确定模块303,包括:第一确定单元,用于根据第一关键词集合和第一信息类别集合,确定满足第一预设筛选条件的第二关键词集合;第二确定单元,用于根据第一信息类别集合,确定满足第二预设筛选条件的第二信息类别集合;第三确定单元,用于根据第二关键词集合和第二信息类别集合,确定实体集合,实体集合包括第一实体和与第一实体关联的第二实体,第一实体为第二关键词集合中的任一第二关键词和第二信息类别集合中的任一第二信息类别对应的实体;第三获取单元,用于根据实体集合,从知识图谱中获取实体集合中的每个实体的属性信息组成属性信息集合,知识图谱包括实体和属性信息的对应关系。可选的,第一确定单元,包括:第一计算子单元,用于计算第一关键词集合中的每个第一关键词的影响度以及每个第一关键词所属的信息类别对每个第一关键词的权重增量;第二计算子单元,用于根据每个第一关键词的影响度和每个第一关键词所属的信息类别对每个第一关键词的权重增量,计算每个第一关键词的推荐度;选择子单元,用于根据每个第一关键词的推荐度,从第一关键词集合中选择推荐度最大的第一预设数目个第一关键词组成第二关键词集合。可选的,第四确定模块304,包括:第二组成单元,用于将第一关键词集合、第一信息类别集合和属性信息集合组成推荐词库;生成单元,用于根据预设选择规则及推荐词库中的推荐词,生成多个推荐表达式;第一选择单元,用于根据多个推荐表达式的推荐度,从多个推荐表达式中选择推荐度最高的第四预设数目个推荐表达式得到一组推荐表达式。可选的,推荐模块305,包括:第四确定单元,用于对于一组推荐表达式中的每个推荐表达式,根据该推荐表达式包括的推荐词在推荐信息库中匹配第二信息,并确定匹配度;第二选择单元,用于根据该推荐表达式与匹配的每个第二信息之间的匹配度,针对每个推荐表达式,从推荐信息库中选择匹配度最高的第二预设数目个第二信息;推荐单元,用于将该第二预设数目个第二信息作为推荐信息推荐给用户。在本发明实施例中,服务器根据第一关键词集合、第一信息类别集合和属性信息集合,确定一组推荐表达式,根据一组推荐表达式,为用户推荐信息。由于推荐表达式包括更丰富的内容,因此,根据推荐表达式可以为用户推荐与第一信息深度和广度相关的信息,从而提高了推荐准确性,尤其是如果用户是新闻从业者需要了解第一信息深度、广度相关信息时,用户只需要在终端输入一段文本或打开第一信息对应的文档阅读,用户就不需要花费大量时间手动搜集挖掘与第一信息深度和广度相关的信息,降低了新闻从业者的搜集信息的时间成本。需要说明的是:上述实施例提供的推荐信息的装置在推荐信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的推荐信息的装置与推荐信息的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1