一种基于舆情信息的实体关系分析方法及终端设备与流程

文档序号:17442484发布日期:2019-04-17 04:57阅读:276来源:国知局
一种基于舆情信息的实体关系分析方法及终端设备与流程

本发明属于数据处理技术领域,尤其涉及基于舆情信息的实体关系分析方法及终端设备。



背景技术:

舆情系统可以为用户提供实体关系的查询功能,用户只需要输入所需查询的实体名称,舆情系统即会对渠道源提供的舆情信息进行待查询实体的实体关系分析,并输出对应的实体关系分析结果。其中,实体是指舆情信息中的人、地点和机构等,实体关系是指这些人、地点和机构之间的关系,如张三是李四的妻子,北京是中国的首都等。

实际情况中,现有的舆情系统仅能实现对单条舆情信息内的实体关系分析,但由于单条舆情信息所能提供的信息量极其有限,且单条舆情信息的可信度也往往难以得到很好的保证,因此,仅根据单条舆情信息分析往往只能得到有限的几个实体之间的关系网络,对实体与实体之间关系网络分析跟踪的深度较浅,且得到的实体关系网络可信度也较低,无法满足用户日益增加的实际需求。



技术实现要素:

有鉴于此,本发明实施例提供了一种基于舆情信息的实体关系分析方法及终端设备,以解决现有技术中舆情系统无法实现对实体关系网络的进行深入分析跟踪的问题。

本发明实施例的第一方面提供了一种基于舆情信息的实体关系分析方法,包括:

对获取到的多条舆情信息分别进行分析,得到与所述舆情信息对应的多个初始的实体关系网络,所述实体关系网络中记录有多个实体节点以及该多个实体节点之间的实体关系;

提取所述实体关系网络中包含的公共节点,其中,公共节点为至少同时存在于两个实体关系网络中的实体节点;

基于所述公共节点对所述实体关系网络间进行合并处理,直至合并得到的实体关系网络中不包含公共节点,得到合并后的所述实体关系网络。

本发明实施例的第二方面提供了一种终端设备,所述终端设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤。

对获取到的多条舆情信息分别进行分析,得到与所述舆情信息对应的多个初始的实体关系网络,所述实体关系网络中记录有多个实体节点以及该多个实体节点之间的实体关系;

提取所述实体关系网络中包含的公共节点,其中,公共节点为至少同时存在于两个实体关系网络中的实体节点;

基于所述公共节点对所述实体关系网络间进行合并处理,直至合并得到的实体关系网络中不包含公共节点,得到合并后的所述实体关系网络。

本发明实施例的第三方面提供了一种基于舆情信息的实体关系分析装置,包括:

网络分析模块,用于对获取到的多条舆情信息分别进行分析,得到与所述舆情信息对应的多个初始的实体关系网络,所述实体关系网络中记录有多个实体节点以及该多个实体节点之间的实体关系;

节点提取模块,用于提取所述实体关系网络中包含的公共节点,其中,公共节点为至少同时存在于两个实体关系网络中的实体节点;

网络合并模块,用于基于所述公共节点对所述实体关系网络间进行合并处理,直至合并得到的实体关系网络中不包含公共节点,得到合并后的所述实体关系网络。

本发明实施例的第四方面提供了一种计算机可读存储介质,包括:存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的基于舆情信息的实体关系分析方法的步骤。

本发明实施例与现有技术相比存在的有益效果是:本发明实施例通过对每个舆情信息分析得到的简单的实体关系网络进行公共节点的提取,并根据这些公共节点将这些简单的实体关系网络进行合并,直至所有的实体关系网络之间都不包含公共节点为止,即将所有实体关系网络深度最大化为止,才终止对实体关系网络的分析合并,充分实现了对实体可能涉及的所有实体关系的深入分析,实现了对实体关系网络的进行深入分析跟踪。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的基于舆情信息的实体关系分析方法的实现流程示意图;

图2是本发明实施例二提供的基于舆情信息的实体关系分析方法的实现流程示意图;

图3是本发明实施例三提供的基于舆情信息的实体关系分析方法的实现流程示意图;

图4是本发明实施例四提供的基于舆情信息的实体关系分析方法的实现流程示意图;

图5是本发明实施例五提供的基于舆情信息的实体关系分析方法的实现流程示意图;

图6是本发明实施例六提供的基于舆情信息的实体关系分析方法的实现流程示意图;

图7是本发明实施例七提供的基于舆情信息的实体关系分析装置的结构示意图;

图8是本发明实施例八提供的终端设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

为了便于理解,此处先对本发明实施例进行简要说明:现有技术在进行舆情信息中的实体关系分析时,都是直接使用一些现有的自然语言分析算法来进行处理,由于现有的自然语言分析算法都只能对单篇文章内容进行分析处理,从而使得现有技术中仅能实现对单条舆情信息的实体关系分析,进而导致了现有技术中无法实现对实体关系网络的进行深入分析跟踪。

考虑到对实体关系网络分析是否足够深入,其最直观的标准就是该实体关系网络中包含的所有实体,是否都无法与其他实体关系网络中的实体建立起实体关系,即该实体关系网络与其他实体关系网络不具有任何公共的实体节点,例如,假设共有实体关系网络a与实体关系网络b两个实体关系网络,其中实体关系网络a中包含人物a、人物b、人物c以及人物d之间的人物关系,实体关系网络b中包含人物d、人物e、人物f以及人物g之间的人物关系,此时由于两个实体关系网络中都包含公共节点人物d,说明两者还可以通过人物d与其他实体之间存在的关系进一步地合并为一个网络,因此,说明此时的两个实体关系网络分析的都不够深入,而若假设实体关系网络b中仅包含人物e、人物f以及人物g之间的人物关系,此时,由于两个实体关系网络之间并不具有公共节点,因此无法通过实体节点将两个实体关系网络连接起来,即说明两个实体关系网络均已做到对涉及到的所有实体关系的深入分析,实现了对实体关系网络的进行深入分析跟踪。

因此,为了实现对实体关系网络的深入分析,本发明实施例在现有技术的基础上,还会基于单条舆情信息分析得到的简单的实体关系网络进行公共节点提取,并进一步地基于这些公共节点来进行实体关系网络的合并,直至最终得到的实体关系网络之间均不包含任何公共节点为止,以实现对实体关系网络的进行深入分析跟踪,详述如下:

图1示出了本发明实施例一提供的基于舆情信息的实体关系分析方法的实现流程图,详述如下:

s101,对获取到的多条舆情信息分别进行分析,得到与所述舆情信息对应的多个初始的实体关系网络,所述实体关系网络中记录有多个实体节点以及该多个实体节点之间的实体关系。

其中,舆情信息是指从渠道源获取到的新闻、博客及资讯等信息。本发明实施例中获取舆情信息的渠道源由技术人员根据实际情况进行选取设置,包括但不限于与一些社交媒体、新闻网站以及论坛等。

在本发明实施例中,首先会对获取到的每个舆情信息分别进行实体关系的分析,得到每个舆情信息内包含的实体关系网络,如假设一个舆情信息中说明了人物a有一个朋友b,此时可以得到对应的人物a与人物b之间互为朋友关系的实体关系网络,但应当理解地,由于并非每个舆情信息中都一定会包含多个实体之间的实体关系,如假设一个舆情信息中仅说明了人物a是个歌唱家,而未提到其与其他任何实体之间的关系,此时对该舆情信息进行分析是得不到任何实体关系网络的,因此本发明实施例分析得到的实体关系网络的总数量,必定小于或等于获取到的舆情信息的总数量。其中,考虑到现有技术中已有较多可以进行实体关系分析的自然语言分析算法,如常见的基于神经网络的实体关系分析算法等,因此本发明实施例中不对具体使用的实体关系分析方法进行限定,可由技术人员根据实际需求自行设定。

s102,提取所述实体关系网络中包含的公共节点,其中,公共节点为至少同时存在于两个实体关系网络中的实体节点。

公共节点是指几个实体关系网络同时都具有的实体节点,如上述实例中,假设实体关系网络a中包含人物a、人物b、人物c以及人物d之间的人物关系,实体关系网络b中包含人物d、人物e、人物f以及人物g之间的人物关系,则人物d就是该两个实体关系网络中的公共节点。由于本发明实施例中分析得到的简单的实体关系网络的数量未知,且这些实体关系网络中包含的实体的具体情况也无法提前预知,因此此时可提取得到的公共节点的数量也是无法提前预知的,需根据实体关系网络的实际情况决定。

s103,基于所述公共节点对所述实体关系网络间进行合并处理,直至合并得到的实体关系网络中不包含公共节点,得到合并后的所述实体关系网络。

实际应用中发现,当一个实体关系网络与其他任何实体关系网络都不具有公共节点时,说明该实体关系网络中每个实体可延伸出的与其他实体之间的关系,均已被包含在该实体关系网络中,即实现了在已有的舆情信息条件下,对实体与实体之间关系网络分析的最大化最深入化。因此,在确定出实体关系网络中包含的公共节点之后,为了实现对实体关系网络的深度分析,本发明实施例会把包含公共节点的实体关系网络进行合并,直至最终得到的所有实体关系网络之间,均不包含任何公共节点。

具体而言,在进行实体关系网络合并时,考虑到一个公共节点可能同时存在的实体关系网络的数量不定,且不同的实体关系网络之间存在的公共节点的数量也无法确定,即实际情况中由于对舆情信息分析得到的实体关系网络数量较多,导致最终分析得到的实体关系网络之间公共节点的情况也较为复杂,因此在进行实体关系网络合并时,出于不同的实际需求,技术人员可以选取或设定满足其实际需求的合并方法,此处不予限定,例如,当技术人员希望降低合并时的技术难度时,可以选择从一个包含公共节点的实体关系网络出发,选取一个与其具有公共节点的其他实体关系网络,并将两者的公共节点合并以实现两者的网络合并,在得到合并后的实体关系网络后,再检测其中是否包含与其他实体关系网络的公共节点,若包含,重复上述操作,直至最终得到的合并网络中不包含任何公共节点为止,而当技术人员希望提高合并的速度时,则可以同时选取多个包含公共节点的实体关系网络,并以这些实体关系网络为基础,来进行实体关系网的合并,并在每次合并后检测合并得到的实体关系网络中是否包含与其他实体关系网络的公共节点,若包含则继续合并,直至最终得到的合并网络中不包含任何公共节点为止。

因当说明地,由于实际情况中舆情系统可获得到的舆情信息数据量极其庞大,其中包含的实体数量也极其庞大,而并非所有的实体都一定可以直接或间接地具有一定的实体关系,因此,在本发明实施例中,最终得到的不包含公共节点的实体关系网络的数量是无法确定的,即有可能仅有一个,也有可能同时具有多个。

本发明实施例通过对每个舆情信息分析得到的简单的实体关系网络进行公共节点的提取,并根据这些公共节点将这些简单的实体关系网络进行合并,直至所有的实体关系网络之间都不包含公共节点为止,即将所有实体关系网络深度最大化为止,才终止对实体关系网络的分析合并,充分实现了对实体可能涉及的所有实体关系的深入分析,实现了对实体关系网络的进行深入分析跟踪。

作为本发明实施例二,考虑到本发明实施例一中都是直接在每个舆情信息分析得到的实体关系网络基础上,基于公共节点进行合并得到的最终的实体关系网络,这样虽然实现了对实体关系网络的合并分析,可以得到一个分析更加深入的实体关系网络,但实际情况中这样合并得到的实体关系网络中,仅能实现对舆情信息直接记录分析得到的实体关系的记录,而无法得出舆情信息中没有直接记录的实体关系,例如假设最终得到的实体关系网络中,张三有个儿子张四,有个爸爸张五,此时根据本发明实施例一是无法得出张四和张五之间的实体关系的,从而使得本发明实施例一对实体关系网络的分析还不够深入,为了实现对实体关系网络更加深入的分析跟踪,本发明实施例二会在本发明实施例一得到不包含公共节点的实体关系网络的基础上,对其中包含的实体节点之间的实体关系进行进一步地分析,如图2所示,包括:

s201,对合并后的所述实体关系网络中的实体节点进行两两随机组合,并解析每个组合内的2个实体节点之间的实体关系。

考虑到合并后的实体关系网络中很多实体节点之间已经具有了对应的实体关系,因此为了减小本发明实施例中的任务量,在进行两两组合分析时,可以不考虑已经存在实体关系的实体节点组合,例如上述实例中张三和张四、张五都已经分别具有了实体关系,此时若对该三个节点进行两两组合分析,可以仅对其中不存在实体关系的张四+张五的组合进行分析,而无需考虑张三+张四以及张三+张五的两个组合。

为了实现对原本在舆情信息中没有实体关系的实体节点组合之间的实体关系分析,本发明实施例会根据实际生活中的实体关系可能情况进行实体关系规则的预先设置,例如可以根据实际的亲戚关系设置一个亲戚关系规则,再来判断得到的这些实体节点组合之间是否满足设置的实体关系规则,如上述的根据亲戚关系规则可查出张四和张五之间是存在爷孙关系的,此时即可得到两者组合之间的实体关系。其中具体预设的实体关系规则可由技术人员自行设定,优选地,为了实现对实体关系网络的深入分析,这些实体关系规则设置的越多越好。

s202,基于解析得到的每个组合内的2个实体节点之间的实体关系,对合并后的所述实体关系网络中的实体关系进行更新。

在得到实体节点之间的实体关系之后,直接将这些实体关系记录在本发明实施例一得到的合并后的实体关系网络之中,即可实现对其的更新。

本发明实施例突破了现有技术以及本发明实施例一中仅能依靠单条舆情信息解析来获取确定实体节点之间的关系的局限,实现了即使是在不同的舆情信息中出现的实体,仍可以通过合理的实体关系推理解析,得到其对应的实体关系,从而使得本发明实施例可以实现更为深入的实体关系网络分析跟踪。

作为上述本发明实施例中基于公共节点进行实体关系网络合并的一种具体实现方式,考虑到实际情况中舆情系统可获取到的舆情信息的数据量极其庞大,因此在进行合并处理时其工作量也是非常大的,为了提高合并的工作效率,本发明实施例中会同时将多个公共节点作为合并出发点,同步进行多个公共节点所属的实体关系网络的合并,如图3所示,本发明实施例三,包括:

s301,随机选取多个所述公共节点,并对多个所述公共节点中每个公共节点所属的所述实体关系网络分别进行合并,得到多个合并后的所述实体关系网络。

其中,选取的公共节点具体数量可由技术人员自行设定,满足大于或等于2即可。考虑到实际情况中舆情信息的数据量非常大,分析得到的简单的实体关系网络也非常多,因此涉及到筛选查找之类的操作时,所需的工作量都是非常大的。为了减小合并时的工作量,本发明实施例中在选取公共节点时,采用了随机选取的方法,以尽可能地避免有条件筛选所带来的工作量。

在选取出公共节点之后,查询每个公共节点分别对应的实体关系网络,并将这些对应的实体关系网络基于该公共节点进行合并即可,如公共节点a同时存在于实体关系网络a、实体关系网络b以及实体关系网络c,此时可以通过公共节点a将三个实体关系网络合并。其中,考虑到一个实体关系网络可能同时包含几个被选取的公共节点,此时可以将其随机分配至其中一个公共节点。

s302,检测多个合并后的所述实体关系网络中是否存在公共节点。

由于一个实体关系网络中可能同时包含多个公共节点,仅通过一个公共节点的合并还无法一次实现对所有包含相同公共节点的实体关系网络的合并,例如公共节点a同时存在于实体关系网络a、实体关系网络b以及实体关系网络c,但实体关系网络a还与实体关系网络d存在公共节点b,此时若按照公共节点a将实体关系网络a、实体关系网络b以及实体关系网络c合并,此时合并后的实体关系网络中必定还存在与实体关系网络d的公共节点b,即该合并后的实体关系网络仍可以继续进行进一步地深入分析。

s303,若多个合并后的所述实体关系网络中存在公共节点,基于多个合并后的所述实体关系网络,返回执行所述提取出所述实体关系网络中包含的公共节点的操作。

在合并后的实体关系网中仍存在公共节点时,说明该合并后的实体关系网络可以继续进行合并分析,因此本发明实施例会继续返回本发明实施例一中进行公共节点提取的操作,以继续对其进行合并,直至最终合并得到的实体关系网络不存在任何公共节点为止。而当合并后的实体关系网络不存在公共节点时,说明其已经无法进行合并,已经完成了对其的深入分析跟踪。

由于实际情况中舆情系统可获得到的舆情信息数据量极其庞大,其中包含的实体数量也极其庞大,而并非所有的实体都一定可以直接或间接地具有一定的实体关系,因此在进行合并时,也有可能出现得到的多个合并后的实体关系网络中,一部分实体关系网络不存在公共节点,但另一部分则仍存在公共节点,此时只需要将仍存在公共节点的实体关系网络返回至本发明实施例一中进行公共节点提取的操作步骤即可。

作为本发明实施例四,考虑到实际情况中单条舆情信息不一定真实,从而使得对单条舆情信息分析得到的实体关系的可信度难以得到保证,且极有可能出现两条舆情信息分析得到的实体关系冲突的情况,例如根据舆情信息a分析得到人物a是人物b的父亲,但根据另一舆情信息b分析又得到人物a是人物b爷爷,很明显这两个实体关系是存在冲突的,其中必定存在错误的实体关系,因此,为了保证上述本发明实施例中得到的实体关系网络中实体关系的真实可靠,实现对实体之间实体关系的真实可靠的深入分析,本发明实施例会对存在两个及以上实体关系的实体节点组合进行分析,并提出其中存在问题的实体关系,如图4所示,包括:

s401,查找出合并后的所述实体关系网络中的第一节点组,所述第一节点组为对应的实体关系数量大于或等于2的2个实体节点的组合。

由于不同的舆情信息中可能记录有相同的两个实体节点存在的不同实体关系,这些节点关系既有可能是上述分析中存在冲突的关系,也有可能是不存在冲突的节点关系,如假设根据舆情信息a分析得到人物a是人物b的父亲,根据另一舆情信息c分析又得到人物a是人物b同事,此时两个实体关系之间是不存在冲突的,在合并之后这些关系都被记录在了合并后的实体关系网络之中,为了找出其中存在冲突的实体节点组合,本发明实施例首先会查找出所有实体关系数量大于等于2的实体节点组合,这里的实体节点组合都是指实体节点之间两两的组合,即仅会包含两个实体节点。

s402,从所述第一节点组中筛选出第二节点组,所述第二节点组为包含的实体关系内存在预设关系组合的第一节点组。

如上述分析的,不是所有的实体关系都存在冲突,因此即使两个实体节点之间存在多条实体关系也不一定就存在冲突关系。因此,为了剔除不合理的冲突关系,本发明实施例中会从包含多条实体关系的实体节点组合中,筛选出存在冲突的实体关系。其中,为了实现对存在冲突的实体关系的筛选,本发明实施例中会预先设置好一些存在冲突的实体关系的组合,即预设关系组合,例如父子+爷孙/母子/兄弟/姐妹等是冲突的实体关系组合,再根据该预设关系组合来进行查询,判断实体关系组包含的实体关系是否有冲突的实体关系组合,若有,则将这个实体关系组筛选出来。例如上述实例中舆情信息a分析得到人物a是人物b的父亲,另一舆情信息c分析又得到人物a是人物b同事,此时实体节点a与实体节点b的实体节点组合中,就存在满足预设关系组合的父子+爷孙的冲突关系组合,即可将给实体节点组合筛选出来。其中具体的预设关心组合设置规则,可由技术人员根据实际情况进行设置。

s403,基于所述预设关系组合内每个实体关系分别对应的所述舆情信息,对所述预设关系组合进行分析,筛选出其中与所述第二节点组内的两个实体节点唯一对应的实体关系,并基于该唯一对应的实体关系,对合并后的所述实体关系网络进行更新。

在确定出这些存在冲突的实体关系的实体节点组合后,本发明实施例会对这些存在冲突的实体关系进行筛选,确定出其中唯一一个对应的实体关系。其中,因当理解地,这里的筛选仅仅只是针对存在冲突的实体关系,对其他不存在冲突的实体关系此处是不予处理的,因此,最终得到的两个实体节点直接的实体关系可能不唯一,只是其中不会再存在有冲突的实体关系,例如,上述实例中舆情信息a分析得到人物a是人物b的父亲,另一舆情信息c分析又得到人物a是人物b同事,即实体节点a与实体节点b的实体节点组合中,共有父子+爷孙+同事三个实体关系,本发明实施例仅会对其中父子+爷孙的冲突实体关系进行唯一筛选,而不对同事的实体关系进行处理,最终得到的实体节点a与实体节点b的实体节点组合中,也会有父子/爷孙+同事两个实体关系。其中,具体的冲突实体关系的筛选方法此处不予限定,可由技术人员根据实际情况选取设置,包括但不限于如随机选取其中一个保留,或者参考本发明实施例五进行处理。

作为本发明实施例四中对冲突的实体关系进行筛选的一种具体实现方式,考虑到舆情信息的渠道源庞杂,不同渠道源对实体关系的重要程度存在较大差异,例如政府网站发布的舆情信息可信度远高于一些娱乐新闻网站,因此从这着可信度高的渠道源中分析得到的实体关系的可信度,也远高于一些可信度较低的渠道源,另一方面,由于舆情信息的实时性特征较为明显,其中包含的实体关系与时间的关系较为密切,因此实体关系对应的舆情信息的发布时间,也是决定实体关系可信度的一个重要因素,为了保证对冲突的实体关系的准确筛选,如图5所示,本发明实施例五,包括:

s501,获取所述预设关系组合内每个实体关系分别对应的所述舆情信息的渠道源以及发布时间,所述渠道源为提供舆情信息的渠道源。

由于每个实体关系都是从舆情信息中分析得到的,因此直接根据其对应的舆情信息即可查询出提供该舆情信息的渠道源,以及该舆情信息的发布时间。

s502,基于所述渠道源、所述发布时间以及预设的权重系数,计算所述预设关系组合内每个实体关系分别对应的权重值,并基于该权重值筛选出与所述第二节点组的两个实体节点唯一对应的实体关系。

其中,为了实现根据渠道源以及发布时间对冲突的实体关系的筛选,本发明实施例首先会对两者进行量化,如可以预先为每个渠道源设置对应的可信度分数,如可以设置为政府相关的网站分数为100,娱乐新闻网站分数为60,其他网站为80,同时为不同的发布时间设置对应的可信度分数,如可以设置为发布时间半年内未100,半年至一年内80,一年以上为60等,同时还会由技术人员预先对两者设置对应的权重系数,再基于该权重系数,以及每个实体关系各自的渠道源分数以及发布时间分数,来实现对实体关系可信度的量化分数计算,得到对应的权重值。最后,再根据可信度最高的实体关系,作为冲突的实体关系中唯一保留的实体关系。其中渠道源和发布时间对应的权重系数具体值,由技术人员根据实际情况设定。

作为本发明实施例六,为了方便后续用户对实体关系查询功能的使用,本发明实施例中会对最终得到的每个实体关系网络进行分类,例如人物关系网络、地点关系网络以及事件关系网络等,如图6所示,包括:

s601,基于合并后的所述实体关系网络中包含的实体的种类以及实体关系的种类,识别合并后的所述实体关系网络对应的关系网络种类。

这里首先会对实体关系网络进行分类,如可以分为上述的人物关系网络、地点关系网络以及事件关系网络等,并根据每种实体关系网络的实际情况来设定对应的实体和实体关系划分标准,如对于人物关系网络,其内部实体仅包含人,其实体关系也仅包含人物关系,对于地点关系网络,其内部实体仅包含地点,其实体关系也仅包含地点关系,而对于事件关系网络,其内部实体可以同时包含人、地点和机构,实体关系也可以包含多种,因此可以根据上述各种实体关系网络的实际情况,来预先设置每种实体关系网络的实际情况来设定对应的实体和实体关系划分标准,再根据实际得到的实体关系网络的情况,来进行分类。

s602,根据合并后的所述实体关系网络对应的关系网络种类,为合并后的所述实体关系网络添加对应的种类标签。

在确定出最终得到的每个实体关系网络的种类之后,本发明实施例还会对每个实体关系网络添加对应的种类标签,如可以对人物关系网络添加“人物关系”标签,对地点关系网络添加“地点关系”,对事件关系网络添加“事件关系”标签等,从而使得用户在进行实体关系查询时,可以根据所需查询的实体关系的种类,快速实现分类查询。

本发明实施例通过对每个舆情信息分析得到的简单的实体关系网络进行公共节点的提取,并根据这些公共节点将这些简单的实体关系网络进行合并,直至所有的实体关系网络之间都不包含公共节点为止,即将所有实体关系网络深度最大化为止,才终止对实体关系网络的分析合并,充分实现了对实体可能涉及的所有实体关系的深入分析,实现了对实体关系网络的进行深入分析跟踪。同时在此基础上,本发明实施例还对实体关系网络中各个实体节点组合分别进行实体关系的分析,以保证最终得到的实体关系网络中每个可能的实体关系都能被重复挖掘分析处理,且对实体节点之间存在冲突的实体关系进行筛选,仅保留一个可信度最高的实体关系,从而保证了最终得到的实体关系网络的真实可靠,本发明实施例最终实现对舆情信息的综合分析,实现了对实体关系网络更加真实可靠更加深入的分析跟踪。

对应于上文实施例的方法,图7示出了本发明实施例提供的基于舆情信息的实体关系分析装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。图7示例的基于舆情信息的实体关系分析装置可以是前述实施例一提供的基于舆情信息的实体关系分析方法的执行主体。

参照图7,该基于舆情信息的实体关系分析装置包括:

网络分析模块71,用于对获取到的多条舆情信息分别进行分析,得到与所述舆情信息对应的多个初始的实体关系网络,所述实体关系网络中记录有多个实体节点以及该多个实体节点之间的实体关系。

节点提取模块72,用于提取所述实体关系网络中包含的公共节点,其中,公共节点为至少同时存在于两个实体关系网络中的实体节点。

网络合并模块73,用于基于所述公共节点对所述实体关系网络间进行合并处理,直至合并得到的实体关系网络中不包含公共节点,得到合并后的所述实体关系网络。

进一步地,该基于舆情信息的实体关系分析装置,还包括:

节点组合模块,用于对合并后的所述实体关系网络中的实体节点进行两两随机组合,并解析每个组合内的2个实体节点之间的实体关系。

关系更新模块,用于基于解析得到的每个组合内的2个实体节点之间的实体关系,对合并后的所述实体关系网络中的实体关系进行更新。

进一步地,网络合并模块73,包括:

随机选取多个所述公共节点,并对多个所述公共节点中每个公共节点所属的所述实体关系网络分别进行合并,得到多个合并后的所述实体关系网络。

检测多个合并后的所述实体关系网络中是否存在公共节点。

若多个合并后的所述实体关系网络中存在公共节点,基于多个合并后的所述实体关系网络,返回执行所述提取出所述实体关系网络中包含的公共节点的操作。

进一步地,该基于舆情信息的实体关系分析装置,还包括:

多关系节点查找模块,用于查找出合并后的所述实体关系网络中的第一节点组,所述第一节点组为对应的实体关系数量大于或等于2的2个实体节点的组合。

关系组筛选模块,用于从所述第一节点组中筛选出第二节点组,所述第二节点组为包含的实体关系内存在预设关系组合的第一节点组。

节点关系更新模块,用于基于所述预设关系组合内每个实体关系分别对应的所述舆情信息,对所述预设关系组合进行分析,筛选出其中与所述第二节点组内的两个实体节点唯一对应的实体关系,并基于该唯一对应的实体关系,对合并后的所述实体关系网络进行更新。

进一步地,节点关系更新模块,包括:

获取所述预设关系组合内每个实体关系分别对应的所述舆情信息的渠道源以及发布时间,所述渠道源为提供舆情信息的渠道源。

基于所述渠道源、所述发布时间以及预设的权重系数,计算所述预设关系组合内每个实体关系分别对应的权重值,并基于该权重值筛选出与所述第二节点组的两个实体节点唯一对应的实体关系。

进一步地,该基于舆情信息的实体关系分析装置,还包括:

基于合并后的所述实体关系网络中包含的实体的种类以及实体关系的种类,识别合并后的所述实体关系网络对应的关系网络种类。

根据合并后的所述实体关系网络对应的关系网络种类,为合并后的所述实体关系网络添加对应的种类标签。

本发明实施例提供的基于舆情信息的实体关系分析装置中各模块实现各自功能的过程,具体可参考前述图1所示实施例一的描述,此处不再赘述。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

还应理解的是,虽然术语“第一”、“第二”等在文本中在一些本发明实施例中用来描述各种元素,但是这些元素不应该受到这些术语的限制。这些术语只是用来将一个元素与另一元素区分开。例如,第一表格可以被命名为第二表格,并且类似地,第二表格可以被命名为第一表格,而不背离各种所描述的实施例的范围。第一表格和第二表格都是表格,但是它们不是同一表格。

图8是本发明一实施例提供的终端设备的示意图。如图8所示,该实施例的终端设备8包括:处理器80、存储器81,所述存储器81中存储有可在所述处理器80上运行的计算机程序82。所述处理器80执行所述计算机程序82时实现上述各个基于舆情信息的实体关系分析方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如图7所示模块71至73的功能。

所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的示例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入发送设备、网络接入设备、总线等。

所称处理器80可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81可以是所述终端设备8的内部存储单元,例如终端设备8的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经发送或者将要发送的数据。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、电载波信号、电信信号以及软件分发介质等。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使对应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1