舆情信息处理方法、装置及计算机可读存储介质与流程

文档序号:25280627发布日期:2021-06-01 17:27阅读:110来源:国知局
舆情信息处理方法、装置及计算机可读存储介质与流程

本公开涉及信息处理技术领域,尤其涉及一种舆情信息处理方法、装置及计算机可读存储介质。



背景技术:

随着网络普及度的不断提高,每时每刻都会有大量的舆情信息在互联网上曝光,其中的热门舆情信息尤其受大众的关注。需要说明的是,舆情信息除了承载表象的社会性信息,往往还具有内在的价值,但却常常被人忽视,从而导致舆情信息的价值未能得到有效地利用。



技术实现要素:

为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种舆情信息处理方法、装置及计算机可读存储介质。

根据本公开实施例的一个方面,提供了一种舆情信息处理方法,包括:

获取舆情信息;

从所述舆情信息中,获取p个实体标识集合;其中,不同实体标识集合对应不同实体类型;

根据所述p个实体标识集合,进行实体标识组合处理,以得到k个组合结果;其中,任一组合结果中包括每个实体标识集合中的一个实体标识;

根据所述k个组合结果,确定预设对象库中与所述舆情信息匹配的目标对象。

在一个可选示例中,所述p个实体标识集合中包括第一实体标识集合和第二实体标识集合,所述第一实体标识集合中包括m个第一类实体标识,所述第二实体标识集合中包括n个第二类实体标识;

所述根据所述p个实体标识集合,进行实体标识组合处理,以得到k个组合结果,包括:

确定m与n的乘积;

在所述乘积小于第一预设数值的情况下,针对所述m个第一类实体标识和所述n个第二类实体标识,随机进行不同类实体标识的组合处理,以得到k个组合结果;

在所述乘积大于或等于第一预设数值的情况下,从所述m个第一类实体标识和所述n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

在一个可选示例中,所述p个实体标识集合中包括第一实体标识集合和第二实体标识集合,所述第一实体标识集合中包括m个第一类实体标识,所述第二实体标识集合中包括n个第二类实体标识;

所述根据所述p个实体标识集合,进行实体标识组合处理,以得到k个组合结果,包括:

获取所述m个第一类实体标识和所述n个第二类实体标识在所述舆情信息中的出现位置排序;

根据所获取的出现位置排序,从所述m个第一类实体标识和所述n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

在一个可选示例中,所述根据所获取的出现位置排序,从所述m个第一类实体标识和所述n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,包括:

根据所获取的出现位置排序,为所述m个第一类实体标识和所述n个第二类实体标识确定出现位置序号;

在所述m个第一类实体标识中的任一第一类实体标识与所述n个第二类实体标识中的任一第二类实体标识的出现位置序号的数值差的绝对值小于第二预设数值的情况下,确定本第一类实体标识和本第二类实体标识满足指定组合条件。

在一个可选示例中,所述p个实体标识集合中包括第一实体标识集合和第二实体标识集合,所述第一实体标识集合中的每个实体标识均为人物标识,所述第二实体标识集合中的每个实体标识均为企业标识,所述预设对象库中的任一对象采用人物标识和企业标识列表的组合数据进行表征;

所述根据所述k个组合结果,确定预设对象库中与所述舆情信息匹配的目标对象,包括:

根据用于表征所述预设对象库中的各个对象的组合数据,确定所述预设对象库中的、所述k个组合结果中的至少一个组合结果中的人物标识和企业标识均命中的对象;

将所确定的对象作为与所述舆情信息匹配的目标对象。

在一个可选示例中,所述根据所述k个组合结果,确定预设对象库中与所述舆情信息匹配的目标对象之后,所述方法还包括:

向与所述目标对象关联的用户推送所述舆情信息;

和/或,

获取所述目标对象的关联关系情况数据。

根据本公开实施例的另一个方面,提供了一种舆情信息处理装置,包括:

第一获取模块,用于获取舆情信息;

第二获取模块,用于从所述舆情信息中,获取p个实体标识集合;其中,不同实体标识集合对应不同实体类型;

第三获取模块,用于根据所述p个实体标识集合,进行实体标识组合处理,以得到k个组合结果;其中,任一组合结果中包括每个实体标识集合中的一个实体标识;

确定模块,用于根据所述k个组合结果,确定预设对象库中与所述舆情信息匹配的目标对象。

在一个可选示例中,所述p个实体标识集合中包括第一实体标识集合和第二实体标识集合,所述第一实体标识集合中包括m个第一类实体标识,所述第二实体标识集合中包括n个第二类实体标识;

所述第三获取模块,包括:

第一确定子模块,用于确定m与n的乘积;

第一获取子模块,用于在所述乘积小于第一预设数值的情况下,针对所述m个第一类实体标识和所述n个第二类实体标识,随机进行不同类实体标识的组合处理,以得到k个组合结果;

第二获取子模块,用于在所述乘积大于或等于第一预设数值的情况下,从所述m个第一类实体标识和所述n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

在一个可选示例中,所述p个实体标识集合中包括第一实体标识集合和第二实体标识集合,所述第一实体标识集合中包括m个第一类实体标识,所述第二实体标识集合中包括n个第二类实体标识;

所述第三获取模块,包括:

第三获取子模块,用于获取所述m个第一类实体标识和所述n个第二类实体标识在所述舆情信息中的出现位置排序;

第四获取子模块,用于根据所获取的出现位置排序,从所述m个第一类实体标识和所述n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

在一个可选示例中,所述第四获取子模块,包括:

第一确定单元,用于根据所获取的出现位置排序,为所述m个第一类实体标识和所述n个第二类实体标识确定出现位置序号;

第二确定单元,用于在所述m个第一类实体标识中的任一第一类实体标识与所述n个第二类实体标识中的任一第二类实体标识的出现位置序号的数值差的绝对值小于第二预设数值的情况下,确定本第一类实体标识和本第二类实体标识满足指定组合条件。

在一个可选示例中,所述p个实体标识集合中包括第一实体标识集合和第二实体标识集合,所述第一实体标识集合中的每个实体标识均为人物标识,所述第二实体标识集合中的每个实体标识均为企业标识,所述预设对象库中的任一对象采用人物标识和企业标识列表的组合数据进行表征;

所述确定模块,包括:

第二确定子模块,用于根据用于表征所述预设对象库中的各个对象的组合数据,确定所述预设对象库中的、所述k个组合结果中的至少一个组合结果中的人物标识和企业标识均命中的对象;

第三确定子模块,用于将所确定的对象作为与所述舆情信息匹配的目标对象。

在一个可选示例中,所述装置还包括:

推送模块,用于在根据所述k个组合结果,确定预设对象库中与所述舆情信息匹配的目标对象之后,向与所述目标对象关联的用户推送所述舆情信息;

和/或,

第四获取模块,用于在根据所述k个组合结果,确定预设对象库中与所述舆情信息匹配的目标对象之后,获取所述目标对象的关联关系情况数据。

根据本公开实施例的再一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述舆情信息处理方法。

根据本公开实施例的又一个方面,提供了一种电子设备,包括:

处理器;

用于存储所述处理器可执行指令的存储器;

所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述舆情信息处理方法。

根据本公开实施例的又一个方面,提供了一种计算机程序,包括计算机可读代码,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现上述舆情信息处理方法中各步骤的指令。

本公开的实施例中,在获取舆情信息之后,可以从舆情信息中,获取所对应实体类型互异的p个实体标识集合,并根据p个实体标识集合,进行实体标识组合处理,以得到k个组合结果,再之后,可以根据k个组合结果,确定预设对象库中与舆情信息匹配的目标对象。可见,本公开的实施例中,在获取舆情信息之后,可以结合实体标识集合获取处理和实体标识组合处理,得到k个组合结果,并据此确定预设对象库中与舆情信息匹配的目标对象,基于确定结果可以进行一些特定的处理(例如向特定用户推送舆情信息的处理),这样,本公开的实施例中并不仅仅只是通过舆情信息来体现表象的社会性信息,还基于舆情信息进行了一些特定的处理,从而有效地利用了舆情信息内在的价值。

下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

附图说明

通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1是本公开一示例性实施例提供的舆情信息处理方法的流程示意图。

图2是本公开的实施例中预设对象库的示意图。

图3是本公开另一示例性实施例提供的舆情信息处理方法的流程示意图。

图4是本公开再一示例性实施例提供的舆情信息处理方法的流程示意图。

图5是本公开又一示例性实施例提供的舆情信息处理方法的流程示意图。

图6是本公开又一示例性实施例提供的舆情信息处理方法的流程示意图。

图7是本公开的实施例中进行出现位置序号的数值差的计算时参考的示意图。

图8是本公开又一示例性实施例提供的舆情信息处理方法的流程示意图。

图9是本公开又一示例性实施例提供的舆情信息处理方法的流程示意图。

图10是本公开一示例性实施例提供的舆情信息处理装置的结构示意图。

图11是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。

应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。

还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。

还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。

另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。

还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

示例性方法

图1是本公开一示例性实施例提供的舆情信息处理方法的流程示意图。图1所示的方法包括步骤101、步骤102、步骤103和步骤104,下面对各步骤分别进行说明。

步骤101,获取舆情信息。

需要说明的是,本公开的实施例中可以设置包括当下较为热门的舆情信息的数据源,在步骤101中,可以基于数据抓取能力,从数据源中抓取舆情信息。

步骤102,从舆情信息中,获取p个实体标识集合;其中,不同实体标识集合对应不同实体类型。

在步骤102中,可以对舆情信息的所有内容(其可以包括标题内容和正文内容)进行遍历,以从中提取出p个实体标识集合。这里,p可以为大于或等于2的整数,例如,p可以为2、3、4等,在此不再一一列举。为了便于理解,本公开的实施例中均以p为2的情况为例进行说明,这时,p个实体标识集合可以包括第一实体标识集合和第二实体标识集合,第一实体标识集合和第二实体标识集合中可以分别包括若干个实体标识。

可选地,第一实体标识集合对应的实体类型可以为人物类型,第二实体标识对应的实体类型可以为企业类型,这样,第一实体标识集合中的每个实体标识均可以为人物标识,例如为人物名称,第二实体标识集合中的每个实体标识均可以为企业标识,例如为企业名称;或者,第一实体标识集合对应的实体类型可以为人物类型,第二实体标识对应的实体类型可以为高校类型,这样,第一实体标识集合中的每个实体标识均可以为人物标识,例如为人物名称,第二实体标识集合中的每个实体标识均可以为高校标识,例如为高校名称。

步骤103,根据p个实体标识集合,进行实体标识组合处理,以得到k个组合结果;其中,任一组合结果中包括每个实体标识集合中的一个实体标识。

在步骤103中,可以依据p个实体标识集合,进行实体标识组合处理,例如以随机方式进行实体标识的组合处理,或者,以特定方式进行实体标识的组合处理,以得到k个组合结果,本公开的实施例并不限制进行组合处理时使用的具体方式,只需保证每个组合结果中均包括第一实体标识集合中的一个实体标识和第二实体标识集合中的一个实体标识即可。这里,k可以为大于或等于1的整数,例如为1、3、5、8等,在此不再一一列举。

步骤104,根据k个组合结果,确定预设对象库中与舆情信息匹配的目标对象。

需要说明的是,本公开的实施例中可以设置包括多个对象的预设对象库,预设对象库中的每个对象可以为某一领域的大咖(具体可参见图2示意的情况),例如为商业领域的大咖、学术领域的大咖、医学领域的大咖等,这时,预设对象库也可以称为大咖库。

在步骤104中,可以对预设对象库中的多个对象进行遍历,以根据k个组合结果,从多个对象中搜索出与舆情信息匹配的对象,搜索出的对象可以作为目标对象。这里,目标对象的数量可以为大于或等于1的整数,例如为1、2、3、4、5等,在此不再一一列举。

需要说明的是,在确定预设对象库中与舆情信息匹配的目标对象之后,基于确定结果可以进行一些特定的处理,下面对特定的处理的具体实施方式进行举例介绍。

在一种具体实施方式中,如图3所示,在步骤104之后,该方法还包括:

步骤105,向与目标对象关联的用户推送舆情信息。

可选地,与目标对象关联的用户包括但不限于监控目标对象的用户、在互联网上查询目标对象的用户等,这样,与目标对象关联的用户可以认为是对目标对象感兴趣的用户。

这种实施方式中,在确定预设对象库中与所述舆情信息匹配的目标对象之后,可以将舆情信息推送至与目标用户关联的用户所使用的终端设备(例如手机、平板电脑等),以便与目标用户关联的用户对舆情信息进行阅读,从而了解目标用户的舆情动态。由于基于k个组合结果确定的目标对象与舆情信息匹配,可以认为舆情信息与目标对象紧密相关,又由于与目标对象关联的用户可以认为是对目标对象感兴趣的用户,那么,与目标对象紧密相关的舆情信息可以认为是与目标对象关联的用户感兴趣的舆情信息,这样,这种实施方式将舆情信息推送给了对其感兴趣的用户,相应地,用户能够及时有效地阅读到感兴趣的舆情信息,从而能够有效地提升用户的使用体验。

在另一种具体实施方式中,如图4所示,在步骤104之后,该方法还包括:

步骤106,获取目标对象的关联关系情况数据。

这里,目标对象的关联关系情况数据可以呈关系图谱的形式,假设目标对象为商业领域的大咖,关系图谱可以用于体现与目标对象有直接或间接关系的企业个人投资任职等关系,当然,目标对象的关联关系情况数据也可以呈表格形式或者其它形式。

这种实施方式中,可以获取目标对象的关系图谱,以进行关系图谱的展示,这样可以方便对目标对象感兴趣的用户根据实际需要对关系图谱进行查阅。

本公开的实施例中,在获取舆情信息之后,可以从舆情信息中,获取所对应实体类型互异的p个实体标识集合,并根据p个实体标识集合,进行实体标识组合处理,以得到k个组合结果,再之后,可以根据k个组合结果,确定预设对象库中与舆情信息匹配的目标对象。可见,本公开的实施例中,在获取舆情信息之后,可以结合实体标识集合获取处理和实体标识组合处理,得到k个组合结果,并据此确定预设对象库中与舆情信息匹配的目标对象,基于确定结果可以进行一些特定的处理(例如向特定用户推送舆情信息的处理),这样,本公开的实施例中并不仅仅只是通过舆情信息来体现表象的社会性信息,还基于舆情信息进行了一些特定的处理,从而有效地利用了舆情信息内在的价值。

在图1所示实施例的基础上,p个实体标识集合中包括第一实体标识集合和第二实体标识集合,第一实体标识集合中包括m个第一类实体标识,第二实体标识集合中包括n个第二类实体标识;

如图5所示,步骤103,包括:

步骤1031,确定m与n的乘积;

步骤1032,在乘积小于第一预设数值的情况下,针对m个第一类实体标识和n个第二类实体标识,随机进行不同类实体标识的组合处理,以得到k个组合结果;

步骤1033,在乘积大于或等于第一预设数值的情况下,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

这里,m和n可以相同或者不同;第一预设数值可以为10、12、15或者其它数值,在此不再一一列举。

在第一实体标识集合对应的实体类型为人物类型,第二实体标识集合对应的实体类型为企业类型的情况下,第一实体标识集合中的m个第一类实体标识中的每个第一类实体标识均可以为人物名称,第二实体标识集合中的n个第二类实体标识中的每个第二类实体标识均可以为企业名称。在第一实体标识集合对应的实体类型为人物类型,第二实体标识集合对应的实体类型为高校类型的情况下,第一实体标识集合中的m个第一类实体标识中的每个第一类实体标识均可以为人物名称,第二实体标识集合中的n个第二类实体标识中的每个第二类实体标识均可以为高校名称。

本公开的实施例中,可以计算m与n的乘积,并将乘积与第一预设数值进行比较。

在乘积小于第一预设数值的情况下,可以认为m个第一类实体标识和n个第二类实体标识所能够形成的组合结果的最大数量的数值不太大,那么,可以随机进行不同类实体标识的组合处理,以对m个第一类实体标识和n个第二类实体标识所能够形成的组合结果进行穷举,以得到k个组合结果,这时,k可以等于乘积。

在乘积大于或等于第一预设数值的情况下,可以认为m个第一类实体标识和n个第二类实体标识所能够形成的组合结果的最大数量的数值较大,这时,采用穷举方式需要花费非常长的时间,因此,可以从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识(确定满足指定组合条件的不同类实体标识的方式可以参照下文中的说明,这里先不做论述),并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果,这时,k可以等于或小于乘积。在一个具体例子中,m个第一类实体标识具体为3个第一类实体标识,分别是r11、r12、r13,n个第二类实体标识具体为3个第二类实体标识,分别是q21、q22、q23,且r11和q21满足指定组合条件,r12和q23满足指定组合条件,r13和q23满足指定组合条件,则获取的组合结果的数量为3个(即k为3),分别是包括r11和q21的组合结果、包括r12和q23的组合结果、包括r13和q23的组合结果,很显然,k小于乘积。

可见,本公开的实施例中,可以计算m与n的乘积,在乘积小于第一预设数值的情况下,可以随机方式进行实体标识的组合处理,在乘积大于或等于第一预设数值的情况下,可以结合指定组合条件,仅对满足条件的不同类实体标识进行组合,这样能够较为方便快捷地获得所需的组合结果,尽量避免获得所需的组合结果耗费的时间过长。

在图1所示实施例的基础上,p个实体标识集合中包括第一实体标识集合和第二实体标识集合,第一实体标识集合中包括m个第一类实体标识,第二实体标识集合中包括n个第二类实体标识;

如图6所示,步骤103,包括:

步骤1034,获取m个第一类实体标识和n个第二类实体标识在舆情信息中的出现位置排序;

步骤1035,根据所获取的出现位置排序,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

这里,m和n可以相同或者不同。

在第一实体标识集合对应的实体类型为人物类型,第二实体标识集合对应的实体类型为企业类型的情况下,第一实体标识集合中的m个第一类实体标识中的每个第一类实体标识均可以为人物名称,第二实体标识集合中的n个第二类实体标识中的每个第二类实体标识均可以为企业名称。在第一实体标识集合对应的实体类型为人物类型,第二实体标识集合对应的实体类型为高校类型的情况下,第一实体标识集合中的m个第一类实体标识中的每个第一类实体标识均可以为人物名称,第二实体标识集合中的n个第二类实体标识中的每个第二类实体标识均可以为高校名称。为了便于理解,本公开的实施例中均以第一实体标识集合对应的实体类型为人物类型,第二实体标识集合对应的实体类型为企业类型的情况为例进行说明。

本公开的实施例中,可以获取m个第一类实体标识和n个第二类实体标识在舆情信息中的出现位置排序,所获取的出现位置排序可以用于体现m个第一类实体标识和n个第二类实体标识在舆情信息中出现的先后顺序。在一个具体例子中,m个第一类实体标识具体为3个人物标识,分别是r21、r22、r23,n个第二类实体标识具体为3个企业标识,分别是q21、q22、q23,且q21最先出现在舆情信息中,r21紧接着出现在舆情信息中,之后依次是q22、r22、q23、r23出现在舆情信息中,则所获取的出现位置排序可以表示为:q21→r21→q22→r22→q23→r23。

接下来,可以根据所获取的出现位置排序,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识。在一种具体实施方式中,根据所获取的出现位置排序,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,包括:

根据所获取的出现位置排序,为m个第一类实体标识和n个第二类实体标识确定出现位置序号;

在m个第一类实体标识中的任一第一类实体标识与n个第二类实体标识中的任一第二类实体标识的出现位置序号的数值差的绝对值小于第二预设数值的情况下,确定本第一类实体标识和本第二类实体标识满足指定组合条件。

延续上述具体例子中出现位置排序表示为:q21→r21→q22→r22→q23→r23的情况,可以分别为r21、r22、r23、q21、q22、q23六者确定出现位置序号,具体地,如下面的表1所示,为q21确定的出现位置序号可以为1,为r21确定的出现位置序号可以为2,为q22确定的出现位置序号可以为3,为r22确定的出现位置序号可以为4,为q23确定的出现位置序号可以为5,为r23确定的出现位置序号可以为6。

表1

在为r21、r22、r23、q21、q22、q23六者确定出现位置序号之后,可以计算r21、r22、r23中的每一者与q21、q22、q23中的每一者的出现位置序号的数值差,参考图7可知,这样能够得到9个数值差的绝对值。假设第二预设数值为2,则通过计算可知,仅q21与r21的数值差的绝对值、r21与q22的数值差的绝对值、q22与r22的数值差的绝对值、r22与q23的数值差的绝对值、q23与r23的绝对值小于第二预设数值,那么,可以确定q21和r21足指定组合条件、r21和q22满足指定组合条件、q22和r22满足指定组合条件、r22和q23满足指定组合条件、q23和r23满足指定组合条件。

在确定满足指定组合条件的不同类实体标识之后,可以按照确定结果进行不同类实体标识的组合处理,具体地,可以将q21和r21进行组合,将r21和q22进行组合,将q22和r22进行组合,将r22和q23进行组合,将q23和r23进行组合,以得到5个组合结果,这5个组合结果分别是包括q21和r21的组合结果、包括r21和q22的组合结果、包括q22和r22的组合结果、包括r22和q23的组合结果、包括q23和r23的组合结果。

这种实施方式中,通过为m个第一类实体标识和n个第二类实体标识确定出现位置序号,可以基于任一第一类实体标识与任一第二类实体标识在出现位置序号的数值差的绝对值与第二预设数值比较结果,便捷可靠地确定出这个第一类实体标识和这个第二类实体标识是否满足指定组合条件,以便仅对满足条件的实体标识进行组合。

需要指出的是,上述实施方式中,在确定出现位置序号时,采用的是首项为1,公差为1的等差数列,且在确定是否满足指定组合条件时,使用的第二预设数值为2,具体实施时,根据实际情况,也可以在确定出现位置序号时,采用首项和公差为其它数值的等差数列,在确定是否满足指定组合条件时,将第二预设数值设置为3或者其它数值,这都是可行的。

可见,本公开的实施例中,可以根据m个第一类实体标识和n个第二类实体标识在舆情信息中的出现位置排序,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,那么,本公开的实施例可以结合指定组合条件,仅对满足条件的不同类实体标识进行组合,这样能够较为方便快捷地获得所需的组合结果,尽量避免获得所需的组合结果耗费的时间过长。

在图1所示实施例的基础上,p个实体标识集合中包括第一实体标识集合和第二实体标识集合,第一实体标识集合中的每个实体标识均为人物标识,第二实体标识集合中的每个实体标识均为企业标识,预设对象库中的任一对象采用人物标识和企业标识列表的组合数据进行表征;

如图8所示,步骤104,包括:

步骤1041,根据用于表征预设对象库中的各个对象的组合数据,确定预设对象库中的、k个组合结果中的至少一个组合结果中的人物标识和企业标识均命中的对象;

步骤1042,将所确定的对象作为与舆情信息匹配的目标对象。

需要说明的是,本公开的实施例适用于第一实体标识集合对应的实体类型为人物类型,第二实体标识对应的实体类型为企业类型的情况。

假设预设对象库中的每个对象均为商业领域的大咖,则预设对象库中的任一对象可以采用人物标识和企业标识列表的组合数据进行表征,则若人物标识为人物名称,企业标识为企业名称,每个组合数据具体可以呈下面的形式:

本公开的实施例中,在得到k个组合结果之后,可以将k个组合结果分别与用于表征预设对象库中的各个对象的组合数据进行比对。如果针对k个组合结果中的某一组合结果,经过比对,确定出其中的人物标识与某一组合数据中的人物标识相同,且其中的企业标识位于该组合数据中的企业标识列表中,则可以确定该组合结果中的人物标识和企业标识均命中该组合数据所表征的对象,这时,可以将该对象作为与舆情信息匹配的对象。

可见,本公开的实施例中,通过将用于表征预设对象库中的各个对象的组合数据与k个组合结果进行比对,能够非常便捷可靠地确定出预设对象库中与舆情信息匹配的目标对象。

在一个可选示例中,如图9所示,可以预先创建大咖库(相当于上文中的预设对象库),并赋予大咖库中的每个大咖唯一的human_id,human_id可以由人物名称+企业名称列表组成,human_id可以批量/实时导入至大咖库。

在获取舆情信息(例如热门舆情信息)之后,可以获取舆情信息中的人物名称和企业名称(这样可以得到上文中的p个实体标识集合)。具体地,在舆情信息为文章名称为“小鹏汽车何小鹏回应丰田炮轰电动汽车”的文章的情况下,获取的人物名称和企业名称可以包括:广州小鹏汽车科技有限公司、丰田汽车(中国)投资有限公司、何小鹏、丰田章男;在舆情信息为名称为“万达5个海外地产项目清仓,王健林:卖一半资产就能清偿债务”的文章的情况下,获取的人物名称和企业名称可以包括:万达酒店管理(上海)有限公司、大连万达集团股份有限公司、王健林;在舆情信息为文章名称为“小米11取消随机附送充电器:响应科技环保号召”的情况下,获取的人物名称和企业名称可以包括:小米科技有限责任公司、雷军。

假设上段中获取的人物名称为m个,企业名称为n个,则可以通过人物名称和企业名称的组合处理,得到k个组合结果。假设m与n的乘积较大,则可以根据m个人物名称和n个企业名称在舆情信息中的出现位置排序,进行位置关联性判别,例如,若某一人物名称和某一企业名称的出现位置差在2以内(其相当于该人物名称和该企业名称的出现位置序号的数值差的绝对值小于2),则可以确定该人物名称和该企业名称满足指定组合条件,并得到包括该人物名称和该企业名称的组合结果,按照类似的方式,可以得到k个组合结果中的其它组合结果。

在得到k个组合结果之后,可以基于k个组合结果来匹配大咖。具体地,可以将k个组合结果依次与大咖库进行比对,如果k个组合结果中的任一组合结果中的人物名称和企业名称均命中大咖库中的某一大咖,则可以确定舆情信息与该大咖匹配,此时可以将舆情信息推送给监控该大咖的用户或者搜索该大咖的用户;如果舆情信息与大咖库中的所有大咖均不匹配,则可以跳过当前舆情信息,并针对其它舆情信息进行处理。

可见,本公开的实施例能够针对舆情信息进行分析和处理,用户可以通过监控或者搜索的方式快速查看所关注大咖的舆情动态。

本公开的实施例提供的任一种舆情信息处理方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种舆情信息处理方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种舆情信息处理方法。下文不再赘述。

示例性装置

图10是本公开一示例性实施例提供的舆情信息处理装置的结构示意图,图10所示的装置包括第一获取模块1001、第二获取模块1002、第三获取模块1003和确定模块1004。

第一获取模块1001,用于获取舆情信息;

第二获取模块1002,用于从舆情信息中,获取p个实体标识集合;其中,不同实体标识集合对应不同实体类型;

第三获取模块1003,用于根据p个实体标识集合,进行实体标识组合处理,以得到k个组合结果;其中,任一组合结果中包括每个实体标识集合中的一个实体标识;

确定模块1004,用于根据k个组合结果,确定预设对象库中与舆情信息匹配的目标对象。

在一个可选示例中,p个实体标识集合中包括第一实体标识集合和第二实体标识集合,第一实体标识集合中包括m个第一类实体标识,第二实体标识集合中包括n个第二类实体标识;

第三获取模块1003,包括:

第一确定子模块,用于确定m与n的乘积;

第一获取子模块,用于在乘积小于第一预设数值的情况下,针对m个第一类实体标识和n个第二类实体标识,随机进行不同类实体标识的组合处理,以得到k个组合结果;

第二获取子模块,用于在乘积大于或等于第一预设数值的情况下,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

在一个可选示例中,p个实体标识集合中包括第一实体标识集合和第二实体标识集合,第一实体标识集合中包括m个第一类实体标识,第二实体标识集合中包括n个第二类实体标识;

第三获取模块1003,包括:

第三获取子模块,用于获取m个第一类实体标识和n个第二类实体标识在舆情信息中的出现位置排序;

第四获取子模块,用于根据所获取的出现位置排序,从m个第一类实体标识和n个第二类实体标识中,确定满足指定组合条件的不同类实体标识,并按照确定结果进行不同类实体标识的组合处理,以得到k个组合结果。

在一个可选示例中,第四获取子模块,包括:

第一确定单元,用于根据所获取的出现位置排序,为m个第一类实体标识和n个第二类实体标识确定出现位置序号;

第二确定单元,用于在m个第一类实体标识中的任一第一类实体标识与n个第二类实体标识中的任一第二类实体标识的出现位置序号的数值差的绝对值小于第二预设数值的情况下,确定本第一类实体标识和本第二类实体标识满足指定组合条件。

在一个可选示例中,p个实体标识集合中包括第一实体标识集合和第二实体标识集合,第一实体标识集合中的每个实体标识均为人物标识,第二实体标识集合中的每个实体标识均为企业标识,预设对象库中的任一对象采用人物标识和企业标识列表的组合数据进行表征;

确定模块1004,包括:

第二确定子模块,用于根据用于表征预设对象库中的各个对象的组合数据,确定预设对象库中的、k个组合结果中的至少一个组合结果中的人物标识和企业标识均命中的对象;

第三确定子模块,用于将所确定的对象作为与舆情信息匹配的目标对象。

在一个可选示例中,该装置还包括:

推送模块,用于在根据k个组合结果,确定预设对象库中与舆情信息匹配的目标对象之后,向与目标对象关联的用户推送舆情信息;

和/或,

第四获取模块,用于在根据k个组合结果,确定预设对象库中与舆情信息匹配的目标对象之后,获取目标对象的关联关系情况数据。

示例性电子设备

下面,参考图11来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。

图11图示了根据本公开实施例的电子设备1100的框图。

如图11所示,电子设备1100包括一个或多个处理器1101和存储器1102。

处理器1101可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备1100中的其他组件以执行期望的功能。

存储器1102可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1101可以运行所述程序指令,以实现上文所述的本公开的各个实施例的舆情信息处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中,电子设备1100还可以包括:输入装置1103和输出装置1104,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如,在电子设备1100是第一设备或第二设备时,该输入装置1103可以是麦克风或麦克风阵列。在电子设备1100是单机设备时,该输入装置1103可以是通信网络连接器,用于从第一设备和第二设备接收所采集的输入信号。

此外,该输入装置1103还可以包括例如键盘、鼠标等等。

该输出装置1104可以向外部输出各种信息。该输出装置1104可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出装置等等。

当然,为了简化,图11中仅示出了该电子设备1100中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备1100还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的舆情信息处理方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的舆情信息处理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本公开的实施例还可以是计算机程序,其包括计算机可读代码,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的舆情信息处理方法中各步骤的指令。

以上结合具体实施例描述了本公开的基本原理,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。上述公开的具体细节仅是为了示例和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体细节实现。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可按任意方式连接、布置、配置这些器件、装置、设备等。诸如“包括”、“包含”、“具有”等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1