基于元知识的突发事件预警方法、装置和电子装置与流程

文档序号:28114888发布日期:2021-12-22 14:31阅读:87来源:国知局
基于元知识的突发事件预警方法、装置和电子装置与流程

1.本技术涉及计算机领域,尤其涉及一种基于元知识的突发事件预警方法、装置和电子装置。


背景技术:

2.随着社交网络的飞速发展直接导致传统纸质传媒产生深刻变革,极大提升了人们获取、关注、参与社会事件的效率与激情。于是,更多的人借助新媒体制造、分发海量信息,促进信息多元化,便于人们筛选自己需要的信息,在这种多元化的信息模式下,信息会被快速传播,因此极易出现某些信息的不可控传播,其中,此类不可控事件被定义为网络突发事件,这类网络突发事件可能会应发连锁反应事件产生,为避免网络突发事件产生的连锁反映事件,对此类事件进行及时的预警作为一项日益重要的研究目标开始被广泛关注。
3.现有的事件预警的方法在事件突发性判断上仍停留在事件的词典匹配、基于信息聚类的检测及关键词关联分析等方式上,这些方式要么依赖样本数据的数据规模并且很难对大量的数据进行标注,要么依赖人工经验,并没有挖掘到突发事件的本质原因,进而造成事件预警的效果较差,无法对突发事件进行准确预警。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本技术提供了一种基于元知识的突发事件预警方法、装置和电子装置,以至少解决相关技术中事件预警的效率较低的技术问题。
6.根据本技术实施例的一个方面,提供了一种基于元知识的突发事件预警方法,包括:获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件。
7.可选地,根据目标关键词确定第一事件的元知识包括:使用词向量生成模型生成目标关键词的词向量;根据目标关键词的词向量生成词向量集,其中,词向量集中的词向量是按照目标顺序存储的,目标顺序是根据目标关键词在文本数据中的位置信息确定的;使用预训练的事件特征生成模型和词向量集生成第一事件的第一事件向量,其中,事件特征生成模型是使用训练样本集对初始事件生成模型进行训练得到的,训练样本集包括正样本和负样本,负样本是对正样本进行修改得到的;根据第一事件的第一事件向量与预设事件集合中存储的多个预设事件的多个第二事件向量之间的关系确定第一事件的元知识。
8.可选地,根据第一事件的第一事件向量与预设事件集合中存储的多个预设事件的
多个第二事件向量之间的关系确定第一事件的元知识包括:根据第一事件向量和第二事件向量确定第一事件与多个预设事件的空间关系;基于空间关系对第一事件和多个预设事件进行事件聚类,得到包含第一事件的目标事件类簇,目标事件类簇中存储了第一事件以及在第一事件的预设邻域范围内的预设事件;将目标事件类簇中的事件向量的平均值确定为第一事件的元知识。
9.可选地,根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度包括:获取第一事件在第一时间段内的多个预设时刻的热度值,以及每个预设时刻第一事件的第三事件向量,其中,第一时间段包含多个预设时刻;使用第一权重信息和第二权重信息对每个预设时刻第一事件的第三事件向量进行赋权求和计算,得到第一事件在第一时间段内的第四事件向量,其中,第一权重信息是使用权重信息生成模型根据历史权重信息生成的,第二权重信息是根据第三事件向量和第一事件的元知识的相似度确定的;使用预设向量生成模型根据第四事件向量和第一时间段内的时序热度生成第二时间段的目标热度。
10.可选地,根据元知识和目标热度确定在第二时间段第二事件的发生概率包括:使用事件类型预测模型根据元知识预测第一事件在第一时间段事件类型为目标类型的初始概率值;使用第一公式对初始概率值和目标热度进行计算,得到在第二时间段第二事件的发生概率。
11.可选地,根据元知识和目标热度确定在第二时间段第二事件的发生概率之后,方法还包括:检测第二事件的发生概率值是否满足预设条件;在第二事件的发生概率值满足预设条件的情况下,生成目标通知消息;将目标通知消息发送至预设终端设备。
12.根据本技术实施例的另一方面,还提供了一种基于元知识的突发事件预警装置,包括:获取模块,用于获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;第一确定模块,用于根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;第二确定模块,用于根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;第三确定模块,用于根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件。
13.可选地,第一确定模块包括:第一生成单元,用于使用词向量生成模型生成目标关键词的词向量;第二生成单元,用于根据目标关键词的词向量生成词向量集,其中,词向量集中的词向量是按照目标顺序存储的,目标顺序是根据目标关键词在文本数据中的位置信息确定的;第三生成单元,用于使用预训练的事件特征生成模型和词向量集生成第一事件的第一事件向量;确定单元,用于根据第一事件的第一事件向量与预设事件集合中存储的多个预设事件的多个第二事件向量之间的关系确定第一事件的元知识。
14.根据本技术实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
15.根据本技术实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方
法。
16.在本技术实施例中,采用获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件的方式,通过获取用来描述第一事件的目标文本数据中的目标关键词,获取到的目标关键词是用来描述第一事件的特征信息的关键词,根据目标关键词就可确定出用于指示第一事件的事件特征的元信息,从而得到了第一事件的本质特征,根据第一事件的元信息以及第一事件在第一时间段内的时序热度就可以预测出该事件在第一时间段之后的第二时间段内的热度信息,进而可根据该事件在第二时间段的热度信息和该事件的元信息确定出在第二时间段第一事件引发预警事件的概率,达到了描述描述第一事件的文本数据中的关键词和第一事件在第一时间段内的时序热度准确预测第一事件在第二时间段引发预警事件概率的目的,从而实现了提高事件预警的效率的技术效果,进而解决了事件预警的效率较低的技术问题。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
18.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
19.图1是根据本技术实施例的事件概率的确定方法的硬件环境的示意图;
20.图2是根据本技术实施例的一种可选的基于元知识的突发事件预警方法的流程图;
21.图3是根据本技术实施例的一种可选的热度预测示意图;
22.图4是根据本技术实施例的一种可选的突发事件预警流程图;
23.图5是根据本技术实施例的一种可选的基于元知识的突发事件预警装置的示意图;以及
24.图6是根据本技术实施例的一种终端的结构框图。
具体实施方式
25.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
26.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
27.根据本技术实施例的一方面,提供了一种基于元知识的突发事件预警的方法实施例。
28.可选地,在本实施例中,上述基于元知识的突发事件预警方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如数据查询服务、数据计算服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于pc、手机、平板电脑等。本技术实施例的基于元知识的突发事件预警方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本技术实施例的基于元知识的突发事件预警装置方法也可以是由安装在其上的客户端来执行。
29.图2是根据本技术实施例的一种可选的基于元知识的突发事件预警方法的流程图,如图2所示,该方法可以包括以下步骤:
30.步骤s202,获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;
31.步骤s204,根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;
32.步骤s206,根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;
33.步骤s208,根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件。
34.通过上述步骤s202至步骤s208,通过获取用来描述第一事件的目标文本数据中的目标关键词,获取到的目标关键词是用来描述第一事件的特征信息的关键词,根据目标关键词就可确定出用于指示第一事件的事件特征的元信息,从而得到了第一事件的本质特征,根据第一事件的元信息以及第一事件在第一时间段内的时序热度就可以预测出该事件在第一时间段之后的第二时间段内的热度信息,进而可根据该事件在第二时间段的热度信息和该事件的元信息确定出在第二时间段第一事件引发预警事件的概率,达到了描述描述第一事件的文本数据中的关键词和第一事件在第一时间段内的时序热度准确预测第一事件在第二时间段引发预警事件概率的目的,从而实现了提高事件预警的效率的技术效果,进而解决了事件预警的效率较低的技术问题。
35.在步骤s202提供的技术方案中,目标文本数据可以是目标帐号输入的,还可以是根据对某一事件的监测实时生成的。
36.可选地,在本实施例中,目标文本数据可以是在第一时间段内随着目标事件的发
展存在变化,比如:目标文本数据某一公司的发展状况中,最开始张三创建了一个公司,公司名为第一公司,此时目标文本数据为“张三创建了第一公司”,过了一段时间后李四收购了张三公司,并改名为第二公司,此时更新后的文本数据为“李四收购第一公司,并改名为第二公司”。
37.可选地,在本实施例中,第一时间段内可以但不限于包括多个预设的子时间段或者多个时间点,时序热度是每个子时间段或者事件点的热度。
38.可选地,在本实施例中,时序热度可以但不限于是使用检测工具对相关内容进行实时监测得到的,比如对检测某网站相关内容的浏览量、点记率、转发量、检测目标事件在社交软件上的话题出现率等等,本方案对此不作限定。
39.可选地,在本实施例中,第一时间段的长度可以根据需求灵活设置,比如可以将第一时间段长度设置为1分钟、5分钟、1天、1周等等。
40.可选地,在本实施例中,目标关键词的数量可以是一个或多个,目标关键词可以但不限于包括时间触发词相关的关键词、事件类型的关键词、事件参与者的关键词、参与者的角色的关键词等等,本方案对此不作限定。
41.在步骤s204提供的技术方案中,元知识可以是对目标关键词进行相关计算得到的,还可以是根据目标关键词和已有事件进行比较得到的,元知识用于描述目标事件发生的本质原因。
42.在步骤s206提供的技术方案中,第二时间段的长度可以根据需求设置,比如第二时间段的长度可以但不限于设置为1秒、2秒、1分钟、5分钟等等,本方案对此不作限定。
43.可选地,在本实施例中,第二时间段的目标热度的确定方法可以但不限于包括使用预训练的热度生成模型根据元知识和第一时间段内的时序热度生成的,还可以是使用公式对元知识和时序热度进行计算得到的。
44.在步骤s208提供的技术方案中,确定第二时间段第二事件发生概率的方式可以但不限于包括使用与训练的模型根据元知识和目标热度生成的,还可以是使用预设公式对元知识和目标热度进行计算得到的,本方案对此不作限定。
45.可选地,在本实施例中,第二事件是由第一事件引发的在第二时间段的预警时间,比如:当第一事件为张三于今年6月、7月多次向公益组织捐款且数额巨大,则第二事件为未来某一时间段大部分人关注“张三捐款且数额巨大”这件事。
46.作为一种可选的实施例,根据目标关键词确定第一事件的元知识包括:
47.s11,使用词向量生成模型生成目标关键词的词向量;
48.s12,根据目标关键词的词向量生成词向量集,其中,词向量集中的词向量是按照目标顺序存储的,目标顺序是根据目标关键词在文本数据中的位置信息确定的;
49.s13,使用预训练的事件特征生成模型和词向量集生成第一事件的第一事件向量,其中,事件特征生成模型是使用训练样本集对初始事件生成模型进行训练得到的,训练样本集包括正样本和负样本,负样本是对正样本进行修改得到的;
50.s14,根据第一事件的第一事件向量与预设事件集合中存储的多个预设事件的多个第二事件向量之间的关系确定第一事件的元知识。
51.可选地,在本实施例中,词向量生成模型是使用日常新闻中的新闻语料进行词向量生成训练得到的。
52.可选地,在本实施例中,词语在目标文本信息中的不同位置所起到的作用是不同的(比如:“张三抓住李四”这句话中,“张三”是主语,是发起动作的对象,“李四”是宾语,是动作的接受对象,“抓住”是张三触发的动作),根据目标关键词在目标文本数据中的位置确定目标关键词的存储顺序,从而得到词向量集。
53.可选地,在本实施例中,事件特征生成模型是使用训练样本集对初始事件特征生成模型进行训练得到的,训练样本集中包括正样本和负样本,正样本可以是预设的事件向量和对应的关键词的词向量已知的事件,负样本可以是对正样本的任意关键词进行随机调整和替换得到的。
54.通过以上步骤,文本数据用于描述第一事件,获取文本数据中的目标关键词的词向量,并将词向量根据对应的目标关键词在文本中的位置进行排序存储得到词向量集,从而使得事件向量生成模型根据词向量集生成的第一事件向量更加准确,并通过第一事件与预设事件集合中的存储的预设事件的事件向量之间的关系进而确定出了第一事件的元知识,从而实现确定出的第一事件的元信息更加准确可靠。
55.作为一种可选的实施例,根据第一事件的第一事件向量与预设事件集合中存储的多个预设事件的多个第二事件向量之间的关系确定第一事件的元知识包括:
56.s21,根据第一事件向量和第二事件向量确定第一事件与多个预设事件的空间关系;
57.s22,基于空间关系对第一事件和多个预设事件进行事件聚类,得到包含第一事件的目标事件类簇,目标事件类簇中存储了第一事件以及在第一事件的预设邻域范围内的预设事件;
58.s23,将目标事件类簇中的事件向量的平均值确定为第一事件的元知识。
59.可选地,在本实施例中,事件向量是多维的,不同维度的向量进而确定出了事件在空间中的位置,进而可确定出第一事件和预设事件在空间中的位置关系。
60.可选地,在本实施例中,邻域可以根据使用需求随机设置。
61.可选地,在本实施例中,聚类可以从未访问过的任意数据点开始,改点的邻域以距离划分,如果领域中有足够数量的点,则聚类过程开始,且该店成为新聚类中的第一个点,否则该点将被标记为噪声;对于新聚类中的第一点,其邻域内的点会成为同一聚类的一部分,该过程使在领域内的所有点都属于同一聚类,并在所有刚刚添加到聚类组的新点重复进行上述操作,从而是空间中的所有的点都有聚类组。
62.通过以上步骤,通过根据第一事件和预设事件的事件向量在空间中的位置关系确定第一事件的目标事件类簇,目标事件类簇内存储的都是在第一事件邻域范围内的预设事件,进而可以认为目标事件类簇内的点都是与第一事件的本质特征最相似的事件,进而确定出第一事件的元知识,使得到的元知识更加贴近第一事件的本质特征。
63.作为一种可选的实施例,根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度包括:
64.s31,获取第一事件在第一时间段内的多个预设时刻的热度值,以及每个预设时刻第一事件的第三事件向量,其中,第一时间段包含多个预设时刻;
65.s32,使用第一权重信息和第二权重信息对每个预设时刻第一事件的第三事件向量进行赋权求和计算,得到第一事件在第一时间段内的第四事件向量,其中,第一权重信息
是使用权重信息生成模型根据历史权重信息生成的,第二权重信息是根据第三事件向量和第一事件的元知识的相似度确定的;
66.s33,使用预设向量生成模型根据第四事件向量和第一时间段内的时序热度生成第二时间段的目标热度。
67.可选地,在本实施例中,预设时刻是根据需求预先设置的,比如可以设置没5秒、10秒、20秒等为一个预设时刻。
68.可选地,在本实施例中,第一权重信息可以是根据传统注意力机制下生成的,第一权重信息还可以是对历史权重信息进行计算生成的。
69.可选地,在本实施例中,在进行赋权求和计算前可以对第一权重信息和第二权重信息进行归一化处理,使得第一权重信息和第二权重信息在同一维度下,提高计算结果的可靠度。
70.图3是根据本技术实施例的一种可选的热度预测示意图,如图3所示:x0、x1
……
xi分别是第一时间段内各时段的热度值,h0、h1
……
hi分别为第一时间段内各时刻第一事件的事件特征,随着时间的变化,事件也在不断地变化,因此事件的向量值是不断变化的,α
i_s
是传统注意力机制下确定的第一权重值,α
i_m
是根据各时刻的事件特征和第一事件的元知识相似度确定的第二权重值,hi为根据第一权重信息和第二权重信息分别对0至i时间段内各时刻的事件特征和热度值进行赋权并求和计算得到的特征值加权值和热度加权值,进而并使用预设向量生成模型生成i+1时刻该事件的目标热度。
71.作为一种可选的实施例,根据元知识和目标热度确定在第二时间段第二事件的发生概率包括:
72.s41,使用事件类型预测模型根据元知识预测第一事件在第一时间段事件类型为目标类型的初始概率值;
73.s42,使用第一公式对初始概率值和目标热度进行计算,得到在第二时间段第二事件的发生概率。
74.可选地,在本实施例中,事件类型预测模型可以是多层神经网络的二分类模型,该事件预测模型可以是使用样本集对初始事件类型预测模型进行训练得到的,样本集中包括正样本和负样本,正样本和负样本均是标记了标签的样本,正样本可以是元知识和事件类型已知的突发事件,负样本是日常新闻中的非突发事件的元知识和对应的事件类型。
75.可选地,在本实施例中,第一公式可以但不限于是
[0076][0077]
为第二时间段第二事件的发生概率,p
emergency
是第一事件在第一时间段事件类型为目标类型的初始概率值,p
hot
为目标热度,α和β为预设权重值。
[0078]
作为一种可选的实施例,根据元知识和目标热度确定在第二时间段第二事件的发生概率之后,方法还包括:
[0079]
s51,检测目标概率值是否满足预设条件;
[0080]
s52,在目标概率值满足预设条件的情况下,生成目标通知消息;
[0081]
s53,将目标通知消息发送至预设终端设备。
[0082]
可选地,在本实施例中,预设条件可以是目标概率值在目标区间范围内,或者是目标概率值满足某一设定阈值,本方案对此不作限定。
[0083]
图4是根据本技术实施例的一种可选的突发事件预警流程图,如图4所示:
[0084]
s401,作为由文字符号组合而成的半结构化信息(描述事件的文本数据),事件需要化为可计算的数值表征。通过在大量的新闻语料中进行词向量训练,本方案可以将事件类型、事件触发词等事件信息转化为词向量进行词表征。那么,一个事件e
i
便可通过拼接事件要素对应的关键词进行表征,并将事件要素对应的关键词的词向量按照预定顺序进行排列存储,预定顺序为根据事件要素在文本数据中的位置确定的,即[w
type
:w
trigger
:w
subject
:w
object
],其中,w
type
为事件类型对应的关键词的词向量,w
trigger
为事件触发词的词向量,w
subject
为主体信息对应的关键词特征值,w
object
为客体信息对应的关键词的特征值,事件类型、触发词均只有一个,如客体、主体等信息不止一个则取所有客体、主体信息表征的均值。
[0085]
s402,由于突发事件较少且标注困难,因此可供训练分析的数据较少。于是,本方案设计一套自监督任务对事件表征进行预训练提升模型输入(即事件表征)的质量。其中,事件要素分类指将不同的事件要素按照(事件类型、事件触发词、事件论元、论元类型)四类进行分类;事件真实性检测指通过随机替换事件触发词、主客体、事件类别等信息生成虚假事件作为负例,与真实突发事件组成样本集进行二分类判断;事件热度预测指基于事件要素与热度进行匹配度检测;事件要素检测是指基于原始事件文本及常见的序列标注模型进行抽取训练。
[0086]
s403,为抽取事件突发元知识,需要在已标注的突发事件中发现事件的突发本质原因。本发明将事件表征的语义距离定义为突发原因的相似性,那么事件突发的本质原因便转化为对事件类簇的发现。在本发明中,聚类可从未访问过的任意数据点开始,该点的邻域以距离ε划分。如果该邻域中有足够数量的点,则聚类过程开始,且该点成为新聚类中的第一个点。否则,该点将被标记为噪声。在上述两种情况下,该点都被标记为“访问”。对于新聚类中的第一个点,其ε距离内的点会成为同一聚类的一部分。该过程使在ε邻近的所有点都属于同一个聚类,并在所有刚刚添加到聚类组的新点重复进行上述操作。前两步的过程将重复,直到聚类中的所有点都被确定,则在聚类附近的所有点都被访问和标记。当所有点的聚类被完成,就会检索并处理一个新的未访问点,并导致新的聚类或噪声的发现。通过不断重复该过程,所有的点会被标记为访问,则完成聚类。
[0087]
s404,在步骤s403获得事件表征的n个类簇,通过将每个类簇中的所有事件表征取均值便可得到该类簇的元事件表征(即该事件突发的本质原因,元知识)。
[0088]
s405,抽取突发事件的元知识后,便可进行事件突发性的检测。本发明将后续输入的半结构化事件与训练集中的事件样本进行相同的初始化与预训练。之后,通过引入一个多层神经网络作为二分类模型,其中的正例来源为标注的突发事件及上文中抽取到的元知识、负例来源为海量新闻文本中的非突发事件。由于是二分的情况,该模型最后需要预测的结果只有两种情况,对于每个类别本发明的预测得到的概率为p
emergency
和p1‑
emergency

[0089]
s406,除去事件突发性的检测,事件在未来的热度同样是预警与否的一个重要评判指标。其中,事件的热度指该事件要素在不同时间段内的在全部事件中所占份额。通过将不同时间段事件的热度组成时间序列,事件未来时刻热度预测便转化为一个经典的时间序
列预测问题。由于事件热度的发展与事件要素及相互关系存在联系,本发明设计将事件突发的元知识作为注意力的模型实现,本发明按照热度的时间段划分获取已知时间段内该事件的要素,并生成相应的事件表征x
i
,并将0

i时间段的时间序列编码后生成h
i
(事件在0至i时间段内的特征值)和hot
i
(事件在0至i时间段内的热度),通过将h
i
及热度hot
i
作为该时间段的输入,本发明设计相应的时序解码器实现该i+1时间段的热度预测。
[0090]
s407,在完成事件的突发性检测及未来时刻预测后,便可以直接进行突发事件的预警,使用第一公式对事件为突发事件的概率和i+1时间段的热度预测值进行计算得到该事件在i+1时间段是否会触发预警时间的概率,该第一公式为
[0091][0092]
p
emergency
为该事件为突发事件的概率值,p
hot
为该事件在i+1时间段的热度预测值,α和β为事件突发性检测和热度预测值的预设权重值。
[0093]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0094]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例的方法。
[0095]
根据本技术实施例的另一个方面,还提供了一种用于实施上述基于元知识的突发事件预警方法的基于元知识的突发事件预警装置。图5是根据本技术实施例的一种可选的基于元知识的突发事件预警装置的示意图,如图5所示,该装置可以包括:
[0096]
获取模块52,用于获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;
[0097]
第一确定模块54,用于根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;
[0098]
第二确定模块56,用于根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;
[0099]
第三确定模块58,用于根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件。
[0100]
需要说明的是,该实施例中的获取模块52可以用于执行本技术实施例中的步骤s202,该实施例中的第一确定模块54可以用于执行本技术实施例中的步骤s204,该实施例中的第二确定模块56可以用于执行本技术实施例中的步骤s206,该实施例中的第三确定模
块58可以用于执行本技术实施例中的步骤s208。
[0101]
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
[0102]
通过上述模块,可以解决了事件预警的效率较低的技术问题,进而达到提高事件预警的效率的技术效果。
[0103]
可选地,第一确定模块包括:第一生成单元,用于使用词向量生成模型生成目标关键词的词向量;第二生成单元,用于根据目标关键词的词向量生成词向量集,其中,词向量集中的词向量是按照目标顺序存储的,目标顺序是根据目标关键词在文本数据中的位置信息确定的;第三生成单元,用于使用预训练的事件特征生成模型和词向量集生成第一事件的第一事件向量,其中,事件特征生成模型是使用训练样本集对初始事件生成模型进行训练得到的,训练样本集包括正样本和负样本,负样本是对正样本进行修改得到的;确定单元,用于根据第一事件的第一事件向量与预设事件集合中存储的多个预设事件的多个第二事件向量之间的关系确定第一事件的元知识。
[0104]
可选地,确定单元用于:根据第一事件向量和第二事件向量确定第一事件与多个预设事件的空间关系;基于空间关系对第一事件和多个预设事件进行事件聚类,得到包含第一事件的目标事件类簇,目标事件类簇中存储了第一事件以及在第一事件的预设邻域范围内的预设事件;将目标事件类簇中的事件向量的平均值确定为第一事件的元知识。
[0105]
可选地,第二确定模块包括:获取单元,用于获取第一事件在第一时间段内的多个预设时刻的热度值,以及每个预设时刻第一事件的第三事件向量,其中,第一时间段包含多个预设时刻;第一计算单元,用于使用第一权重信息和第二权重信息对每个预设时刻第一事件的第三事件向量进行赋权求和计算,得到第一事件在第一时间段内的第四事件向量,其中,第一权重信息是使用权重信息生成模型根据历史权重信息生成的,第二权重信息是根据第三事件向量和第一事件的元知识的相似度确定的;第四生成单元,使用预设向量生成模型根据第四事件向量和第一时间段内的时序热度生成第二时间段的目标热度。
[0106]
可选地,第三确定模块包括:预测单元,拥有使用事件类型预测模型根据元知识预测第一事件在第一时间段事件类型为目标类型的初始概率值;第二计算单元,用于使用第一公式对初始概率值和目标热度进行计算,得到在第二时间段第二事件的发生概率。
[0107]
可选地,装置还包括:检测模块,用于根据元知识和目标热度确定在第二时间段第二事件的发生概率之后,检测第二事件的发生概率值是否满足预设条件;生成模块,用于在第二事件的发生概率值满足预设条件的情况下,生成目标通知消息;发送模块,用于将目标通知消息发送至预设终端设备。
[0108]
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
[0109]
根据本技术实施例的另一个方面,还提供了一种用于实施上述基于元知识的突发事件预警方法的服务器或终端。
[0110]
图6是根据本技术实施例的一种终端的结构框图,如图6所示,该终端可以包括:一
个或多个(图中仅示出一个)处理器601、存储器603、以及传输装置605,如图6所示,该终端还可以包括输入输出设备607。
[0111]
其中,存储器603可用于存储软件程序以及模块,如本技术实施例中的基于元知识的突发事件预警方法和装置对应的程序指令/模块,处理器601通过运行存储在存储器603内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的基于元知识的突发事件预警方法。存储器603可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器603可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0112]
上述的传输装置605用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置605包括一个网络适配器(network interface controller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置605为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0113]
其中,具体地,存储器603用于存储应用程序。
[0114]
处理器601可以通过传输装置605调用存储器603存储的应用程序,以执行下述步骤:获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件采用本技术实施例,提供了一种基于元知识的突发事件预警方法、装置和电子装置的方案。通过获取用来描述第一事件的目标文本数据中的目标关键词,获取到的目标关键词是用来描述第一事件的特征信息的关键词,根据目标关键词就可确定出用于指示第一事件的事件特征的元信息,从而得到了第一事件的本质特征,根据第一事件的元信息以及第一事件在第一时间段内的时序热度就可以预测出该事件在第一时间段之后的第二时间段内的热度信息,进而可根据该事件在第二时间段的热度信息和该事件的元信息确定出在第二时间段第一事件引发预警事件的概率,达到了描述描述第一事件的文本数据中的关键词和第一事件在第一时间段内的时序热度准确预测第一事件在第二时间段引发预警事件概率的目的,从而实现了提高事件预警的效率的技术效果,进而解决了事件预警的效率较低的技术问题。
[0115]
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
[0116]
本领域普通技术人员可以理解,图6所示的结构仅为示意,终端可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图6其并不对上述电子装置的结构造成限定。例如,终端还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
[0117]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read

only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
[0118]
本技术的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行基于元知识的突发事件预警方法的程序代码。
[0119]
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
[0120]
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取目标文本数据中的目标关键词,以及第一事件在第一时间段内的时序热度,其中,目标文本数据为描述第一事件的文本数据,目标关键词为目标文本数据中用于描述第一事件的特征信息的关键词;根据目标关键词确定第一事件的元知识,其中,元知识用于指示第一事件的目标事件特征;根据元知识以及第一时间段内的时序热度确定第一事件在第二时间段内的目标热度,其中,第一时间段的终止时间早于第二时间段的起始时间;根据元知识和目标热度确定在第二时间段第二事件的发生概率,其中,第二事件是由第一事件引发的待预警事件。
[0121]
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
[0122]
可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0123]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0124]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例方法的全部或部分步骤。
[0125]
在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0126]
在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0127]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0128]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0129]
以上仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1