事件预测方法及装置与流程

文档序号:18704443发布日期:2019-09-17 23:27阅读:210来源:国知局
事件预测方法及装置与流程

本发明涉及计算机技术领域,尤其涉及一种事件预测方法及装置。



背景技术:

随着计算机网络技术飞速发展,计算机网络基本成为人们生活中的必不可少的一部分,人们通过网络进行交流、获取自己所需的信息,以及商品交易等。

例如,在电子商务领域,为了提高用户体验,根据的历史行为数据向用户推荐商品。具体的,根据用户对一种商品的检索行为,进行商品特征计算,按照特征和分类计算用户下一阶段对类似商品或另一种商品的需求。例如,用户在某电子商务网站浏览过某个品牌的“空气净化器”这一商品,该网站根据用户这一历史行为数据,向用户推荐其它品牌“空气净化器”或用户所浏览品牌的其他空气净化器产品。但是,对于预测用户下一阶段可能发生的事件或行为,目前尚未提出有效的解决方案。



技术实现要素:

鉴于上述问题,提出了本发明提供了一种事件预测方法及装置,以实现预测用户下一阶段可能发生的事件或行为。

第一方面,本申请提供了一种事件预测方法,包括:

获取当前事件,以及所述当前事件所属领域及事件类型;

获取所述领域对应的事件转移图谱,所述事件转移图谱包括不同事件类型之间的转移规律;

根据所述领域对应的事件转移图谱,确定所述当前事件对应的事件类型能够直接转移到的目标事件类型集合,所述目标事件类型集合包括至少一个目标事件类型。

第二方面,本申请提供了一种事件预测装置,包括:

事件获取单元,用于获取当前事件,以及所述当前事件所属领域及事件类型;

图谱获取单元,用于获取所述领域对应的事件转移图谱,所述事件转移图谱包括不同事件类型之间的转移规律;

预测单元,用于根据所述领域对应的事件转移图谱,确定所述当前事件对应的事件类型能够直接转移到的目标事件类型集合,所述目标事件类型集合包括至少一个目标事件类型。

第三方面,本申请提供了一种存储介质,其上存储有程序,所述程序被处理器执行时实现第一方面所述的事件预测方法。

第四方面,本申请提供了一种处理器,所述处理器用于运行程序,所述程序运行时执行第一方面所述的事件预测方法。

本发明提供的事件预测方法,先获取当前事件,以及该当前事件的领域。然后,获取该领域对应的事件转移图谱,其中,事件转移图谱是不同事件之间的转移规律。最后,从该领域对应的事件转移图谱中查找该当前事件对应的事件类型能够直接转移到的目标事件类型集合。利用该方法能够预测当前事件发生后,下一阶段要发生的事件类型;例如,利用该方法能够有效预测用户下一阶段发生的事件或行为。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本申请实施例一种事件预测方法的流程图;

图2示出了本申请实施例一种事件转移图谱的示意图;

图3示出了本申请实施例另一种事件预测方法的流程图;

图4示出了本申请实施例又一种事件预测方法的流程图;

图5示出了本申请实施例又一种事件预测方法的流程图;

图6示出了本申请实施例一种获得包含转移概率的事件转移图谱过程的流程图;

图7示出了本申请实施例一种事件预测装置的框图;

图8示出了本申请实施例另一种事件预测装置的框图;

图9示出了本申请实施例再一种事件预测装置的框图;

图10示出了本申请实施例又一种事件预测装置的框图。

具体实施方式

在电子商务领域,相关技术能够根据用户的历史行为数据向用户推荐相关商品。例如,用户在某网站中搜索了某种商品,相关方法能够计算出用户搜索的商品对应的分类和特征,进一步根据该商品的分类和特征向用户推荐同类商品或另一种相关商品。无法预测用户围绕同一商品发生的一系列行为或事件。本申请提供的事件预测方法,预先训练得到各类事件对应的事件转移图谱,当获得当前事件后,根据该当前事件所对应的事件转移图谱确定该当前事件发生后最有可能发生的事件。利用该方法实现对用户围绕同一商品发生的一系列行为或事件的预测。

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

请参见图1,示出了本申请实施例一种事件预测方法的流程图,该方法应用于服务器中,用于对某个事件或某个行为发生后下一阶段发生的事件或行为进行预测。如图1所示,该方法可以包括以下步骤:

s110,获取当前事件,以及该当前事件所属的领域及事件类型。

领域可以分为多个层级,例如,一级领域、二级领域、三级领域等,其中,一级领域可以根据不同业务场景划分,例如,电子商务领域、司法领域等。二级领域可以根据业务场景需求划分,例如,在司法领域中的,样本数据是裁判文书,而裁判文书对应的案件种类有多个,例如,刑事、民事和行政。因此,可以根据案件种类划分二级领域;同一案件种类的裁判文书又包括很多类案由,因此,二级领域下可以划分多个三级领域,例如,可以根据案由划分三级领域,即,一个案由就是一个三级领域。

不同业务场景中,当前事件需要从不同的业务数据中提取获得,例如,在司法领域,可以从裁判文书中提取事件。在电子商务领域中,可以从用户的行为数据中提取,例如,从用户基于互联网的浏览数据中,提取浏览事件。

可以预先根据样本数据训练事件提取模型,然后,利用事件提取模型从相应的数据中提取事件,在利用事件提取模型提取事件的同时可以获得该事件的事件类型。事件类型根据事件所述包含的事件内容划分,属于同一事件类型的事件具有相同的事件内容。例如,事件类型包括成立公司、注册商标、转让商标等。

s120,获取当前事件的领域对应的事件转移图谱。

事件转移图谱是一个描述事件之间顺承、因果关系的事理演化逻辑有向图。图中节点表示抽象、泛化的事件,有向边表示事件之间顺承、因果关系。在本申请的一个优选实施例中,事件转移图谱还可以包括事件类型之间直接转移的转移概率,该转移概率可以标注在有向边上。

事件转移图谱可以应用于多个领域中,例如电子商务领域、司法领域或人们的日常生活等领域。不同领域对应的事件转移图谱不同。

其中,对于包含多个层级的领域,多个事件对应的最末级的领域相同才认为这些事件属于同一领域。例如,如果两个事件都是侵害商标权纠纷领域的事件,则这两个事件属于同一领域。

事件转移图谱可以根据大量包含不同事件的数据统计得到。例如,在司法领域中,根据属于同一领域的大量不同的样本数据,从中寻找得到不同事件之间的转移关系,以及转移概率,最终得到该领域对应的事件转移图谱。

如图2所示,示出了本申请实施例一种事件转移图谱的示意图,图2中的每一个节点代表一个事件类型,有向边代表不同事件类型之间的顺承、因果关系。有向边上还标注有事件类型之间直接转移的转移概率。

该图中包括事件类型1、事件类型2、事件类型3和事件类型4,其中,事件类型1->事件类型2的转移概率是20%;事件类型1->事件类型3的转移概率是75%;事件类型2->事件类型3的转移概率是25%;事件类型2->事件类型4的转移概率是75%;事件类型3->事件类型4的转移概率是15%。

s130,根据当前事件所属领域对应的事件转移图谱,确定该当前事件所对应的事件类型能够直接转移到的目标事件类型集合。

目标事件类型集合包括至少一个目标事件类型。从当前事件所属领域对应的事件概率图谱中查找到该当前事件对应的事件类型;接着,查找出该事件类型下一步直接转移到哪些事件类型,能够直接转移到的事件类型均作为目标事件类型集合中的元素。或者,从这些事件类型中选取部分事件类型作为目标事件类型。

本实施例提供的事件预测方法,先获取当前事件,以及该当前事件的领域。然后,获取该领域对应的事件转移图谱,其中,事件转移图谱是不同事件类型之间的转移规律。最后,从该领域对应的事件转移图谱中查找当前事件对应的事件类型直接转移到的目标事件类型集合。利用该方法能够预测当前事件发生后,下一阶段要发生的事件类型。

请参见图3,示出了本申请实施例另一种事件预测方法的流程图,该方法在预测当前事件发生后可能发生的事件之后,进一步可以根据预测出的事件向用户推送与预测出的事件相关的信息。如图3所示,该方法在图1所示实施例的基础上还包括以下步骤:

s210,获取与目标事件类型相匹配的待推送信息。

例如,当前事件是在电商平台浏览奶粉,而且,预测出目标事件类型是查看奶粉,则与该目标事件类型相匹配的待推送信息可以包括奶粉产品,以及,与奶粉相关的其它婴儿用品等。又如,预测的目标事件类型是注册商标,则与该目标事件类型相匹配的待推送信息可以是注册商标代理机构等。

s220,推送该待推送信息。

将上一步骤获得的待推送信息发送至客户端,以便客户端向用户展示该待推送信息。

本实施例提供的事件预测方法,在预测出当前事件下一步可能发生的目标事件类型之后,根据该目标事件类型获取相对应的待推送信息并推送给用户,以使用户利用该待推送信息做出相应的行为。

请参见图4,示出了本申请实施例又一种事件预测方法的流程图,本实施例将着重介绍事件提取模型的训练过程。如图4所示,该方法在图1所示实施例的基础上还可以包括:

s310,获取第一样本数据集合。

其中,第一样本数据集合中所有样本均属于同一领域。对于包含多个层级的领域,多个事件对应的最末级的领域相同才认为这些事件属于同一领域。例如,如果两个事件都是侵害商标权纠纷领域的事件,则这两个事件属于同一领域。

第一样本数据集合由多个第一样本数据组成,一条第一样本数据能够提取至少一个事件。不同领域对应的样本不同,例如,在司法领域中,第一样本是裁判文书,一篇裁判文书就是一个样本数据,一篇裁判文书中通常包括原告和被告在不同时间发生的多个事件。在电子商务领域中,用户在一段时间内在某个网站上的浏览数据或购买信息就是一个样本。

以司法领域的裁判文书为例进行说明,获得案由是侵害商标权纠纷的裁判文书后,对裁判文书所涉及事件的事件类型及事件要素进行标记;其中,事件要素主要包括事件发生时间,事件主体,事件所涉及的人、事、物等信息。这些标记后的信息,以及样本中被标记的原文内容本身作为该第二样本数据所涉及事件的事件信息。

其中,事件类型可以根据事件所包含的事件内容划分,属于同一事件类型的事件具有相同事件内容,例如,事件类型是成立公司,则该事件类型所包含的事件都包括成立/创建公司的事件内容。

标记的事件类型经过标准化处理,例如,将事件内容实质一致,但事件描述不一致的事件统一定义为同一类事件。其中,可以以机器容易识别的动宾语法结构定义每一类事件,同时,保留不同事件特有的类型数据,例如,成立公司、注册商标、转让商标等。

s320,根据第一样本数据集合中全部样本数据所包含的事件信息训练得到事件提取模型。

根据第一样本数据中标注的语句特征与事件或行为之间的对应关系,进行机器学习训练,得到事件提取模型。

训练事件提取模型的过程,即,对于任意一个类型的事件,通过机器训练得到该事件对应的事件特征。利用该事件提取模型的过程就是利用事件特征从样本数据中提取相应的事件。

例如,可以利用神经网络训练得到事件提取模型,第一样本数据集合作为神经网络的输入数据,经过训练后,在神经网络的输出获得事件提取模型。

当然,在本申请的其它实施例中,可以利用其它机器学习方法训练得到事件提取模型,此处不再一一举例说明。

其中,s310~s320是根据第一样本数据训练得到事件提取模型的过程,对于同一领域,该过程只需训练一次。得到事件提取模型后,直接利用该事件提取模型从事件数据中提取事件,以及该事件的事件类型。例如,侵害商标权纠纷这一领域的事件包括成立公司、注册商标、认定著名商标、使用商标(未经授权)等多个事件类型。

然后,可以直接利用s310~s320获得的与当前事件数据所属领域对应的事件提取模型,从当前事件数据中获取当前事件。

本实施例提供的事件预测方法,利用属于同一领域的第一样本数据训练得到事件提取模型,然后,可以直接利用该事件提取模型从事件数据中提取事件,提高了事件提取的效率。

请参见图5,示出了本申请实施例又一种事件预测方法的流程图,本实施例将着重介绍获得事件转移图谱的过程,如图5所示,该方法在图1所示实施例的基础上还包括:

s410,获取同一领域的第二样本数据集合。

该第二样本数据集合中的每一条样本数据均属于同一领域;且每一条第二样本数据至少包括至少一个事件。

s420,利用事件提取模型,提取第二样本数据集合中每一条第二样本数据所包含的事件。

例如,第二样本数据集合是同一领域的多篇裁判文书,利用事件提取模型从每一篇裁判文书中提取所包含的事件。

例如,某一侵犯商标权的裁判文书中,涉及到的事件可能包括:成立公司、注册商标、认定著名商标、使用商标(未经授权)。

在本申请的一个优选实施例中,从每一条第二样本数据中提取得到事件之后,还可以继续提取该事件对应的事件要素。例如,事件要素可以包括事件主体、事件发生时间、事件发生地点等。不同领域对应的事件主体可能不同,例如,在电子商务领域中,事件主体是某个网站的用户;而在司法领域中,裁判文书中的事件主体包括原告和被告。

s430,对于每一条第二样本数据所包含的事件,按照事件发生时间的先后顺序进行排序,得到每一条第二样本数据对应的事件序列。

在样本数据是裁判文书的应用场景中,对于每一篇裁判文书,将从该裁判文书中提取的所有事件按照时间先后顺序进行排序,得到该裁判文书对应的事件转移关系。

在某些领域,一条第二样本数据通常包括不同事件主体的事件,如果不区分事件主体,仅按事件发生时间进行排布得到一个事件序列,可能导致事件序列中的事件转化逻辑有误。因此,获得每一条第二样本数据对应的事件序列的过程可以包括:

将第二样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。

例如,从一篇裁判文书中提取出的不同事件之后,如果一条样本数据涉及到多个事件主体,则可以从同一条样本数据所包含的所有事件按照事件主体分类,并针对不同的事件主体分别按照事件发生时间由先到后的顺序,得到各个事件主体对应的事件序列。

s440,根据每一条第二样本数据所对应的事件序列,得到不同事件类型之间的事件转移图谱。

在本申请的一个实施例中,根据第二样本数据集合中每一条样本数据所对应的事件序列,构建不同事件类型之间的拓扑图,得到事件转移图谱。

事件序列中每一个节点代表一个具体的事件,而事件转移图谱中的每一节点代表一个事件类型;在利用事件序列构建事件转移图谱时,需要将事件序列中的事件映射到对应的事件类型,再根据事件序列中该事件的事件转化关系构建不同的事件类型,最终得到事件转移图谱。

在本申请的另一个实施例中,获得各个事件主体对应的事件序列后,利用事件序列得到事件转移图谱的过程可以包括:

针对任一事件主体,利用第二样本数据集合中涉及的该事件主体对应的事件序列构建得到该事件主体对应的事件转移图谱;遍历第二样本数据集合中涉及的所有事件主体,得到第二样本数据集合涉及的全部事件转移图谱。

在本申请的一个优选实施例中,事件转移图谱还可以包括事件类型之间直接转移的转移概率信息。

在本申请一种可能的实现方式中,如图6所示,获得包含事件类型之间的转移概率信息的事件转移图谱的过程可以包括以下步骤:

s441,利用全部第二样本数据对应的事件序列,构建不同事件类型之间的拓扑图。

s442,统计全部第二样本数据涉及的各种事件类型之间直接转移的转移概率。

在本申请的一个实施例中,s442可以包括以下步骤:

1),统计第二样本数据集合中从当前事件类型直接转移到各个相邻事件类型的转移概率。

当前事件类型是第二样本数据集合中涉及的任意一种事件类型。本实施例中的相邻事件类型是与当前事件类型之间具有直接转移关系的事件类型。

2),遍历第二样本数据集合中的所有事件类型,得到第二样本数据集合所涉及的所有事件类型之间直接转移的转移概率。

例如,当前事件类型为a,则统计从a出发直接转移到各种相邻事件类型的转移概率,以该方式遍历第二样本数据集合中的全部事件类型,得到全部事件类型之间直接转移的转移概率。

在本申请另一种可能的实现方式中,s442可以包括以下步骤:

11),统计第二样本数据集合中从各个相邻事件类型直接转移到当前事件类型的转移概率。

12),遍历第二样本数据集合中的所有事件类型,得到第二样本数据集合所涉及的所有事件类型之间直接转移的转移概率。

例如,当前事件类型为b,则统计从各种相邻事件类型直接转移到b的转移概率,以该方式遍历第二样本数据集合中的全部事件类型,得到全部事件类型之间直接转移的转移概率。

本申请实施例中,计算两个事件之间转移概率的过程可以包括以下方式:

一种:利用第二样本数据集合中从当前事件类型直接转移到某相邻事件类型的有向组合的数量与当前事件类型总数的比值,计算得到当前事件直接转移到某相邻事件类型的转移概率。其中,转移概率可以是该比值对应的百分数、分数或小数。

例如,两个不同的事件类型e1和e2,e1直接转移到e2的转移概率计算公式如公式1所示:

p(e1,e2)=n(e1->e2)/n(e1)(公式1)

公式1中,p(e1,e2)为e1直接转移到e2的转移概率,n(e1->e2)为在全部第二样本数据中e1直接转移到e2这种有向组合的次数,n(e1)为第二样本数据集合中e1这种事件类型的总数。

在本申请的一个实施例中,该当前事件类型的总数n(e1)可以是第二样本数据集合中从当前事件类型出发转移到相邻事件类型的所有有向组合的数量;

在本申请的另一个实施例中,该当前事件类型的数量可以是第二样本数据集合中所有包含该当前事件类型的第二样本数据的数量。

这两种方式都能得到当前事件类型的总数,保证同一事件转移图谱中当前事件类型的总数的计算标准相同即可。

另一种:直接将从当前事件类型直接转移到相邻事件类型的次数作为转移概率。

这两种方式均能计算得到转移概率,保证同一事件转移图谱中计算转移概率的标准相同即可。

s443,根据该转移概率及对应的拓扑图获得事件转移图谱。

在本申请的一个实施例中,在拓扑图中每构建一个事件类型,统计该事件类型相关的转移概率;即,统计从当前事件类型相关的转移概率的过程与构建事件转移图谱的过程可以交叉进行。

在本申请的另一个实施例中,构建拓扑图与统计转移概率的过程分别独立进行,例如,先构建完成拓扑图,然后,再计算拓扑图中各个事件类型之间的直接转移概率。

在获得各个领域对应的事件转移图谱,当需要预测当前事件发生后的下一个事件时,可以直接利用该当前事件所属领域对应的事件转移图谱预测该当前事件能够直接转移的目标事件类型。

在本申请的一个优选实施例中,该事件转移图谱包括不同事件类型之间的转移概率,此种应用场景下,预测该当前事件的下一事件类型时,可以参考由该当前事件对应的事件类型直接转移到各个相邻事件类型的有向组合的转移概率,最终确定出目标事件类型。

在本申请一种可能的实现方式中,可以按照从该当前事件对应的事件类型直接转移到各个相邻事件类型的有向组合的转移概率由大到小的顺序,选择前预设数量个相邻事件类型作为目标事件类型。该预设数量可以根据实际需求确定。

在本申请另一种可能的实现方式中,从事件转移图谱中查找从该当前事件对应的事件类型直接转移到各个相邻事件类型的转移概率,然后,将转移概率大于预设值的事件类型作为目标事件类型。

例如,图2所示的事件转移图谱中,事件类型2的下一事件类型包括事件类型3和事件类型4,其中,事件类型2->事件类型3的转移概率是25%,事件类型2->事件类型4的转移概率是75%;由此可见,如果当前事件的事件类型是事件类型2,则在事件类型2下一步最可能发生的是事件类型4。

本实施例提供的事件预测方法,利用事件提取模型从第二样本数据集合中提取相应的事件。对于第二样本数据集合中每一条样本数据所包含的事件,按照时间先后顺序进行排序,得到事件序列。根据第二样本数据集合中每一条第二样本数据所对应的事件序列得到不同事件类型之间的事件转移图谱。然后利用该事件转移图谱查找到当前事件对应的事件类型,并确定当前事件的下一步最可能的事件类型。从而,有效预测用户下一阶段发生的事件或行为。

相应于上述的事件预测方法实施例,本申请还提供了事件预测装置实施例。

请参见图7,示出了本申请实施例一种事件预测装置的框图,该装置可以应用于服务器中,用于对某个事件或某个行为发生后下一阶段发生的事件或行为进行预测。如图7所示,该装置可以包括:事件获取单元110、图谱获取单元120和预测单元130。

事件获取单元110,用于获取当前事件,以及该当前事件所属领域及事件类型。

可以预先根据样本数据训练事件提取模型,然后,利用事件提取模型从相应的数据中提取事件,在利用事件提取模型提取事件的同时可以获得该事件的事件类型。事件类型根据事件所述包含的事件内容划分,属于同一事件类型的事件具有相同的事件内容。例如,事件类型包括成立公司、注册商标、转让商标等。

图谱获取单元120,用于获取领域对应的事件转移图谱。

事件转移图谱是一个描述事件之间顺承、因果关系的事理演化逻辑有向图。图中节点表示抽象、泛化的事件,有向边表示事件之间顺承、因果关系。

事件转移图谱可以根据大量包含不同事件的数据统计得到。例如,在司法领域中,根据属于同一领域的大量不同的样本数据,从中寻找得到不同事件之间的转移关系,以及转移概率,最终得到该领域对应的事件转移图谱。

预测单元130,用于根据领域对应的事件转移图谱,确定当前事件对应的事件类型能够直接转移到的目标事件类型集合。

目标事件类型集合包括至少一个目标事件类型。从当前事件所属领域对应的事件概率图谱中查找到该当前事件对应的事件类型;接着,查找出该事件类型下一步直接转移到哪些事件类型,能够直接转移到的事件类型均作为目标事件类型集合中的元素。或者,从这些事件类型中选取部分事件类型作为目标事件类型。

本实施例提供的事件预测装置,先获取当前事件,以及该当前事件的领域。然后,获取该领域对应的事件转移图谱,其中,事件转移图谱是不同事件类型之间的转移规律。最后,从该领域对应的事件转移图谱中查找当前事件对应的事件类型直接转移到的目标事件类型集合。利用该装置能够预测当前事件发生后,下一阶段要发生的事件类型。

请参见图8,示出了本申请实施例另一种事件预测装置的框图,该装置在图7所示实施例的基础上还不可以包括:

要素获取单元210,用于获取目标事件类型对应的事件要素。

事件要素可以是该事件所涉及的人或物等,例如,该事件是购买母婴用品,则该事件的事件要素是母婴用品。又如,该事件是认定驰名商标,则该事件的事件要素可以是驰名商标,或具体的商标名称。

信息获取单元220,用于获取与事件要素相匹配的待推送信息。

获得目标事件类型的事件要素之后,获取与该事件要素相对应的待推送信息。

例如,事件要素是“母婴用品”,则获取母婴用品类的商品信息作为待推送信息。又如,事件要素是驰名商标,则对应的待推送信息可以是驰名商标相关的裁判文书。

推送单元230,用于推送待推送信息。

将上一步骤获得的待推送信息发送至客户端,以便客户端向用户展示该待推送信息。

本实施例提供的事件预测装置,在预测出当前事件下一步可能发生的目标事件类型之后,根据该目标事件类型获取相对应的待推送信息并推送给用户,以使用户利用该待推送信息做出相应的行为。

请参见图9,示出了本申请实施例再一种事件预测装置的框图,该装置可以在图7所示实施例的基础上还包括:

第一样本获取单元310,用于获取属于同一领域的第一样本数据集合。

所述第一样本数据集合中的每一条第一样本数据均包含至少一个事件的事件信息。

训练单元320,用于根据第一样本数据集合所包含的事件信息训练得到事件提取模型。

根据第一样本数据训练得到事件提取模型的过程,对于同一领域,该过程只需训练一次。得到事件提取模型后,直接利用与当前事件数据所属领域对应的事件提取模型从当前事件数据中提取当前事件,以及该事件的事件类型。例如,侵害商标权纠纷这一领域的事件包括成立公司、注册商标、认定著名商标、使用商标(未经授权)等多个事件类型。

本实施例提供的事件预测方法,利用属于同一领域的第一样本数据训练得到事件提取模型,然后,可以直接利用该事件提取模型从事件数据中提取事件,提高了事件提取的效率。

请参见图10,示出了本申请实施例又一种事件预测装置的框图,本实施例将着重介绍获得事件转移图谱的过程,如图10所示,该装置在图7所示的基础上还可以包括:

第二样本获取单元410,用于获取属于同一领域的第二样本数据集合。

第二样本数据集合中的每一条第二样本数据包括至少一个事件。

提取单元420,用于分别提取每一条第二样本数据所包含的事件。

例如,第二样本数据集合是同一领域的多篇裁判文书,利用事件提取模型从每一篇裁判文书中提取所包含的事件。

在本申请的一个优选实施例中,从每一条第二样本数据中提取得到事件之后,还可以继续提取该事件对应的事件要素。例如,事件要素可以包括事件主体、事件发生时间、事件发生地点等。不同领域对应的事件主体可能不同,例如,在电子商务领域中,事件主体是某个网站的用户;而在司法领域中,裁判文书中的事件主体包括原告和被告。

事件排序单元430,用于将每一条第二样本数据所包含的事件按照事件发生时间的先后顺序排序,得到每一条第二样本数据对应的事件序列。

优选地,在同一样本数据包含不同事件主体的事件的应用场景下,将第二样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。

图谱生成单元440,用于根据每一条第二样本数据对应的所述事件序列,得到不同事件类型之间的事件转移图谱。

在本申请的一个实施例中,根据第二样本数据集合中每一条样本数据所对应的事件序列,构建不同事件类型之间的拓扑图,得到事件转移图谱。

在本申请的一个优选实施例中,事件转移图谱还可以包括事件类型之间直接转移的转移概率信息。

本实施例提供的事件预测装置,利用事件提取模型从第二样本数据集合中提取相应的事件。对于第二样本数据集合中每一条样本数据所包含的事件,按照时间先后顺序进行排序,得到事件序列。根据第二样本数据集合中每一条第二样本数据所对应的事件序列得到不同事件类型之间的事件转移图谱。然后利用该事件转移图谱查找到当前事件对应的事件类型,并确定当前事件的下一步最可能的事件类型。从而,有效预测用户下一阶段发生的事件或行为。

所述事件预测装置包括处理器和存储器,上述事件获取单元、图谱获取单元、预测单元、要素获取单元、信息获取单元、推送单元、第一样本获取单元、训练单元、第二样本获取单元、提取单元、事件排序单元和图谱生成单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现自动预测当前事件发生后下一步可能会发生的事件类型。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。

本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述事件预测方法。

本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述事件预测方法。

本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:

获取当前事件,以及所述当前事件所属领域及事件类型;

获取所述领域对应的事件转移图谱,所述事件转移图谱包括不同事件类型之间的转移规律;

根据所述领域对应的事件转移图谱,确定所述当前事件对应的事件类型能够直接转移到的目标事件类型集合,所述目标事件类型集合包括至少一个目标事件类型。

在本申请一种可能的实现方式中,还包括:

获取所述目标事件类型对应的事件要素;

获取与所述事件要素相匹配的待推送信息;

推送所述待推送信息。

在本申请一种可能的实现方式中,还包括:

获取属于同一领域的第一样本数据集合,所述第一样本数据集合中的每一条第一样本数据均包含至少一个事件的事件信息;

根据第一样本数据集合所包含的事件信息训练得到所述事件提取模型;

所述获取当前事件,包括:

获取当前事件数据;

利用所述当前事件所属领域对应的所述事件提取模型,从所述当前事件数据中提取所述当前事件。

在本申请一种可能的实现方式中,还包括:

获取属于同一领域的第二样本数据集合,所述第二样本数据集合中的每一条第二样本数据包括至少一个事件;

分别提取所述每一条第二样本数据所包含的事件,并将所述每一条第二样本数据所包含的事件按照事件发生时间的先后顺序排序,得到所述每一条第二样本数据对应的事件序列;

根据所述每一条第二样本数据对应的所述事件序列,得到不同事件类型之间的事件转移图谱。

在本申请一种可能的实现方式中,所述事件转移图谱还包括不同的事件类型之间直接转移的转移概率;

所述根据所述每一条第二样本数据对应的所述事件序列,得到不同事件类型之间的事件转移图谱,包括:

根据所述每一条第二样本数据对应所述事件序列,构建不同事件类型之间的拓扑图,并统计所述全部第二样本数据涉及的各种事件类型之间直接转移的转移概率;

根据所述各个事件类型之间的转移概率及对应的拓扑图,得到所述事件转移图谱。

在本申请一种可能的实现方式中,所述统计全部第二样本数据涉及的各种事件类型之间直接转移的转移概率,包括:

对于所述全部第二样本数据涉及的每种事件类型,执行以下操作:

分别统计从所述事件类型直接转移到所述事件类型的各种相邻事件类型的次数;

利用所述事件类型直接转移到所述各种相邻事件类型的次数,分别计算所述事件类型直接转移到所述各种相邻事件类型的转移概率。

在本申请一种可能的实现方式中,所述统计全部第二样本数据涉及的各种事件类型之间直接转移的转移概率,包括:

对于所述全部第二样本数据涉及的每种事件类型,执行以下操作:

分别统计从所述事件类型的各种相邻事件类型直接转移到所述事件类型的次数;

利用从所述各种相邻事件类型直接转移到所述事件类型的次数,分别计算从所述各种相邻事件类型直接转移到所述事件类型的转移概率。

在本申请一种可能的实现方式中,所述根据所述领域对应的事件转移图谱,确定在所述当前事件对应的事件类型下一步发生的目标事件类型集合,包括:

根据所述当前事件所属领域对应的事件转移图谱,查找所述当前事件对应的事件类型直接转移到的待选事件类型集合,所述待选事件类型集合包括至少一个待选事件类型;

按照所述当前事件的事件类型直接转移到所述待选事件类型的转移概率由大到小的顺序,选取前预设数量个所述待选事件类型,得到目标事件类型集合。

本文中的设备可以是服务器、pc、pad、手机等。

本申请实施例提供的设备,先获取当前事件,以及该当前事件的领域。然后,获取该领域对应的事件转移图谱,其中,事件转移图谱是不同事件类型之间的转移规律。最后,从该领域对应的事件转移图谱中查找当前事件对应的事件类型直接转移到的目标事件类型集合。利用该设备能够预测当前事件发生后,下一阶段要发生的事件类型。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:

获取当前事件,以及所述当前事件所属领域及事件类型;

获取所述领域对应的事件转移图谱,所述事件转移图谱包括不同事件类型之间的转移规律;

根据所述领域对应的事件转移图谱,确定所述当前事件对应的事件类型能够直接转移到的目标事件类型集合,所述目标事件类型集合包括至少一个目标事件类型。

在本申请一种可能的实现方式中,还包括:

获取所述目标事件类型对应的事件要素;

获取与所述事件要素相匹配的待推送信息;

推送所述待推送信息。

在本申请一种可能的实现方式中,还包括:

获取属于同一领域的第一样本数据集合,所述第一样本数据集合中的每一条第一样本数据均包含至少一个事件的事件信息;

根据第一样本数据集合所包含的事件信息训练得到所述事件提取模型;

所述获取当前事件,包括:

获取当前事件数据;

利用所述当前事件所属领域对应的所述事件提取模型,从所述当前事件数据中提取所述当前事件。

在本申请一种可能的实现方式中,还包括:

获取属于同一领域的第二样本数据集合,所述第二样本数据集合中的每一条第二样本数据包括至少一个事件;

分别提取所述每一条第二样本数据所包含的事件,并将所述每一条第二样本数据所包含的事件按照事件发生时间的先后顺序排序,得到所述每一条第二样本数据对应的事件序列;

根据所述每一条第二样本数据对应的所述事件序列,得到不同事件类型之间的事件转移图谱。

在本申请一种可能的实现方式中,所述事件转移图谱还包括不同的事件类型之间直接转移的转移概率;

所述根据所述每一条第二样本数据对应的所述事件序列,得到不同事件类型之间的事件转移图谱,包括:

根据所述每一条第二样本数据对应所述事件序列,构建不同事件类型之间的拓扑图,并统计所述全部第二样本数据涉及的各种事件类型之间直接转移的转移概率;

根据所述各个事件类型之间的转移概率及对应的拓扑图,得到所述事件转移图谱。

在本申请一种可能的实现方式中,所述统计全部第二样本数据涉及的各种事件类型之间直接转移的转移概率,包括:

对于所述全部第二样本数据涉及的每种事件类型,执行以下操作:

分别统计从所述事件类型直接转移到所述事件类型的各种相邻事件类型的次数;

利用所述事件类型直接转移到所述各种相邻事件类型的次数,分别计算所述事件类型直接转移到所述各种相邻事件类型的转移概率。

在本申请一种可能的实现方式中,所述统计全部第二样本数据涉及的各种事件类型之间直接转移的转移概率,包括:

对于所述全部第二样本数据涉及的每种事件类型,执行以下操作:

分别统计从所述事件类型的各种相邻事件类型直接转移到所述事件类型的次数;

利用从所述各种相邻事件类型直接转移到所述事件类型的次数,分别计算从所述各种相邻事件类型直接转移到所述事件类型的转移概率。

在本申请一种可能的实现方式中,所述根据所述领域对应的事件转移图谱,确定在所述当前事件对应的事件类型下一步发生的目标事件类型集合,包括:

根据所述当前事件所属领域对应的事件转移图谱,查找所述当前事件对应的事件类型直接转移到的待选事件类型集合,所述待选事件类型集合包括至少一个待选事件类型;

按照所述当前事件的事件类型直接转移到所述待选事件类型的转移概率由大到小的顺序,选取前预设数量个所述待选事件类型,得到目标事件类型集合。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1