事件相似度的确定方法及装置与流程

文档序号:19117278发布日期:2019-11-13 01:18阅读:489来源:国知局
事件相似度的确定方法及装置与流程

本发明涉及事件处理领域,具体而言,涉及一种事件相似度的确定方法及装置。



背景技术:

在公安领域,每天都有无数的行为事件发生,如何去深度分析事件之间的关联性,有助于提升公安人员对串、并案的判别效率,也有助于参考历史关联事件对当前事件做出准确判断。计算两个样本之间的关联系数,可以确定两个事件的相关性。传统的方法是计算两个样本之间的距离,距离越近,则关联系数越高。计算距离的方法有欧氏距离、余弦距离、杰卡德相似系数、马氏距离等。

但是这些距离的计算方式都是建立在所有属性(或变量)等权重的基础上,即认为所有属性的重要性相同。而实际业务中,每个属性的重要性不同,即使是同一个属性,不同的取值(或变量值),其重要性也不同。因此在计算距离之前,必须对每个属性值进行权重调整。传统业务中,经常人为判断属性的重要程度,并给予权重,但该方法主观性强,不同专家的判断不同,而且在属性数量多的时候,需要消耗大量时间。

现有技术中,针对上述问题没有有效的技术方案。



技术实现要素:

本发明实施例提供了一种事件相似度的确定方法及装置,以至少解决相关技术中,在对两事件之间的相关性确定的过程中,无法简单、有效的获取两事件之间的相关性系数的权重,以及导致判断两事件相关性的准确性低的问题。

根据本发明的一个实施例,提供了一种事件相似度的确定方法,包括:分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,所述m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;根据所述第一事件的n个属性中的离散属性和所述第二事件的m个属性中的离散属性确定第一参数,其中,所述第一参数表示所述第一事件和所述第二事件之间的离散属性的相关性;根据所述第一事件的n个属性中的连续属性和所述第二事件的m个属性中的连续属性确定第二参数,其中,所述第二参数表示所述第一事件和所述第二事件之间的连续属性的相关性;根据所述第一参数和所述第二参数确定所述第一事件和所述第二事件之间的关联系数;在所述关联系数大于预定阈值的情况下,确定所述第一事件和所述第二事件为相似事件。

进一步地,根据所述第一事件的n个属性中的离散属性和所述第二事件的m个属性中的离散属性确定所述第一参数包括:获取所述第一事件和所述第二事件之间所有离散属性对应的第三参数,以及所述第一事件和所述第二事件之间所有离散属性对应的第四参数,其中,所述第三参数用于表示所述第一事件和所述第二事件之间所有离散属性的关联关系,所述第四参数用于表示所述第一事件和和所述二事件之间所有离散属性的权重系数;根据所述第三参数与所述第四参数的乘积确定所述第一参数。

进一步地,获取所述第一事件和所述第二事件之间所有离散属性对应的所述第三参数包括:在所述第一事件的离散属性值和所述第二事件的离散属性值相同的情况下,所述第三参数取值为1;在所述第一事件的离散属性值和所述第二事件的离散属性值不相同的情况下,所述第三参数取值为0。

进一步地,获取所述第一事件和所述第二事件之间所有离散属性对应的所述第四参数包括:在所述第一事件中的离散属性和所述第二事件的离散属性的属性值相同的情况下,获取所述相同的离散属性在样本事件库中的概率;对所述概率进行负对数运算,取值作为所述第四参数;在所述第一事件中的离散属性和所述第二事件的离散属性的属性值不相同,或者所述离散属性仅在所述第一事件中出现的情况下,所述四参数取值为零。

进一步地,根据所述第一事件的n个属性中的连续属性和所述第二事件的m个属性中的连续属性确定所述第二参数包括:获取所述第一事件和所述第二事件之间所有连续属性对应的第五参数,以及所述第一事件和所述第二事件之间所有连续属性对应的第六参数,其中,所述第五参数用于表示所述第一事件和所述第二事件之间所有连续属性的关联关系,所述第六参数用于表示所述第一事件和和所述二事件之间所有连续属性的权重系数;根据所述第五参数与所述第六参数的乘积确定所述第二参数。

进一步地,获取所述第一事件和所述第二事件之间所有连续属性对应的所述第五参数包括:通过如下公式确定每个连续属性的第五参数:

其中,xmax、xmin分别为样本事件库中的所述连续属性的属性值的最大值与最小值,x1表示所述第一事件中的连续属性c的属性值,x2表示所述第二事件中的连续属性c的属性值。

进一步地,获取所述第一事件和所述第二事件之间所有连续属性对应的所述第六参数包括:通过如下公式确定每个连续属性的第六参数:

wc=-ln(f(x2)-f(x1))

其中,f(x2)为所述连续属性c的属性值x2在样本事件库中的累计密度分布函数,f(x1)为所述连续属性c的属性值x1在所述样本事件库中的累计密度分布函数。

根据本发明的另一个实施例,提供了一种事件相似度计算装置,包括:获取单元,用于分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,所述m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;第一确定单元,用于根据所述第一事件的n个属性中的离散属性和所述第二事件的m个属性中的离散属性确定第一参数,其中,所述第一参数表示所述第一事件和所述第二事件之间的离散属性的相关性;第二确定单元,用于根据所述第一事件的n个属性中的连续属性和所述第二事件的m个属性中的连续属性确定第二参数,其中,所述第二参数表示所述第一事件和所述第二事件之间的连续属性的相关性;第三确定单元,用于根据所述第一参数和所述第二参数确定所述第一事件和所述第二事件之间的关联系数;第四确定单元,用于在所述关联系数大于预定阈值的情况下,确定所述第一事件和所述第二事件为相似事件。

根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明,分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性;根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性;根据第一参数和第二参数确定第一事件和第二事件之间的关联系数;在关联系数大于预定阈值的情况下,确定第一事件和第二事件为相似事件,进而可以解决相关技术中,在对两事件之间的相关性确定的过程中,无法简单、有效的获取两事件之间的相关性系数的权重,以及导致判断两事件相关性的准确性低的问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种事件相似度的确定方法的移动终端的硬件结构框图;

图2是根据本发明实施例的事件相似度的确定方法的流程图;

图3是根据本发明优先实施例的自适应计算事件之间关联系数的系统模块示意图;

图4是根据本发明实施例的事件相似度的确定装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的事件相似度的确定方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种事件相似度的确定方法的移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的事件相似度的确定方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于上述移动终端或网络架构的事件相似度的确定方法,图2是根据本发明实施例的事件相似度的确定的流程图,如图2所示,该事件相似度的确定方法流程包括如下步骤:

步骤s202,分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数。

其中,一个事件的属性可以包括离散属性n个,连续性属性m个。例如,公安领域的事件,一个事件可以包括:案发时间、案件人物、案件类型。案件类型属于事件的离散属性,案发时间属于事件的连续性属性。

步骤s204,根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性。

需要说明的是,根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数可以包括:获取第一事件和第二事件之间所有离散属性对应的第三参数,以及第一事件和第二事件之间所有离散属性对应的第四参数,其中,第三参数用于表示第一事件和第二事件之间所有离散属性的关联关系,第四参数用于表示第一事件和和二事件之间所有离散属性的权重系数;根据第三参数与第四参数的乘积确定第一参数。

其中,获取第一事件和第二事件之间所有离散属性对应的第三参数可以包括:在第一事件的离散属性值和第二事件的离散属性值相同的情况下,第三参数取值为1;在第一事件的离散属性值和第二事件的离散属性值不相同的情况下,第三参数取值为0。

例如,当两个事件都存在3个离散属性参数,其中存在两个离散属性相同,则取值为1;剩余的离散属性不同,取值为0,进而事件的离散属性对应的第三参数为一个行向量,即(1,1,0)。

还需说明的是,获取第一事件和第二事件之间所有离散属性对应的第四参数可以包括:在第一事件中的离散属性和第二事件的离散属性的属性值相同的情况下,获取相同的离散属性在样本事件库中的概率;对概率进行负对数运算,取值作为第四参数;在第一事件中的离散属性和第二事件的离散属性的属性值不相同,或者离散属性仅在第一事件中出现的情况下,四参数取值为零。

例如,当两个事件都存在3个离散属性参数,其中存在两个离散属性相同,在样本事件库中的概率取值为0.6、0.3;剩余的离散属性不同,取值为0,进而两个事件的连离散性对应的第四参数(权重参数)为一个行向量,即(0.6,0.3,0)。

步骤s206,根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性。

需要说明的是,根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数可以包括:获取第一事件和第二事件之间所有连续属性对应的第五参数,以及第一事件和第二事件之间所有连续属性对应的第六参数,其中,第五参数用于表示第一事件和第二事件之间所有连续属性的关联关系,第六参数用于表示第一事件和和二事件之间所有连续属性的权重系数;根据第五参数与第六参数的乘积确定第二参数。

其中,获取第一事件和第二事件之间所有连续属性对应的第五参数可以包括:通过如下公式确定每个连续属性的第五参数:

其中,xmax、xmin分别为样本事件库中的连续属性的属性值的最大值与最小值,x1表示第一事件中的连续属性c的属性值,x2表示第二事件中的连续属性c的属性值。

还需要说明的是,获取第一事件和第二事件之间所有连续属性对应的第六参数可以包括:通过如下公式确定每个连续属性的第六参数:

wc=-ln(f(x2)-f(x1))

其中,f(x2)为连续属性c的属性值x2在样本事件库中的累计密度分布函数,f(x1)为连续属性c的属性值x1在样本事件库中的累计密度分布函数。

步骤s208,根据第一参数和第二参数确定第一事件和第二事件之间的关联系数。

需要说明的是,将确定的第一参数与第二参数相加可以确定第一事件和第二事件之间的关联系数。

步骤s210,在关联系数大于预定阈值的情况下,确定第一事件和第二事件为相似事件。

其中,在确定第一事件和第二事件为相似事件之后,上述方法还可以包括:计算事件库中所有事件与第一事件的相似度;获取所有事件中的与第一事件相似度大于预定阈值的事件;显示所有事件中的与第一事件相似度大于预定阈值的事件。进而可以方便用户查询与第一事件相关的事件。

通过上述步骤,分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性;根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性;根据第一参数和第二参数确定第一事件和第二事件之间的关联系数;在关联系数大于预定阈值的情况下,确定第一事件和第二事件为相似事件。解决了现有技术中,通常采用人工操作确定两事件的相关关系的参数,进而确定两事件的相关性,浪费大量的人力;同时,因为人为因素会导致确定事件的相关性的准确度不高的问题。

可选地,上述步骤的执行主体可以为服务器、终端等,但不限于此。

可选地,步骤s204和步骤s206的执行顺序是可以互换的,即可以先执行步骤s204,然后再执行s206。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

基于上述实施例,在本优先实施例中还提供了一种自适应权重的结构化事件相似度计算方法。

事件数据是记录主体行为的数据,对于公安领域来说,记录每个人日常的出行、住宿、上网等数据。一般来说,事件包含事件主体、发生时间、事件名称三个必须属性要素,以及其他依赖于事件名称的可选属性。例如对于火车事件,可选属性包括出发地点、到达地点、车次等,而住宿事件,可选属性包括酒店名称、离店时间等。上述意味着不同事件的属性结构之间会有差异。本优选实施例对属性结构相同的事件提出自适应权重的关联系数计算方法。具体介绍如下:

1、关联系数的计算方法(相当于确定第一事件和第二事件之间的关联系数)

假设事件有n个属性,其中离散属性和连续属性数量分别为nc、nd。则两个事件的关联系数为r,并且r=rc+rd。

对于离散属性,rd=wd·xd。首先构建属性的关联度向量xd(相当于第三参数),对于两个事件的任何一个离散属性,若属性值相同,则该属性的关联度为1,如果不同,则关联度为0,向量的维度与字段的个数相同。其次,计算权重向量wd(相当于第四参数)。对于两个事件的任何一个属性,若属性值相同,则权重为-lnp(p为该属性值在所有样本中出现的概率,若概率为0.01,则权重为-ln0.01=4.6),如果不同或出现缺失值,则权重为0。即对于每个离散属性d,权重公式如下(1)所示:

其中,p为该属性值在属性d中出现的频率。

对于连续属性,rc=wc·xc。首先,构建属性的关联度向量xd(相当于第五参数),对于两个事件的任何一个连续属性,关联度计算公式(2)如下:

其中,xmax、xmin分别为样本事件库中的最大值与最小值,目的是去除异常值影响。

其次,计算权重向量wc。对于两个事件的任何一个属性,计算公式(3)如下:

wc=-ln(f(x2)-f(x1))(3)

其中,f(x)为属性c的累计密度分布函数,即权重等于x1~x2之间(包括x1,x2)的样本累计密度的负对数。

2、属性相关性对关联系数的影响

在离散字段中,考虑以下案例:

案例一:两个属性a,b相互独立,其中a属性取值为0、1(各占50%),b属性取值为0、1(各占50%)。而c属性=2*a+b,取值为0~3(各占25%)。

此时认为c属性理应与a、b给出的信息量之和相同。按照上述离散字段关联系数计算,当a和b两个样本的c属性相同时,关联系数为-ln0.25,与a、b属性均相同的关联系数(-ln0.5-ln0.5)相同。该结果与实际情况一致。

案例二:当两个属性a,b完全相关时,其中a属性取值为0,1(各占50%),b属性=a。而c属性=2*a+b,取值为0,3(各占50%)。

此时认为c属性理应与a或b给出的信息量相同。按照上述离散字段关联系数计算,当a和b两个样本的c属性相同时,关联系数为-ln0.5,与a、b属性均相同的关联系数(-ln0.5-ln0.5)相同。该结果与实际情况不一致。

综上,离散属性字段中,关联系数的计算应该充分考虑属性之间的相关性,该情况在连续属性中也成立。因此,在对关联系数计算前,必须去除属性之间的相关性。

去除相关性有两种备选方法:1、计算字段之间的相关系数矩阵,过滤相关系数0.6以上的属性(仅保留一个),该种方法相对简单,牺牲部分准确率以估算关联系数。2、将wi=-lnp中的概率p调整为基于已知第1至第i个属性的条件概率,如在案例二中,a=0的权重为-ln0.5,而b与a完全相关,p(b=0|a=0)=1,因此权重为-ln1=0。该种方法可精确计算关联系数,但属性数量较多或属性值出现概率极小情况下,条件概率不稳定或无法计算。

3、属性的相关性计算

属性相关性计算分为三种情况:1)两个连续性属性的相关性;2)两个离散性属性的相关性;3)连续性与离散性属性的相关性。

两个连续性属性的相关性可以采用pearson相关系数计算,若两个属性的相关性大于0.6,则仅保留一个。

由于离散属性的取值数量变化罗大,如100万样本中姓名的取值可以达到数十万种,而性别仅有两种。因此,直接将离散属性转化成哑变量,计算复杂而且结果不可靠。为解决该问题,采用信息增益率代替相关系数,如公式(4)所示。同样,如果两个属性相关性大于0.6,则仅保留一个。

其中,e(a)、e(b)表示属性a、b的信息熵,e(a|b)表示加入b分类的属性a的信息熵。

计算连续性与离散性的相关性,首先将连续性转化为离散属性,再采用离散属性的计算方法,计算相关系数,方法同计算离散性相同。

如图3所示,自适应计算事件之间关联系数的系统模块示意图,其中,系统功能包括三大模块:质量管理模块、预处理模块和计算模块。具体详细如下。

质量管理模块,用于主要负责对数据质量进行检测,功能包括对缺失值进行填补或删除,对异常值进行修正或删除。

预处理模块,用于完成自增id的检测,连续型属性的数据降维(目的是去除相关性的干扰),以及特征标准化(统一量纲)。

计算模块,用于负责完成两个事件关联度的向量计算,离散属性相关性系数计算以及系数降维处理,每个属性的权重计算,以及两个事件的整体关联度计算(相当于实施例1中的方法)。

需要说明的是,计算模块可以用于计算如下内容:

第一步:关联度向量x计算。对于两个事件的任何一个离散属性,若属性值相同,则该属性的关联度为1,如果不同,则关联度为0。对于连续属性,则按照背景技术中公式(1)进行计算,向量的维度与字段的个数相同。

第二步:离散属性之间的相关性计算。对相关系数大于等于0.6的离散属性做降维处理,多个维度仅保留一个。

第三步:权重向量w的计算。离散属性按照公式(2)所述进行计算,而连续属性按照公式(3)所述方法进行计算。

第四步:关联度r计算。r=rc+rd=wc·xc+wd·xd。即关联度为离散属性关联度与连续属性关联度之和。

实施例3

在本实施例中还提供了一种事件相似度的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本发明实施例的事件相似度的确定装置的结构框图,如图4所示,该事件相似度的确定装置包括:获取单元41、第一确定单元43、第二确定单元45、第三确定单元47以及第四确定单元49。

获取单元41,用于分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,所述m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数。

第一确定单元43,用于根据所述第一事件的n个属性中的离散属性和所述第二事件的m个属性中的离散属性确定第一参数,其中,所述第一参数表示所述第一事件和所述第二事件之间的离散属性的相关性。

第二确定单元45,用于根据所述第一事件的n个属性中的连续属性和所述第二事件的m个属性中的连续属性确定第二参数,其中,所述第二参数表示所述第一事件和所述第二事件之间的连续属性的相关性.

第三确定单元47,用于根据所述第一参数和所述第二参数确定所述第一事件和所述第二事件之间的关联系数。

第四确定单元49,用于在所述关联系数大于预定阈值的情况下,确定所述第一事件和所述第二事件为相似事件。

通过上述装置,获取单元41分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;第一确定单元43根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性;第二确定单元45根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性;第三确定单元47根据第一参数和第二参数确定第一事件和第二事件之间的关联系数;第四确定单元49在关联系数大于预定阈值的情况下,确定第一事件和第二事件为相似事件。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例4

本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;

s2,根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性;

s3,根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性;

s4,根据第一参数和第二参数确定第一事件和第二事件之间的关联系数。

可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:

s1,分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;

s2,根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性;

s3,根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性;

s4,根据第一参数和第二参数确定第一事件和第二事件之间的关联系数。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

s1,分别获取表示第一事件的n个属性以及表示第二事件的m个属性,其中,m、n个属性均包括:离散属性和连续属性,且m与n相等,且均为正整数;

s2,根据第一事件的n个属性中的离散属性和第二事件的m个属性中的离散属性确定第一参数,其中,第一参数表示第一事件和第二事件之间的离散属性的相关性;

s3,根据第一事件的n个属性中的连续属性和第二事件的m个属性中的连续属性确定第二参数,其中,第二参数表示第一事件和第二事件之间的连续属性的相关性;

s4,根据第一参数和第二参数确定第一事件和第二事件之间的关联系数。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1