一种获取关联度的方法和装置与流程

文档序号:11155147阅读:233来源:国知局
一种获取关联度的方法和装置与制造工艺

本发明涉及大数据技术,尤指一种获取关联度的方法和装置。



背景技术:

目前在很多领域(例如金融、安全、公安、税务等)均需要对数据进行分析,尤其在追踪犯罪团伙等时往往需要对不同实体之间的关联度进行分析。

现有的获取关联度的方法大致包括:

预先根据已知关联度的各个实体样本的特征值获取计算关联度的经验公式,根据待分析的实体的特征值和预设实体的特征值采用计算得到的经验公式计算待分析的实体和预设实体之间的关联度,将计算得到的关联度采用数字百分比的形式进行显示。

现有的获取关联度的方法中,由于实体样本通常无法准确地表示所有实体之间关联度的实际情况,并且采用的实体样本往往不是合理的,因此,获得的实体之间的关联度的精度较低。



技术实现要素:

为了解决上述问题,本发明提出了一种获取关联度的方法和装置,能够提高精度,从而保证数据分析的准确性。

为了达到上述目的,本发明提出了一种获取关联度的方法,包括:

分别统计预设实体和第一待分析的实体之间满足不同的预设条件的次数,分别根据统计的次数计算不同的预设条件对应的关联度;

根据不同的预设条件对应的关联度计算预设实体和第一待分析的实体之间的关联度。

优选地,该方法还包括:

根据所述预设实体和所述第一待分析的实体之间的关联度、第j待分析的实体和第(j+1)待分析的实体之间的关联度计算所述预设实体和第m待分析的实体之间的关联度;其中,m为大于或等于2的整数,j为1到(m-1)的整数。

优选地,所述根据预设实体和第一待分析的实体之间的关联度、第j待分析的实体和第(j+1)待分析的实体之间的关联度计算预设实体和第m待分析的实体之间的关联度包括:

按照公式计算所述预设实体和所述第m待分析的实体之间的关联度;

其中,LL为所述预设实体和所述第二待分析的实体之间的关联度,L1为所述预设实体和所述第一待分析的实体之间的关联度,Lj为第(j-1)待分析的实体和第j待分析的实体之间的关联度,……,Lm为第(m-1)待分析的实体和第m待分析的实体之间的关联度。

优选地,该方法还包括:

在预先设置的关联度和表示图形的信息之间的对应关系中,查找所述预设实体和所述第一待分析的实体之间的关联度对应的表示图形的信息,根据查找到的表示图形的信息显示对应的图形。

优选地,该方法还包括:

在显示的图形内显示所述第一待分析的实体的头像。

优选地,当判断出鼠标位于显示的图形内时,该方法还包括:

显示所述第一待分析的实体的信息。

优选地,所述表示图形的信息为表示图形的面积的信息。

优选地,所述预设条件包括:

所述预设实体和所述第一待分析的实体在同一天入住同一家宾馆的同一间房间,且入住时间的差值的绝对值小于或等于第一预设时间,且退房时间的差值的绝对值小于或等于第二预设时间;

或者,所述预设实体和所述第一待分析的实体在同一天入住同一家宾馆,且入住时间的差值的绝对值小于或等于第三预设时间,且退房时间的差值的绝对值小于或等于第四预设时间的次数大于或等于第一预设次数;

或者,所述预设实体和所述第一待分析的实体在同一天乘坐同一车次,且出发站和终点站均相同,且订票时间的差值的绝对值小于或等于第五预设时间,且取票时间的差值的绝对值小于或等于预设时间;

或者,所述预设实体和所述第一待分析的实体在同一天乘坐同一车次,且出发站和终点站均相同的次数大于或等于第二预设次数。

优选地,所述分别根据统计的次数计算不同的预设条件对应的关联度包括:

按照公式Li=logNi计算不同的预设条件对应的关联度;

其中,Li为第i个预设条件对应的关联度,Ni为所述预设实体和所述第一待分析的实体之间满足第i个预设条件的次数。

优选地,所述根据不同的预设条件对应的关联度计算预设实体和第一待分析的实体之间的关联度包括:

按照公式计算所述预设实体和所述第一待分析的实体之间的关联度;

其中,Wi为第i个预设条件的权重,Li为第i个预设条件对应的关联度;L1为所述预设实体和所述第一待分析的实体之间的关联度。

本发明还提出了一种获取关联度的装置,至少包括:

统计模块,用于分别统计预设实体和第一待分析的实体之间满足不同的预设条件的次数;

第一计算模块,用于分别根据统计的次数计算不同的预设条件对应的关联度;

第二计算模块,用于根据不同的预设条件对应的关联度计算预设实体和第一待分析的实体之间的关联度。

优选地,还包括:

第三计算模块,用于根据所述预设实体和所述第一待分析的实体之间的关联度、第j待分析的实体和第(j+1)待分析的实体之间的关联度计算所述预设实体和第m待分析的实体之间的关联度;其中,m为大于或等于2的整数,j为1到(m-1)的整数。

优选地,所述第三计算模块具体用于:

按照公式计算所述预设实体和所述第m待分析的实体之间的关联度;

其中,LL为所述预设实体和所述第二待分析的实体之间的关联度,L1为所述预设实体和所述第一待分析的实体之间的关联度,Lj为第(j-1)待分析的实体和第j待分析的实体之间的关联度,……,Lm为第(m-1)待分析的实体和第m待分析的实体之间的关联度。

优选地,还包括:

显示模块,用于在预先设置的关联度和表示图形的信息之间的对应关系中,查找所述预设实体和所述第一待分析的实体之间的关联度对应的表示图形的信息,根据查找到的表示图形的信息显示对应的图形。

优选地,所述显示模块还用于:

在显示的图形内显示所述第一待分析的实体的头像。

优选地,所述显示模块还用于:

判断出鼠标位于显示的图形内,显示所述第一待分析的实体的信息。

优选地,所述第一计算模块具体用于:

按照公式Li=logNi计算不同的预设条件对应的关联度;

其中,Li为第i个预设条件对应的关联度,Ni为所述预设实体和所述第一待分析的实体之间满足第i个预设条件的次数。

优选地,所述第二计算模块具体用于:

按照公式计算所述预设实体和所述第一待分析的实体之间的关联度;

其中,Wi为第i个预设条件的权重,Li为第i个预设条件对应的关联度;L1为所述预设实体和所述第一待分析的实体之间的关联度。

与现有技术相比,本发明的技术方案包括:分别统计预设实体和第一待分析的实体之间满足不同的预设条件的次数,分别根据统计的次数计算不同的预设条件对应的关联度;根据不同的预设条件对应的关联度计算预设实体和第一待分析的实体之间的关联度。通过本发明的方案,分别根据预设实体和第一待分析的实体之间满足不同的预设条件的次数计算不同的预设条件对应的关联度,由于预设条件根据实际的情况来确定,真实地反映了实际情况,从而提高了关联度的精度,保证了数据分析的准确性。

进一步地,采用不同的图形来显示不同的关联度,更加直观地显示了关联度,从而提高了用户的体验度。

附图说明

下面对本发明实施例中的附图进行说明,实施例中的附图是用于对本发明的进一步理解,与说明书一起用于解释本发明,并不构成对本发明保护范围的限制。

图1为本发明获取关联度的方法的流程图;

图2为本发明获取关联度的装置的结构组成示意图。

具体实施方式

为了便于本领域技术人员的理解,下面结合附图对本发明作进一步的描述,并不能用来限制本发明的保护范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的各种方式可以相互组合。

参见图1,本发明提出了一种获取关联度的方法,包括:

步骤100、分别统计预设实体和第一待分析的实体之间满足不同的预设 条件的次数,分别根据统计的次数计算不同的预设条件对应的关联度。

本步骤中,预设条件包括:

预设实体和第一待分析的实体在同一天入住同一家宾馆的同一间房间,且入住时间的差值的绝对值小于或等于第一预设时间,且退房时间的差值的绝对值小于或等于第二预设时间;

或者,预设实体和第一待分析的实体在同一天入住同一家宾馆,且入住时间的差值的绝对值小于或等于第三预设时间,且退房时间的差值的绝对值小于或等于第四预设时间的次数大于或等于第一预设次数;

或者,预设实体和第一待分析的实体在同一天乘坐同一车次,且出发站和终点站均相同,且订票时间的差值的绝对值小于或等于第五预设时间,且取票时间的差值的绝对值小于或等于预设时间;

或者,预设实体和第一待分析的实体在同一天乘坐同一车次,且出发站和终点站均相同的次数大于或等于第二预设次数。

其中,第一预设时间、第二预设时间、第三预设时间、第四预设时间、第五预设时间、第一预设次数、第二预设次数可以由本领域的专家确定。

本步骤中,分别根据统计的次数计算不同的预设条件对应的关联度包括:

按照公式Li=logNi计算不同的预设条件对应的关联度;

其中,Li为第i个预设条件对应的关联度,Ni为预设实体和第一待分析的实体之间满足第i个预设条件的次数。

步骤101、根据不同的预设条件对应的关联度计算预设实体和第一待分析的实体之间的关联度。具体包括:

按照公式计算所述预设实体和所述第一待分析的实体之间的关联度。

其中,Wi为第i个预设条件的权重,Li为第i个预设条件对应的关联度;L1为预设实体和第一待分析的实体之间的关联度。

通过本发明的方案,分别根据预设实体和第一待分析的实体之间满足不 同的预设条件的次数计算不同的预设条件对应的关联度,由于预设条件根据实际的情况来确定,真实地反映了实际情况,从而提高了关联度的精度,保证了数据分析的准确性。

进一步地,该方法还包括:

根据预设实体和第一待分析的实体之间的关联度、第j待分析的实体和第(j+1)待分析的实体之间的关联度计算预设实体和第m待分析的实体之间的关联度;其中,m为大于或等于2的整数,j为1到(m-1)的整数。具体包括:

按照公式计算预设实体和第m待分析的实体之间的关联度。

其中,LL为预设实体和第二待分析的实体之间的关联度,L1为预设实体和第一待分析的实体之间的关联度,Lj为第(j-1)待分析的实体和第j待分析的实体之间的关联度,……,Lm为第(m-1)待分析的实体和第m待分析的实体之间的关联度。

进一步地,该方法还包括:

在预先设置的关联度和表示图形的信息之间的对应关系中,查找预设实体和第一待分析的实体之间的关联度对应的表示图形的信息,根据查找到的表示图形的信息显示对应的图形。

其中,还可以在显示的图形内显示第一待分析的实体的头像。

其中,表示图形的信息为表示图形的面积的信息。例如,圆的直径或半径、正方形的边长、长方形的其中一个边长(另一个边长为固定值)、椭圆形的长半轴或短半轴(另一个半轴为固定值)等等。

其中,当判断出鼠标位于显示的图形内时,还可以显示第一待分析的实体的信息。

其中,第一待分析的实体的信息包括以下的任意一个或多个:

姓名、籍贯、出生年月、民族、工作单位、住址、微信号、QQ号、手 机号码、Email、银行信息等等。

进一步地,采用不同的图形来显示不同的关联度,更加直观地显示了关联度,从而提高了用户的体验度。

参见图2,本发明还提出了一种获取关联度的装置,至少包括:

统计模块,用于分别统计预设实体和第一待分析的实体之间满足不同的预设条件的次数;

第一计算模块,用于分别根据统计的次数计算不同的预设条件对应的关联度;

第二计算模块,用于根据不同的预设条件对应的关联度计算预设实体和第一待分析的实体之间的关联度。

本发明的装置中,还包括:

第三计算模块,用于根据预设实体和第一待分析的实体之间的关联度、第j待分析的实体和第(j+1)待分析的实体之间的关联度计算预设实体和第m待分析的实体之间的关联度;其中,m为大于或等于2的整数,j为1到(m-1)的整数。

本发明的装置中,第三计算模块具体用于:

按照公式计算预设实体和第m待分析的实体之间的关联度;

其中,LL为预设实体和第二待分析的实体之间的关联度,L1为预设实体和第一待分析的实体之间的关联度,Lj为第(j-1)待分析的实体和第j待分析的实体之间的关联度,……,Lm为第(m-1)待分析的实体和第m待分析的实体之间的关联度。

本发明的装置中,还包括:

显示模块,用于在预先设置的关联度和表示图形的信息之间的对应关系中,查找预设实体和第一待分析的实体之间的关联度对应的表示图形的信息,根据查找到的表示图形的信息显示对应的图形。

本发明的装置中,显示模块还用于:

在显示的图形内显示第一待分析的实体的头像。

本发明的装置中,显示模块还用于:

判断出鼠标位于显示的图形内,显示第一待分析的实体的信息。

本发明的装置中,第一计算模块具体用于:

按照公式Li=logNi计算不同的预设条件对应的关联度;

其中,Li为第i个预设条件对应的关联度,Ni为预设实体和第一待分析的实体之间满足第i个预设条件的次数。

本发明的装置中,第二计算模块具体用于:

按照公式计算预设实体和第一待分析的实体之间的关联度;

其中,Wi为第i个预设条件的权重,Li为第i个预设条件对应的关联度;L1为预设实体和第一待分析的实体之间的关联度。

需要说明的是,以上所述的实施例仅是为了便于本领域的技术人员理解而已,并不用于限制本发明的保护范围,在不脱离本发明的发明构思的前提下,本领域技术人员对本发明所做出的任何显而易见的替换和改进等均在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1