一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法

文档序号:9471523阅读:361来源:国知局
一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法
【技术领域】
[0001] 本发明设及一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法。
【背景技术】
[0002] 如何在海量的数据中,挖掘其中隐藏的、人们感兴趣的知识,已经成为了一个研究 的热点。Agrawal等在1994年提出使用Apriori方法对顾客交易的数据库项之间的关联规 则进行挖掘,运种方法分成W下两部分来完成:首先,找出数据库中所有出现频率比最小支 持度大或者相等的频繁项集;然后,根据所得到的频繁项集来制定强关联规则,同时运些强 关联规则必须要满足最小可信度W及最小支持度运两个基本的条件。
[0003] 从上面方法实现的两个部分可W看出,Apriori方法的实现分成W下两个步骤: 1、首先使用迭代方法对数据集中的所有项集进行扫描,并且设定一个支持度阔值,筛选出 数据集中的所有频繁项集,即将支持度低于阔值的项集全部淘汰掉,而将支持度高于运个 阔值的项集认为是频繁项集;2、得到所有的频繁项集之后,就可W利用它挖掘出强关联规 贝1J,对于每个频繁项集1产生强关联规则的基本步骤可W总结为W下两步:a、生成1所有的 非空真子集;b、对于1的每个非空真子集1,,如果1的支持度除W1,的支持度大于或等于 min_corif,则输出强关联规则1,一(1-1,)。
[0004] 传统Apriori方法其挖掘对象的事务数据库中,内部的事务条目只具有空间属 性,不适用于挖掘移动节点移动轨迹关联规则。

【发明内容】

[0005] 本发明所要解决的技术问题是针对上述现有技术提供一种适用于挖掘移动节点 移动轨迹关联规则的Apriori方法。
[0006] 本发明解决上述技术问题所采用的技术方案为:一种适用于挖掘移动节点移动轨 迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其特征 在于:包含如下步骤:
[0007] 步骤一、使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的 日期,计算每个频繁项集的支持度;
[0008] 步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并 计算每条移动规则的置信度;
[0009] 其中,步骤一中,将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象 数据,用事务数据库D表示对象数据集,每条事务条目用Pi,P2,…P。2,P。1,P。表示,其中P。 ={(C。,t。)kGC,T},代表移动节点在时间点t。接入了路由器C。,集合C代表移动 节点日常经过的所有接入路由器,T代表每天划分的X个时间段集合,X= 12或24或48或 72〇
[0010] 考虑到移动节点每条生活存在一定的规律,比如上班族,每天上下班的线路和时 间都相对固定,而对学生而言,会根据每周课程安排,重复地在某个时间点到达固定的教室 上课。因此移动节点的移动轨迹数据的时间属性与空间属性之间有着紧密的联系,在挖掘 移动节点的关联移动规则时,充分考虑移动轨迹的时间属性和空间属性,因此挖掘的对象 数据是具有时间和空间双重属性的移动轨迹数据,而P。则能同时表示移动节点的位置与时 间属性。
[0011] 在大型交互数据库应用中,每条记录的日期字段往往是非常重要的,对于移动轨 迹数据集而言,日期较近的移动轨迹记录重要性应该高于日期较远的,作为改进,在所述步 骤二中,记录移动节点每条关联移动规则的日期W及计算每条关联移动规则日期的远近变 动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期 加权值TWei曲t(时,从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变 动因子m和近变动因子n计算公式如下:
[0012]
[0013] 每条关联移动规则的日期加权值TWei曲t(R)计算公式如下:
[0014]
[0015] 其中,Ruinate、MaxDateW及MinData分别表示移动规则的日期、移动轨迹数据 集中最近的记录日期与最远的记录日期;m为移动轨迹数据集中的最近记录日期MaxDate 的变动因子,即近变动因子;n为移动轨迹数据集中的最远记录日期MinData的变动因子, 即远变动因子;K为该移动规则日期Ruinate所在月的总天数,Ruld)atek表示该月中第k 天的日期值。
[0016] 再改进,本发明提供的Apriori方法,还包括如下步骤:
[0017] 步骤=、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下 一个移动轨迹:
[001引假定当前移动节点的移动轨迹为T: (C。,t。)一(Cm,tm),遍历所有关联移动规则, 如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的移动规则,然后根据 下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
[0019] Score(R) =Confidence(R)+TWei曲t(R)
[0020] 其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的 置信度,TWei曲t(时为关联移动规则R的日期加权值
[0021] 与现有技术相比,本发明的优点在于:将移动节点移动轨迹的时间属性与空间 属性一同作为挖掘对象数据,充分考虑了移动轨迹的时间和空间双重属性,相较于传统 Apriori方法,本发明提供的Apriori方法适用用于挖掘移动节点移动轨迹关联规则。
【附图说明】
[0022] 图1为本发明实施例中挖掘移动节点移动轨迹关联规则的Apriori方法流程图。
【具体实施方式】
[0023] W下结合附图实施例对本发明作进一步详细描述。
[0024] 如图1所示的挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点 移动轨迹的关联移动规则进行挖掘,其包含如下步骤:
[00巧]步骤一、使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的 日期,计算每个频繁项集的支持度;该步骤中,将移动节点移动轨迹的时间属性与空间属性 一同作为挖掘对象数据,用事务数据库D表示对象数据集,每条事务条目用Pi,P2,…P"2, Pn1,Pn表示,其中Pn= {(C。,tj|CnGC,tnGT},代表移动节点在时间点tn接入了路由 器C。,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个时间段集 合,X= 12或24或48或72 ;使用迭代方法挖掘对象数据集中所有频繁项集的过程与传统 Apriori方法相同,即为现有常规技术,此处不再详细描述;
[00%] 步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并 计算每条移动规则的置信度;该步骤中生成移动节点所有可能的关联移动规则过程与传统Apriori方法相同,计算每条移动规则的置信度的方法也与传统Apriori方法相同,即为现 有常规技术,此处不再详细描述现有常规技术;
[0027] 而该步骤中,同时记录移动节点每条关联移动规则的日期W及计算每条关联移动 规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关 联移动规则的日期加权值TWei曲t(时,从而得到强关联性移动规则,其中,每条关联移动规 则日期对应的远变动因子m和近变动因子n计算公式如下:
[0028]
[0029] 每条关联移动规则的日期加权值TWei曲t(R)计算公式如下:
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1