一种基于烟花算法的交通路线确定方法及系统与流程

文档序号:14940977发布日期:2018-07-13 20:46阅读:176来源:国知局

本发明涉及数据挖掘技术领域,特别是涉及一种基于烟花算法的交通路线确定方法及系统。



背景技术:

随着计算机技术的迅速发展,1993年r.agrawal等人在对市场购物篮问题的调查分析研究中,首次提出了用关联规则表达式得到规则知识。关联规则提取的主要目标是发现数据项集之间内涵的关联或依赖关系,即从大量积累的数据中找出隐藏的数据模式或者知识。

目前,通常采用关联规则的挖掘算法实现对交通路线的确定,即通过关联规则的挖掘算法对交通路线进行关联挖掘,通过分析居民的出行需求,得到交通路线的规划。先验性算法是现有的关联规则的挖掘算法之一,该算法需要多次扫描数据库,内存消耗大,在大数据量上挖掘十分耗时,导致挖掘效率不高。将先验性算法用于交通路线的确定,不能快速地实现对交通路线的关联挖掘,导致交通路线确定的效率不高。



技术实现要素:

基于此,有必要提供一种基于烟花算法的交通路线确定方法及系统,以快速地实现对交通路线的关联挖掘,提高交通路线确定的效率。

为实现上述目的,本发明提供了如下方案:

一种基于烟花算法的交通路线确定方法,包括:

获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线;

统计数据库中每一个所述出行路线的出现次数;

对所述出现次数进行排序;

获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的;

依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组;

依据所述频繁一项集组构建频繁模式树;

利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系;

根据所述关联关系确定交通路线。

可选的,所述利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,具体包括:

自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;

判断每条所述路径对应的所述出行路线的适应度函数是否大于1;

若是,则将所述路径的标记为0,表示保留所述路径,得到保留路径;

若否,则将所述路径标记为1,表示删除所述路径;

通过所述保留路径构建条件子树。

可选的,所述方法中所述适应度函数是依据支持度和置信度确定的,具体为

其中,i=1,2,...,n,fitnessi表示第i条出行路线的适应度函数,supporti表示第i条出行路线的支持度;confidencei表示第i条出行路线的置信度;minsupport表示最小支持度;minconfidence表示最小置信度。

本发明还提供了一种基于烟花算法的交通路线确定系统,所述系统包括:

数据集获取模块,用于获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线;

统计模块,用于统计数据库中每一个所述出行路线的出现次数;

排序模块,用于对所述出现次数进行排序;

频繁一项集列表获取模块,用于获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的;

频繁一项集组获取模块,用于依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组;

频繁模式树构建模块,用于依据所述频繁一项集组构建频繁模式树;

条件子树获取模块,用于利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系;

交通路线确定模块,用于根据所述关联关系确定交通路线。

可选的,所述条件子树获取模块,具体包括:

频繁子树获取单元,自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;

判断单元,用于判断每条所述路径对应的所述出行路线的适应度函数是否大于1;

第一标记单元,用于当所述适应度函数大于1时,则将所述路径标记为0,表示保留所述路径,得到保留路径;

第二标记单元,用于当所述适应度函数小于1时,则将所述路径标记为1,表示删除所述路径;

条件子树构建单元,用于通过所述保留路径构建条件子树。

可选的,所述系统中所述适应度函数是依据支持度和置信度确定的,具体为

其中,i=1,2,...,n,fitnessi表示第i条出行路线的适应度函数,supporti表示第i条出行路线的支持度;confidencei表示第i条出行路线的置信度;minsupport表示最小支持度;minconfidence表示最小置信度。

与现有技术相比,本发明的有益效果是:

本发明提出了一种基于烟花算法的交通路线确定方法及系统,所述方法包括:获取乘客出行数据集,乘客出行数据集包括多个区域内乘客的出行路线;统计数据库中每一个出行路线的出现次数;对出现次数进行排序;获取频繁一项集列表,频繁一项集列表是由出现次数大于最小出现次数的出行路线组成的;依据区域类别对频繁一项集列表进行分组,得到多个频繁一项集组;依据频繁一项集组构建频繁模式树;利用烟花算法对频繁模式树进行剪枝,得到条件子树,条件子树表示出行路线之间的关联关系;根据关联关系确定交通路线。该方法利用烟花算法对频繁模式树进行剪枝,能够快速地实现对交通路线的关联挖掘,提高交通路线确定的效率,并且还能减少在挖掘过程中关联规则的遗漏。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例一种基于烟花算法的交通路线确定方法的流程图;

图2为本发明实施例一种基于烟花算法的交通路线确定系统的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例一种基于烟花算法的交通路线确定方法的流程图。

参见图1,实施例的基于烟花算法的交通路线确定方法,包括:

步骤s1:获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线。

步骤s2:统计数据库中每一个所述出行路线的出现次数。

步骤s3:对所述出现次数进行排序。

步骤s4:获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的。

步骤s5:依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组。

步骤s6:依据所述频繁一项集组构建频繁模式树。

步骤s7:利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系。

所述条件子树的具体构建过程如下:

自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;

判断每条所述路径对应的所述出行路线的适应度函数是否大于1;

若是,则将所述路径的标记为0,表示保留所述路径,得到保留路径;

若否,则将所述路径标记为1,表示删除所述路径;

通过所述保留路径构建条件子树。

其中所述适应度函数是依据支持度和置信度确定的,具体为

其中,i=1,2,...,n,fitnessi表示第i条出行路线的适应度函数,supporti表示第i条出行路线的支持度;confidencei表示第i条出行路线的置信度;minsupport表示最小支持度;minconfidence表示最小置信度。

步骤s8:根据所述关联关系确定交通路线。

本实施例中的基于烟花算法的交通路线确定方法,利用烟花算法对频繁模式树进行剪枝,能够快速地实现对交通路线的关联挖掘,提高交通路线确定的效率,并且还能减少在挖掘过程中关联规则的遗漏。

本发明还提供了一种基于烟花算法的交通路线确定系统,图2为本发明实施例一种基于烟花算法的交通路线确定系统的结构图。

参见图2,实施例的基于烟花算法的交通路线确定系统20,包括:

数据集获取模块201,用于获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线。

统计模块202,用于统计数据库中每一个所述出行路线的出现次数。

排序模块203,用于对所述出现次数进行排序。

频繁一项集列表获取模块204,用于获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的。

频繁一项集组获取模块205,用于依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组。

频繁模式树构建模块206,用于依据所述频繁一项集组构建频繁模式树。

条件子树获取模块207,用于利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系。

所述条件子树获取模块207,具体包括:

频繁子树获取单元,自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;

判断单元,用于判断每条所述路径对应的所述出行路线的适应度函数是否大于1;

第一标记单元,用于当所述适应度函数大于1时,则将所述路径标记为0,表示保留所述路径,得到保留路径;

第二标记单元,用于当所述适应度函数小于1时,则将所述路径标记为1,表示删除所述路径;

条件子树构建单元,用于通过所述保留路径构建条件子树。

交通路线确定模块208,用于根据所述关联关系确定交通路线。

本实施例中的基于烟花算法的交通路线确定系统,利用烟花算法对频繁模式树进行剪枝,能够快速地实现对交通路线的关联挖掘,提高交通路线确定的效率,并且还能减少在挖掘过程中关联规则的遗漏。

本说明书中对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1