基于隐语义模型的交通信号优化方法

文档序号:6714088阅读:285来源:国知局
基于隐语义模型的交通信号优化方法
【专利摘要】本发明公开了一种基于隐语义模型的交通信号优化方法,该方法利用隐语义模型在推荐系统中处理不确定性因素的优势,将交通状态类比为用户,将配时方案类比为物品,将交通指标(如延时)类比为评分。该方法包括:预处理数据;将交通状态和配时方案映射到隐语义空间;训练交通状态对配时方案的评分预测模型;预测评分并选择最佳配时方案;实际应用配时方案并反馈交通信息。本发明方法简单易行,能处理传统控制策略不能很好处理、但实际存在且影响较大的不确定性因素,无需精确对难以准确量化的不确定性因素建模,所以具有很好的普适性和较少约束,可作为传统策略的补充和优化。
【专利说明】基于隐语义模型的交通信号优化方法

【技术领域】
[0001] 本发明涉及交通信号控制、信息处理和数据挖掘等【技术领域】,更具体地,涉及一种 基于隐语义模型的交通信号优化方法。

【背景技术】
[0002] 城市机动车保有量的不断增长,导致很多城市问题,如交通拥堵、环境污染、交通 事故等。单纯依赖于增建交通基础设施,如扩张道路等,既耗财较大,又需面对楼房拆迁和 城市已有规划等现实问题。交通信号控制已在实践中被证明是一种有效的缓解交通问题的 方式,主要通过给各种复杂多变的路况提供实时的配时方案来实现。理论研究上的交通信 号控制,试图分析实际交通环境中的各种可能影响交通状况的因素,通过理想化或假设性 建模,用数学语言描述尽可能贴近实际的交通环境,进一步预测下一时段的路况,以提前配 置出合适的红绿灯配时方案,以尽可能的减轻交通拥堵。基于理论研究,目前的交通信号控 制策略可大致分为定时控制、感应控制、智能控制等;但受限于实际交通环境的复杂性和随 机性等,实际应用中以初级的定时控制策略为主。而导致其复杂性、随机性等的主要因素, 就是实际交通环境中有大量的不确定性因素,这些因素难以用数学语言准确建模、甚至有 相当一部分不确定因素无法建模,这就导致理论上的理想化假设在实际应用中无法达到令 人满意的程度。
[0003] 推荐系统目前主要应用在电子商务、电影网站、音乐网站、视频网站、广告等领 域;个性化推荐系统通过建立用户与信息产品之间的二元关系,利用已有的选择过程或相 似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐。而隐语义模型(Latent Factor Model)是近几年在推荐系统领域最为热门的研究话题,它的核心思想是通过隐含 特征(latent factor)联系用户兴趣和物品;隐语义模型取得很好的效果并被广泛应用, 其主要原因是它能较好的处理用户兴趣与物品之间相互影响的很多不确定性因素,即隐含 特征。隐语义模型试图通过分析用户对物品的评分,将用户和物品都映射到一个隐语义空 间;物品和用户均由一个向量表示,向量元素即为各种不确定性因素。例如,以电影为例,有 些因素是显性的,如喜剧片、动作片、惊悚片等,有些因素是很难定义明确的,如道德深度、 诡异程度等等,还有很多因素根本就无法解释,但这些因素都是影响用户对电影的喜好程 度,对用户与电影之间的相互影响起着关键性的作用。用户喜好这些元素的程度越高,且电 影拥有这些元素的程度越高,则用户越容易喜欢这些电影。隐语义模型,从机器学习和数据 挖掘的角度,很好的处理了用户与物品之间的难以用数学精确建模的不确定性因素,很好 的建立起了用户与物品的最佳匹配的连接。
[0004] 随着检测技术的日益成熟,交通中的数据量也与日俱增,使得在交通中应用机器 学习和数据挖掘技术成为可能;且交通中也存在一些指标可以反映交通状态对交通信号的 "喜好程度",如交通状态在对应交通信号配时方案下的延时、流量等。如何将隐语义模型无 缝连接的应用到交通信号推荐中,处理好复杂交通环境中难以建模但又对实际交通状况有 影响的不确定性因素,是一个极大的挑战和极具意义的研究点。


【发明内容】

[0005] 针对当前实际交通环境中存在大量难以用数学精确建模、甚至根本无法建模的不 确定因素,以及这些因素造成理论研究成果和实际应用之间的差距问题,本发明的目的是 提供一种基于隐语义模型的交通信号优化方法,以解决理论成果和实际应用的无缝连接问 题。
[0006] 为了实现上述目的,本发明提出了一种基于隐语义模型的交通信号优化方法,包 括以下步骤:
[0007] 选定相关交通指标,为评分建模;
[0008] 为基本交通状态和配时方案建模;
[0009] 结合实际交通情况,考虑交通状态和配时方案本身特性,进一步细化精确所述评 分预测模型;
[0010] 利用数据库的数据和优化方法,从机器学习的角度训练所述评分预测模型的参 数,以得到交通状态对配时方案的评分预测公式参数;
[0011] 利用得到的所述评分预测公式参数,结合所述评分预测模型,预测交通状态对未 使用过的配时方案的评分;
[0012] 对比得到的所述最佳配时方案和该交通状态历史使用过的配时方案,得出最终最 优配时方案。
[0013] 其中,所述数据库的数据采集既可以通过技术采集,也可以通过交管局获取;以及 所述数据库中的配时方案既可以通过采集得到,又可以由经典算法生成。
[0014] 其中,作为评分的交通指标,选取延时作为评分。
[0015] 其中,所述为基本交通状态和配时方案建模的步骤包括:将交通状态和配时方案 以向量的形式映射到隐语义空间,用数学语言表述为:
[0016] qt e Rf, ps e Rf,
[0017] 其中,向量qt表示配时方案,向量ps表示交通状态,f表示交通状态和配时方案之 间相互作用的不确定性因素。
[0018] 其中,所述进一步细化精确所述评分预测模型的步骤包括:
[0019] 用公式表达交通状态和配时方案中存在的偏置评分为:
[0020] bst = u+bs+bt,
[0021] 由此,最终的评分预测模型为
[0022] /;, = n + bs + b, + ¢// ps ^
[0023] 其中,fst为预测评分结果,bst表示偏置评分,u表示平均评分,b s和bt分别表示 交通状态和配时方案本身打分或被打分偏离平局分u的程度,向量qt表不配时方案,向量 ps表示交通状态。
[0024] 其中,所述利用数据库的数据和优化方法,从机器学习的角度训练所述评分预测 模型的参数,以得到交通状态对配时方案的评分预测公式参数的步骤进一步包括:
[0025] 整理提取出数据库中的交通状态、配时方案和相应评分都均在的三元数组;
[0026] 数据预处理:将上述三元数组的数据按要求处理成统一标准格式;
[0027] 将处理好的数据分成Μ份,其中M-1份作为训练集,剩余1份作为测试集;
[0028] 在训练集上训练模型参数,此处选择以最小化预测评分和真实评分的绝对均方差 为目标训练,即
[0029]

【权利要求】
1. 一种基于隐语义模型的交通信号优化方法,包括以下步骤: 选定相关交通指标,为评分建模; 为基本交通状态和配时方案建模; 结合实际交通情况,考虑交通状态和配时方案本身特性,进一步细化精确所述评分预 测模型; 利用数据库的数据和优化方法,从机器学习的角度训练所述评分预测模型的参数,以 得到交通状态对配时方案的评分预测公式参数; 利用得到的所述评分预测公式参数,结合所述评分预测模型,预测交通状态对未使用 过的配时方案的评分; 对比得到的所述最佳配时方案和该交通状态历史使用过的配时方案,得出最终最优配 时方案。
2. 根据权利要求1所述的基于隐语义模型的交通信号优化方法,其中所述数据库的数 据是通过技术采集,或者通过交管局获取;以及所述数据库中的配时方案是通过采集得到, 或者由经典算法生成。
3. 根据权利要求1所述的基于隐语义模型的交通信号优化方法,其中作为评分的交通 指标,选取延时作为评分。
4. 根据权利要求1所述的基于隐语义模型的交通信号优化方法,其中所述为基本交 通状态和配时方案建模的步骤包括:将交通状态和配时方案以向量的形式映射到隐语义空 间,用数学语言表述为: qt e Rf, Ps e Rf, 其中,向量qt表示配时方案,向量Ps表示交通状态,f表示交通状态和配时方案之间相 互作用的不确定性因素。
5. 根据权利要求1所述的基于隐语义模型的交通信号优化方法,其中所述进一步细化 精确所述评分预测模型的步骤包括: 用公式表达交通状态和配时方案存在的偏置评分为: bst = u+bs+bt, 由此,最终的评分预测模型为 =? + + h, + t\ , 其中,fst为预测评分结果,bst表示偏置评分,u表示平均评分,bs和bt分别表示交通 状态和配时方案本身打分或被打分偏离平局分u的程度,向量qt表不配时方案,向量ps表 示交通状态。
6. 根据权利要求1所述的基于隐语义模型的交通信号优化方法,其中所述利用数据库 的数据和优化方法,从机器学习的角度训练所述评分预测模型的参数,以得到交通状态对 配时方案的评分预测公式参数的步骤进一步包括: 整理提取出数据库中的交通状态、配时方案和相应评分都均在的三元数组; 数据预处理:将上述三元数组的数据按要求处理成统一标准格式; 将处理好的数据分成Μ份,其中M-1份作为训练集,剩余1份作为测试集; 在训练集上训练模型参数,此处选择以最小化预测评分和真实评分的绝对均方差为目 标训练,即
其中,rst为真实评分,α表示训练集上交通状态、配时方案和相应评分都存在的三元 组的集合,上式第二项为防止过拟合的正则化项,λ为正则化参数,其具体值一般结合实验 选取;此处通过随机梯度下降法或最小二乘法进行优化,得到各待求参数; 得到模型后,在测试集上测试该模型下的绝对均方差,通过以下公式计算:
其中,I α I表示测试集上交通状态、配时方案和相应评分都存在的三元组的集合的长 度; 调整参数f,重复上述两个步骤,训练出各种不同的模型,以及相应的测试集上的绝对 均方差值; 根据以上结果,选择使得绝对均方差RMSE最小的最佳预测模型。
7. 根据权利要求6所述的基于隐语义模型的交通信号优化方法,其中所述对比得到的 所述最佳配时方案和该交通状态历史使用过的配时方案的步骤包括:利用所得的所述最佳 预测模型,为当前交通状态预测其未使用过的配时方案的评分,并将该评分与具使用过的 配时方案的评分对比,确定最终最佳的配时方案。
8. 根据权利要求1所述的基于隐语义模型的交通信号优化方法,还包括在得到最佳配 时方案之后,进一步将实际应用后的数据反馈给所述数据库,进一步丰富或更新所述数据 库的步骤。
【文档编号】G08G1/07GK104112366SQ201410360312
【公开日】2014年10月22日 申请日期:2014年7月25日 优先权日:2014年7月25日
【发明者】王飞跃, 赵一飞, 吕宜生, 朱凤华 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1