一种基于文本挖掘的交通控制方法与流程

文档序号:12749207阅读:312来源:国知局

本发明涉及交通控制领域,特别涉及一种基于文本挖掘的交通控制方法。



背景技术:

近年来,英国、澳大利亚、欧洲和美国均在某些城市建立了交通控制系统。在这些系统中,大部分都在各路口附近安装有磁性环路检测器,并由各路口的控制装置或工作人员将交通控制参数通过电话线、电缆、闭路电视线等通讯网络输入微处理器,用小型计算机进行集中控制。

目前国内已有一些自主开发的城市交通控制与管理系统,但在整体性能比国外同类系统仍有较大差距,只在一些中小城市得到一些应用。国内城市尤其是大城市引进的交通系统大部分为进口的SCOOT和SCATS系统。由于我国交通流是混合交通流,和国外的交通流大不相同,国外的交通控制系统在国内的使用效果不尽人意。与国外相比,我国目前交通状况还比较落后,主要表现在:

(1)城市道路结构不合理,大多数城市道路空间结构属平面交通状态,形成“人车混行,快慢车混驶”的特点。主、次干道和支线比例失调,衔接关系紊乱,使干线道路难以发挥其功能。就道路面积来说,国内的城市道路面积率低于世界上同等规模大城市。

(2)交通出行结构失衡。国内的城市交通主要由各种机动车、非机动车和行人构成,形成特殊的三元混合交通结构。

(3)交通管理技术水平低,交通事故频繁。目前中国城市交通的问题呈现两类典型现象:管理不力、秩序混乱;没有科学、合理、有效的城市交通监控系统。由此带来的后果日趋严重。表现为路网通行能力明显低于设计要求并且波动性大、出行时间难以预测、高发交通事故、交通环境恶化、出行者容易疲劳等。



技术实现要素:

本发明为解决上述问题,提供了一种基于文本挖掘的交通控制方法,其特征在于,包括以下步骤:

步骤100,获取交通控制的文本信息;

步骤200,确定十字路口的辐射范围;

步骤300,确定所述十字路口辐射范围内的关键词;

步骤400,统计所述关键词出现频率和次数;

步骤500,预测所述十字路口的拥塞度;

步骤600,对所述十字路口的交通控制信息进行调整;

步骤700,确定本轮交通控制调整的周期。

本发明可以根据一定时间内与交通控制相关的文本信息,分析指定十字路口未来一段时间可能的拥塞度,基于拥塞度对指定十字路口的交通控制信息进行调整,避免造成交通拥堵,提高人民出行质量,有利于建设低碳社会。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例一公开了一种基于文本挖掘的交通控制方法,其特征在于,包括以下步骤:

步骤100,获取交通控制的文本信息;

步骤200,确定十字路口的辐射范围;

步骤300,确定所述十字路口辐射范围内的关键词;

步骤400,统计所述关键词出现频率和次数;

步骤500,计算所述十字路口的拥塞度;

步骤600,对所述十字路口的交通控制信息进行调整;

步骤700,确定本轮交通控制调整的周期。

本发明实施例二公开了一种基于文本挖掘的交通控制方法,其特征在于,包括以下步骤:

步骤100,获取交通控制的文本信息;

所述步骤100中获取交通控制的文本信息的方法包括但不仅限于抓取短信信息,抓取地图软件信息以及抓取互联网信息。

步骤200,确定十字路口的辐射范围;

所述步骤200进一步包括:

步骤220,确定经过所述十字路口的两条道路级别;

本发明中的道路级别划分标准为:城市道路等级分快速路、主干路、次干路、支路四级,各级红线宽度控制:快速路不小于40米,主干道30—40米,次干道25—40米,支路12—25米。

(根据《城市道路工程设计规范》(CJJ37-2012),对于道路的红线宽度并没有作强制性要求,仅对道路的路幅要求、横断面组成及各功能带最小宽度进行了要求)

一级路为快速路,取值为1:城市道路中设有中央分隔带,具有四条以上机动车道,全部或部分采用立体交叉与控制出入,供汽车以较高速度行驶的道路。又称汽车专用道。快速路的设计行车速度为60-80km/h。

二级路为主干路,取值为2:连接城市各分区的干路,以交通功能为主。主干路的设计行车速度为40-60km/h。

三级路为次干路,取值为3:承担主干路与各分区间的交通集散作用,兼有服务功能。次干路的设计行车速度为40km/h。

四级路为支路,取值为4:次干路与街坊路(小区路)的连接线,以服务功能为主。支路的设计行车速度为30km/h。

步骤240,确定经过所述十字路口的两条道路的车道数;

步骤260,确定所述十字路口与邻近十字路口之间的大型建筑数量,本发明中的大型建筑是指:

25层以上(含,下同)的房屋建筑工程;高度100米以上的构筑物或建筑物工程;单体建筑面积3万平方米以上的房屋建筑工程;

单跨跨度30米以上的房屋建筑工程;建筑面积10万平方米以上的住宅小区或建筑群体工程;单项建安合同额1亿元以上的房屋建筑工程;

深度15米以上,且单项工程合同额1000万元以上的软弱地基处理工程;单桩承受荷载6000kN以上,且单项工程合同额1000万元以上的地基与基础工程;深度11米以上,且单项工程合同额1000万元的深大基坑围护及土石方工程;钢结构重量1000吨以上,且钢结构建筑面积2万平方米以上的钢结构工程;网架结构重量300吨以上,且网架结构建筑面积5000平方米以上,且网架边长70米以上的网架工程;

步骤280,根据所述道路性质、车道数和人口数量计算所述十字路口的辐射范围,计算辐射范围的公式为:

<mrow> <mi>R</mi> <mi>a</mi> <mi>d</mi> <mo>=</mo> <mi>&lambda;</mi> <mo>*</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mfrac> <mrow> <msub> <mi>lnN</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>lnN</mi> <mn>2</mn> </msub> </mrow> <mrow> <msub> <mi>&alpha;L</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>&beta;L</mi> <mn>2</mn> </msub> </mrow> </mfrac> </mrow> </msup> <mo>*</mo> <msqrt> <mrow> <msub> <mi>N</mi> <mi>c</mi> </msub> <mo>+</mo> <mn>1</mn> </mrow> </msqrt> <mo>;</mo> </mrow>

其中Rad为所述十字路口的辐射范围,L1和L2分别为经过所述十字路口的第一条和第二条道路级别,N1和N2分别为经过所述十字路口的第一条和第二条道路的车道数量,Nc为所述十字路口周围的大型建筑数量,α和β分别为经过所述十字路口的第一条和第二条道路的权重系数,有α,β∈[0,1],且α+β=1,λ为辐射范围系数,可以根据城市大小而调整,优选为5。

通常来说,经过一个十字路口的道路级别取值越小,说明此十字路口越重要,如果经过一个十字路口的车道数越多,说明此十字路口越重要,如果十字路口周围的大型建筑越多,说明此十字路口越重要。所以本发明的辐射范围计算公式能够反映出不同参数对辐射范围的影响和重要程度,而且辐射范围系数的使用能够使得本公式适用于不同规模的城市,进一步扩展了其实用性。

步骤300,确定所述十字路口辐射范围内的关键词,所述步骤300中的关键词包括但不仅限于地址,街道名称,门牌号,建筑物名称,单位名称,演出名称,比赛名称。

步骤400,统计所述关键词出现频率和次数;

所述步骤400进一步包括:

步骤420,提取文本信息中的关键词;

步骤440,统计文本信息中每个关键词出现的总次数;

步骤450,计算文本信息中所有关键词出现的总次数N

<mrow> <mi>N</mi> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mi>i</mi> </msub> </mrow>

其中wi为第i个关键词出现的总次数,n为关键词的数量;

步骤460,计算文本信息中第i个关键词出现的真实次数Wi

<mrow> <msub> <mi>W</mi> <mi>i</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>*</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>;</mo> </mrow>

其中wj为第j个关键词出现的总次数,rij为第j个关键词与第i个关键词的相似程度系数,rij∈[0,1],i,j∈[1,n],相似程度系数计算方法可以使用基于空间向量的余弦算法;

所谓关键词出现的真实次数,是因为一个地名可能有不同的表述方式,不同的关键词可能是强相关的,例如“国家知识产权局”与“国知局”可以视为同一个关键词,与地址“西土城路6号”也是强相关的,相似程度系数就是描述关键词之间联系的度量,毫无关联的关键词之间相似程度系数为0,关键词全称与简称的相似程度系数为1。

步骤470,计算第i个关键词出现的频率fi

<mrow> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>W</mi> <mi>i</mi> </msub> <mrow> <mi>&Delta;</mi> <mi>t</mi> </mrow> </mfrac> </mrow>

其中Δt为统计文本信息中的关键词的时间周期;

步骤480,根据关键词出现的次数和频率计算所述十字路口的热度h

<mrow> <mi>h</mi> <mo>=</mo> <mi>&gamma;</mi> <mo>*</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <mrow> <mi>r</mi> <mi>a</mi> <mi>d</mi> </mrow> </msub> </munderover> <msub> <mi>W</mi> <mi>k</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>&gamma;</mi> <mo>)</mo> </mrow> <msub> <mi>n</mi> <mrow> <mi>r</mi> <mi>a</mi> <mi>d</mi> </mrow> </msub> </mfrac> <mo>*</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <mrow> <mi>r</mi> <mi>a</mi> <mi>d</mi> </mrow> </msub> </munderover> <msub> <mi>f</mi> <mi>k</mi> </msub> <mo>;</mo> </mrow>

其中Wk为所述十字路口辐射范围中的第k个关键词出现的真实次数,fk为所述十字路口辐射范围中的第k个关键词出现的频率,nrad为所述十字路口辐射范围中的关键词数量,γ为调节系数,γ∈[0,1]。

步骤500,预测所述十字路口的拥塞度,具体方法为:

<mrow> <mi>P</mi> <mo>=</mo> <mfrac> <mi>h</mi> <mrow> <mi>&pi;</mi> <mo>*</mo> <msup> <mi>Rad</mi> <mn>2</mn> </msup> </mrow> </mfrac> <mo>;</mo> </mrow>

步骤600,对所述十字路口的交通控制信息进行调整,具体方法为:

给定第一阈值T,如果拥塞度大于第一阈值,那么向全市的汽车播报预警信息,提示该十字路口可能出现拥堵,提醒市民调整出行路线;

步骤700,确定本轮交通控制调整的周期,调整周期的时长优选为30分钟。

其他与方法相同之处在此不赘述,详情请参照方法说明部分。

本发明实施例可以根据一定时间内与交通控制相关的文本信息,分析指定十字路口未来一段时间可能的拥塞度,根据拥塞度对指定十字路口的交通控制信息进行调整,避免造成交通拥堵,提高人民出行质量,有利于建设低碳社会。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1