一种预测旅客出行方式的方法及装置与流程

文档序号:20955780发布日期:2020-06-02 20:24阅读:356来源:国知局
一种预测旅客出行方式的方法及装置与流程

本发明智能交通技术领域,尤其涉及一种预测旅客出行方式的方法及装置。



背景技术:

出行方式的选择问题是个人出行决策中的重要一环,现有技术中对于用户出行方式的研究预测,主要有意愿调查(statedpreference,sp)法,和行为调查(revealedpreference,rp)法,但单独采用意愿调查法获取旅客出行数据,然后进行预测分析,常常会存在人们的行为结果与意向结果不一致的问题的,,而单独采用行为调查法又无法体现旅客的意愿需求,从而导致单独采用上述任意一种方法构建出行预测模型,来进行旅客出行预测时,准确性较差,而基于准确性较差的出行方式预测,则无法规划出更利于出行的交通布局。



技术实现要素:

本发明实施例提供一种预测旅客出行方式的方法及装置,能将sp调查数据以及pr调查数据相结合,基于融合后的数据构建出行预测模型,进行旅客出行方式预测,提高出行方式预测的准确性,使得交通规划更为有效。

本发明一实施例提供一种预测旅客出行方式的方法,包括:

获取若干旅客的出行影响因素信息及所选择的出行方式信息;其中,所述出行影响因素信息包括个人属性信息和出行属性信息;所述个人属性信息包括若干rp调查数据;所述出行属性信息包括若干sp出行调查数据和若干rp出行调查数据;

对所述个人属性信息以及所述出行方式信息进行相关性分析,并将所述个人属性信息中,相关性达到预设条件的属性信息,作为主要个人属性信息;

根据所述主要个人属性信息,对各所述旅客进行分类,获得若干旅客类别信息;

将所述旅客类别信息以及所述出行属性信息,作为第二出行影响因素信息,并对所述第二出行影响因素信息以及所述出行方式信息进行相关性分析,继而将所述第二出行影响因素信息中,相关性达到第二预设条件的数据项,作为所述主要出行影响因素信息;其中,所述主要出行影响因素信息包括至少一项sp出行调查数据和一项rp出行调查数据;

根据所述主要出行影响因素信息构建出行方式预测模型;

获取待预测旅客的主要出行影响信息,将所述待预测旅客的主要出行影响信息输入所述出行方式预测模型中,获得所述待预测旅客的预测出行方式信息。

进一步的,所述个人属性信息包括以下数据项:性别、年龄、月收入、学历、职业以及私家车属性信息;其中,所述私家车属性信息用于标识所述旅客是否拥有私家车;所述性别、年龄、月收入、学历、职业以及私家车属性信息均为rp调查数据。

进一步的,所述出行属性信息包括:出行频率、出行目的、出行地区、出行费用属性、出行费用敏感度、准时性敏感度、安全性敏感度、舒适性敏感度以及便捷性敏感度;其中,所述出行频率、出行目的、出行地区以及出行费用属性均为rp出行调查数据,所述出行费用敏感度、准时性敏感度、安全性敏感度、舒适性敏感度以及便捷性敏感度均为sp出行调查数据。

进一步的,所述对所述个人属性信息以及所述出行方式信息进行相关性分析,并将相关性达到预设条件的个人属性信息,作为主要个人属性信息,具体包括:

调用预设的统计分析工具,对所述个人属性信息以及所述出行方式信息进行相关性分析;

将所述个人属性信息中在0.01级别上呈显著性相关的属性信息,作为所述个人属性信息。

进一步的,所述将所述第二出行影响因素信息以及所述出行方式信息进行相关性分析,继而对所述第二出行影响因素信息中,相关性达到第二预设条件的数据项,作为所述主要出行影响因素信息,具体包括:

调用预设的统计分析工具,对所述第二出行影响因素信息以及所述出行方式信息进行相关性分析;

将所述第二出行影响因素信息中在0.01级别上呈显著性相关的数据项,作为所述主要出行影响因素信息。

进一步的,所述根据所述出行影响因素信息构建出行方式预测模型,具体包括:

将所述出行影响因素信息中的各数据项作为logit模型的因素变量,进行数据仿真,生成所述为logit模型各因素变量的系数值;

根据所述logit模型的因素变量以及各因素变量的系数值,构建基于logit模型的出行方式预测模型。

在上述方法项实施例的基础上,对应提供了装置项实施例。

本发明一实施例提供了一种预测出行方式的装置,包括样本数据获取模块、主要个人属性信息提取模块、旅客分类模块、主要出行影响因素信息提取模块、出行预测模型构建模块以及出行预测模块;

所述样本数据获取模块,用于获取若干旅客的出行影响因素信息及所选择的出行方式信息;其中,所述出行影响因素信息包括个人属性信息和出行属性信息;所述个人属性信息包括若干rp调查数据;所述出行属性信息包括若干sp出行调查数据和若干rp出行调查数据;

所述主要个人属性信息提取模块,用于对所述个人属性信息以及所述出行方式信息进行相关性分析,并将所述个人属性信息中,相关性达到预设条件的属性信息,作为主要个人属性信息;

所述旅客分类模块,用于根据所述主要个人属性信息,对各所述旅客进行分类,获得若干旅客类别信息;

所述主要出行影响因素信息提取模块,用于将所述旅客类别信息以及所述出行属性信息,作为第二出行影响因素信息,并对所述第二出行影响因素信息以及所述出行方式信息进行相关性分析,继而将所述第二出行影响因素信息中,相关性达到第二预设条件的数据项,作为所述主要出行影响因素信息;其中,所述主要出行影响因素信息包括至少一项sp出行调查数据和一项rp出行调查数据;

所述出行预测模型构建模块,用于根据所述主要出行影响因素信息构建出行方式预测模型;

所述出行预测模块,用于获取待预测旅客的主要出行影响信息,将所述待预测旅客的主要出行影响信息输入所述出行方式预测模型中,获得所述待预测旅客的预测出行方式信息。

通过实施本发明实施例具有如下有益效果:

本发明实施例提供了一种预测旅客出行方式的方法及装置,所述方法首先获取旅客的出行影响因素信息及对应的出行方式信息,出行影响因素信息包括个人属性信息和出行属性信息,在个人属性信息中只有属于rp调查类型的数据项,但在出行属性信息中既有属于sp调查类型的数据项(即上述sp出行调查数据)又有属于rp调查类型的数据项(即上述rp出行调查数据),然后根据个人属性信息和出行属性信息,提取主要出行影响因素信息,提取出的主要出行因素信息包括了属于rp调查类型的数据项,又包含了属于sp调查类型的数据项,根据主要出行影响因素信息构建出行方式预测模型,最后通过出行方式预测模型对待预测旅客进行出行方式的预测,相比与现有技术,本发明在构建出行方式预测模型,将sp调查类型的数据以及rp调查类型的数据进行融合,使构建的出行方式预测模型,既能够反应旅客的出行意愿又能够反应旅客的实际出行行为,提高了模型的准确性,从而提高了出行方式预测的准确性,进而更有利于出行的交通布局规划。

附图说明

图1是本发明一实施例提供的一种预测旅客出行方式的方法的流程示意图。

图2是本发明一实施例提供的一种预测出行方式的装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明一实施例提供的一种预测旅客出行方式的方法,包括:

步骤s101:获取若干旅客的出行影响因素信息及所选择的出行方式信息;其中,所述出行影响因素信息包括个人属性信息和出行属性信息;所述个人属性信息包括若干rp调查数据;所述出行属性信息包括若干sp出行调查数据和若干rp出行调查数据;

步骤s102:对所述个人属性信息以及所述出行方式信息进行相关性分析,并将所述个人属性信息中,相关性达到预设条件的属性信息,作为主要个人属性信息;

步骤s103:根据所述主要个人属性信息,对各所述旅客进行分类,获得若干旅客类别信息;

步骤s104:将所述旅客类别信息以及所述出行属性信息,作为第二出行影响因素信息,并对所述第二出行影响因素信息以及所述出行方式信息进行相关性分析,继而将所述第二出行影响因素信息中,相关性达到第二预设条件的数据项,作为所述主要出行影响因素信息;其中,所述主要出行影响因素信息包括至少一项sp出行调查数据和一项rp出行调查数据;

步骤s105:根据所述主要出行影响因素信息构建出行方式预测模型;

步骤s106:获取待预测旅客的主要出行影响信息,将所述待预测旅客的主要出行影响信息输入所述出行方式预测模型中,获得所述待预测旅客的预测出行方式信息。

对于步骤s101:首先本步骤中所述的出行方式信息为用于表示,旅客出行时所选择的交通工具,包括当不限于,公交车、出租车(包括网约车)以及私家车。

上述rp调查数据和rp出行调查数据,均为采用rp调查方法(行为调查方法)所采集的数据,而sp出行调查数据,为采用sp调查方法(意愿调查方法)所采集的数据,个人属性信息中的所有数据项均为通过rp调查方法获取的数据项(即上述rp调查数据),而出行属性信息中即包含通过rp调查方法获取的数据项(即上述rp出行调查数据),也包含通过sp调查方式获取的数据项(即上述sp出行调查数据)。

优选的,上述个人属性信息包括但不限于以下数据项:性别、年龄、月收入、学历、职业以及私家车属性信息;其中,所述私家车属性信息用于标识所述旅客是否拥有私家车;所述性别、年龄、月收入、学历、职业以及私家车属性信息均为rp调查数据。

上述出行属性信息包括:出行频率、出行目的、出行地区、出行费用属性、出行费用敏感度、准时性敏感度、安全性敏感度、舒适性敏感度以及便捷性敏感度;其中,所述出行频率、出行目的、出行地区以及出行费用属性均为rp出行调查数据,所述出行费用敏感度、准时性敏感度、安全性敏感度、舒适性敏感度以及便捷性敏感度均为sp出行调查数据。

本发明实施例首先通过发放问卷调查的方式向旅客发放问卷,再通过现有的语义分析技术从问卷中提取上述出行影响因素信息及所选择的出行方式信息,或者直接接收由用户根据回收的问卷,输入的行影响因素信息及所选择的出行方式信息。以中国江门东站为调查地点,设计基于rp和sp组合的调查问卷,在江门东站进行随机均匀抽样调查。问卷形式如下表1所述:

表1

对于步骤s102,在获取上述出行影响因素信息及所选择的出行方式信息后需要从上述个人属性信息中选取,与旅客出行方式的选择具有显著关联性的数据项。在一个优选的实施例中,调用预设的统计分析工具,对所述个人属性信息以及所述出行方式信息进行相关性分析;将所述个人属性信息中在0.01级别上呈显著性相关的属性信息,作为所述主要个人属性信息。优选的,本发明所提取的主要个人属性信息包括:年龄、月收入、职业、学历以及私家车属性信息;上述统计分析工具包括但不限于spss22.0软件,以下例举一个实际分析的事例,进行进一步的说明:

调用spss22.0软件,对表1中旅客个人属性和接驳交通方式选择进行相关性分析,最终结果如表2所示。根据表2可知,年龄、收入、学历、职业和是否拥有私家车这5项旅客个人属性与接驳交通方式的选择在0.01级别上呈显著性相关,置信度达到了99%。该结果说明了旅客的这5项个人属性对其接驳交通方式(出行方式)的选择具有显著影响。表2:旅客个人属性与接驳交通方式的相关性分析。

表2

因此可选取年龄、月收入、职业、学历以及私家车属性信息,这五个数据项作为上述主要个人属性信息。

对于步骤s103:由于旅客的年龄、收入、职业等个人因素之间并不是完全孤立的,而是相互关联的,独立分析每项因素对旅客出行选择行为的影响具有局限性。因此,本发明基于上述5项呈显著性相关的旅客个人属性(即上述主要个人属性信息),对旅客进行聚类分析,将旅客划分成具有不同特征的人群,分别研究不同人群中旅客的接驳交通方式选择行为。这样便可综合考察这5项个人属性对旅客出行选择行为的影响。聚类分析的关键在于将具有类似特征的人群划分到同一类别,不同类别之间的特征具有明显的差异性,这样可以较好地突出各个群体的特征,且不同群体之间具有较为明显的差异。聚类分析的结果见表3和表4。由表3为各类型人群特征,由表3可知,聚类分析将旅客划分为三个群体;表4为各类人群接驳交通方式的选择情况:

表3

表4

结合表3和表4,对这三类人群的特征及其接驳交通方式的选择特征进行综合分析,如下:

1)第一类人群数量占比为40.30%,主要以25岁以下的年轻人为主,学历主要集中在大专和本科。其中月收入和私家车占有率都很低,平均月收入不足2500元,私家车占有率仅为18%。所以这类人群多为在读的学生和刚步入社会的青年,对出行费用比较敏感,选择公交车出行的比例较高,为50.0%。

2)第二类人群数量占比32.89%,平均年龄为31.3岁,有50%以上的受访旅客为本科学历,甚至有10.8%的受访旅客为研究生及以上学历。其中月收入和私家车占有率都很高,平均月收入接近6400元,拥有私家车占比为43%。所以这类人群多为公司职员,对出行费用不敏感,倾向于出租车为主,占比为46.3%。

3)第三类人群数量占比为26.81%,年龄主要集中在35~44岁之间,学历水平不高,以高中及以下学历为主。其中有较高的私家车占有率和中等的月收入水平,平均收入水平接近5000元,拥有私家车占比高达48%。所以这类人群多为专业人士和服务行业人员,他们参与工作多年,生活比较稳定,对出行费用不敏感,更倾向于选择出租车和公交车出行,占比分别为40.8%和34.9%。

总体而言,公交车和出租车是旅客的主要接驳交通方式,收入越高的群体选择出租车作为接驳交通方式的比例越高。从第一类人群到第三类人群,平均年龄逐渐增大,私家车的拥有率逐渐上升,同时选择私家车作为接驳交通方式的比例也逐渐增加,而选择公交车作为接驳交通方式的比例逐渐减少。

对于步骤s104:在一个优选的实施例中,在步骤s103中获得旅客类别信息后,将旅客类别信息(即上述表3或表4中,人群类别数据项下的1、2、3)与出行属性信息,作为更新后的出行影响因素信息(即上述第二出行影响因素信息),然后对第二出行影响因素信息中的各个数据项与出行方式信息进行相关性分析,优选的具体分析方式包括调用预设的统计分析工具,对所述第二出行影响因素信息以及所述出行方式信息进行相关性分析;

将所述第二出行影响因素信息中在0.01级别上呈显著性相关的数据项,作为所述主要出行影响因素信息。

以下例举一个具体实例进行进一步的说明:由于旅客的个人属性之间的关联性较强,因此采用人群类别作为代表,描述旅客个人属性与接驳交通方式之间的相关性。同时,调用spss22.0软件,进一步分析旅客出行属性和接驳交通方式选择的相关性,如表5所示。表5是旅客属性与接驳交通方式的相关性分析结果示意表。结果表明,人群类别、出行目的、出行地区、公费出行、出行费用敏感度、安全性敏感度和舒适性敏感度这7项属性与接驳交通方式的选择在0.01级别上呈显著性相关,即置信度水平达99%,对旅客的接驳交通方式选择具有显著影响,因此以人群类别、出行目的、出行地区、公费出行敏感度、出行费用敏感度、安全性敏感度和舒适性敏感度这7个数据项,作为上述主要出行影响因素信息,这7个数据项中,人群类别、出行目的、出行地区均为通过rp调查方式获得的数据,公费出行、出行费用敏感度、安全性敏感度和舒适性敏感度均为sp出行调查数据。

表5

对于步骤s105、在一个优选的实施例中,根据所述出行影响因素信息构建出行方式预测模型,具体包括:将所述出行影响因素信息中的各数据项作为logit模型的因素变量,进行数据仿真,生成所述为logit模型各因素变量的系数值;根据所述logit模型的因素变量以及各因素变量的系数值,构建基于logit模型的出行方式预测模型。以下例举实际例子进行进一步的说明:

多项logit模型的基本形式如下,

uin=vin+εin,i∈an(1)

式中:uin——个人n关于选择枝i的效用

vin——能被测定的效用确定项

εin——不能被测定的效用随机项

an——选择枝的集合

假设vin和εin之间相互独立且εin服从gumbel分布,个人n选择效用最大的选择枝,则个人n采用选择枝i的概率为[10]

在本文中,an表示旅客的接驳交通方式集合。

令an={公交车,出租车,私家车}。根据第2节的分析,选取对旅客的接驳交通方式选择行为具有显著性影响的7个属性(人群类别、出行目的、出行地区、公费出行、出行费用、安全性和舒适性)确定旅客的出行效用vin,如下所示,

式中:αi——常数项;xnm——影响旅客n出行选择的第m个因素变量;βim——选择第i个选择枝时第m个因素变量的参数。变量定义及其取值范围具体见表6。

表6

spss22.0软件中多元logit模型进行数据仿真,得到模型参数估计值,如表7所示。显著性水平取值为0.05,表7为模型参数估计结果,从表7可知,人群类别、出行目的、出行地区、公费出行、出行费用、安全性敏感度和舒适性敏感度与接驳交通方式的选择均有显著性关系,符合变量选取的要求。

表7

根据表7模型参数估计结果,以私家车为基准,分别用pn(1),pn(2),pn(3)表示选择公交车、出租车、私家车的概率,旅客接驳交通方式选择模型(出行方式预测模型)对应的数学表达式如下:

在一个优选的实施例中,在获取上述出行方式预测模型后,为了检验模型参数标定结果的可靠性,对模型进行拟合度检验,结果如表8所示。由表8可知,-2对数似然值由403.015下降到374.364。似然比检验p<0.01,表明模型的拟合度较高(显著水平为0.001),说明具有统计意义。在各个模型变量中,出行目的、公费出行、安全性敏感度的显著水平p<0.01,其余变量显著水平均小于或接近0.05,由此可知全部经过筛选的模型变量对模型都有较高的相关性。

表8

对于步骤s106,获取待预测旅客的主要出行影响信息,将所述待预测旅客的主要出行影响信息输入所述出行方式预测模型中,将概率最大的出行方式作为,所述待预测旅客的预测出行方式,即上述(预测出行方式信息)。

在上述方法项实施例的基础上,对应提供了装置项实施例。

如图2所示,本发明一实施例提供了一种预测出行方式的装置,包括包括样本数据获取模块、主要个人属性信息提取模块、旅客分类模块、主要出行影响因素信息提取模块、出行预测模型构建模块以及出行预测模块;

所述样本数据获取模块,用于获取若干旅客的出行影响因素信息及所选择的出行方式信息;其中,所述出行影响因素信息包括个人属性信息和出行属性信息;所述个人属性信息包括若干rp调查数据;所述出行属性信息包括若干sp出行调查数据和若干rp出行调查数据;

所述主要个人属性信息提取模块,用于对所述个人属性信息以及所述出行方式信息进行相关性分析,并将所述个人属性信息中,相关性达到预设条件的属性信息,作为主要个人属性信息;

所述旅客分类模块,用于根据所述主要个人属性信息,对各所述旅客进行分类,获得若干旅客类别信息;

所述主要出行影响因素信息提出行影响因素信息中,相关性达到第二预设条件的数据项,作为所述主要出行影取模块,用于将所述旅客类别信息以及所述出行属性信息,作为第二出行影响因素信息,并对所述第二出行影响因素信息以及所述出行方式信息进行相关性分析,继而将所述第二响因素信息;其中,所述主要出行影响因素信息包括至少一项sp出行调查数据和一项rp出行调查数据;

所述出行预测模型构建模块,用于根据所述主要出行影响因素信息构建出行方式预测模型;

所述出行预测模块,用于获取待预测旅客的主要出行影响信息,将所述待预测旅客的主要出行影响信息输入所述出行方式预测模型中,获得所述待预测旅客的预测出行方式信息。

可以理解的是,上述装置项实施例是与本发明方法项实施例相对应的,其可以实现本发明上述任意一项方法项实施例提供的预测旅客出行方式的方法。

需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。所述示意图仅仅是预测出行方式的装置的示例,并不构成对预测出行方式的装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。

通过实施本发明实施例能将sp调查数据以及pr调查数据相结合,基于融合后的数据构建出行预测模型,进行旅客出行方式预测,提高出行方式预测的准确性,使得交通规划更为有效。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1