一种基于出行特征的乘客分类方法及系统与流程

文档序号:19313867发布日期:2019-12-03 23:47阅读:388来源:国知局
一种基于出行特征的乘客分类方法及系统与流程
本发明涉及交通数据的处理
技术领域
,具体涉及一种乘客分类方法及系统。
背景技术
:现有公共交通广告投放模式下,广告商主要考虑广告投放位置、交通枢纽/路线客流量、广告投放时间、广告投放时长等因素进行广告投放。这种统一的、粗放式的广告投放模式缺乏对广告受众的个性化需求分析,导致投放的广告针对性不强,达不到最佳的广告投放效果。另一方面,公共交通服务的质量是公共交通运营商的核心竞争力。但是在目前情况下,公共交通运营商并没有充分考虑不同类型乘客的个性化需求,更没有提供定制化的服务,公共交通服务的质量还待提升。因此,需要一种乘客分类方法,提高交通广告的投放效果和交通的服务质量。技术实现要素:为此,本发明提供一种乘客分类方法及系统,以解决现有技术中,针对乘客的统一的、粗放式的广告投放模式,导致广告投放缺乏针对性和个性化的问题。为了实现上述目的,本发明第一方面提供一种乘客分类方法,包括:采集乘客的乘车数据;对所述乘车数据进行预处理;分析所述预处理后的乘车数据,获得所述乘客的出行特征;依据所述出行特征对所述乘客进行分类;按照乘客分类结果向乘客投放信息。进一步地,所述对乘车数据进行预处理,包括:剔除所述乘车数据中出行频次小于第一预设阈值的乘客对应的乘车数据,所述第一预设阈值为设定的数值。进一步地,所述对所述预处理后的乘车数据进行分析,获得所述乘客的出行特征,包括:从所述乘客的乘车数据中提取乘车时间和乘车地点;统计所述乘客的乘车时间和乘车地点,获得所述乘客的出行特征,所述出行特征包括月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点。进一步地,所述依据出行特征对所述乘客进行分类,包括:设定出行分类特征阈值;根据所述乘客的出行特征获得所述乘客的出行特征值;根据所述出行分类特征阈值和所述乘客的出行特征值确定该乘客的分类。进一步地,所述依据出行特征对所述乘客进行分类,还包括:获取乘客编号;基于不同所述乘客分类分别赋予对应的特征属性值;将所述乘客的乘客编号和特征属性值关联生成乘客与乘客分类对应表。为了实现上述目的,本发明第二方面提供一种乘客分类系统,包括:采集模块,用于采集乘客的乘车数据;预处理模块,用于对所述乘车数据进行预处理;分析模块,用于分析所述预处理后的乘车数据,获得所述乘客的出行特征;分类模块,用于依据所述出行特征对所述乘客进行分类;信息投放模块,用于按照乘客分类结果向乘客投放信息。进一步地,所述预处理模块是将所述乘车数据中出行频次小于第一预设阈值的乘客对应的乘车数据剔除,所述第一预设阈值为设定的数值。进一步地,所述分析模块包括:提取单元,用于从所述乘客的乘车数据中提取乘车时间和乘车地点;统计单元,用于统计所述乘客的乘车时间和乘车地点,获得所述乘客的出行特征,所述出行特征包括月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点。进一步地,所述分类模块包括:阈值设定单元,用于设定出行分类特征阈值;出行特征值获取单元,用于根据所述乘客的出行特征获得所述乘客的出行特征值;乘客分类单元,用于根据所述出行分类特征阈值和所述乘客的出行特征值确定该乘客的分类。进一步地,所述分类模块还包括:乘客编号单元,用于获取乘客编号;赋值单元,用于基于不同所述乘客分类分别赋予对应的特征属性值;分类表生产单元,用于将所述乘客的乘客编号和特征属性值关联生成乘客与乘客分类对应表。本发明具有如下优点:本发明提供的乘客分类方法,通过采集乘客的乘车数据,对乘车数据进行预处理,并分析预处理后的乘车数据,获得乘客的出行特征,依据该出行特征对乘客进行分类,并按照乘客分类结果向乘客投放信息。该方法基于出行特征对乘客进行了分类,以供广告商或其他信息投送方充分考虑乘客作为信息受众的个性化需求,从而更有指向性和针对性地投放广告,提高广告投放效果。附图说明附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:图1是本实施例提供的一种乘客分类方法的流程图;图2是本实施例提供的一种乘客分类系统的原理框图。通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。具体实施方式以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。图1是本发明第一实施例提供的一种乘客分类方法的流程图,如图1所示,该乘客分类方法包括如下步骤:步骤s101,采集乘客的乘车数据。在一个实施方式中,乘客乘车时会产生相应的乘车数据,包括乘车时间数据和乘车地点数据。具体地,假定在某一段时间内某乘客有乘车行为,产生了相应的乘车数据,包括该乘客在这段时间内参与乘车的天数,其中乘客在工作日参与乘车的天数,乘客每天乘车的次数,乘客每次乘车的进站时间和出站时间,乘客每次乘车的进站地点和出站地点。采集该乘客的乘车数据,包括但不限于乘车总天数、工作日乘车天数、每天乘车的次数、乘车进站时间、乘车出站时间、乘车进站地点和乘车出站地点。利用同样的方式采集其他乘客的乘车数据,形成不同乘客的乘车数据集合。如,乘客a在最近段时间内有乘车行为。具体地,乘客a在这该段时间内参与乘车的天数为n,其中在工作日参与乘车的天数为nw。乘客a每天乘车的次数集合为c={c1,c2,…ci…,cn},其中i为乘客在这个月内乘车的第i天,ci为乘客在第i天的乘车次数。乘客每次乘车的进站时间为te,乘客每次乘车的出站时间为to,乘客每次乘车的进站地点为adde和出站地点addo。采集乘客a在该段时间内的乘车数据,包括但不限于乘车总天数n、工作日乘车天数nw、每天乘车的次数ci、乘车进站时间te、乘车出站时间to、乘车进站地点adde和乘车出站地点addo。步骤s102,对乘车数据进行预处理。在一个实施方式中,对乘车数据预处理包括剔除该乘车数据中出行频次小于第一预设阈值的乘客对应的乘车数据,其中第一预设阈值为根据需要设定的数值。具体地,乘车数据为采集得到的多个乘客在某段时间内的乘车数据,包括这些乘客的乘车总天数、工作日乘车天数、每天乘车的次数、乘车进站时间、乘车出站时间、乘车进站地点和乘车出站地点等内容。根据实际需要,设置第一预设阈值,第一预设阈值的属性为乘客出行频次。根据乘客数据中的乘车总天数除以这段时间的总天数,计算得到每个乘客的出行频次,将每个乘客的出行频次与第一预设阈值进行比较。如果该乘客的出行频次小于第一预设阈值,则将该乘客的乘车数据从总的乘车数据中删除,最终得到筛选完的数据即为预处理后的数据。如,分别采集乘客a、乘客b和乘客c三位乘客的乘车数据。设置第一预设阈值为thr1,第一预设阈值thr1为设置的乘客最小出行频次。采集乘客a在某段时间内的乘车数据。该段时间的总天数为n1,乘客a在这段时间内的乘车总天数na、工作日乘车天数nwa、每天乘车的次数cai、乘车进站时间taei、乘车出站时间taoi、乘车进站地点addaei和乘车出站地点addaoi。乘客a的出行频次fa由fa=na/n1计算得到。采集乘客b在某段时间内的乘车数据。该段时间的总天数为n2,乘客b在这段时间内的乘车总天数nb、工作日乘车天数nwb、每天乘车的次数cbi、乘车进站时间tbei、乘车出站时间tboi、乘车进站地点addbei和乘车出站地点addboi。乘客b的出行频次fb由fb=nb/n2计算得到。采集乘客c在某段时间内的乘车数据。该段时间的总天数为n3,乘客c在这段时间内的乘车总天数nc、工作日乘车天数nwc、每天乘车的次数cci、乘车进站时间tcei、乘车出站时间tcoi、乘车进站地点addcei和乘车出站地点addcoi。乘客c的出行频次fc由fc=nc/n3计算得到。将乘客a的出行频率fa、乘客b的出行频次fb、乘客c的出行频次fc分别与第一预设阈值thr1作比较。如果乘客c的出行频次fc小于第一预设阈值thr1,乘客a的出行频率fa、乘客b的出行频次fb大于第一预设阈值thr1,则将乘客c的乘车数据剔除,得到只有乘客a和乘客b的乘车数据为预处理完成的数据。步骤s103,分析预处理后的乘车数据,获得乘客的出行特征。在一个实施方式中,从预处理后的乘车数据中提取每个乘客的乘车时间和乘车地点数据。统计提取的乘客乘车时间和乘车地点数据,获得该乘客的出行特征,其中出行特征包括乘客的月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点。具体地,预处理后的乘车数据包括若干个乘客的乘车数据,分别提取每个乘客的乘车时间数据和乘车地点数据,包括该乘客的乘车总天数、工作日乘车天数、每天乘车的次数、乘车进站时间、乘车出站时间、乘车进站地点和乘车出站地点等数据。对上述乘客乘车时间数据和乘车地点数据进行统计,得到该乘客的乘车时间统计数据和乘车地点统计数据,包括月乘车总天数、月工作日乘车天数、单次乘车时间、日乘车频率、进站地点、出站地点。如,预处理后的乘车数据中包含有四个乘客的乘车数据,分别是乘客a、乘客b、乘客c和乘客d。假设本次进行乘车数据统计的统计周期为一个月,且一个月有n天,其中工作日为nw天。从乘客数据中提取乘客a的乘车数据,具体提取乘客a的乘车时间和乘客地点数据,假设该段时间总天数为n1,其中工作日天数为nwa1,乘客a的乘车总天数为na,工作日乘车天数为nwa,每天乘车的次数为cai,工作日乘车的次数为cwai,乘车进站时间为taei,乘车出站时间为taoi,乘车进站地点为addaei,乘车出站地点为addaoi。则根据乘客a在n1天内的乘车时间和乘客地点数据可以得到乘客a的月乘车统计数据,具体包括乘客a的月乘车总天数na(sd),月工作日乘车天数nwa(sd)、单次乘车时间tai(sd)、日乘车频率fa(sd)、工作日乘车频率fwa(sd)、进站地点addaei(sd)、出站地点addaoi(sd)。其中:月乘车总天数na(sd)=na*n/n1;月工作日乘车天数nwa(sd)=nwa*nw/nwa1;单次乘车时间tai(sd)=taoi-taei;日乘车频率fa(sd)=cai*n/na;工作日乘车频率fwa(sd)=cwai*nw/nwa。从乘客数据中提取乘客b的乘车数据,具体提取乘客b的乘车时间和乘客地点数据,假设该段时间总天数为n2,其中工作日天数为nwb2,乘客b的乘车总天数为nb,工作日乘车天数为nwb,每天乘车的次数为cbi,工作日乘车的次数为cwbi,乘车进站时间为tbei,乘车出站时间为tboi,乘车进站地点为addbei,乘车出站地点为addboi。则根据乘客b在n2天内的乘车时间和乘客地点数据可以得到乘客b的月乘车统计数据,具体包括乘客b的月乘车总天数nb(sd),月工作日乘车天数nwb(sd)、单次乘车时间tbi(sd)、日乘车频率fb(sd)、工作日乘车频率fwb(sd)、进站地点addbei(sd)、出站地点addboi(sd)。其中:月乘车总天数nb(sd)=nb*n/n2;月工作日乘车天数nwb(sd)=nwb*nw/nwb2;单次乘车时间tbi(sd)=tboi-tbei;日乘车频率fb(sd)=cbi*n/nb;工作日乘车频率fwb(sd)=cwbi*nw/nwb。从乘客数据中提取乘客c的乘车数据,具体提取乘客c的乘车时间和乘客地点数据,假设该段时间总天数为n3,其中工作日天数为nwc3,乘客c的乘车总天数为nc,工作日乘车天数为nwc,每天乘车的次数为cci,工作日乘车的次数为cwci,乘车进站时间为tcei,乘车出站时间为tcoi,乘车进站地点为addcei,乘车出站地点为addcoi。则根据乘客c在n3天内的乘车时间和乘客地点数据可以得到乘客c的月乘车统计数据,具体包括乘客c的月乘车总天数nc(sd),月工作日乘车天数nwc(sd)、工作日乘车频率fwc(sd)、单次乘车时间tci(sd)、日乘车频率fc(sd)、进站地点addcei(sd)、出站地点addcoi(sd)。其中:月乘车总天数nc(sd)=nc*n/n3;月工作日乘车天数nwc(sd)=nwc*nw/nwc3;单次乘车时间tci(sd)=tcoi-tcei;日乘车频率fc(sd)=cci*n/nc;工作日乘车频率fwc(sd)=cwci*nw/nwc。从乘客数据中提取乘客d的乘车数据,具体提取乘客d的乘车时间和乘客地点数据,假设该段时间总天数为n4,其中工作日天数为nwd4,乘客d的乘车总天数为nd,工作日乘车天数为nwd,每天乘车的次数为cdi,工作日乘车的次数为cwdi,乘车进站时间为tdei,乘车出站时间为tdoi,乘车进站地点为adddei,乘车出站地点为adddoi。则根据乘客d在n4天内的乘车时间和乘客地点数据可以得到乘客d的月乘车统计数据,具体包括乘客d的月乘车总天数nd(sd),月工作日乘车天数nwd(sd)、单次乘车时间tdi(sd)、日乘车频率fd(sd)、工作日乘车频率fwd(sd)、进站地点adddei(sd)、出站地点adddoi(sd)。其中:月乘车总天数nd(sd)=nd*n/n4;月工作日乘车天数nwd(sd)=nwd*nw/nwd4;单次乘车时间tdi(sd)=tdoi-tdei;日乘车频率fd(sd)=cdi*n/nd;工作日乘车频率fwd(sd)=cwdi*nw/nwd。步骤s104,依据出行特征对乘客进行分类。在一个实施方式中,依据出行特征对乘客进行分类,首先需要设定出行分类特征阈值,根据该乘客的出行特征获得乘客的出行特征值,并根据出行分类特征阈值和该乘客的出行特征值确定该乘客的出行分类。具体地,首先设定出行分类特征阈值,包括月乘车总天数阈值、月工作日乘车天数阈值、单次乘车时间最小阈值、单次乘车时间最大阈值、工作日乘车频率第一阈值和工作日乘车频率第二阈值。乘客数据中包含有若干个乘客的乘车数据,分别根据该乘客的出行特征得到对应的出行特征值。如,某一乘客的出行特征包括该乘客的月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点,与上述出行特征对应的出行特征值包括月乘车天数值、月工作日乘车天数值、单次乘车时间值、日乘车频率值、工作日乘车频率值、进站地点值、出站地点值。将乘客的出行特征值与设定的月乘车总天数阈值、月工作日乘车天数阈值、单次乘车时间最小阈值、单次乘车时间最大阈值、工作日乘车频率第一阈值和工作日乘车频率第二阈值进行比较,并分别针对比较结果进行判断,最终可以确定该乘客的出行分类。具体地:首先比较该乘客每月乘车天数值和月乘车总天数阈值,如果乘客月乘车天数值小于月乘车天数阈值,则该乘客为随机出行类乘客,否则进一步比较该乘客的单次乘车时间值与单次乘车时间最大阈值;如果乘客的单次乘车时间值大于等于单次乘车时间最大阈值,则进一步判断乘客乘车的进站地点和出站地点是否相同,如果乘客乘车的进站地点和出站地点相同,则该乘客为乞讨卖艺出行类乘客,否则为随机出行类乘客;如果乘客的单次乘车时间值小于单次乘车时间阈值,则进一步比较该乘客的月工作日乘车天数值与月工作日乘车天数阈值,如果该乘客的月工作日乘车天数值小于月工作日乘车天数阈值,则该乘客为随机出行类乘客,否则进一步对乘客日乘车频率值与日乘车频率第一阈值和日乘车第二阈值分别进行比较;如果乘客日乘车频率值等于日乘车频率第一阈值,则进一步判断乘客是否满足第一次乘车进站地点为第二次乘车的出站地点,第二次乘车的进站地点为第一次乘车的出站地点,如果不满足,则该乘客为随机出行类乘客,否则进一步判断该乘客第一次乘车时间是否为早高峰时段,且第二次乘车是否为晚高峰时段,;如果该乘客第一次乘车时间为早高峰时段,且第二次乘车为晚高峰时段,则该乘客为通勤类出行乘客,否则为随机出行类乘客;如果乘客日乘车频率值等于日乘车频率第二阈值,则进一步比较该乘客单次乘车时间值与单次乘车时间最小阈值,如果该乘客单次乘车时间值大于单次乘车时间最小阈值,则该乘客为随机类出行乘客,如果该乘客单次乘车时间值小于等于单次乘车时间最小阈值,则进一步判断乘客是否满足第一次乘车进站地点为第二次乘车的出站地点,第二次乘车进站地点为第一次乘车的出站地点,第三次乘车进站地点和出站地点与第一次乘车相同,第四次乘车进站地点和出站地点与第二次乘车相同,且第三次乘车进站地点为第四次乘车的出站地点,第四次乘车进站地点为第三次乘车的出站地点;如果满足,则该乘客为家长出行类乘客,否则为随机出行类乘客;如果乘客日乘车频率既不等于日乘车频率第一阈值也不等于日乘车第二阈值,该乘客为随机出行类乘客。通过上述过程得到乘客的出行分类后,获取每个乘客的编号,实现对乘客的唯一性标识。同时,基于不同的乘客分类,分别赋予该乘客分类对应的特征属性值,并将乘客的乘客编号和其特征属性值关联起来,最后生成关于乘客与乘客分类的对应表格。如,设定月乘车总天数阈值为nthr、月工作日乘车天数阈值为nwthr、单次乘车时间最小阈值tthrmin、单次乘车时间最大阈值tthrmax、工作日乘车频率第一阈值为cwthr1和工作日乘车频率第二阈值为cwthr2。乘车数据中包括包含有四个乘客的乘车数据,分别对应乘客a、乘客b、乘客c和乘客d。从上述乘车数据中分别获得乘客a、乘客b、乘客c和乘客d出行特征对应的出行特征值。乘客a的月乘车总天数值为na(sd),月工作日乘车天数值为nwa(sd)、单次乘车时间值为tai(sd)、日乘车频率值为fa(sd)、日乘车频率值为fwa(sd)、进站地点值为addaei(sd)、出站地点值为addaoi(sd)。其中,月乘车总天数值na(sd)大于月乘车总天数阈值为nthr,月工作日乘车天数值为nwa(sd)大于月工作日乘车天数阈值为nwthr,单次乘车时间值为tai(sd)小于单次乘车时间最大阈值tthrmax,日乘车频率值为fwa(sd)等于工作日乘车频率第一阈值为cwthr1,且第一次乘车进站地点为第二次乘车的出站地点,第二次乘车的进站地点为第一次乘车的出站地点,同时,第一次乘车时间为早高峰时段,且第二次乘车为晚高峰时段。基于乘客a的以上出行特征值,判断乘客a为通勤类出行乘客。乘客b的月乘车总天数值为nb(sd),月工作日乘车天数值为nwb(sd)、单次乘车时间值为tbi(sd)、日乘车频率值为fb(sd)、日乘车频率值为fwb(sd)、进站地点值为addbei(sd)、出站地点值为addboi(sd)。其中,月乘车总天数值nb(sd)大于月乘车总天数阈值为nthr,月工作日乘车天数值为nwb(sd)大于月工作日乘车天数阈值为nwthr,单次乘车时间值为tbi(sd)小于等于单次乘车时间最小阈值tthrmin,日乘车频率值为fwb(sd)等于工作日乘车频率第二阈值为cwthr2,且第一次乘车进站地点为第二次乘车的出站地点,第二次乘车进站地点为第一次乘车的出站地点,第三次乘车进站地点和出站地点与第一次乘车相同,第四次乘车进站地点和出站地点与第二次乘车相同,且第三次乘车进站地点为第四次乘车的出站地点,第四次乘车进站地点为第三次乘车的出站地点。基于乘客b的以上出行特征值,判断乘客b为家长类出行乘客。乘客c的月乘车总天数值为nc(sd),月工作日乘车天数值为nwc(sd)、单次乘车时间值为tci(sd)、日乘车频率值为fc(sd)、日乘车频率值为fwc(sd)、进站地点值为addcei(sd)、出站地点值为addcoi(sd)。其中,月乘车总天数值为nc(sd)大于月乘车总天数阈值为nthr,单次乘车时间值为tci(sd)大于单次乘车时间最大阈值tthrmax,其乘车进站地点等于乘车出站地点。基于乘客c的以上出行特征值,判断乘客c为乞讨卖艺类出行乘客。乘客d的月乘车总天数值为nd(sd),月工作日乘车天数值为nwd(sd)、单次乘车时间值为tdi(sd)、日乘车频率值为fd(sd)、日乘车频率值为fwd(sd)、进站地点值为adddei(sd)、出站地点值为adddoi(sd)。其中,月乘车总天数值为nd(sd)小于月乘车总天数阈值为nthr,基于乘客d的以上出行特征值,判断乘客d为随机类出行乘客。通过上述过程得到乘客a属于通勤类出行乘客、乘客b属于家长类出行乘客、乘客c属于乞讨卖艺类出行乘客,乘客d属于随机出行类乘客。分别获取每个乘客的编号,并假设获取的乘客a的乘客编号为codea,乘客b的乘客编号为codeb,乘客c的乘客编号为codec,乘客d的乘客编号为coded。同时,分别赋予通勤类出行乘客对应的特征属性值为wook,家长类出行乘客对应的特征属性值为parent,乞讨卖艺类出行乘客对应的特征属性值为beg,随机出行类乘客对应的特征属性值为random。将乘客a的乘客编号codea与其对应的通勤类出行特征属性值wook,乘客b的乘客编号codeb与其对应的家长类出行乘客特征属性值parent,乘客c的乘客编号codec与其对应的乞讨卖艺类出行乘客特征属性值beg,乘客d的乘客编号coded与其对应的随机出行类乘客特征属性值random关联起来,最后生成关于乘客与乘客分类的对应表格,即:乘客编号特征属性值codeawookcodebparentcodecbegcodedrandom步骤s105,按照乘客分类结果向乘客投放信息。在一个实施方式中,乘客分类分别为通勤出行乘客分类、家长出行乘客分类、乞讨卖艺出行乘客分类,随机出行乘客分类。信息投送方可根据自己的需求,个性化向不同分类的乘客分别投送相应的信息。如,广告商可按照乘客分类,分别向通勤出行类乘客、家长出行类乘客和随机出行类乘客投送定制化的广告内容。地铁运营商可向乞讨卖艺出行类乘客推送禁止乞讨卖艺的相关法律法规。图2是根据另一示例性实施例示出的一种乘客分类系统的原理框图,该乘客分类系统可以通过软件、硬件或者两者的结合实现其部分或者全部。该乘客分类系统可以包括:采集模块210、预处理模220、分析模块230、分类模块240、信息投放模块250。采集模块210,用于采集乘客的乘车数据。在一个实施方式中,乘客乘车时会产生相应的乘车数据,包括乘车时间数据和乘车地点数据。具体地,假定在某一段时间内某乘客有乘车行为,产生了相应的乘车数据,包括该乘客在这段时间内参与乘车的天数,其中乘客在工作日参与乘车的天数,乘客每天乘车的次数,乘客每次乘车的进站时间和出站时间,乘客每次乘车的进站地点和出站地点。采集该乘客的乘车数据,包括但不限于乘车总天数、工作日乘车天数、每天乘车的次数、乘车进站时间、乘车出站时间、乘车进站地点和乘车出站地点。利用同样的方式采集其他乘客的乘车数据,形成不同乘客的乘车数据集合。如,乘客a在最近一个月内有乘车行为。具体地,乘客a在这一个月内参与乘车的天数为n,其中在工作日参与乘车的天数为nw。乘客每天乘车的次数集合为c={c1,c2,…ci…,cn},其中i为乘客在这个月内乘车的第i天,ci为乘客在第i天的乘车次数。乘客每次乘车的进站时间为te,乘客每次乘车的出站时间为to,乘客每次乘车的进站地点为adde和出站地点addo。采集乘客a在这一个月内的乘车总天数n、工作日乘车天数nw、每天乘车的次数ci、乘车进站时间te、乘车出站时间to、乘车进站地点adde和乘车出站地点addo。预处理模块220,用于对乘车数据进行预处理。在一个实施方式中,对乘车数据预处理包括剔除该乘车数据中出行频次小于第一预设阈值的乘客对应的乘车数据,其中第一预设阈值为根据需要设定的数值。具体地,乘车数据为采集得到的多个乘客在某段时间内的乘车数据,包括这些乘客的乘车总天数、工作日乘车天数、每天乘车的次数、乘车进站时间、乘车出站时间、乘车进站地点和乘车出站地点等内容。根据实际需要,设置第一预设阈值,第一预设阈值的属性为乘客出行频次。根据乘客数据中的乘车总天数除以这段时间的总天数,计算得到每个乘客的出行频次,将每个乘客的出行频次与第一预设阈值进行比较。如果该乘客的出行频次小于第一预设阈值,则将该乘客的乘车数据从总的乘车数据中删除,最终得到筛选完的数据即为预处理后的数据。如,分别采集乘客a、乘客b和乘客c三位乘客的乘车数据。设置第一预设阈值为thr1,第一预设阈值thr1为设置的乘客最小出行频次。采集乘客a在某段时间内的乘车数据。该段时间的总天数为n1,乘客a在这段时间内的乘车总天数na、工作日乘车天数nwa、每天乘车的次数cai、乘车进站时间taei、乘车出站时间taoi、乘车进站地点addaei和乘车出站地点addaoi。乘客a的出行频次fa由fa=na/n1计算得到。采集乘客b在某段时间内的乘车数据。该段时间的总天数为n2,乘客b在这段时间内的乘车总天数nb、工作日乘车天数nwb、每天乘车的次数cbi、乘车进站时间tbei、乘车出站时间tboi、乘车进站地点addbei和乘车出站地点addboi。乘客b的出行频次fb由fb=nb/n2计算得到。采集乘客c在某段时间内的乘车数据。该段时间的总天数为n3,乘客c在这段时间内的乘车总天数nc、工作日乘车天数nwc、每天乘车的次数cci、乘车进站时间tcei、乘车出站时间tcoi、乘车进站地点addcei和乘车出站地点addcoi。乘客c的出行频次fc由fc=nc/n3计算得到。将乘客a的出行频率fa、乘客b的出行频次fb、乘客c的出行频次fc分别与第一预设阈值thr1作比较。如果乘客c的出行频次fc小于第一预设阈值thr1,乘客a的出行频率fa、乘客b的出行频次fb大于第一预设阈值thr1,则将乘客c的乘车数据剔除,得到只有乘客a和乘客b的乘车数据为预处理完成的数据。分析模块230,用于分析预处理后的乘车数据,获得乘客的出行特征。在一个实施例中,分析模块230包括:提取单元231,用于从乘客的乘车数据中提取乘车时间和乘车地点。在一个实施方式中,从预处理后的乘车数据中提取每个乘客的乘车时间和乘车地点数据。统计提取的乘客乘车时间和乘车地点数据,获得该乘客的出行特征,其中出行特征包括乘客的月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点。具体地,预处理后的乘车数据包括若干个乘客的乘车数据,分别提取每个乘客的乘车时间数据和乘车地点数据,包括该乘客的乘车总天数、工作日乘车天数、每天乘车的次数、乘车进站时间、乘车出站时间、乘车进站地点和乘车出站地点等数据。如,预处理后的乘车数据中包含有四个乘客的乘车数据,分别是乘客a、乘客b、乘客c和乘客d。从乘客数据中提取乘客a的乘车数据,具体提取乘客a的乘车时间和乘客地点数据,假设该段时间总天数为n1,其中工作日天数为nwa1,乘客a的乘车总天数为na,工作日乘车天数为nwa,每天乘车的次数为cai,工作日乘车的次数为cwai,乘车进站时间为taei,乘车出站时间为taoi,乘车进站地点为addaei,乘车出站地点为addaoi。从乘客数据中提取乘客b的乘车数据,具体提取乘客b的乘车时间和乘客地点数据,假设该段时间总天数为n2,其中工作日天数为nwb2,乘客b的乘车总天数为nb,工作日乘车天数为nwb,每天乘车的次数为cbi,工作日乘车的次数为cwbi,乘车进站时间为tbei,乘车出站时间为tboi,乘车进站地点为addbei,乘车出站地点为addboi。从乘客数据中提取乘客c的乘车数据,具体提取乘客c的乘车时间和乘客地点数据,假设该段时间总天数为n3,其中工作日天数为nwc3,乘客c的乘车总天数为nc,工作日乘车天数为nwc,每天乘车的次数为cci,工作日乘车的次数为cwci,乘车进站时间为tcei,乘车出站时间为tcoi,乘车进站地点为addcei,乘车出站地点为addcoi。从乘客数据中提取乘客d的乘车数据,具体提取乘客d的乘车时间和乘客地点数据,假设该段时间总天数为n4,其中工作日天数为nwd4,乘客d的乘车总天数为nd,工作日乘车天数为nwd,每天乘车的次数为cdi,工作日乘车的次数为cwdi,乘车进站时间为tdei,乘车出站时间为tdoi,乘车进站地点为adddei,乘车出站地点为adddoi。统计单元232,用于统计乘客的乘车时间和乘车地点,获得乘客的出行特征,出行特征包括月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点。在一个实施方式中,设定进行统计的统计周期,基于该统计周期对上述乘客乘车时间数据和乘车地点数据进行统计,得到该乘客的乘车时间统计数据和乘车地点统计数据,包括月乘车总天数、月工作日乘车天数、单次乘车时间、日乘车频率、进站地点、出站地点。如,假设本次进行乘车数据统计的统计周期为一个月,且一个月有n天,其中工作日为nw天。根据乘客a在n1天内的乘车时间和乘客地点数据可以得到乘客a的月乘车统计数据,具体包括乘客a的月乘车总天数na(sd),月工作日乘车天数nwa(sd)、单次乘车时间tai(sd)、日乘车频率fa(sd)、工作日乘车频率fwa(sd)、进站地点addaei(sd)、出站地点addaoi(sd)。其中:月乘车总天数na(sd)=na*n/n1;月工作日乘车天数nwa(sd)=nwa*nw/nwa1;单次乘车时间tai(sd)=taoi-taei;日乘车频率fa(sd)=cai*n/na;工作日乘车频率fwa(sd)=cwai*nw/nwa。根据乘客b在n2天内的乘车时间和乘客地点数据可以得到乘客b的月乘车统计数据,具体包括乘客b的月乘车总天数nb(sd),月工作日乘车天数nwb(sd)、单次乘车时间tbi(sd)、日乘车频率fb(sd)、工作日乘车频率fwb(sd)、进站地点addbei(sd)、出站地点addboi(sd)。其中:月乘车总天数nb(sd)=nb*n/n2;月工作日乘车天数nwb(sd)=nwb*nw/nwb2;单次乘车时间tbi(sd)=tboi-tbei;日乘车频率fb(sd)=cbi*n/nb;工作日乘车频率fwb(sd)=cwbi*nw/nwb。根据乘客c在n3天内的乘车时间和乘客地点数据可以得到乘客c的月乘车统计数据,具体包括乘客c的月乘车总天数nc(sd),月工作日乘车天数nwc(sd)、工作日乘车频率fwc(sd)、单次乘车时间tci(sd)、日乘车频率fc(sd)、进站地点addcei(sd)、出站地点addcoi(sd)。其中:月乘车总天数nc(sd)=nc*n/n3;月工作日乘车天数nwc(sd)=nwc*nw/nwc3;单次乘车时间tci(sd)=tcoi-tcei;日乘车频率fc(sd)=cci*n/nc;工作日乘车频率fwc(sd)=cwci*nw/nwc。根据乘客d在n4天内的乘车时间和乘客地点数据可以得到乘客d的月乘车统计数据,具体包括乘客d的月乘车总天数nd(sd),月工作日乘车天数nwd(sd)、单次乘车时间tdi(sd)、日乘车频率fd(sd)、工作日乘车频率fwd(sd)、进站地点adddei(sd)、出站地点adddoi(sd)。其中:月乘车总天数nd(sd)=nd*n/n4;月工作日乘车天数nwd(sd)=nwd*nw/nwd4;单次乘车时间tdi(sd)=tdoi-tdei;日乘车频率fd(sd)=cdi*n/nd;工作日乘车频率fwd(sd)=cwdi*nw/nwd。分类模块240,用于依据出行特征对乘客进行分类。在一个实施例中,分类模块240包括:阈值设定单元241,用于设定出行分类特征阈值。在一个实施方式中,依据出行特征对乘客进行分类,首先需要设定出行分类特征阈值,根据该乘客的出行特征获得乘客的出行特征值,并根据出行分类特征阈值和该乘客的出行特征值确定该乘客的出行分类。具体地,首先设定出行分类特征阈值,包括月乘车总天数阈值、月工作日乘车天数阈值、单次乘车时间最小阈值、单次乘车时间最大阈值、工作日乘车频率第一阈值和工作日乘车频率第二阈值。出行特征值获取单元242,用于根据乘客的出行特征获得乘客的出行特征值。在一个实施方式中,乘客数据中包含有若干个乘客的乘车数据,分别根据该乘客的出行特征得到对应的出行特征值。如,某一乘客的出行特征包括该乘客的月乘车天数、月工作日乘车天数、单次乘车时间、日乘车频率、工作日乘车频率、进站地点、出站地点,与上述出行特征对应的出行特征值包括月乘车天数值、月工作日乘车天数值、单次乘车时间值、日乘车频率值、工作日乘车频率值、进站地点值、出站地点值。乘客分类单元243,用于根据出行分类特征阈值和乘客的出行特征值确定该乘客的分类。在一个实施方式中,假设出行分类特征阈值和乘客的出行特征值已知,那么将乘客的出行特征值与设定的月乘车总天数阈值、月工作日乘车天数阈值、单次乘车时间最小阈值、单次乘车时间最大阈值、工作日乘车频率第一阈值和工作日乘车频率第二阈值分别进行比较,并分别针对比较结果进行判断,最终可以确定该乘客的出行分类。具体地:首先比较该乘客每月乘车天数值和月乘车总天数阈值,如果乘客月乘车天数值小于月乘车天数阈值,则该乘客为随机出行类乘客,否则进一步比较该乘客的单次乘车时间值与单次乘车时间最大阈值;如果乘客的单次乘车时间值大于等于单次乘车时间最大阈值,则进一步判断乘客乘车的进站地点和出站地点是否相同,如果乘客乘车的进站地点和出站地点相同,则该乘客为乞讨卖艺出行类乘客,否则为随机出行类乘客;如果乘客的单次乘车时间值小于单次乘车时间阈值,则进一步比较该乘客的月工作日乘车天数值与月工作日乘车天数阈值,如果该乘客的月工作日乘车天数值小于月工作日乘车天数阈值,则该乘客为随机出行类乘客,否则进一步对乘客日乘车频率值与日乘车频率第一阈值和日乘车第二阈值分别进行比较;如果乘客日乘车频率值等于日乘车频率第一阈值,则进一步判断乘客是否满足第一次乘车进站地点为第二次乘车的出站地点,第二次乘车的进站地点为第一次乘车的出站地点,如果不满足,则该乘客为随机出行类乘客,否则进一步判断该乘客第一次乘车时间是否为早高峰时段,且第二次乘车是否为晚高峰时段,;如果该乘客第一次乘车时间为早高峰时段,且第二次乘车为晚高峰时段,则该乘客为通勤类出行乘客,否则为随机出行类乘客;如果乘客日乘车频率值等于日乘车频率第二阈值,则进一步比较该乘客单次乘车时间值与单次乘车时间最小阈值,如果该乘客单次乘车时间值大于单次乘车时间最小阈值,则该乘客为随机类出行乘客,如果该乘客单次乘车时间值小于等于单次乘车时间最小阈值,则进一步判断乘客是否满足第一次乘车进站地点为第二次乘车的出站地点,第二次乘车进站地点为第一次乘车的出站地点,第三次乘车进站地点和出站地点与第一次乘车相同,第四次乘车进站地点和出站地点与第二次乘车相同,且第三次乘车进站地点为第四次乘车的出站地点,第四次乘车进站地点为第三次乘车的出站地点;如果满足,则该乘客为家长出行类乘客,否则为随机出行类乘客;如果乘客日乘车频率既不等于日乘车频率第一阈值也不等于日乘车第二阈值,该乘客为随机出行类乘客。通过上述过程得到乘客的出行分类后,获取每个乘客的编号,实现对乘客的唯一性标识。同时,基于不同的乘客分类,分别赋予该乘客分类对应的特征属性值,并将乘客的乘客编号和其特征属性值关联起来,最后生成关于乘客与乘客分类的对应表格。如,阈值设定单元241设定月乘车总天数阈值为nthr、月工作日乘车天数阈值为nwthr、单次乘车时间最小阈值tthrmin、单次乘车时间最大阈值tthrmax、工作日乘车频率第一阈值为cwthr1和工作日乘车频率第二阈值为cwthr2。乘车数据中包括包含有四个乘客的乘车数据,分别对应乘客a、乘客b、乘客c和乘客d。利用出行特征值获取单元242从上述乘车数据中分别获得乘客a、乘客b、乘客c和乘客d出行特征对应的出行特征值。乘客a的月乘车总天数值为na(sd),月工作日乘车天数值为nwa(sd)、单次乘车时间值为tai(sd)、日乘车频率值为fa(sd)、日乘车频率值为fwa(sd)、进站地点值为addaei(sd)、出站地点值为addaoi(sd)。其中,月乘车总天数值na(sd)大于月乘车总天数阈值为nthr,月工作日乘车天数值为nwa(sd)大于月工作日乘车天数阈值为nwthr,单次乘车时间值为tai(sd)小于单次乘车时间最大阈值tthrmax,日乘车频率值为fwa(sd)等于工作日乘车频率第一阈值为cwthr1,且第一次乘车进站地点为第二次乘车的出站地点,第二次乘车的进站地点为第一次乘车的出站地点,同时,第一次乘车时间为早高峰时段,且第二次乘车为晚高峰时段。基于乘客a的以上出行特征值,利用乘客分类单元243得到乘客a为通勤类出行乘客。乘客b的月乘车总天数值为nb(sd),月工作日乘车天数值为nwb(sd)、单次乘车时间值为tbi(sd)、日乘车频率值为fb(sd)、日乘车频率值为fwb(sd)、进站地点值为addbei(sd)、出站地点值为addboi(sd)。其中,月乘车总天数值nb(sd)大于月乘车总天数阈值为nthr,月工作日乘车天数值为nwb(sd)大于月工作日乘车天数阈值为nwthr,单次乘车时间值为tbi(sd)小于等于单次乘车时间最小阈值tthrmin,日乘车频率值为fwb(sd)等于工作日乘车频率第二阈值为cwthr2,且第一次乘车进站地点为第二次乘车的出站地点,第二次乘车进站地点为第一次乘车的出站地点,第三次乘车进站地点和出站地点与第一次乘车相同,第四次乘车进站地点和出站地点与第二次乘车相同,且第三次乘车进站地点为第四次乘车的出站地点,第四次乘车进站地点为第三次乘车的出站地点。基于乘客b的以上出行特征值,利用乘客分类单元243得到乘客b为家长类出行乘客。乘客c的月乘车总天数值为nc(sd),月工作日乘车天数值为nwc(sd)、单次乘车时间值为tci(sd)、日乘车频率值为fc(sd)、日乘车频率值为fwc(sd)、进站地点值为addcei(sd)、出站地点值为addcoi(sd)。其中,月乘车总天数值为nc(sd)大于月乘车总天数阈值为nthr,单次乘车时间值为tci(sd)大于单次乘车时间最大阈值tthrmax,其乘车进站地点等于乘车出站地点。基于乘客c的以上出行特征值,利用乘客分类单元243得到乘客c为乞讨卖艺类出行乘客。乘客d的月乘车总天数值为nd(sd),月工作日乘车天数值为nwd(sd)、单次乘车时间值为tdi(sd)、日乘车频率值为fd(sd)、日乘车频率值为fwd(sd)、进站地点值为adddei(sd)、出站地点值为adddoi(sd)。其中,月乘车总天数值为nd(sd)小于月乘车总天数阈值为nthr,基于乘客d的以上出行特征值,利用乘客分类单元243得到乘客d为随机类出行乘客。乘客编号单元244,用于获取乘客编号。在一个实施方式中,分别对乘客进行编号,获得乘客的乘客编号,实现对乘客的唯一性标识。如乘客数据中包括四位乘客,分别对这四位乘客编号,得到乘客a的乘客编号为codea,乘客b的乘客编号为codeb,乘客c的乘客编号为codec,乘客d的乘客编号为coded。赋值单元245,用于基于不同乘客分类分别赋予对应的特征属性值。如,赋予通勤类出行乘客对应的特征属性值为wook,家长类出行乘客对应的特征属性值为parent,乞讨卖艺类出行乘客对应的特征属性值为beg,随机出行类乘客对应的特征属性值为random。分类表生产单元246,用于将乘客的乘客编号和特征属性值关联生成乘客与乘客分类对应表。如,将乘客a的乘客编号codea与其对应的通勤类出行特征属性值wook,乘客b的乘客编号codeb与其对应的家长类出行乘客特征属性值parent,乘客c的乘客编号codec与其对应的乞讨卖艺类出行乘客特征属性值beg,乘客d的乘客编号coded与其对应的随机出行类乘客特征属性值random关联起来,最后生成关于乘客与乘客分类的对应表格,即:乘客编号特征属性值codeawookcodebparentcodecbegcodedrandom信息投放模块250,用于按照乘客分类结果向乘客投放信息。在一个实施方式中,乘客分类分别为通勤出行乘客分类、家长出行乘客分类、乞讨卖艺出行乘客分类,随机出行乘客分类。信息投送方可根据自己的需求,个性化向不同分类的乘客分别投送相应的信息。如,广告商可按照乘客分类,分别向通勤出行类乘客、家长出行类乘客和随机出行类乘客投送定制化的广告内容。地铁运营商可向乞讨卖艺出行类乘客推送禁止乞讨卖艺的相关法律法规。可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1