面向公交车身广告投放线路定制方法、装置及电子设备与流程

文档序号:14451558阅读:155来源:国知局

本发明涉及人工智能和大数据技术领域,特别是一种面向公交车身广告投放线路定制方法、装置及电子设备。



背景技术:

随着城市和公共交通系统的发展,公交已经成为城市居民重要的出行交通工具之一,也是一种渗透力极强的户外广告媒体。尽管公交每天承载着大量的用户群体,然而目标广告收益没有得到很好的效果,其主要原因在于仍然依靠传统简单的粗略计价方式,一般是根据一条公交车线路覆盖的城区范围或者一辆公交车车载的乘客数量来评估公交线路上的广告效果并定价。事实上,这不能科学地评估实际的广告投放效果与收入比。因此广告商纷纷从线下广告投放转向“用户点击计费”这种更加清晰的线上广告方式。

由于城市公交线路繁多复杂,公交车站在不同时段乘客流量差异较大,此外每条公交线路会经过不同的功能区域、乘客类型不同,导致对不同领域的广告效果也不同,因此单依靠公交线路长度和乘客流量很难科学、精确地评估广告投放线路效果,亟需解决这一问题。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的面向公交车身广告投放线路定制方法、装置及电子设备。

依据本发明的一方面,提供了一种面向公交车身广告投放线路定制方法,包括:

收集与公交车相关的数据,得到多源异构数据源;

对所述多源异构数据源进行挖掘处理,提取各公交线路的特征属性;

根据广告投放需求和意图,匹配各公交线路的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案;

对投放线路方案中的公交线路及其特征属性信息进行可视化展示。

可选地,所述多源异构数据源包括下列中的多个:

地图数据、公交车站数据、公交线路数据、智能公交卡数据scd、用户兴趣点poi数据。

可选地,所述各公交线路的特征属性包括下列中的多个:

各公交线路长度、各公交线路全天时客流量、各公交线路功能主题分布、各公交线路行政区划分布。

可选地,对所述多源异构数据源进行挖掘处理,提取各公交线路的特征属性,包括:

从所述多源异构数据源的公交线路数据中提取各公交线路长度;

基于所述多源异构数据源中的智能公交卡数据、公交车站数据以及公交线路数据,计算各公交线路全天时客流量;

基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布和各公交线路行政区划分布。

可选地,基于所述多源异构数据源中的智能公交卡数据、公交车站数据以及公交线路数据,计算各公交线路全天时客流量,包括:

对所述多源异构数据源中的智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据;

对所述指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,所述指定信息包括公交卡id、公交线路id、乘客上车时间、乘客下车时间、乘客上车车站id和/或地理位置信息、乘客下车车站id和/或地理位置信息;

基于包含指定信息的智能公交卡数据和公交车站数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡id重复的乘客数量,得到每个公交车站在该时段的乘客流量;

根据公交线路数据,确定每条公交线路所经过的所有公交车站;

在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡id重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。

可选地,基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布,包括:

从所述多源异构数据源的公交车站数据中提取公交车站的地理位置信息;

基于公交车站的地理位置信息以及poi数据中的地理位置信息,针对每个公交车站,获取其周边指定距离以内的所有poi数据;

将所有poi数据中的描述信息进行提取,并合并到一个文档;

基于合并的文档,使用文档主题生成模型lda分析每个公交车站的功能主题分布;

根据每个公交车站的功能主题分布,汇总并合并每条公交线路所经过所有公交车站的功能主题分布,进而确定各公交线路功能主题分布。

可选地,基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路行政区划分布,包括:

根据地图数据和公交车站的地理位置信息,确定每个公交车站的行政区划归属;

根据每个公交车站的行政区划归属,汇总并合并每条公交线路所经过所有公交车站的行政区划分布,进而确定各公交线路行政区划分布。

可选地,基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布,包括:

从所述多源异构数据源的公交车站数据中提取公交车站的地理坐标经纬度信息,以及从所述多源异构数据源的公交线路数据中提取公交线路的地理坐标经纬度信息;

根据公交车站和公交线路的地理坐标经纬度信息,设定城市中心坐标和广告投放区域,并以指定长度为网格间距对地图数据进行网格切分,得到切分后的各网格;

根据各网格的地理坐标经纬度信息以及poi数据中的地理坐标经纬度信息,获取各网格的所有poi数据;

将所有poi数据中的描述信息进行提取,并合并到一个文档;

基于合并的文档,使用文档主题生成模型lda分析各网格的功能主题分布;

综合各公交线路途经网格和各网格的功能主题分布,确定各公交线路功能主题分布。

可选地,基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路行政区划分布,包括:

根据地图数据和各网格的地理坐标经纬度信息,确定各网格的行政区划归属;

综合各公交线路途经网格和各网格的行政区划归属,确定各公交线路行政区划分布。

可选地,所述方法还包括:

根据各网格的地理坐标经纬度信息、公交车站的地理坐标经纬度信息以及各公交车站全天时客流量,计算各网格全天时客流量。

可选地,根据广告投放需求和意图,匹配各公交线路的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案,包括:

设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围和公交线路客流量范围;

根据广告投放意图,选取功能主题区域覆盖或行政区划覆盖投放方式;

如果选择功能主题区域覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和功能主题区域覆盖要求,匹配各公交线路的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案;

如果选择行政区划覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和行政区划覆盖要求,匹配各公交线路的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案。

可选地,若筛选出符合要求的多条公交线路,则生成公交车身广告投放线路方案,包括:

按照公交线路功能主题区域覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案;或者

按照公交线路行政区划覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案。

可选地,对投放线路方案中的公交线路及其特征属性信息进行可视化展示,包括:

在地图上,新建图层使用网格方式显示城市地图网格结果,并使用热度图方式显示各网格在时间范围的客流量;

新建图层使用线状图方式显示投放线路方案中的公交线路,沿途网格使用指定颜色填充。

可选地,在生成公交车身广告投放线路方案之后,所述方法还包括:

对公交车身广告投放线路方案所有的公交线路特征进行统计;

根据统计结果对公交车身广告投放线路方案的投放效果进行衡量,进而根据衡量结果对公交车身广告投放线路方案进行调整;

对调整后的投放线路方案中的公交线路及其特征属性信息进行可视化展示。

依据本发明的另一方面,还提供了一种面向公交车身广告投放线路定制装置,包括:

收集模块,适于收集与公交车相关的数据,得到多源异构数据源;

公交线路特征挖掘模块,适于对所述多源异构数据源进行挖掘处理,提取各公交线路的特征属性;

公交车身广告投放线路生成模块,适于根据广告投放需求和意图,匹配各公交线路的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案;

投放方案可视化模块,适于对投放线路方案中的公交线路及其特征属性信息进行可视化展示。

可选地,所述多源异构数据源包括下列中的多个:

地图数据、公交车站数据、公交线路数据、智能公交卡数据scd、用户兴趣点poi数据。

可选地,所述各公交线路的特征属性包括下列中的多个:

各公交线路长度、各公交线路全天时客流量、各公交线路功能主题分布、各公交线路行政区划分布。

可选地,所述公交线路特征挖掘模块包括:

提取单元,适于从所述多源异构数据源的公交线路数据中提取各公交线路长度;

公交线路客流量计算单元,适于基于所述多源异构数据源中的智能公交卡数据、公交车站数据以及公交线路数据,计算各公交线路全天时客流量;

确定单元,适于基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布和各公交线路行政区划分布。

可选地,所述公交线路客流量计算单元还适于:

对所述多源异构数据源中的智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据;

对所述指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,所述指定信息包括公交卡id、公交线路id、乘客上车时间、乘客下车时间、乘客上车车站id和/或地理位置信息、乘客下车车站id和/或地理位置信息;

基于包含指定信息的智能公交卡数据和公交车站数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡id重复的乘客数量,得到每个公交车站在该时段的乘客流量;

根据公交线路数据,确定每条公交线路所经过的所有公交车站;

在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡id重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。

可选地,所述确定单元还适于:

从所述多源异构数据源的公交车站数据中提取公交车站的地理位置信息;

基于公交车站的地理位置信息以及poi数据中的地理位置信息,针对每个公交车站,获取其周边指定距离以内的所有poi数据;

将所有poi数据中的描述信息进行提取,并合并到一个文档;

基于合并的文档,使用文档主题生成模型lda分析每个公交车站的功能主题分布;

根据每个公交车站的功能主题分布,汇总并合并每条公交线路所经过所有公交车站的功能主题分布,进而确定各公交线路功能主题分布。

可选地,所述确定单元还适于:

根据地图数据和公交车站的地理位置信息,确定每个公交车站的行政区划归属;

根据每个公交车站的行政区划归属,汇总并合并每条公交线路所经过所有公交车站的行政区划分布,进而确定各公交线路行政区划分布。

可选地,所述确定单元还适于:

从所述多源异构数据源的公交车站数据中提取公交车站的地理坐标经纬度信息,以及从所述多源异构数据源的公交线路数据中提取公交线路的地理坐标经纬度信息;

根据公交车站和公交线路的地理坐标经纬度信息,设定城市中心坐标和广告投放区域,并以指定长度为网格间距对地图数据进行网格切分,得到切分后的各网格;

根据各网格的地理坐标经纬度信息以及poi数据中的地理坐标经纬度信息,获取各网格的所有poi数据;

将所有poi数据中的描述信息进行提取,并合并到一个文档;

基于合并的文档,使用文档主题生成模型lda分析各网格的功能主题分布;

综合各公交线路途经网格和各网格的功能主题分布,确定各公交线路功能主题分布。

可选地,所述确定单元还适于:

根据地图数据和各网格的地理坐标经纬度信息,确定各网格的行政区划归属;

综合各公交线路途经网格和各网格的行政区划归属,确定各公交线路行政区划分布。

可选地,所述公交线路特征挖掘模块还包括:

网格客流量计算单元,适于根据各网格的地理坐标经纬度信息、公交车站的地理坐标经纬度信息以及各公交车站全天时客流量,计算各网格全天时客流量。

可选地,所述公交车身广告投放线路生成模块还适于:

设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围和公交线路客流量范围;

根据广告投放意图,选取功能主题区域覆盖或行政区划覆盖投放方式;

如果选择功能主题区域覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和功能主题区域覆盖要求,匹配各公交线路的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案;

如果选择行政区划覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和行政区划覆盖要求,匹配各公交线路的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案。

可选地,所述公交车身广告投放线路生成模块还适于:

若筛选出符合要求的多条公交线路,按照公交线路功能主题区域覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案;或者

按照公交线路行政区划覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案。

可选地,所述投放方案可视化模块还适于:

在地图上,新建图层使用网格方式显示城市地图网格结果,并使用热度图方式显示各网格在时间范围的客流量;

新建图层使用线状图方式显示投放线路方案中的公交线路,沿途网格使用指定颜色填充。

可选地,所述装置还包括:

个性化方案定制模块,适于在生成公交车身广告投放线路方案之后,对公交车身广告投放线路方案所有的公交线路特征进行统计;

根据统计结果对公交车身广告投放线路方案的投放效果进行衡量,进而根据衡量结果对公交车身广告投放线路方案进行调整;

对调整后的投放线路方案中的公交线路及其特征属性信息进行可视化展示。

依据本发明的又一方面,还提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据上述的面向公交车身广告投放线路定制方法。

依据本发明的再一方面,还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行根据上述的面向公交车身广告投放线路定制方法。

本发明实施例收集与公交车相关的数据,得到多源异构数据源,并基于多源异构数据源,采用数据挖掘技术深入分析并提取各公交线路的特征属性;进而将广告投放需求和意图与各公交线路的特征属性进行深度匹配,从而有针对性地制定公交线路投放方案,保证广告投放效果。并且,本发明实施例还借助可视化技术对投放方案信息进行显示,更好地帮助人工对广告投放效果的对比、认知和理解;借助人机交互技术实现个性化投放方案定制。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一实施例的面向公交车身广告投放线路定制方法的流程图;

图2示出了根据本发明一实施例的公交线路多维特征属性挖掘方法的流程图;

图3a示出了根据本发明另一实施例的公交线路多维特征属性挖掘方法的流程图;

图3b示出了根据本发明另一实施例的公交线路多维特征属性挖掘方法中temproal-ideagraph算法流程示意图;

图4示出了根据本发明一实施例的公交车身广告投放线路方案生成方法的流程图;

图5示出了根据本发明一实施例的公交车身广告投放线路方案展示方法的流程图;

图6示出了根据本发明另一实施例的面向公交车身广告投放线路定制方法的流程图;

图7示出了根据本发明一实施例的面向公交车身广告投放线路定制装置的结构示意图;

图8示出了根据本发明一实施例的公交线路特征挖掘模块的结构示意图;

图9示出了根据本发明另一实施例的面向公交车身广告投放线路定制装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

为解决上述技术问题,本发明实施例提供了一种面向公交车身广告投放线路定制方法。图1示出了根据本发明一实施例的面向公交车身广告投放线路定制方法的流程图。如图1所示,该方法可以包括以下步骤s102至步骤s108。

步骤s102,收集与公交车相关的数据,得到多源异构数据源。

步骤s104,对多源异构数据源进行挖掘处理,提取各公交线路的特征属性。

步骤s106,根据广告投放需求和意图,匹配各公交线路的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案。

步骤s108,对投放线路方案中的公交线路及其特征属性信息进行可视化展示。

本发明实施例收集与公交车相关的数据,得到多源异构数据源,并基于多源异构数据源,采用数据挖掘技术深入分析并提取各公交线路的特征属性;进而将广告投放需求和意图与各公交线路的特征属性进行深度匹配,从而有针对性地制定公交线路投放方案,保证广告投放效果。并且,本发明实施例还借助可视化技术对投放方案信息进行显示,更好地帮助人工对广告投放效果的对比、认知和理解;借助人机交互技术实现个性化投放方案定制。

上文步骤s102中提及的多源异构数据源可以是地图数据、公交车站数据、公交线路数据、scd(smartcartdata,智能公交卡数据)、poi(pointofinterest用户兴趣点)数据,等等,本发明不限于此。

步骤s102中收集与公交车相关的数据,具体可以是从地图应用接口api获取地图数据、公交车站数据和公交线路数据,以及收集智能公交卡数据和用户兴趣点数据。这里,公交车站数据可以包括车站站点编号、站点名称以及站点地理位置信息(如地理坐标经纬度信息等)。公交线路数据可以包括公交线路id(也可以称为公交线路编号)、线路名称、该线路所包含的所有公交车站数据以及该线路上两两车站间的路程长度等。智能公交卡数据为持卡者乘坐公交车的记录,一条记录包括持卡者一次乘车记录,具体包括公交卡id、公交卡类型、记录插入时间、公交线路id、公交车id、乘客上车时间、乘客下车时间、乘客上车车站id、乘客下车车站id等。用户兴趣点为城市中所有公共场所的信息,例如学校、公园、餐厅、商场、影院、4s店、写字楼、公共建筑、社区等,一条记录包含一个场所的信息,具体包括场所名称、地址、地理位置信息、经纬度坐标、场所描述等。

上文步骤s104中提及的各公交线路的特征属性可以是各公交线路长度、各公交线路全天时客流量、各公交线路功能主题分布、各公交线路行政区划分布、各公交线路上的公交车站的枢纽度,等等,本发明不限于此。进一步地,本发明实施例对上述的各公交线路的特征属性定义如下。

各公交线路长度,是指各公交线路上公交车从起始站到终点站经过的路程长度。

公交车站客流量,是指在某一时间段内在该公交车站停留的乘客数量,即在时间段内在该站上车和下车的乘客数量总和,并减去公交卡id重复的数量。

公交线路客流量,是指在某一时间段内、某公交线路沿线各车站乘客数量的总和,减去公交卡id重复的数量。

各公交线路全天时客流量,是指在全天时的任意时间段内、各公交线路上沿线各车站乘客数量的总和,减去公交卡id重复的数量。

各公交线路功能主题分布,是指各公交线路所经过所有公交车站的功能主题分布,以及各个主题的覆盖面积。这里,各个主题的覆盖面积可以是各个主题实际覆盖面积,也可以是该主题的网格的面积和。

各公交线路行政区划分布,是指各公交线路上公交车沿途经过的行政区划(如北京的东城、西城、海淀、朝阳等),以及各个区域的覆盖面积。这里,各个区域的覆盖面积可以是各个区域实际覆盖面积,也可以是沿途经过的网格的面积和。

各公交线路上的公交车站的枢纽度,是指公交车站作为中转车站的一种度量,车站公交车数量越多、换乘人数越大,则枢纽度越大,同时也能度量公交车站客流量。

步骤s104中对多源异构数据源进行挖掘处理,提取各公交线路的特征属性,本发明实施例提供了一种可选的方案,图2示出了根据本发明一实施例的公交线路多维特征属性挖掘方法的流程图。如图2所示,该方法可以包括以下步骤s200至步骤s206。

步骤s200,从地图应用接口api获取地图数据、公交车站数据和公交线路数据,以及收集智能公交卡数据和用户兴趣点数据,得到多源异构数据源。

步骤s202,从多源异构数据源的公交线路数据中提取各公交线路长度。

步骤s204,基于多源异构数据源中的智能公交卡数据、公交车站数据以及公交线路数据,计算各公交线路全天时客流量。

步骤s206,基于多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布和各公交线路行政区划分布。

由于公交线路数据中包括了线路名称、该线路所包含的所有公交车站数据以及该线路上两两车站间的路程长度,因而,在步骤s202中可以直接根据公交线路数据计算各公交线路长度。

上文步骤s204中基于多源异构数据源中的智能公交卡数据、公交车站数据以及公交线路数据,计算各公交线路全天时客流量,本发明实施例提供了一种可选的方案,具体可以包括以下步骤s2041至步骤s2045。

步骤s2041,对多源异构数据源中的智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据。

在该步骤中,由于近期的智能公交卡数据参考价值最大,因此可以根据实际情况提取最近时间范围内的数据(如最近一个月等),并且去除无效时间记录数据。

步骤s2042,对指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,这里的指定信息可以包括公交卡id、公交线路id、乘客上车时间、乘客下车时间、乘客上车车站id和/或地理位置信息、乘客下车车站id和/或地理位置信息。

在该步骤中,可以去除指定时间范围内的智能公交卡数据中的无用信息,如公交卡类型等,从而得到包含指定信息的智能公交卡数据。

步骤s2043,基于包含指定信息的智能公交卡数据和公交车站数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡id重复的乘客数量,得到每个公交车站在该时段的乘客流量。

步骤s2044,根据公交线路数据,确定每条公交线路所经过的所有公交车站。

步骤s2045,在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡id重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。

上文步骤s206中基于多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布和各公交线路行政区划分布,本发明可以利用地理位置信息或者通过对地图数据进行网格切分的方式来实现,下面将分别进行详细介绍。

方式一,利用地理位置信息的方式,具体可以包括以下步骤a11-a15:

步骤a11,从多源异构数据源的公交车站数据中提取公交车站的地理位置信息;

步骤a12,基于公交车站的地理位置信息以及poi数据中的地理位置信息,针对每个公交车站,获取其周边指定距离以内的所有poi数据;

步骤a13,将所有poi数据中的描述信息进行提取,并合并到一个文档;

步骤a14,基于合并的文档,使用文档主题生成模型lda分析每个公交车站的功能主题分布;

步骤a15,根据每个公交车站的功能主题分布,汇总并合并每条公交线路所经过所有公交车站的功能主题分布,进而确定各公交线路功能主题分布。

在步骤a12中,指定距离可以根据实际需求进行设置,如指定距离可以为100或500米等,本发明实施例不限于此。

在步骤a14中,lda(latentdirichletallocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,即假设一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。

lda是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bagofwords)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。

在本发明实施例中,将单个poi描述文本信息作为文档中的一个词,针对每个公交车站,将其周边指定距离以内的所有poi数据中的描述信息作为一个文档,根据公交车身广告投放内容,最终选取10类主题,包括民宅、旅游、家居、办公室、公司、汽车、购物、教育、市场、领事馆。需要说明的是,此处列举仅是示例性的,并不对本发明进行限制。

上述步骤a11-a15是基于多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布;进一步地,基于多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路行政区划分布,可以包括以下步骤a21-a22:

步骤a21,根据地图数据和公交车站的地理位置信息,确定每个公交车站的行政区划归属;

步骤a22,根据每个公交车站的行政区划归属,汇总并合并每条公交线路所经过所有公交车站的行政区划分布,进而确定各公交线路行政区划分布。

方式二,通过对地图数据进行网格切分的方式,具体可以包括以下步骤b11-b16:

步骤b11,从多源异构数据源的公交车站数据中提取公交车站的地理坐标经纬度信息,以及从多源异构数据源的公交线路数据中提取公交线路的地理坐标经纬度信息;

步骤b12,根据公交车站和公交线路的地理坐标经纬度信息,设定城市中心坐标和广告投放区域,并以指定长度为网格间距对地图数据进行网格切分,得到切分后的各网格;

步骤b13,根据各网格的地理坐标经纬度信息以及poi数据中的地理坐标经纬度信息,获取各网格的所有poi数据;

步骤b14,将所有poi数据中的描述信息进行提取,并合并到一个文档;

步骤b15,基于合并的文档,使用文档主题生成模型lda分析各网格的功能主题分布;

步骤b16,综合各公交线路途经网格和各网格的功能主题分布,确定各公交线路功能主题分布。

在步骤b12中,指定长度可以根据实际需求进行设置,如指定长度可以为1000米等,本发明实施例不限于此。

上文步骤b15中提及的lda可以参见前文介绍,此处不再赘述。在本发明实施例中,可以将单个poi描述文本信息作为文档中的一个词,将每个网格中所有poi数据中的描述信息作为一个文档,根据公交车身广告投放内容,最终选取10类主题,包括民宅、旅游、家居、办公室、公司、汽车、购物、教育、市场、领事馆。需要说明的是,此处列举仅是示例性的,并不对本发明进行限制。

上述步骤b11-b16是基于多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布;进一步地,基于多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路行政区划分布,可以包括以下步骤b21-b22:

步骤b21,根据地图数据和各网格的地理坐标经纬度信息,确定各网格的行政区划归属;

步骤b22,综合各公交线路途经网格和各网格的行政区划归属,确定各公交线路行政区划分布。

在本发明的可选实施例中,还可以计算各网格的全天时客流量,从而来确定各公交线路全天时客流量,具体地,根据各网格的地理坐标经纬度信息、公交车站的地理坐标经纬度信息以及各公交车站全天时客流量,计算各网格全天时客流量。

在本发明的可选实施例中,还可以基于智能公交卡数据中的公交线路编号、乘客上下车时间、乘客上下车车站编号来计算公交线路上的公交车站的枢纽度。图3a示出了根据本发明另一实施例的公交线路多维特征属性挖掘方法的流程图。如图3a所示,该方法可以包括以下步骤s302至步骤s304。

步骤s302,对智能公交卡数据进行处理,计算得到包含公交线路编号、乘客上下车时间、途经车站编号序列的乘客轨迹数据。

步骤s304,基于乘客轨迹数据计算公交线路上的公交车站的枢纽度。

由于智能公交卡数据中包括公交线路编号、乘客上下车时间、乘客上下车车站编号,因而能够直接根据智能公交卡数据,计算得到包含公交线路编号、乘客上下车时间、途经车站编号序列的乘客轨迹数据。

在实际应用中,智能公交卡数据中的乘客上下车车站编号为车站收费编号,存在多个车站共用同一编号的问题,这种编号方式会导致无法精确分析每个车站的客流量,本发明实施例将车站收费编号映射为实际的逻辑编号来解决上述问题。具体地,上述步骤s302可以进一步包括以下步骤s3021-s3023:

步骤s3021,将智能公交卡数据中的乘客上下车车站编号记为车站收费编号;

步骤s3022,基于智能公交卡数据中的乘客上下车时间以及乘客上下车车站收费编号,计算智能公交卡数据中的乘客上下车车站逻辑编号;

步骤s3023,根据智能公交卡数据中的乘客上下车车站逻辑编号,确定途经车站编号序列,从而得到包含公交线路编号、乘客上下车时间、途经车站编号序列的乘客轨迹数据。

上文步骤s3022中基于智能公交卡数据中的乘客上下车时间以及乘客上下车车站收费编号,计算智能公交卡数据中的乘客上车车站逻辑编号,具体可以包括以下步骤c11-c15:

步骤c11,将同一公交车上的智能公交卡数据按照乘客上车时间进行排序,得到排序后的智能公交卡数据;

步骤c12,对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客上车车站收费编号相同的分为一组;

步骤c13,对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数;

步骤c14,针对每个聚类中的智能公交卡数据计算上车时间平均值;

步骤c15,将多个聚类按照上车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客上车车站逻辑编号。

上文步骤s3022中基于智能公交卡数据中的乘客上下车时间以及乘客上下车车站收费编号,计算智能公交卡数据中的乘客下车车站逻辑编号,具体可以包括以下步骤c21-c25:

步骤c21,将同一公交车上的智能公交卡数据按照乘客下车时间进行排序,得到排序后的智能公交卡数据;

步骤c22,对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客下车车站收费编号相同的分为一组;

步骤c23,对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数;

步骤c24,针对每个聚类中的智能公交卡数据计算下车时间平均值;

步骤c25,将多个聚类按照下车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客下车车站逻辑编号。

上文步骤s304中基于乘客轨迹数据计算公交线路上的公交车站的枢纽度,本发明实施例提供了一种可选的方案,具体可以包括以下步骤s3041-s3044:

步骤s3041,基于乘客轨迹数据挖掘出长度大于n的序列,记为目标序列,n为正整数;

步骤s3042,确定目标序列中各序列的权值,并作为各序列中两两车站的权值;

步骤s3043,基于目标序列中各序列的权值,将包含相同车站的序列进行合并,得到连接模式网络;

步骤s3044,根据连接模式网络,计算公交线路上的公交车站的枢纽度。

在步骤s3041中,可以将目标序列记为p,目标序列中的元素记为p,元素p的权值记为w(p)。

在步骤s3044中,根据连接模式网络,计算公交线路上的公交车站的枢纽度,计算方法如下:

其中si为车站i,h(si)为车站si枢纽度,lstarti为起始车站为si的序列集合,lendi为终止车站为si的序列集合,li→j为其实车站为si、终止车站为sj的序列。

图3b示出了根据本发明另一实施例的公交线路多维特征属性挖掘方法中temproal-ideagraph算法流程示意图,在图3b中,根据乘客轨迹数据进行序列模式挖掘,得到的目标序列的元素有pattern1、p2、p3、p4、p5,进而进行序列模式合并,从而发现枢纽车站2(即s2)。需要说明的是,此处列举仅是示例性的,并不对本发明进行限制。

上述步骤s3041-s3044是temproal-ideagraph算法的原理步骤,该算法是一种公知算法,可以准确挖掘数据中的序列以及各个元素主体之间的关系,形成关系网络图。此外,可以从网络图中提取关键桥接节点,为用户决策提供支持。应用到公交广告推广中,关键桥接节点即为枢纽度高的公交站点。

上文步骤s106中根据广告投放需求和意图,匹配各公交线路的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案,本发明实施例提供了一种可选的实施方式,图4示出了根据本发明一实施例的公交车身广告投放线路方案生成方法的流程图。如图4所示,该方法可以包括以下步骤s402至步骤s406。

步骤s402,设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围和公交线路客流量范围中的至少之一。

步骤s404,根据广告投放意图,选取功能主题区域覆盖或行政区划覆盖投放方式。

步骤s406,根据广告投放需求和意图,匹配各公交线路的包括公交线路长度、全天时客流量、功能主题分布、行政区划分布中至少之一的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案。

在本发明的可选实施例中,在步骤s406中,根据广告投放意图,如果选择功能主题区域覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和功能主题区域覆盖要求,匹配各公交线路相应的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案;

如果选择行政区划覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和行政区划覆盖要求,匹配各公交线路相应的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案。

在本发明的可选实施例中,若步骤s406中筛选出符合要求的多条公交线路,则生成公交车身广告投放线路方案,具体可以是:

如果选择功能主题区域覆盖投放方式,则按照公交线路功能主题区域覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案;

如果选择行政区划覆盖投放方式,则按照公交线路行政区划覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案。

在本发明的可选实施例中,上述步骤s402中广告投放需求还可以包括公交线路上的公交车站的枢纽度信息,这样,步骤s406中可以根据广告投放需求和意图,匹配各公交线路的包括公交线路长度、全天时客流量、功能主题分布、行政区划分布、公交车站的枢纽度中至少之一的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案。

上文步骤s108中对投放线路方案中的公交线路及其特征属性信息进行可视化展示,本发明实施例提供了一种可选的方案,图5示出了根据本发明一实施例的公交车身广告投放线路方案展示方法的流程图。如图5所示,该方法可以包括以下步骤s502至步骤s504。

步骤s502,在地图上,新建图层使用网格方式显示城市地图网格结果,并使用热度图方式显示各网格在时间范围的客流量。

步骤s504,新建图层使用线状图方式显示投放线路方案中的公交线路,沿途网格使用指定颜色填充。

在本发明的可选实施例中,在步骤s106生成公交车身广告投放线路方案之后,还可以对公交车身广告投放线路方案所有的公交线路特征进行统计;随后,根据统计结果对公交车身广告投放线路方案的投放效果进行衡量,进而根据衡量结果对公交车身广告投放线路方案进行调整;之后,对调整后的投放线路方案中的公交线路及其特征属性信息进行可视化展示。由此,本发明实施例借助可视化技术对投放方案信息进行显示,更好地帮助人工对广告投放效果的对比、认知和理解;借助人机交互技术实现个性化投放方案定制。

以上介绍了图1所示实施例的各个环节的多种实现方式,下面将通过具体实施例来详细介绍本发明的面向公交车身广告投放线路定制方法的实现过程。

本发明实施例以多源异构大数据为主要数据源,采用数据挖掘和可视分析技术,提供一种面向公交车身广告投放线路定制方法,即给定一个某类广告,能够返回合理的公交线路组合,从而使得公交车身广告投放影响最大化。

如图6所示,本发明实施例提供了一种面向公交车身广告投放线路定制方法,包括公交线路特征挖掘模块、公交车身广告投放方案自动生成模块和投放方案可视化和个性化方案定制模块,方法步骤如下:

步骤s601,从地图api获取城市公交车站和公交线路数据并进行预处理;

步骤s602,对scd数据进行预处理;

步骤s603,基于步骤s601和步骤s602得到的数据,计算各公交车站和公交线路全天时乘客流量;

步骤s604,城市地图数据网格化;

步骤s605,根据poi数据,借助lda主题模型,挖掘网格行政区划和功能主题特征等属性;

步骤s606,根据公交线路途经的地图网格,计算公交线路的特征属性;

步骤s607,设定广告投放基本要求和意图;

步骤s608,结合公交车身广告投放基本要求和意图,生成公交线路投放方案;

步骤s609,公交线路投放方案可视化显示;

步骤s610,公交线路投放方案人工理解和调整;

步骤s611,多公交线路投放方案对比分析;

步骤s612,判断是否完成,若否,则重复步骤s609、步骤s610和步骤s611;若是,则继续步骤s613;

步骤s613,生成最终的公交线路投放方案。

公交线路特征挖掘模块,基于地图数据、scd数据和poi数据,借助数据挖掘技术可以挖掘公交线路长度、全天时客流量、覆盖区域功能主题分布、覆盖区域行政区划分布等特征,方法步骤如下:

步骤11,使用javascript技术从地图api获取城市公交车路线和公交车站信息,包括所有公交车站和公交路线沿线地理坐标经纬度信息,并进行预处理,将距离小于10米的公交车站合并;最终将公交线路和公交车站两类数据分别存储,并存储每个公交车站都属于哪些公交线路,从而对二者进行关联;本实施例使用数据覆盖北京四环全部和部分五环区域,从地图api获取了21518个公交车站信息和789条公交线路信息;

步骤12,公交卡scd数据清洗,包括:①一般近期的scd数据参考价值最大,因此根据实际情况提取最近时间范围内的数据(如最近一个月),去除无效时间记录数据;②去除scd数据的无用信息,如公交卡类型等;③将公交车站编号替换为地理坐标等;最终scd数据包含的信息有:公交卡id、公交线路id、乘客上车时间、乘客下车时间、上车车站地理位置经纬度和下车车站地理位置经纬度信息;本实施例采集北京2015年8月1日至2015年8月31日的公交卡数据,数据总量32.4gb;

步骤13,公交车站和公交线路乘客流量计算,在全天各个时段内(每个小时),计算每个公交车站上车和下车乘客数量的总和,减去公交卡id重复的乘客数量,得到每个公交车站在该时段的乘客流量;在全天各个时段内(每个小时),计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡id重复的乘客数量,得到每条公交线路在该时段的乘客流量;

步骤14,城市地图数据网格化,根据步骤11中得到公交车站和公交线路经纬度信息,设定城市中心坐标和广告投放区域,以1千米为网格间距对地图数据进行网格切分;根据步骤11中得到的公交车站经纬度信息和步骤13中得到的各公交车站乘客流量信息,计算每个地图网格全天时的乘客流量;本实施例中设置北京中心经纬度坐标为(e116.397428,n39.90923);

步骤15,分析各网格行政区划归属,基于地图api统计网格中各个点的行政区划归属,将多数点的归属作为网格的行政区划域归属特征;

步骤16,获取各网格poi数据,根据各poi的坐标信息将其与城市地图各个网格进行关联,通过lda主题分布模型分析各网格主题特征,将单个poi描述文本信息作为文档中的一个词,每个网格中所有poi信息为一个文档,训练时α设为0.1,β设为0.1,迭代次数设为1000,根据车身广告投放内容,最终选取10类主题:民宅、旅游、家居、办公室、公司、汽车、购物、教育、市场、领事馆;本实施例共获取385792个poi数据;

步骤17,综合各公交线路途经网格提取公交线路特征属性,基于地图api获取的公交线路沿线地理坐标,提取公交线路覆盖的网格,汇总所有网格区域的主题特征,并计算每一种主题所覆盖的区域面积,从而将网格特征合并、融合,得到公交线路特征,包括公交线路涵盖的主题以及各个主题所覆盖的区域面积。

公交车身广告投放方案自动生成模块,根据广告投放基本要求和意图选取特征属性最符合的公交线路形成投放方案,方法步骤如下:

步骤21,设定广告投放方案需求,包括时间范围(具体到小时)、公交线路数、公交线路长度范围和公交线路客流量范围;本实施例设定公交线路数要求为2或3,其他条件不做要求;

步骤22,根据不同的广告投放意图,可以选择行政区划或者功能主题区域两种投放方式,如果投放意图倾向于不同行政区划分别撒网覆盖,可以采用行政区划选项,并选择需覆盖的行政区划;如果倾向于符合兴趣目标群体,那么采用功能主题区域选项进行广告投放,并选择需要包含的主题;本实施例广告投放方式为功能主题区域投放,要求覆盖主题为旅行和购物;

步骤23,将公交线路特征与广告投放意图进行匹配,给出最佳的公交线路方案;如果选择行政区划覆盖意图,则根据公交线路长度范围要求、客流量范围要求和行政区划覆盖要求筛选符合的公交线路,然后按照行政区划覆盖总面积、客流量和线路长度排序(行政区划覆盖面积优先、其次客流量、最后线路长度),然后根据公交线路数目要求选择最优的几条线路,形成最终公交线路方案;如果选择兴趣目标群体覆盖意图,则根据公交线路长度范围要求、客流量要求需要和主题覆盖要求筛选符合的公交线路,然后按照主题覆盖区域总面积、客流量和线路长度排序(主题覆盖区域总面积优先、其次客流量、最后线路长度),然后根据公交线路数目要求选择最优的几条线路,形成最终的公交线路方案。本实施例自动形成公交线路投放方案为982路和特11路,公交路线途经华联、金四季、蓝色港湾、翠微、飘亮、北辰等购物中心和圆明园、颐和园、海淀公园、万丰公园、莲花池公园、北京奥林匹克森林公园、地坛公园、南锣鼓巷、北海公园、景山公园、故宫、天坛公园等旅游景点,符合广告需求。

公交线路投放方案可视化和个性化方案定制模块,借助可视化技术对投放方案信息进行显示,更好地帮助人工对广告投放效果的对比、认知和理解;借助人机交互技术实现个性化投放方案定制,方法步骤如下:

步骤31,投放方案可视化显示,在地图上,新建图层使用网格方式显示城市地图网格结果,并使用热度图方式显示各个网格的客流量;新建图层用线状图方式显示方案中公交线路,沿途网格使用明显颜色填充;采用这种方式可以非常直观地将公交线路沿途覆盖的区域,即广告传播的区域进行可视化显示;

步骤32,投放方案公交线路特征统计,对当前投放方案所有的公交线路特征进行统计,包括公交线路数量、公交线路长度、客流量、途经行政区划区划或者功能主题区域、各行政或功能主题区域覆盖面积和总面积,从而对公交线路方案的广告投放效果进行定量评估;本实施例中投放方案公交线路数量为2、长度为56千米、客流量27722人、旅行功能主题区域覆盖面积为25平方千米、购物功能主题覆盖面积为17平方千米;

步骤33,投放方案个性化调整,根据当前的公交线路投放方案,如果需要调整,可以自由地在投放方案中添加新的公交线路或移除已有的公交线路,形成新的投放方案,并依照步骤32统计新投放方案所有公交线路特征;本实施例中增加了1路公交车,可以使方案覆盖西单购物中心、天安门广场等符合功能主题要求的区域,调整后公交线路数量为3、长度为77千米、客流量为77300人、旅行功能主题区域覆盖面积为34平方千米、购物功能主题覆盖面积为25平方千米;

步骤34,多投放方案人工对比分析评估,可随意切换不同投放方案视图,从视图效果和属性特征两方面对不同的方案进行对比分析,辅助人工充分理解和对比评估方案;

步骤35,重复步骤33和步骤34,直到形成最佳的公交线路投放方案为止,最终确定公交线路投放方案为982路、特11路和1路三条公交线路。

为进一步解释行政区划投放方式,以下给出了相应的实施例。该实施例中广告需求为3条公交线路,需覆盖海淀区、丰台区和石景山区,自动选取路线为982路、77路和74路,线路均符合需求,投放方案有效。针对此投放方案用户可以在定制界面中进行调整,形成最优的定制投放方案,如使用961路替换74路等。

需要说明的是,实际应用中,上述所有可选实施方式可以采用结合的方式任意组合,形成本发明的可选实施例,在此不再一一赘述。

基于上文各实施例提供的面向公交车身广告投放线路定制方法,基于同一发明构思,本发明实施例还提供了一种面向公交车身广告投放线路定制装置。

图7示出了根据本发明一实施例的面向公交车身广告投放线路定制装置的结构示意图。如图7所示,该装置可以包括收集模块710、公交线路特征挖掘模块720、公交车身广告投放线路生成模块730以及投放方案可视化模块740。

现介绍本发明实施例的面向公交车身广告投放线路定制装置的各组成或器件的功能以及各部分间的连接关系:

收集模块710,适于收集与公交车相关的数据,得到多源异构数据源;

公交线路特征挖掘模块720,与收集模块710相耦合,适于对所述多源异构数据源进行挖掘处理,提取各公交线路的特征属性;

公交车身广告投放线路生成模块730,与公交线路特征挖掘模块720相耦合,适于根据广告投放需求和意图,匹配各公交线路的特征属性,选取特征属性匹配的一条或多条公交线路,进而生成公交车身广告投放线路方案;

投放方案可视化模块740,与公交车身广告投放线路生成模块730相耦合,适于对投放线路方案中的公交线路及其特征属性信息进行可视化展示。

在本发明的可选实施例中,所述多源异构数据源包括下列中的多个:

地图数据、公交车站数据、公交线路数据、智能公交卡数据scd、用户兴趣点poi数据。

在本发明的可选实施例中,所述各公交线路的特征属性包括下列中的多个:

各公交线路长度、各公交线路全天时客流量、各公交线路功能主题分布、各公交线路行政区划分布。

在本发明的可选实施例中,如图8所示,所述公交线路特征挖掘模块720可以包括:

提取单元721,适于从所述多源异构数据源的公交线路数据中提取各公交线路长度;

公交线路客流量计算单元722,适于基于所述多源异构数据源中的智能公交卡数据、公交车站数据以及公交线路数据,计算各公交线路全天时客流量;

确定单元723,适于基于所述多源异构数据源中的地图数据、poi数据、公交车站数据以及公交线路数据,确定各公交线路功能主题分布和各公交线路行政区划分布。

在本发明的可选实施例中,所述公交线路客流量计算单元722还适于:

对所述多源异构数据源中的智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据;

对所述指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,所述指定信息包括公交卡id、公交线路id、乘客上车时间、乘客下车时间、乘客上车车站id和/或地理位置信息、乘客下车车站id和/或地理位置信息;

基于包含指定信息的智能公交卡数据和公交车站数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡id重复的乘客数量,得到每个公交车站在该时段的乘客流量;

根据公交线路数据,确定每条公交线路所经过的所有公交车站;

在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡id重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。

在本发明的可选实施例中,所述确定单元723还适于:

从所述多源异构数据源的公交车站数据中提取公交车站的地理位置信息;

基于公交车站的地理位置信息以及poi数据中的地理位置信息,针对每个公交车站,获取其周边指定距离以内的所有poi数据;

将所有poi数据中的描述信息进行提取,并合并到一个文档;

基于合并的文档,使用文档主题生成模型lda分析每个公交车站的功能主题分布;

根据每个公交车站的功能主题分布,汇总并合并每条公交线路所经过所有公交车站的功能主题分布,进而确定各公交线路功能主题分布。

在本发明的可选实施例中,所述确定单元723还适于:

根据地图数据和公交车站的地理位置信息,确定每个公交车站的行政区划归属;

根据每个公交车站的行政区划归属,汇总并合并每条公交线路所经过所有公交车站的行政区划分布,进而确定各公交线路行政区划分布。

在本发明的可选实施例中,所述确定单元723还适于:

从所述多源异构数据源的公交车站数据中提取公交车站的地理坐标经纬度信息,以及从所述多源异构数据源的公交线路数据中提取公交线路的地理坐标经纬度信息;

根据公交车站和公交线路的地理坐标经纬度信息,设定城市中心坐标和广告投放区域,并以指定长度为网格间距对地图数据进行网格切分,得到切分后的各网格;

根据各网格的地理坐标经纬度信息以及poi数据中的地理坐标经纬度信息,获取各网格的所有poi数据;

将所有poi数据中的描述信息进行提取,并合并到一个文档;

基于合并的文档,使用文档主题生成模型lda分析各网格的功能主题分布;

综合各公交线路途经网格和各网格的功能主题分布,确定各公交线路功能主题分布。

在本发明的可选实施例中,所述确定单元723还适于:

根据地图数据和各网格的地理坐标经纬度信息,确定各网格的行政区划归属;

综合各公交线路途经网格和各网格的行政区划归属,确定各公交线路行政区划分布。

在本发明的可选实施例中,如图8所示,所述公交线路特征挖掘模块720还可以包括:

网格客流量计算单元724,适于根据各网格的地理坐标经纬度信息、公交车站的地理坐标经纬度信息以及各公交车站全天时客流量,计算各网格全天时客流量。

在本发明的可选实施例中,所述公交车身广告投放线路生成模块730还适于:

设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围和公交线路客流量范围;

根据广告投放意图,选取功能主题区域覆盖或行政区划覆盖投放方式;

如果选择功能主题区域覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和功能主题区域覆盖要求,匹配各公交线路的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案;

如果选择行政区划覆盖投放方式,则根据公交线路长度范围要求、客流量范围要求和行政区划覆盖要求,匹配各公交线路的特征属性,筛选出符合要求的一条或多条公交线路,进而生成公交车身广告投放线路方案。

在本发明的可选实施例中,所述公交车身广告投放线路生成模块730还适于:

若筛选出符合要求的多条公交线路,按照公交线路功能主题区域覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案;或者

按照公交线路行政区划覆盖总面积、客流量和长度的优先顺序,对多条公交线路进行排序,根据公交线路数目要求选择最优的线路,形成最终公交车身广告投放线路方案。

在本发明的可选实施例中,所述投放方案可视化模块740还适于:

在地图上,新建图层使用网格方式显示城市地图网格结果,并使用热度图方式显示各网格在时间范围的客流量;

新建图层使用线状图方式显示投放线路方案中的公交线路,沿途网格使用指定颜色填充。

在本发明的可选实施例中,如图9所示,上文图7展示的装置还可以包括:

个性化方案定制模块750,适于在生成公交车身广告投放线路方案之后,对公交车身广告投放线路方案所有的公交线路特征进行统计;

根据统计结果对公交车身广告投放线路方案的投放效果进行衡量,进而根据衡量结果对公交车身广告投放线路方案进行调整;

对调整后的投放线路方案中的公交线路及其特征属性信息进行可视化展示。

基于同一发明构思,本发明实施例还提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据上述的面向公交车身广告投放线路定制方法。这里的电子设备可以是个人电脑、服务器、智能手机、平板电脑、pda(personaldigitalassistant,个人数字助理)、pos(pointofsales,销售终端)、车载电脑等,本发明不限于此。

基于同一发明构思,本发明实施例还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行根据上述的面向公交车身广告投放线路定制方法。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的面向公交车身广告投放线路定制装置及电子设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1