一种时空大数据的综合计费方法与流程

文档序号:17431277发布日期:2019-04-17 03:31阅读:185来源:国知局
一种时空大数据的综合计费方法与流程

本发明涉及数据处理技术领域,具体涉及一种时空大数据的综合计费方法。



背景技术:

时空大数据分析系统是一个能够通过将通信运营商提供的数据和地图服务商提供的地图数据进行有机结合,计算出每个手机用户每天的运动轨迹,并结合手机用户历史的运动轨迹,分析出每个运动轨迹对应的手机用户的个人特征,可以实现商业选址、人口时空分布分析和空间定位功能,为人口学研究提供充分的、精准的数据。

时空大数据分析系统将分析的数据存储在服务器中,客户通过注册并充值后可以访问数据库,获取想要的数据。但是客户访问数据后,需要进行计费,目前没有一个有效、精准的计费方法来实现。



技术实现要素:

本发明目提供了一种时空大数据的综合计费方法,解决了现有技术中不能有效、精准计费的问题。

本发明所采用的技术方案为:

一种时空大数据的综合计费方法,包括以下步骤:

s1、计算层根据通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合,计算出每个手机用户每天的轨迹链,给每个手机用户打上标签;并将得出的轨迹链存储在轨迹库中,将得出的手机用户标签存储在人口库中;标签内容包括手机用户的职业、工作和居住属性;

s2、用户在服务层中注册账号并充值后,即可访问计算层中存储的数据,用户充值后,计费模块将用户充值后的余额进行记录,当用户访问计算层内的数据后,根据用户访问数据的内容进行计费,并将费用实时在余额中进行扣除,并将扣除后的余额进行显示。

作为上述技术方案的优选,所述步骤s2中,用户访问数据的内容包括人口数量、地理区域范围、地理精度、服务使用时长、跟踪数据使用深度和标签使用类型中的一种或多种。

作为上述技术方案的优选,所述计算层包括:

轨迹库,用于储存每个手机用户每天的轨迹链;

人口库,用于储存每个手机用户标签;

基础数据库,用于储存获取的通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合;

模型库,用于储存算法模块,所述算法模块用于根据基础数据库的内容得到轨迹库和人口库

作为上述技术方案的优选,所述服务层包括:

业务db,用于存储根据不同的业务需要在计算层的轨迹库和人口库中读取的数据;

第三方数据接入/采集模块,用于接收第三方输入的业务数据或主动采集第三方业务数据;

业务服务模块,用于将业务db内存储的数据,根据业务需要进行统计,得出对应的业务模型数据。所述主动采集第三方业务数据的方式为,通过网络爬虫在搜索引擎中读取所需的信息。

作为上述技术方案的优选,所述服务层还包括用户管理模块,用户管理模块用于用户注册和用户权限管理;用户管理模块分别与用户库和运维库数据连接,所述用户库用于储存已注册的用户信息,所述运维库用于储存系统运行的数据和运行日志。

作为上述技术方案的优选,所述服务层还包括计费模块,计费模块用于用户充值,并根据用户的消费情况进行余额管理。用户充值后,计费模块将用户充值后的余额进行记录,当用户访问计算层内的数据后,根据用户访问数据内包括的人口数量、地理区域范围、地理精度、服务使用时长、标签使用类型和跟踪数据使用深度进行计费,并将费用实时在余额中进行扣除,并将扣除后的余额进行显示。

作为上述技术方案的优选,所述计算层和服务层均设置有系统检测模块,系统检测模块用于检测系统内各个模块的运行是否正常,若发现有系统运行运行状态失常,则发出报警信息。

作为上述技术方案的优选,所述用户的余额低于预设值时,计费模块及时向用户提供充值提醒信息。

作为上述技术方案的优选,所述基站工程参数包括地区区域码、基站识别码、网络制式、天线类型、天线方位角、基站覆盖类型、基站天线位置经度坐标和基站天线位置纬度坐标;所述移动业务信令数据包括时间、用户号码和基站编号。

作为上述技术方案的优选,所述基站覆盖类型包括室内型和非室内型;所述天线类型包括全向天线和定向天线;所述室内型基站的覆盖半径r为固定值;非室内型基站的覆盖半径r为,该基站天线经纬度坐标和最近的三个非室内型基站的平均距离与特定系数的乘积。所述特定系数为1.6;所述室内型基站的覆盖半径r默认为400米。

本发明的有益效果为:

本发明通过将得出的每个手机用户的轨迹链和手机用户的标签进行存储,通过客户自主注册,自主充值,自动计费,可以方便客户随时根据需要对不同的数据进行有针对性的访问。数据的访问方式灵活多样,同时,针对每一个数据的访问方式,计费方式都不同,使各种不同需要的客户都能够更加精准的访问找到自己需要的数据,支付更加精准。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明-实施例中地理实体标签的定义标准示例;

图2是本发明-实施例中用户特征标签的定义标准示例;

图3是本发明-实施例中用户特征标签内容示例。

具体实施方式

下面结合附图及具体实施例对本发明作进一步阐述。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。

应当理解,尽管本文可以使用术语第一、第二等等来描述各种单元,这些单元不应当受到这些术语的限制。这些术语仅用于区分一个单元和另一个单元。例如可以将第一单元称作第二单元,并且类似地可以将第二单元称作第一单元,同时不脱离本发明的示例实施例的范围。

应当理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,单独存在b,同时存在a和b三种情况,本文中术语“/和”是描述另一种关联对象关系,表示可以存在两种关系,例如,a/和b,可以表示:单独存在a,单独存在a和b两种情况,另外,本文中字符“/”,一般表示前后关联对象是一种“或”关系。

应当理解,当将单元称作与另一个单元“连接”、“相连”或“耦合”时,它可以与另一个单元直相连接或耦合,或中间单元可以存在。相対地,当将单元称作与另一个单元“直接相连”或“直接耦合”时,不存在中间单元。应当以类似方式来解释用于描述单元之间的关系的其他单词(例如,“在……之间”对“直接在……之间”,“相邻”对“直接相邻”等等)。

本文使用的术语仅用于描述特定实施例,并且不意在限制本发明的示例实施例。如本文所使用的,单数形式“一”、“一个”以及“该”意在包括复数形式,除非上下文明确指示相反意思。还应当理解术语“包括”、“包括了”、“包含”、和/或“包含了”当在本文中使用时,指定所声明的特征、整数、步骤、操作、单元和/或组件的存在性,并且不排除一个或多个其他特征、数量、步骤、操作、单元、组件和/或他们的组合存在性或增加。

还应当注意到在一些备选实施例中,所出现的功能/动作可能与附图出现的顺序不同。例如,取决于于所涉及的功能/动作,实际上可以实质上并发地执行,或者有时可以以相反的顺序来执行连续示出的两个图。

在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出系统,以避免用不必要的细节来使得示例不清楚。在其他实施例中,可以不以非必要的细节来示出众所周知的过程、结构和技术,以避免使得示例实施例不清楚。

实施例1:

本实施例提供了一种时空大数据的综合计费方法,包括以下步骤:

s1、计算层根据通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合,计算出每个手机用户每天的轨迹链,给每个手机用户打上标签;并将得出的轨迹链存储在轨迹库中,将得出的手机用户标签存储在人口库中;标签内容包括手机用户的职业、工作和居住属性;

s2、用户在服务层中注册账号并充值后,即可访问计算层中存储的数据,用户充值后,计费模块将用户充值后的余额进行记录,当用户访问计算层内的数据后,根据用户访问数据的内容进行计费,并将费用实时在余额中进行扣除,并将扣除后的余额进行显示。

所述步骤s2中,用户访问数据的内容包括人口数量、地理区域范围、地理精度、服务使用时长、跟踪数据使用深度和标签使用类型中的一种或多种。

所述计算层包括:

轨迹库,用于储存每个手机用户每天的轨迹链;

人口库,用于储存每个手机用户标签;

基础数据库,用于储存获取的通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合;

模型库,用于储存算法模块,所述算法模块用于根据基础数据库的内容得到轨迹库和人口库

所述服务层包括:

业务db,用于存储根据不同的业务需要在计算层的轨迹库和人口库中读取的数据;

第三方数据接入/采集模块,用于接收第三方输入的业务数据或主动采集第三方业务数据;

业务服务模块,用于将业务db内存储的数据,根据业务需要进行统计,得出对应的业务模型数据。所述主动采集第三方业务数据的方式为,通过网络爬虫在搜索引擎中读取所需的信息。

所述服务层还包括用户管理模块,用户管理模块用于用户注册和用户权限管理;用户管理模块分别与用户库和运维库数据连接,所述用户库用于储存已注册的用户信息,所述运维库用于储存系统运行的数据和运行日志。

所述服务层还包括计费模块,计费模块用于用户充值,并根据用户的消费情况进行余额管理。用户充值后,计费模块将用户充值后的余额进行记录,当用户访问计算层内的数据后,根据用户访问数据内包括的人口数量、地理区域范围、地理精度、服务使用时长、标签使用类型和跟踪数据使用深度进行计费,并将费用实时在余额中进行扣除,并将扣除后的余额进行显示。

所述计算层和服务层均设置有系统检测模块,系统检测模块用于检测系统内各个模块的运行是否正常,若发现有系统运行运行状态失常,则发出报警信息。

所述用户的余额低于预设值时,计费模块及时向用户提供充值提醒信息。

所述基站工程参数包括地区区域码、基站识别码、网络制式、天线类型、天线方位角、基站覆盖类型、基站天线位置经度坐标和基站天线位置纬度坐标;所述移动业务信令数据包括时间、用户号码和基站编号。

所述基站覆盖类型包括室内型和非室内型;所述天线类型包括全向天线和定向天线;所述室内型基站的覆盖半径r为固定值;非室内型基站的覆盖半径r为,该基站天线经纬度坐标和最近的三个非室内型基站的平均距离与特定系数的乘积。所述特定系数为1.6;所述室内型基站的覆盖半径r默认为400米。

支持本方法的一种时空大数据分析系统,包括计算层和服务层,其中:

计算层,根据通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合,计算出每个手机用户每天的轨迹链,并给每个手机用户打上标签;

服务层,根据不同的业务需要提取计算层内的不同数据,将提取出的数据进行统计后,得出对应的业务模型数据。

所述标签内容包括手机用户的职业、工作和居住属性。

所述基站工程参数包括地区区域码、基站识别码、网络制式、天线类型、天线方位角、基站覆盖类型、基站天线位置经度坐标和基站天线位置纬度坐标;所述移动业务信令数据包括时间、用户号码和基站编号。

所述基站覆盖类型包括室内型和非室内型;所述天线类型包括全向天线和定向天线;所述室内型基站的覆盖半径r为固定值;非室内型基站的覆盖半径r为,该基站天线经纬度坐标和最近的三个非室内型基站的平均距离与特定系数的乘积。所述特定系数为1.6;所述室内型基站的覆盖半径r默认为400米。

所述服务层将得出的业务模型数据转换为api、sdk和可视化组件中的一种或多种,以便第三方软件调用。

所述计算层和服务层均设置有系统检测模块,系统检测模块用于检测系统内各个模块的运行是否正常,若发现有系统运行运行状态失常,则发出报警信息。

所述计算层包括:

轨迹库,用于储存每个手机用户每天的轨迹链;

人口库,用于储存每个手机用户标签;

基础数据库,用于储存获取的通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合;

模型库,用于储存算法模块,所述算法模块用于根据基础数据库的内容得到轨迹库和人口库。

所述服务层包括:

业务db,用于存储根据不同的业务需要在计算层的轨迹库和人口库中读取的数据;

第三方数据接入/采集模块,用于接收第三方输入的业务数据或主动采集第三方业务数据;

业务服务模块,用于将业务db内存储的数据,根据业务需要进行统计,得出对应的业务模型数据。

所述主动采集第三方业务数据的方式为,通过网络爬虫在搜索引擎中读取所需的信息。

所述服务层还包括用户管理模块,用户管理模块用于用户注册和用户权限管理;用户管理模块分别与用户库和运维库数据连接,所述用户库用于储存已注册的用户信息,所述运维库用于储存系统运行的数据和运行日志。

所述服务层还包括计费模块,计费模块用于用户充值,并根据用户的消费情况进行余额管理。用户充值后,计费模块将用户充值后的余额进行记录,当用户访问计算层内的数据后,根据用户访问数据内包括的人口数量、地理区域范围、地理精度、服务使用时长、标签使用类型和跟踪数据使用深度进行计费,并将费用实时在余额中进行扣除,并将扣除后的余额进行显示。

实施例2:

本实施例提供了一种时空大数据的综合计费方法,包括以下步骤:

s1、计算层根据通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合,计算出每个手机用户每天的轨迹链,给每个手机用户打上标签;并将得出的轨迹链存储在轨迹库中,将得出的手机用户标签存储在人口库中;标签内容包括手机用户的职业、工作和居住属性;

s2、用户在服务层中注册账号并充值后,即可访问计算层中存储的数据,用户充值后,计费模块将用户充值后的余额进行记录,当用户访问计算层内的数据后,根据用户访问数据的内容进行计费,并将费用实时在余额中进行扣除,并将扣除后的余额进行显示。

所述步骤s2中,用户访问数据的内容包括人口数量、地理区域范围、地理精度、服务使用时长、跟踪数据使用深度和标签使用类型中的一种或多种。

本发明通过将得出的每个手机用户的轨迹链和手机用户的标签进行存储,通过客户自主注册,自主充值,自动计费,可以方便客户随时根据需要对不同的数据进行有针对性的访问。数据的访问方式灵活多样,同时,针对每一个数据的访问方式,计费方式都不同,使各种不同需要的客户都能够更加精准的访问找到自己需要的数据,支付更加精准。

实施例3:

本实施例公开了一种利用本发明所述的时空大数据的综合计费方法进行基于人口时空分布的选址计费的方法。

包括以下步骤:

s1、通过通信运营商提供的数据和地图服务商提供的地理数据,计算出每个手机用户每天的运动轨迹链;

s2、通过运动轨迹链分析出每个手机用户的特征,对每个手机用户打上特征标签,特征标签内容包括职业、居住地和工作地;

s3、通过运动轨迹链分析出每个地理实体建筑在每个时段的人口驻留数据,所述人口驻留数据包括驻留人员数量、驻留类型和驻留人员的特征标签;

s4、客户登录并充值后,根据需要选址的区域、选址的类型选择需要访问的数据,及访问的人口数量、地理区域范围、地理精度、服务使用时长、跟踪数据使用深度和标签使用类型;

s5、根据地理实体建筑上的人口驻留数据,对每个地理实体建筑内适合设置的业务类型进行分类。

所述步骤s5中,在结合地理实体建筑上的人口驻留数据和选址目的之前,可输入选址主体现有的业务数据,结合选址主体的业务数据,分析出适合设置选址主体的目标业务类型的地理实体建筑。所述选址主体现有的业务数据包括选址主体输入的业务数据或主动采集的业务数据。

所述步骤s1中,通信运营商提供的数据包括基站工程参数和移动业务信令数据,所述地图服务商提供的地理数据包括空间区块实际位置坐标点集合。

所述步骤s1中,计算手机用户每天的运动轨迹链包括以下步骤:

s11、获取通信运营商提供的基站工程参数、移动业务信令数据和地图服务商提供的空间区块实际位置坐标点集合;

s12、通过基站工程参数和空间区块实际位置坐标点集合,形成地理实体特征指纹;

s13、将业务信令数据按时间、空间关系进行聚合,确定用户的业务信令轨迹数据特征;由于是业务信令,即一个时间点只有一个基站。但由于用户在一个位置时,可能由于多种因素会发生基站切换,即用户连续的多条业务信令可能均指向一个位置,因此需要将用户的业务信令按时间、空间关系进行聚合;

s14、根据聚合后的业务信令轨迹数据特征,对手机用户的每个时段进行定位,判断用户在每一时段所处的具体地理实体;

s15、根据用户每一时刻的定位,按照时间先后生成用户每天的定位轨迹链。

所述步骤s12中,形成地理实体特征指纹的步骤为:

s121、根据基站工程参数计算基站的覆盖面;

s122、根据地理实体的覆盖范围和基站的覆盖面,通过gis空间计算引擎,计算得到地理实体和基站覆盖的交叉面积s;所述地理实体的覆盖范围为:将地图服务商提供的地理实体实际位置坐标点进行两两相连,形成封闭的覆盖区域,即为地理实体覆盖范围;

s123:通过基站的工程参数计算出基站的覆盖面积sb;

s124:通过基站的覆盖面积sb和交叉面积s,通过方程计算地理实体和基站的空间关系系数α,计算方程为:α=s÷sb;

s125:输出地理实体和覆盖该地理实体的基站的关系:

{b,{lc1,α},{lc2,α}{lc3,α}..{lcn,α}}(1)

其中,b为地理实体,lc为基站编号。

所述步骤s13中,确定用户的业务信令轨迹数据特征包括如下步骤:

s131、对用户业务信令记录按发生时间进行排序,如连续的业务信令记录出现往复切换,则将这两条业务信令记录合并;

例如基站a->…->基站a这样的切换,如两次出现基站a的时间间隔不超过2小时,且两次基站a之前出现的其他基站和基站a之间的距离均不超过1km,则将这些记录合并;

s132、将时间间隔在1分钟的业务信令数据合并;

由于业务信令采集来源为多个数据源,且各数据源时间可能有些许差异,故将时间间隔在1分钟的业务信令数据合并;

s133、迭代执行步骤s131和步骤s132,直到无法合并为止;

s134、合并后的记录按“开始-结束”时间划分为多个时段,每个时段内存在多条记录,修正错误数据,找到每个时段内出现时间最长的基站,并剔除时段内跟该基站距离大于1km的记录;

s135、历史数据学习,将步骤s304处理后的记录存入数据库,并与历史记录进行相似度匹配,将相似的历史记录并入该时段;

s136、计算同一时段中出现过的每个基站在近一个月中的出现频次w;

s137、输出合并后的记录:

{u,ts,te,{lc1,w1},{lc2,w2},{lc3,w3}…{lcn,wn}}(2)

其中,u为用户标识,ts为时段开始时间,te为时段结束时间,lcn为基站小区标识,wn为基站小区在近一个月的出现频次。

所述s135中,如历史记录中存在跟该时段相似度大于80%,且均为工作日或均为非工作日,且历史记录的中的基站经纬度跟当前时段中所有基站的经纬度距离均小于1km,则将历史记录也并入该时段。时段相似度=两时段内相同分钟数的平方÷(时段一分钟数×时段二分钟数)。

所述步骤s14中,判断用户在每一时段所处的具体地理实体包括:

将式(1)和式(2)按照方程(3)进行关联计算,得到用户在该时段可能所在的可能性大小p,方程(3)为:

p{u,b}=∑w*α(3)

形成每个用户每个时段在各地理实体内的可能性大小数据集,

{u,ts,te,{b1,p1},{b2,p2},{b3,p3}…{bn,pn}}(4)

其中p最大的一个地理实体即为用户该时段的驻留位置。

所述步骤s3中,驻留类型的判断方法为:

s301、根据用户的历史定位轨迹链,统计出用户当月在该地理实体的驻留频次、驻留开始时段、驻留结束时段、平均驻留时长、工作日驻留天数、非工作日驻留天数和同类位置驻留天数;

s302、根据s301中统计出的数据,判断该用户每一次驻留行为的类型,驻留类型包括居住、工作和路过。所述驻留类型确定后,结合用户的自然属性,统计各地理实体内用户结构分布,形成地理实体标签。所述自然属性由通信运营商提供,包括用户性别、年龄等。

所述基站工程参数包括地区区域码、基站识别码、网络制式、天线类型、天线方位角、基站覆盖类型、基站天线位置经度坐标和基站天线位置纬度坐标;所述移动业务信令数据包括时间、用户号码和基站编号。

所述基站覆盖类型包括室内型和非室内型;所述天线类型包括全向天线和定向天线;所述室内型基站的覆盖半径r为固定值;非室内型基站的覆盖半径r为,该基站天线经纬度坐标和最近的三个非室内型基站的平均距离与特定系数的乘积。所述特定系数为1.6;所述室内型基站的覆盖半径r默认为400米。

所述全向天线基站覆盖面的计算方法为:以天线经纬度为中心点,每隔45度向外延伸基站覆盖半径r的长度,分别得到八个坐标点,将相邻的坐标点用直线两两连接,形成封闭的基站覆盖区域,即得到全向天线基站的覆盖面。

所述定向天线基站覆盖面的计算方法为:以天线经纬度为中心点,分别按角度a、a+h÷6、a+h÷3、a+h÷2、a-h÷6、a-h÷3和a+h÷2向外延伸基站覆盖半径r的长度,得到七个坐标点,将相邻的坐标点用直线两两连接,两端的两个坐标点分别与天线经纬度点相连,形成封闭的基站覆盖区域,即得到全向天线基站的覆盖面;所述角度a为天线方位角,角度h为水平波瓣角度。所述水平波瓣角度计算方法为,若该基站定向天线数量小于等于2,则为180度,否则为120度。

本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1