一种社交匹配数据挖掘系统的制作方法

文档序号:8282364阅读:492来源:国知局
一种社交匹配数据挖掘系统的制作方法
【技术领域】
[0001] 本发明涉及社交数据挖掘领域,更具体地,涉及一种社交匹配数据挖掘系统。
【背景技术】
[0002] 随着社交网络的兴起,社交活动成为人们生活中不可或缺的一个部分。传统的 社交匹配方法是基于用户线上信息,如关注兴趣,主题及共同好友等的相似程度。随着 Online-to-Off line (020)的发展,人们关于线上社交的目光逐步从线上的虚拟关系转移到 线下基于地理位置与行为特性的线下社交。而公交上下车信息正是记录着用户线下生活的 主要行为习惯。如何将生活中的线下信息进行收集与数据挖掘,并将结果应用于线上的成 为大数据时代下的热门议题。
[0003] 随着大数据与数据挖掘的发展,各种数据来源背后隐含着个人的行为特性。而公 车作为现代社会人们出行必不可少的交通工具,其乘客上下车信息蕴含着乘客日常生活的 行为特性。
[0004] 现有Origin-Destination(OD)客流采集方法有:1)人工采集方法;2)自动计数 设备:包括基于视频采集的图像处理人流分析技术、踏板式、红外及超声波式的下车检测技 术。上述方法只能实现整体客流检测,特别是在人流拥挤的情况下存在检测不准确的情况, 且无法实现到单独乘客的上下车信息。

【发明内容】

[0005] 本发明一种将乘客公交车上下车数据应用到社交平台的社交匹配数据挖掘系统, 实现基于用户线下行为的社交推荐及匹配,将乘客上下车信息进行深度数据挖掘,使得这 些数据能有效地应用于社交平台的社交推荐与匹配。
[0006] 为达到上述技术效果,本发明的技术方案如下:
[0007] -种社交匹配数据挖掘系统,该系统用于采集和处理公交乘客上下车信息的数 据,包括乘客上下车信息采集模块、数据处理模块和社交匹配度计算模块;所述乘客上下车 信息采集模块安装于公车内,数据处理模块和社交匹配度计算模块安装于公车运行线路的 终点站或始发站内,公车到达终点站后,乘客上下车信息采集模块采集的数据经数据处理 模块处理后传送至社交匹配度计算模块来计算乘客之间的社交关系匹配程度。
[0008] 进一步地,所述乘客上下车信息采集模块包括乘客持有的含有其身份信息的双射 频识别公交卡,近距阅读器模块、远距阅读器模块、无线通信模块、地理位置信息模块和后 台数据库服务器;所述近距阅读器模块和地理位置信息模块与后台数据库服务器连接,远 距阅读器模块通过无线通信模块与后台数据库服务器连接;所述双射频识别公交卡包括无 源近距RFID模块和有源远距RFID模块,近距阅读器模块读取无源近距RFID模块中的数 据,远距阅读器模块读取有源远距RFID模块中的数据。
[0009] 进一步地,所述无源近距RFID模块记录公车卡的ID信息及费用信息,用于搭乘公 交时余额信息的读取与扣费;有源远距RFID模块包含远距射频芯片、晶振与天线,记录与 无源RFID模块相同的公车卡ID号,用于与远距阅读器模块交互。
[0010] 进一步地,所述近距阅读器模块安装于公车前门入口作为刷卡机,乘客上车时,近 距阅读器模块对无源近距RFID模块进行信息读取与扣费,读取无源近距RFID模块中包括 公交卡号、公交卡余额信息,并将读取到的数据打包发送到后台数据库服务器,数据库服务 器在接收到的数据包中加入当前站点编号、线路编号及上车时间后,记录于数据库服务器 的数据库中。
[0011] 进一步地,所述远距阅读器模块安装于公车前后门边框上,该阅读器模块包括偶 极子天线,布置于公车门边框左右两侧,乘客下车时,远距阅读器模块中的天线架向门口区 域发射射频能量,公交卡内有源远距RFID模块接收到天线架发出的能量后被驱动激活,产 生具有超高频能量的载波信号,将公交卡ID信息数据调制并载入该载波信号,并反射调制 方式完成电子标签载波信号向远距阅读器模块的传送;远距阅读器模块获取公交卡远距 RFID模块的载波信号,通过解调,获取公交卡信息,并将该信息打包后通过无线通信模块发 送至后台数据库服务器;数据库服务器在接收到的数据包中加入当前站点编号、线路编号 及下车时间后,记录于数据库服务器的数据库中;数据库服务器比对本趟车发车至当前站 点的下车记录中是否有此公车卡,若有,则将记录更新;若无,则新增加该公交卡的下车条 目,记录于数据库服务器的数据库中。
[0012] 进一步地,所述数据处理模块对数据库服务器数据库中的任一乘客公交卡对应数 据的处理过程如下:
[0013] Sl :统计时间段t内乘客的上下车站点及其对应的频数,提取出上下车频数最大 的前h个站点作为该用户的特征站点,得特征站点F 1,F2,…,Fh,其中若乘客在时间间隔△ t 内在同一站点先上车后下车,则视该站点为该乘客的中转站,中转站不作为上下车站,予以 忽略;
[0014] S2 :利用地理位置信息模块提取特征站点对应的地理位置经炜度信息;
[0015] S3 :获取特征站点对应的上下车时间序列,通过截尾均值计算获取对应特征站点 的上下车特征时间;
[0016] S4 :将下车特征时间较晚的特征站点作为第一特征站点,其次为第二特征站点,以 此类推,得到该乘客乘车特征数据向量:
【主权项】
1. 一种社交匹配数据挖掘系统,该系统用于采集和处理公交乘客上下车信息的数据, 其特征在于,包括乘客上下车信息采集模块、数据处理模块和社交匹配度计算模块;所述乘 客上下车信息采集模块安装于公车内,数据处理模块和社交匹配度计算模块安装于公车运 行线路的终点站或始发站内,公车到达终点站后,乘客上下车信息采集模块采集的数据经 数据处理模块处理后传送至社交匹配度计算模块来计算乘客之间的社交关系匹配程度。
2. 根据权利要求1所述的社交匹配数据挖掘系统,其特征在于,所述乘客上下车信息 采集模块包括乘客持有的含有其身份信息的双射频识别公交卡,近距阅读器模块、远距阅 读器模块、无线通信模块、地理位置信息模块和后台数据库服务器;所述近距阅读器模块和 地理位置信息模块与后台数据库服务器连接,远距阅读器模块通过无线通信模块与后台数 据库服务器连接;所述双射频识别公交卡包括无源近距RFID模块和有源远距RFID模块,近 距阅读器模块读取无源近距RFID模块中的数据,远距阅读器模块读取有源远距RFID模块 中的数据。
3. 根据权利要求2所述的社交匹配数据挖掘系统,其特征在于,所述无源近距RFID模 块记录公车卡的ID信息及费用信息,用于搭乘公交时余额信息的读取与扣费;有源远距 RFID模块包含远距射频巧片、晶振与天线,记录与无源RFID模块相同的公车卡ID号,用于 与远距阅读器模块交互。
4. 根据权利要求3所述的社交匹配数据挖掘系统,其特征在于,所述近距阅读器模块 安装于公车前口入口作为刷卡机,乘客上车时,近距阅读器模块对无源近距RFID模块进行 信息读取与扣费,读取无源近距RFID模块中包括公交卡号、公交卡余额信息,并将读取到 的数据打包发送到后台数据库服务器,数据库服务器在接收到的数据包中加入当前站点编 号、线路编号及上车时间后,记录于数据库服务器的数据库中。
5. 根据权利要求4所述的社交匹配数据挖掘系统,其特征在于,所述远距阅读器模块 安装于公车前后口边框上,该阅读器模块包括偶极子天线,布置于公车口边框左右两侧,乘 客下车时,远距阅读器模块中的天线架向口 口区域发射射频能量,公交卡内有源远距RFID 模块接收到天线架发出的能量后被驱动激活,产生具有超高频能量的载波信号,将公交卡 ID信息数据调制并载入该载波信号,并反射调制方式完成电子标签载波信号向远距阅读器 模块的传送;远距阅读器模块获取公交卡远距RFID模块的载波信号,通过解调,获取公交 卡信息,并将该信息打包后通过无线通信模块发送至后台数据库服务器;数据库服务器在 接收到的数据包中加入当前站点编号、线路编号及下车时间后,记录于数据库服务器的数 据库中;数据库服务器比对本趟车发车至当前站点的下车记录中是否有此公车卡,若有,贝U 将记录更新;若无,则新增加该公交卡的下车条目,记录于数据库服务器的数据库中。
6. 根据权利要求5所述的社交匹配数据挖掘系统,其特征在于,所述数据处理模块对 数据库服务器数据库中的任一乘客公交卡对应数据的处理过程如下: 51 ;统计时间段t内乘客的上下车站点及其对应的频数,提取出上下车频数最大的前 h个站点作为该用户的特征站点,得特征站点Fi,F2,…,Fh,其中若乘客在时间间隔At内 在同一站点先上车后下车,则视该站点为该乘客的中转站,中转站不作为上下车站,予W忽 略; 52 ;利用地理位置信息模块提取特征站点对应的地理位置经绅度信息; S3;获取特征站点对应的上下车时间序列,通过截尾均值计算获取对应特征站点的上 下车特征时间; 54 ;将下车特征时间较晚的特征站点作为第一特征站点,其次为第二特征站点,W此类 推,得到该乘客乘车特征数据向量:
其中,;为乘客乘车特征数据向量;Uk,Lgk,T&,Tdk分别为第k个特征站点的上车经度、 绅度、上车特征时间与下车特征时间。
7.根据权利要求6所述的社交匹配数据挖掘系统,其特征在于,在数据库服务器数据 库中抽取S个乘客公交卡对应数据进行如S1-S4的处理得到矩阵P = ),对P进 一步进行处理,过程如下: 55 ;对P进行尺度归一化处理,确保各个分量保持在相同的变化尺度内,得到特征矩阵 P' : S7 ;将训练特征矩阵P'进行聚类分析,设定类别数为k,聚类后得到k个类别中屯、序列 氏,;,...,;],其对应的类别标签为山,12,…,1J ; S8;对于一个新的乘客乘车特征数据向量;,> 计算;;f与k个类别中屯、序列 氏,;,…,;]的欧氏距离,将苗的类别标签It标记为与其欧式距离最小的类别中屯、点对 应的类别标签,并取前Z个距离最小的类别最为的最近邻类别; S9 ; 对应的Z个最近邻类别的所有样本集合S = {pi, P2,…,PiJ,计算与S中的 所有样本的欧式距离,并将计算的结果按降序排列得到新的样本集合S'; S10;S'中的一样本的序号为X,则该样本与;社交关系度量值为v;v = ^其中N为 y new 八, Z个最近邻类别的所有样本的个数。
【专利摘要】本发明提供一种社交匹配数据挖掘系统,该系统用于采集和处理公交乘客上下车信息的数据,其特征在于,包括乘客上下车信息采集模块、数据处理模块和社交匹配度计算模块;所述乘客上下车信息采集模块安装于公车内,数据处理模块和社交匹配度计算模块安装于公车运行线路的终点站或始发站内,公车到达终点站后,乘客上下车信息采集模块采集的数据经数据处理模块处理后传送至社交匹配度计算模块来计算乘客之间的社交关系匹配程度。本发明能充分利用乘客日常生活的行为特征,映射到线上的社交关系匹配中,深度挖掘出数据的价值,对公共交通服务的信息化及人性化起到促进作用。
【IPC分类】G06F17-30, G06Q50-00, G06K9-62
【公开号】CN104598543
【申请号】CN201410851735
【发明人】余荣, 蔡圻钊, 张浩川, 谢胜利, 潘树坤, 吴茂强
【申请人】广东工业大学
【公开日】2015年5月6日
【申请日】2014年12月29日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1