一种基于时空交互的用户社交关系强度计算方法及系统与流程

文档序号:11251006阅读:912来源:国知局
一种基于时空交互的用户社交关系强度计算方法及系统与流程

本发明涉及用户社交关系挖掘领域,尤其是一种基于时空交互的用户社交关系强度计算方法及系统。



背景技术:

手机、平板电脑等便携式移动设备的迅速普及极大地推动了各种社交平台的广泛应用。集成了gps、无线网络、卫星定位等定位功能的智能设备为用户在社交平台上的位置标记、位置签到和位置共享提供了极大的便利。随着社交平台与位置技术的紧密结合,促进了基于位置的社交网络(location-basedsocialnetworks,lbsns)的形成和发展。社交平台通过用户的位置标记、位置签到、位置分享等功能,将线上的虚拟社会与线下的物理世界关联在一起,不仅能够体现用户活动的时空信息,还能够实现基于位置的社交活动在虚拟网络世界中的共享和传播。这种基于位置的社交网络所具备的社交化(social)、本地化(local)和移动性(mobile)等基本特征可以表示为solomo,正逐渐吸引人们的关注,成为未来互联网的发展趋势。

在solomo中,social指的是用户之间在线上虚拟的网络世界中广泛存在的社交关系,包括用户之间的相互关注、用户之间的朋友关系或同事关系等;local指的是线下真实世界中用户的位置或活动信息,包括签到、消费、旅游等;mobile指的是用户在真实的现实空间中的移动。除了位置标记、位置签到、位置共享等直接的时空信息获取功能外,它还允许用户通过社交平台分享带有时空标记的观点、图片以及活动轨迹等信息。例如:用户可以通过微信向好友发送位置信息,可以在twitter和新浪微博等社交平台上发布带有时空标签的内容,可以在flickr上发布带有位置信息的照片,还可以在foursquare或gowalla上进行签到等。

在位置社交网络中,用户之间的交互主要体现在用户的活动在时间和空间维度上的重叠。用户社交关系的发现和计算旨在利用用户的活动发现用户之间的社交关系并对其进行量化计算,但现阶段的用户社交关系发现和计算存在很多不足和困难,如:

(1)在对用户之间的社交关系进行定性分析时,不仅需要考虑用户社交网络之间的固有连接,还需要综合考虑用户之间交互的属性特征,例如交互时间点、交互时长、交互位置特征等。

(2)在对用户之间的社交关系进行定量分析时,需要抽取用户的时空交互特征,如交互频度、用户行为特征等,对其进行量化计算,并以此为基础对用户之间的社交关系进行定量分析。

(3)用户之间的社交关系发现与强度计算需要从基于位置的社交网络数据中尽可能多地发现和抽取用户的宏观活动和语义信息。由于通过定位系统和社交网络获得的位置数据信息量大,且冗余以及不确定,单纯地采用传统数据挖掘方法是无法对用户之间的社交关系强度进行精确量化计算的,因此,需要稳定、可伸缩性的挖掘方法进行处理;同时,基于位置的社交网络数据具有稀疏性,这会减弱用户之间的社交关系,从而降低用户之间社交关系量化计算的准确性。此外,如果算法设计不合理,随着用户数量的增加,位置数据量的增大,模型的计算代价可能呈指数级增长,这将严重影响模型的实际应用价值。基于位置的社交网络数据是由一个个的地理坐标点构成的,设备误差和用户误差导致这些数据较为离散。因此,上述问题的解决将会为用户社交关系强度的精准计算带来非常大的帮助。



技术实现要素:

本发明所要解决的技术问题在于克服现有技术缺陷,提供一种基于时空交互的用户社交关系强度计算方法及系统,在深入分析位置社交网络的时空交互特性的基础上,充分考虑了用户的行为特征和时空交互信息,能够更加全面和准确地度量用户之间的社交关系强度。

一种基于时空交互的用户社交关系强度计算方法,主要包括以下3大阶段:

(1)地理位置映射,该阶段包括以下4个步骤:

step1:将地球表面划分为若干个大小相等的正方形格子,初始化的网格要满足以下2个条件:①能覆盖地球表面,②网格数最少;

step2:用户根据数据分析结果,设定网格内的样本密度阈值和网格最小边界阈值;

step3:根据网格内的样本密度阈值和网格最小边界阈值对网格进行迭代划分,直到满足结束条件;

step4:将用户签到数据匹配到网格中,并将其映射为时空序列;

(2)时空交互情境模型构建及情境权重计算,该阶段包括以下3个步骤:

step1:提取不同时间段中用户的签到频率、签到位置等信息,构建时间情境模型并计算时间情境的权重;

step2:提取不同位置点处用户的签到频率、签到时间和用户数量等信息,构建环境情境模型并计算环境情境的权重;

step3:提取不同用户在不同时间段、不同位置点处的签到频率等信息,构建用户情境模型并计算用户情境的权重;

(3)用户社交关系强度计算,该阶段包括以下3个步骤:

step1:将时空交互序列转换为访问向量;

step2:从访问向量中提取出用户之间的相遇向量;

step3:匹配用户进行时空交互时的时空交互情境特征并获得其权重,按照权重优先的策略,计算用户之间的社交关系强度。

本发明还提供一种基于时空交互的用户社交关系强度计算系统,主要包括以下3大模块:

数据预处理模块,该模块包括以下4个步骤:

step1:对用户签到数据集和朋友关系数据集进行降噪和清洗,过滤掉用户签到数据集和朋友关系数据集中的异常数据;

step2:根据用户提出的条件,对用户签到数据集进行筛选处理,从中筛选出满足用户需求的用户签到数据子集和朋友关系数据子集;

step3:根据用户设置的相关参数,对用户签到数据子集中的签到数据进行地理位置映射处理,从而得到用户时空交互序列;

step4:根据用户朋友关系数据子集中的用户朋友关系,计算用户之间的初始社交关系强度;

用户社交关系强度计算模块,该模块包括以下4个步骤:

step1:将用户时空交互序列转化为用户访问向量;

step2:根据本发明提出的时空交互情境模型,分别计算时间情境、环境情境和用户情境的权重;

step3:根据本发明提出的时空交互条件(如交互时间点、交互时长、交互时间差等)和时空交互情境模型,将用户访问向量转化为用户相遇向量;

step4:综合分析相遇向量,结合时间情境权重、环境情境权重和用户情境权重,计算用户之间的社交关系强度;

可视化数据分析展示模块,该模块包括以下2个步骤:

step1:用户和系统进行交互,用户通过输入不同的参数,对系统的展示结果进行调整;

step2:以用户签到数据集和朋友关系数据集的分析结果为基础,将虚拟的数据转化为可视化的数据并展示给用户,如:网格数量与用户社交关系查全率的对比图、网格数量与用户社交关系查准率的对比图、用户社交关系查全率与用户社交关系查准率的对比图以及网格数量对用户社交关系强度影响的对比图。

本发明的有益效果在于:

(1)该方法充分考虑了用户的时空交互特征和用户的行为习惯;

(2)该方法能够有效地计算用户之间的社交关系强度;

(3)该方法能够更为详细地计算用户之间的社交关系强度;

(4)该方法能够为用户社交关系发现、用户朋友推荐等应用提供精确、全面的数据支持。

附图说明

图1为本发明基于时空交互的用户社交关系强度计算方法的算法流程图;

图2为本发明基于时空交互的用户社交关系强度计算方法的算法总体框架图;

图3为本发明基于时空交互的用户社交关系强度计算方法的算法模型图;

图4为本发明基于时空交互的用户社交关系强度计算系统的系统框架图;

图5为本发明基于时空交互的用户社交关系强度计算方法中地理位置匹配的示意图;

图6为本发明基于时空交互的用户社交关系强度计算方法中用户时空交互的时间情境模型;

图7为本发明基于时空交互的用户社交关系强度计算方法中用户时空交互的环境情境模型;

图8为本发明基于时空交互的用户社交关系强度计算方法中用户时空交互的用户情境模型;

图9为本发明基于时空交互的用户社交关系强度计算方法的网格数量与用户社交关系查全率的对比图;

图10为本发明基于时空交互的用户社交关系强度计算方法的网格数量与用户社交关系查准率的对比图;

图11为本发明基于时空交互的用户社交关系强度计算方法的用户社交关系查全率与用户社交关系查准率的对比图;

图12为本发明基于时空交互的用户社交关系强度计算方法的网格数量对用户社交关系强度影响的对比图。

具体实施方式

本发明公开了一种基于时空交互的用户社交关系强度计算方法及系统,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清晰地描述。以下实施例有助于本领域的技术人员更好地理解本发明,但不以任何形式限制本发明。需要注明的是,基于本发明中的实施例,本领域中的普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。

如图1-图3所示,本发明提供的基于时空交互的用户社交关系强度计算方法,其特征在于,包括如下步骤:

(1)地理位置映射,将地球表面划分为若干个网格,并将用户签到数据转换为时空序列(如图5所示);

step1:初始化网格,将地球表面划分为若干个大小相等的正方形格子,初始化的网格通常要满足以下2个条件:①能覆盖地球表面,②网格数最少;

step2:用户根据数据分析结果,设定网格内的样本密度阈值d和网格最小边界阈值b

step3:统计网格内的实际样本密度ρ,比较网格内的实际样本密度是否大于给定的样本密度阈值,若大于,则执行step4,否则,执行step6;

step4:统计网格的边界λ,比较网格边界是否大于给定的边界阈值,若大于,则执行step5,否则,执行step6;

step5:将网格进行四等分,重复执行step3;

step6:将用户签到数据c匹配到网格中,并将其映射为时空序列l

(2)时空交互情境模型构建及情境权重计算,分别搭建时间情境模型、环境情境模型和用户情境模型,并计算其权重;

step7:提取不同时间段中用户的签到频率、签到位置等信息,构建时间情境模型(如图6所示)并计算时间情境的权重wt

step8:提取不同位置点处用户的签到频率、签到时间和用户数量等信息,构建环境情境模型(如图7所示)并计算环境情境的权重we,计算公式如下所示:

其中,|cg|为位置点g处全部用户签到次数的总和,|cu,g|为每个位置点g处用户u的签到次数总和,|cu|每个位置点g处签到用户的数量总和,|u|为用户的总数量,α为可调节的参数;

step9:提取不同用户在不同时间段、不同位置点处的签到频率等信息,构建用户情境模型(如图8所示,t1t2,……,t14分别代表不同的时间点)并计算用户情境的权重wu

其中,|cu,g|为每个位置点g处用户u的签到次数总和,|g|为位置点的总数量。

(3)用户社交关系强度计算,提取用户之间的相遇向量,按照权重优先的策略,计算用户之间的社交关系强度;

step10:将时空交互序列l转换为访问向量vv

step11:从访问向量vv中提取出用户之间的相遇向量cv

step12:匹配用户进行时空交互时的时空交互情境特征并获得其权重,按照权重优先的策略,计算用户之间的社交关系强度s,计算公式如下所示:

其中,s为用户之间的社交关系强度,wt为时间情境下用户之间的时空交互权重,we为环境情境下用户之间的时空交互权重,wu为用户情境下用户之间的时空交互权重。

如图4所示,本发明还公开了一种基于时空交互的用户社交关系强度计算系统,该系统可以实现本发明所述的基于时空交互的用户社交关系强度计算方法,但该基于时空交互的用户社交关系强度计算方法的实现装置包括但不限于所述的基于时空交互的用户社交关系强度计算系统。

本发明提供的基于时空交互的用户社交关系强度计算系统包括:数据预处理模块、用户社交关系强度计算模块和可视化数据分析模块;

数据预处理模块,对用户的签到数据集和朋友关系数据集进行降噪、清洗、筛选、地理位置映射等处理,以及计算用户之间的初始社交关系强度;

step1:对用户签到数据集c和朋友关系数据集p进行降噪和清洗,过滤掉用户签到数据集c和朋友关系数据集p中的异常数据;

step2:根据用户提出的条件,对用户签到数据集c和朋友关系数据集p进行筛选处理,从中筛选出满足用户需求的用户签到数据子集cs和朋友关系数据子集ps

step3:根据用户设置的相关参数,对用户签到数据子集cs中的签到数据进行地理位置映射处理,从而得到用户时空交互序列l

step4:根据用户朋友关系数据子集ps中的用户朋友关系,计算用户之间的初始社交关系强度sini

用户社交关系强度计算模块,提取用户之间的时空交互特性和行为特征,计算用户之间的静态社交关系强度;

step5:将用户时空交互序列l转化为用户访问向量cv

step6:根据本发明提出的时空交互情境模型,分别计算时间情境、环境情境和用户情境的权重;

step7:根据本发明提出的时空交互条件(如交互时间点、交互时长、交互时间差等)和时空交互情境模型,将用户访问向量cv转化为用户相遇向量vv

step8:综合分析相遇向量vv,结合时间情境权重wt、环境情境权重we和用户情境权重wu,计算用户之间的社交关系强度s

可视化数据分析展示模块,用户通过参数输入界面修改实验参数、调整实验结果,利用多种方式对用户之间的社交关系分析结果进行可视化的展示;

step9:用户和系统进行交互,用户通过输入不同的参数,对系统的展示结果进行调整;

step10:以用户签到数据集c和朋友关系数据集p的分析结果为基础,将虚拟的数据转化为可视化的数据并展示给用户;如:网格数量与用户社交关系查全率的对比图(如图9所示)、网格数量与用户社交关系查准率的对比图(如图10所示)、用户社交关系查全率与用户社交关系查准率的对比图(如图11所示)以及网格数量对用户社交关系强度影响的对比图(如图12所示)。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1