一种通信用户社交圈生成方法及系统与流程

文档序号:12722291阅读:251来源:国知局
一种通信用户社交圈生成方法及系统与流程

本发明涉及通信领域,尤其涉及一种通信用户社交圈生成方法及系统。



背景技术:

移动通讯技术是通讯技术新的发展,是利用移动终端设备来进行通信,实现信息的交流,以共享资源的一种新兴技术。随着智能手机的发展,移动通讯技术更是得到飞速的发展,使得移动即时通讯设备与通信网络无线连接的可用性变得越来越普遍,其中通信用户中保存有大量的通信数据,这些大量的通信数据是通信用户获取社交圈的重要资源。

目前,通信用户社交圈的生成,基本都是基于微信、微博等网络社交媒体来分析;也有基于通信用户的通话数据进行分析的,但基于通话数据的大多是根据通话频次等数据的分布式处理进行的一些统计分析,对于仅通过简单的统计通信次数进行的分析必然不够,因为目前通信用户大量的通信数据致使传统的数据库统计满足不了大数据量的分析要求;还有,对单个用户行为数据进行统计结果较粗糙,很难准确分析出其社交圈,分析具有片面性。

因此,针对通信用户的大数据进行分析,进而准确生成所述通信用户的社交圈,在通信用户社交圈生成领域具有重要的意义。



技术实现要素:

为了解决上述技术问题,本发明提出了一种通信用户社交圈生成方法及系统。

本发明是以如下技术方案实现的:

本发明的第一方面提供了一种通信用户社交圈生成方法,所述方法包括:

获取第一通信用户与第二通信用户间的相似指数,所述第二通信用户为所述第一通信用户的目标对端;

根据所述相似指数对所述第二通信用户进行第一排序;

设定第一阈值,由相似指数大于所述第一阈值的第二通信用户生成候选社交圈;

根据用户属性获取所述第一通信用户与所述候选社交圈中的第二通信用户间的交往指数,所述用户属性为所述第一通信用户与所述候选社交圈中的第二通信用户的通话频度、通话时长和通话次数;

根据所述交往指数对所述候选社交圈中的第二通信用户进行第二排序;

设定第二阈值,由交往指数大于所述第二阈值的第二通信用户生成用户社交圈。

进一步地,所述相似指数为所述第一通信用户与所述第二通信用户中相同对端的数量;

所述交往指数是由所述第一通信用户与所述候选社交圈中的第二通信用户间的通话频度、通话时长和通话次数加权得到的。

进一步地,所述获取第一通信用户与第二通信用户间的相似指数之前包括:

清洗所述第一通信用户中对端的数据,得到第二通信用户。

进一步地,所述获取第一通信用户与第二通信用户间的相似指数,包括:

获取所述第一通信用户的通话数据和所述第二通信用户的通话数据;

判断所述第一通信用户的通话数据和所述第二通信用户的通话数据中是否存在相同的对端,若是,则统计所述相同对端的数量,得到所述相似指数。

所述通话频度的权重最高,所述通话时长和通话次数的权重次之,所述通话频度为所述第一通信用户与所述第二通信用户间联系的稳定度,所述通话次数为所述第一通信用户与所述第二通信用户间联系的密度,所述通话时长为所述第一通信用户与所述第二通信用户间联系的重要度。

进一步地,所述通话频度的计算包括:

根据所述第二通信用户在所述第一通信用户中出现的天数、周数和月数,获取所述第二通信用户的通话频度。

本发明的第二方面提供了一种通信用户社交圈生成系统,所述系统包括:

相似指数获取模块,用于获取第一通信用户与第二通信用户间的相似指数,所述第二通信用户为所述第一通信用户的目标对端;

第一排序模块,用于根据所述相似指数对所述第二通信用户进行第一排序;

候选社交圈生成模块,用于设定第一阈值,由相似指数大于所述第一阈值的第二通信用户生成候选社交圈;

交往指数获取模块,用于根据用户属性获取所述第一通信用户与所述候选社交圈中的第二通信用户间的交往指数,所述用户属性为所述第一通信用户与所述候选社交圈中的第二通信用户的通话频度、通话时长和通话次数;

第二排序模块,根据所述交往指数对所述候选社交圈中的第二通信用户进行第二排序;

用户社交圈生成模块,用于设定第二阈值,由交往指数大于所述第二阈值的第二通信用户生成用户社交圈。

进一步地,所述相似指数为所述第一通信用户与所述第二通信用户中相同对端的数量;

所述交往指数是由所述第一通信用户与所述候选社交圈中的第二通信用户间的通话频度、通话时长和通话次数加权得到的。

进一步地,所述相似指数获取模块,包括:

通话数据获取单元,用于获取所述第一通信用户的通话数据和所述第二通信用户的通话数据;

相同对端统计单元,用于判断所述第一通信用户的通话数据和所述第二通信用户的通话数据中是否存在相同的对端,若是,则统计所述相同对端的数量,得到所述相似指数。

进一步地,所述交往指数获取模块包括:

通话频度获取单元,用于根据所述第二通信用户在所述第一通信用户中出现的天数、周数和月数,获取所述第二通信用户的通话频度。

本发明通过获取第一通信用户与其对端间的相似指数,由相似指数大于第一阈值的第二通信用户构成候选社交圈;进一步地,根据用户属性获取所述第一通信用户与其对端间的交往指数,由交往指数大于第二阈值的第二通信用户构成用户社交圈;本发明通过逐次对所述第一通信用户的对端进行筛选,能够准确生成所述第一通信用户的社交圈。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是实施例一提供的所述方法的方法流程图;

图2是实施例一中对所述相似指数进行举例说明的示意图;

图3是实施例二提供的所述系统的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一:

本实施例提供了一种通信用户社交圈生成方法,如图1所示,所述方法包括:

S101.获取第一通信用户与第二通信用户间的相似指数,所述第二通信用户为所述第一通信用户的目标对端;

其中,每个通信用户都有各自的身份,通信用户间的相似指数以终端使用的电话号码作为身份进行体现。

具体地,所述获取第一通信用户与第二通信用户间的相似指数,包括:

获取所述第一通信用户的通话数据和所述第二通信用户的通话数据;

判断所述第一通信用户的通话数据和所述第二通信用户的通话数据中是否存在相同的对端,若是,则统计所述相同对端的数量,得到对应的相似指数。

举例说明,如图2所示,图2中的通信用户的电话号码133****9682与电话号码189****2227都与中间的三个号码有通话联系,则这两个号码之间的相似指数为3;而电话号码133****9682与电话号码133****2815之间仅有一个通话号码,相似指数为1;133****9682与189****2227的相似指数要比133****9682与133****2815之间的相似指数高。

具体地,以手机用户来说,则所述对端用户为所述手机用户进行通信的用户,所述相似指数的获取是通过检测手机用户与其交往用户中均有通话记录的电话号码进行获取的,相同号码的数量就是手机用户与其交往用户之间的相似指数;当相似指数比较高时,说明手机用户与其交往用户之间关系密切。

进一步地,所述获取第一通信用户与第二通信用户间的相似指数之前包括:

清洗所述第一通信用户中对端的数据,得到第二通信用户。

具体地,以手机用户为例,清洗所述第一通信用户中对端的数据包括,对一些临时性通话号码的干扰进行删除处理;所述临时性通话号码包括客服号码或是错误来电的突发号码等;清洗数据能够确保通话比较有规律的号码的通话频度高,进而提升所述社交圈生成的准确率。

S102.根据所述相似指数对所述第二通信用户进行第一排序;

其中,清洗过后获取所述第一通信用户的目标对端,所述相似指数为所述第一通信用户与所述第二通信用户中相同对端的数量,根据所述数量对所述第一通信用户的所有第二通信用户进行排序。所述相似指数作为通信用户关系判断的衡量标准,其中以手机用户为例,通过相似指数关系计算手机用户之间关系的概率,所述相似指数能够体现出手机用户之间的密切程度。

S103.设定第一阈值,由相似指数大于所述第一阈值的第二通信用户生成候选社交圈;

由相似指数大于所述第一阈值的第二通信用户生成候选社交圈

具体地,每个所述第二通信用户对应一个相似指数,将第一阈值与每个相似指数进行比对,有些相似指数大于所述第一阈值,则这些相似指数对应的第二通信用户就构成了候选社交圈;有些相似指数小于所述第一阈值,则删除这些相似指数对应的第二通信,不进行考虑。

S104.根据用户属性获取所述第一通信用户与所述候选社交圈中的第二通信用户间的交往指数,所述用户属性为所述第一通信用户与所述候选社交圈中的第二通信用户的通话频度、通话时长和通话次数;

所述交往指数是由所述第一通信用户与所述候选社交圈中的第二通信用户间的通话频度、通话时长和通话次数加权得到的。

所述通话频度为所述第一通信用户与所述第二通信用户间联系的稳定度;在一段时间内,通话频度越高,则表示交往越稳定,其交往指数也越高,反之,通话频度低,则表示交往不稳定,其交往指数也低。

所述通话次数为所述第一通信用户与所述第二通信用户间联系的密度;在有效时间内,通话次数越多,表示本时间段内,联系越紧密。

所述通话时长为所述第一通信用户与所述第二通信用户间联系的重要度;在有效时间内,总通话时间越长,表示交往对象也越重要。

其中,所述通话频度的权重最高,通话时长和通话次数的权重次之,计算公式如下:

Exp=0.6*call_freq+0.2*call_dur+0.2*call_counts

call_freq表示通话频度;call_dur表示通话时长;call_counts表示通话次数;Exp表示通话频度。

进一步地,所述通话频度的计算包括:

根据所述第二通信用户在所述第一通信用户中出现的天数、周数和月数,获取所述第二通信用户的通话频度。

具体地,所述通话频度的计算综合考虑对端号码出现的天数、周数和月数,这样能够提高频度计算的精确度。

所述通话频度的计算方法如下:

call_freq=(Dn+Wn+Pn)/C

C:常量,表示第一通信用户在一个连续时间段进行通话行为的天数;

Dn:第一通信用户在C天内与第二通信用户有通话行为的天数;

Wn:第一通信用户在C天内与第二通信用户有通话行为的周数;

Pn:第一通信用户在C天内与第二通信用户有通话行为的月数。

S105.根据所述交往指数对所述候选社交圈中的第二通信用户进行第二排序;

具体地,根据计算出来的交往指数大小对所述候选社交圈中的第二通信用户进行排序,其中,所述交往指数高的第二通信用户为所述第一通信用户的亲密的朋友。

S106.设定第二阈值,由交往指数大于所述第二阈值的第二通信用户生成用户社交圈。

具体地,所述候选社交圈中的每个第二通信用户对应一个交往指数,将第二阈值与每个交往指数进行比对:有些交往指数小于所述第二阈值,则删除这些交往指数对应的第二通信,不进行考虑;有些交往指数大于所述第二阈值,则这些交往指数对应的第二通信用户就构建出所述第一通信用户的社交圈。

需要说明的是,利用所述方法生成社交圈中的通信用户,也可以进一步扩展至使用应用平台作为社交工具进行通信,对应的通信用户的身份就是在应用平台上注册的账号。在得到所述用户社交圈之后,可以进一步地进行用户社交圈的深入分析,了解所述通信用户的其他相关信息,比如喜爱的兴趣、热爱的领域和娱乐的方式等。

实施例二:

本实施例提供了一种通信用户社交圈生成系统,如图3所示,所述系统包括:

相似指数获取模块110,用于获取第一通信用户与第二通信用户间的相似指数,所述第二通信用户为所述第一通信用户的目标对端;

进一步地,所述相似指数获取模块110,包括:

通话数据获取单元111,用于获取所述第一通信用户的通话数据和所述第二通信用户的通话数据;

相同对端统计单元112,用于判断所述第一通信用户的通话数据和所述第二通信用户的通话数据中是否存在相同的对端,若是,则统计所述相同对端的数量,得到所述相似指数。

第一排序模块120,用于根据所述相似指数对所述第二通信用户进行第一排序;

候选社交圈生成模块130,用于设定第一阈值,由相似指数大于所述第一阈值的第二通信用户生成候选社交圈;

交往指数获取模块140,用于根据用户属性获取所述第一通信用户与所述候选社交圈中的第二通信用户间的交往指数,所述用户属性为所述第一通信用户与所述候选社交圈中的第二通信用户的通话频度、通话时长和通话次数;

所述交往指数获取模块140包括:

通话频度获取单元141,用于根据所述第二通信用户在所述第一通信用户中出现的天数、周数和月数,获取所述第二通信用户的通话频度;其中,所述通话频度为所述第一通信用户与所述第二通信用户间联系的稳定度;在一段时间内,通话频度越高,则表示交往越稳定,其交往指数也越高,反之,通话频度越低,则表示交往越稳定,其交往指数也越低。

通话次数获取单元142,用于获取所述第一通信用户与所述第二通信用户间联系的次数,所述通话次数为所述第一通信用户与所述第二通信用户间联系的密度;其中,在有效时间内,通话次数越多,表示本时间段内,联系越紧密。

通话时长获取单元143,用于获取所述第一通信用户与所述第二通信用户间联系的重要度;其中,在有效时间内,总通话时间越长,表示交往对象也越重要。

第二排序模块150,根据所述交往指数对所述候选社交圈中的第二通信用户进行第二排序;

用户社交圈生成模块160,用于设定第二阈值,由交往指数大于所述第二阈值的第二通信用户生成用户社交圈。

进一步地,所述相似指数为所述第一通信用户与所述第二通信用户中相同对端的数量;

所述交往指数是由所述第一通信用户与所述候选社交圈中的第二通信用户间的通话频度、通话时长和通话次数加权得到的。

(一)本发明通过获取第一通信用户与其对端间的相似指数,利用设定的第一阈值与所述相似指数进行对比,进一步地,根据用户属性获取所述第一通信用户与其对端间的交往指数,利用设定的第二阈值与所述交往指数进行对比;通过逐次对所述第一通信用户的对端进行筛选,能够准确生成所述第一通信用户的社交圈;

(二)本发明的所述交往指数是由所述第一通信用户与所述候选社交圈中的第二通信用户间的通话频度、通话时长和通话次数加权得到,其中,所述通话频度的计算综合考虑对端号码出现的天数、周数和月数,准确计算第一通信用户与其对端的通话频度,提高通话频度计算的精确度;

(三)本发明在获取所述第一通信用户与对端之间的相似指数之前,先对所述第一通信用户的通信数据进行清洗,删除临时性通话数据的干扰,确保通话比较有规律的号码的通话频度高,进而提高社交圈生成的效率;

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

本发明中的技术方案中的各个模块均可通过计算机终端或其它设备实现。所述计算机终端包括处理器和存储器。所述存储器用于存储本发明中的程序指令/模块,所述处理器通过运行存储在存储器内的程序指令/模块,实现本发明相应功能。

本发明中的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

本发明中所述模块/单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。可以根据实际的需要选择其中的部分或者全部模块/单元来达到实现本发明方案的目的。

另外,在本发明各个实施例中的各模块/单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1