一种对多个用户进行用户群划分的方法、装置与设备的制作方法

文档序号:6383587阅读:293来源:国知局
专利名称:一种对多个用户进行用户群划分的方法、装置与设备的制作方法
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备。
背景技术
现有技术中一般基于用户属性,如基于用户所属行业分类、地域等,直接对多个用户进行用户群划分;或是通过确定用户的分类体系,构建被标注的客户分类样本,通过训练分类模型从而对多个用户进行用户群划分。但是,基于用户属性直接划分的方式所涉及的用户属性信息维度有限,在复杂的网络应用场景中则无法得到正确划分后的用户群;同时,由于不同的业务需求需要不同类型的分类体系,因而通过构建训练分类模型体系进行划分的方式的构建成本较大,且静态的分类体系构建无法有效地适应复杂多变的网络应用环境。

发明内容
本发明的目的是提供一种基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备。根据本发明的一个方面,提供了一种基于用户拓扑关系网对多个用户进行用户群划分的方法,该方法包括以下步骤a获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;b根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;c当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。根据本发明的另一方面,还提供了一种用于基于用户拓扑关系网对多个用户进行用户群划分的划分装置,该划分装置包括发布次数获取装置,用于获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;第一强度确定装置,用于根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;第一划分装置,用于当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。与现有技术相比,本发明与现有技术的区别在于通过构建用户拓扑关系网,并基于层次级聚类方法对该用户拓扑关系网中的多个用户进行用户群划分,能够根据多个用户之间基于发布信息的共同展现次数的关系进行用户群划分,提高划分效率及准确性;且避免了现有技术中仅基于用户属性直接划分的方式的局限性及通过构建训练分类模型体系进行划分的方式的较大成本花费,有效地在复杂多变的网络应用环境中对海量用户进行客观性群属划分;2)通过确定用户拓扑关系网中每个用户群的用户群内交互关系强度,能够掌握群内各个用户基于信息发布的竞争关系紧密度,使得群内每一用户能够客观了解与其具有相同或相似信息发布需求的其他用户的与自身的发布竞争关系,从而为适当调整其信息发布方式提供可靠依据;3)通过提取划分后的用户群中的多个用户的相同特征信息的方式来为该用户群标注描述信息,使得描述信息能够更加全面、准确地从多个维度出发来概括该用户群,因此用户能够充分了解其自身所处用户群的特点,为用户进一步适当调整其信息发布方式提供可靠依据;进一步,降低了由于用户不能准确把握其所属用户群而错失的发布机会,使得网民可通过搜索引擎进行查询来获取与其查询需求更为匹配的来自同一用户群的多条发布信息,提高了网民查询效率与搜索体验。。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图1示出本发明一个方面的用于基于用户拓扑关系网对多个用户进行用户群划分的划分装置的结构示意图;图2示出根据本发明一个优选实施例的用于为用户群标注描述信息的划分装置的设备示意图;图3示出根据本发明另一个方面的基于用户拓扑关系网对多个用户进行用户群划分的方法流程图;图4示出根据本发明一个优选实施例的为用户群标注描述信息的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示出本发明一个方面的用于基于用户拓扑关系网对多个用户进行用户群划分的划分装置的结构示意图;本实施例的划分装置包含于网络设备中;该划分装置包括发布次数获取装置1、第一强度确定装置2及第一划分装置3。其中,所述网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述网络设备仅为举例,其他现有的或今后可能出现的网络设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。其中,所述用户拓扑关系网中包括待划分用户群的多个用户。首先,发布次数获取装置I获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数。其中,当网民执行一次检索操作来获取搜索结果时,多个用户中任意两个用户的发布信息同时出现在搜索结果页面中,即指一次共同发布;所述共同发布次数意指基于网民的同次检索的搜索结果中、多个用户中任意两个用户的发布信息同时出现在搜索结果页面中的统计次数;所述非共同发布次数意指基于网民的同次检索的搜索结果中、多个用户中任意两个用户的发布信息未同时出现在搜索结果页面中的统计次数。具体地,发布次数获取装置I根据多个用户的用户标识,如用户ID,在本地或第三方设备的发布信息库中进行查询,以获取多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数。其中,所述发布信息库中保存有多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;优选地,所述发布信息库包括但不限于关系数据库、Key-Value存储系统或文件系统等;所述发布信息库可位于划分装置所在的网络设备中,或位于于与该网络设备通过网络连接的其他第三方设备中。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数的实现方式,均应包含在本发明的范围内。随后,第一强度确定装置2根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度。具体地,第一强度确定装置2根据任意两个用户的共同发布次数及非共同发布次数,并基于下式I)来确定该任意两个用户的共现关系强度
权利要求
1.一种基于用户拓扑关系网对多个用户进行用户群划分的方法,该方法包括以下步骤a获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;b根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;c当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。
2.根据权利要求1所述的方法,其中,所述步骤c包括-当所述共现关系强度不小于预定的关系强度阈值时,通过CNM算法,基于下式来构建初始化模块度增量矩阵AQ,其中,初始化将所述用户拓扑关系网中每个节点上的一个用户作为一个用户群
3.根据权利要求2所述的方法,其中,该方法还包括-基于C匪算法,根据下式在所述用户拓扑关系网中确定每个用户群的用户群内交互关系强度Q = Σ j (θπ—aj )。其中,i表示用户拓扑关系网中划分后的用户群i ;表示用户群i中处于群内的边的连接权值和与用户拓扑关系网中所有边的连接权值和的比例;%表示用户群i所关联的所有边的连接权值和与用户拓扑关系网中所有边的连接权值和的比例。
4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括-提取划分后的属于同一用户群的多个用户的相同特征信息;-将所述相同特征信息标注为该用户群的描述信息。
5.根据权利要求4所述的方法,其中,所述相同特征信息包括以下至少任一项-用户属性信息;-同一用户群的多个用户的发布信息对应的相同关键词。
6.一种用于基于用户拓扑关系网对多个用户进行用户群划分的划分装置,该划分装置包括发布次数获取装置,用于获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;第一强度确定装置,用于根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度; 第一划分装置,当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。
7.根据权利要求6所述的划分装置,其中,所述第一划分装置包括 矩阵构建装置,用于当所述共现关系强度不小于预定的关系强度阈值时,通过CNM算法,基于下式来构建初始化模块度增量矩阵AQ,其中,初始化将所述用户拓扑关系网中每个节点上的一个用户作为一个用户群
8.根据权利要求7所述的划分装置,其中,该划分装置还包括 第二强度确定装置,用于基于CNM算法,根据下式在所述用户拓扑关系网中确定每个用户群的用户群内交互关系强度
9.根据权利要求6至8中任一项所述的划分装置,其中,该划分装置还包括 特征信息提取装置,用于提取划分后的属于同一用户群的多个用户的相同特征信息; 标注装置,用于将所述相同特征信息标注为该用户群的描述信息。
10.根据权利要求9所述的划分装置,其中,所述相同特征信息包括以下至少任一项 -用户属性信息; -同一用户群的多个用户的发布信息对应的相同关键词。
11.一种网络设备,包括如权利要求6至10中至少一项所述的划分装置。
全文摘要
本发明的目的是提供一种用于基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备。其中,本发明获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。
文档编号G06F17/30GK103049496SQ20121052628
公开日2013年4月17日 申请日期2012年12月7日 优先权日2012年12月7日
发明者闫新发, 黄启友, 谢剑, 董贯慧 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1