一种对对象进行聚类的方法和装置的制造方法

文档序号:8412534阅读:272来源:国知局
一种对对象进行聚类的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及计算机技术领域,尤其涉及一种对对象进行聚类的方法和装置。
【背景技术】
[0002] 现有技术中,通常通过对对象的描述文本进行自然语言分析,来对对象进行分类。 特别地,当对象涉及商业用途,如当对象为品牌时,除了对品牌名称进行自然语言分析以 外,还会结合从对象角度出发的数据,如品牌所属的行业和地域、品牌的销售情况和市场需 求等因素,来对品牌进行分类。

【发明内容】

[0003] 本发明的目包括提供一种对对象进行聚类的方法和装置。
[0004] 根据本发明的一个方面,提供一种用于在计算机设备中对对象进行聚类的方法, 其中,该方法包括:
[0005] 获取多个对象的转移情况信息,所述转移情况信息用于指示基于对象信息获取行 为的、用户在所述多个对象中的转移情况;
[0006] 根据所述转移情况信息,对所述多个对象进行聚类,获得所述多个对象的聚类结 果。
[0007] 根据本发明的另一个方面,还提供了一种用于在计算机设备中对对象进行聚类的 装置,其中,该装置包括:
[0008] 用于获取多个对象的转移情况信息的装置,所述转移情况信息用于指示基于对象 信息获取行为的、用户在所述多个对象中的转移情况;
[0009] 用于根据所述转移情况信息,对所述多个对象进行聚类,获得所述多个对象的聚 类结果的装置。
[0010] 与现有技术相比,本发明具有以下优点:1)本发明的方案打破了本领域的偏见, 能够通过分析用户在对象中的转移情况信息来对对象进行聚类;2)相比从对象角度出发 的数据,本发明中通过分析用户在多个对象中的转移情况来对对象进行的方案,更贴近用 户角度,更能直观地反映用户对对象的认识,因此,本发明的方案所确定的对象分类更为客 观、准确;3)即便在从用户角度出发的数据中,本发明的转移情况信息也并非常见数据,事 实上,若明确提及从用户角度出发的数据,本领域技术人员更容易想到的是来自用户的直 接评价(如打分、评论文字等)。
【附图说明】
[0011] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显:
[0012] 图1为本发明一个优选实施例的对对象进行聚类的方法流程示意图;
[0013] 图2为本发明一个优选实施例的对对象进行聚类的聚类装置的结构示意图;
[0014] 图3示出了一个优选实施例的用户在多个对象中的转移路径的示意图;
[0015] 图4示出了一个优选实施例的用户在多个关键词中的转移路径的示意图;
[0016] 图5示出了一个从关键词的网状结构的转移路径到对象的网状结构的转移路径 的转换的具体实例;
[0017] 图6示出了一个优选实施例的、从一个对象到多个对象的转移的示意图;
[0018] 图7示出了图6的一个具体实例。
[0019] 附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0020] 下面结合附图对本发明作进一步详细描述。
[0021] 图1为本发明一个优选实施例的对对象进行聚类的方法流程示意图。其中,本实 施例的方法主要通过计算机设备来实现,该计算机设备包括网络设备和用户设备。所述 网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算 (Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的 一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述网络设备所处的网络 包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC 机、平板电脑、智能手机、PDA、IPTV等。
[0022] 需要说明的是,所述计算机设备和网络仅为举例,其他现有的或今后可能出现的 计算设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含 于此。
[0023] 根据本实施例的方法包括步骤Sl和步骤S2。
[0024] 在步骤Sl中,计算机设备获取多个对象的转移情况信息。
[0025] 其中,所述对象可包括任何能够被进行聚类的对象。优选地,所述对象具有商业性 质。更优选地,所述对象包括品牌。
[0026] 其中,所述转移情况信息用于指示基于对象信息获取行为的、用户在所述多个对 象中的转移情况。其中,所述对象信息获取行为包括任何能够用于获取对象的信息的行为; 例如,所述对象信息获取行为包括通过搜索与对象有关的关键词来获取对象信息的行为; 又例如,所述对象信息获取行为包括通过点击并浏览与对象有关的内容来获取对象信息的 行为。其中,所述"基于对象信息获取行为",表示所述转移情况反映了用户在对象信息获 取行为中产生的转移情况,优选地,所述转移情况需要基于对象信息获取行为来被确定;例 如,通过统计多个用户在搜索行为中变更的搜索对象,或通过统计多个用户在搜索行为中 变更的与对象关联的搜索关键词,来确定用户在中对象中的转移情况信息等。
[0027] 优选地,所述多个对象的转移情况信息包括但不限于以下至少一项:
[0028] 1)用户在多个对象中的转移路径信息。
[0029] 其中,所述转移路径信息指示了用户在多个对象中的转移路径。例如,存在三个对 象Objectl、0bject2和0bject3,转移路径信息指示多个用户在该三个对象中的转移路径 包括:从Objectl转移至Ob ject2,以及,从Objectl转移至Ob ject3。
[0030] 2)用户在各个对象之间的转移次数信息。
[0031] 其中,所述转移次数信息指示了用户在各个对象之间的转移次数。例如,存在三个 对象Objectl、Object2和Object3,转移次数信息指示了多个用户在该三个对象之间的转 移次数包括:从Objectl转移至Object2五次,以及,从Objectl转移至Object3八次。
[0032] 3)用户在各个对象之间的转移概率信息。
[0033] 其中,所述转移概率信息指示了用户在各个对象之间的转移概率。例如,存在三 个对象Objectl、0bject2和0bject3,转移概率信息指示了多个用户在该三个对象之间 的转移概率包括:从Objectl转移至Object2的概率为38. 46%,以及,从Objectl转移至 0bject3 的概率为 6L 54%。
[0034] 需要说明的是,多个对象中的部分对象之间可能不存在转移路径(即用户在对象 信息获取行为中未在该等部分对象之间进行过转移),则该等部分对象之间的转移次数和 转移概率均为零。此外,可能存在从一个对象转移至该对象自身的情况;例如,用户在搜索 行为中可能连续多次采用不同的搜索关键词搜索同一个对象的信息,从而产生从一个对象 转移至该对象自身的情况。
[0035] 优选地,该转移情况信息可采用多种存储方式。
[0036] 例如,该转移情况信息存储为表格,且表格中记录了用户在多个对象中的转移路 径以及用户在各个对象之间的转移次数和转移概率,如下表1所示。
[0037]
【主权项】
1. 一种用于在计算机设备中对对象进行聚类的方法,其中,该方法包括: 获取多个对象的转移情况信息,所述转移情况信息用于指示基于对象信息获取行为 的、用户在所述多个对象中的转移情况; 根据所述转移情况信息,对所述多个对象进行聚类,获得所述多个对象的聚类结果。
2. 根据权利要求1所述的方法,其中,所述进行聚类的步骤包括: 通过基于所述转移情况信
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1