用户相似度确定方法和装置的制造方法

文档序号:8445668阅读:597来源:国知局
用户相似度确定方法和装置的制造方法
【技术领域】
[0001] 本申请涉及通信技术领域,具体涉及网络通信技术领域,尤其涉及用于确定用户 之间的相似度的方法和装置。
【背景技术】
[0002] 随着移动通信技术以及智能应用的不断发展,使得人们能够相对容易地获取到 移动终端(或者移动用户)的移动轨迹。例如,各种基于位置的服务(location-based service,LBS)能够获取并记录移动终端的位置信息。这些移动轨迹可以反映出移动用户 的生活习惯和行为模式。基于用户的生活习惯和行为模式,可以寻找出相似的用户,从而可 以为这一类用户群体提供针对性服务。
[0003] 目前已知针对相似用户发现的方法主要存在如下几类:利用用户的基本资料进行 匹配,例如性别、年龄、兴趣等;利用用户的当前位置信息进行匹配,例如各种社交交友应 用;利用用户历史上的移动轨迹进行匹配,其主要在于轨迹相似度的计算;利用用户对于 某种应用产品或者设备的使用记录进行匹配;诸如此类。
[0004] 上面提到的几类方法利用不同的参数来匹配用户,这些参数仅反映了用户在某一 方面的信息,匹配度的应用存在一定的局限性。

【发明内容】

[0005] 鉴于现有技术中的上述缺陷或不足,期望提供一种能够准确反映用户在生活模式 上的相似性的方案,以利于后续对相似用户群体的针对性服务。为了实现上述一个或多个 目的,本申请提供了一种用于确定用户之间的相似度的方法和装置。
[0006] 第一方面,提供了一种用于确定用户之间的相似度的方法。该方法包括:获取用户 移动轨迹中的一个或多个地理位置;获取对地理位置的语义标注;以及基于地理位置的语 义标注分析用户之间的相似度。
[0007] 第二方面,提供了一种用于确定用户之间的相似度的装置。该装置包括:地理位置 获取单元,配置用于获取用户移动轨迹中的一个或多个地理位置;语义类别获取单元,配置 用于获取所述地理位置的语义类别;以及相似度分析单元,配置用于基于所述地理位置的 语义类别分析用户之间的相似度。
[0008] 按照本申请的实施例,通过对用户移动轨迹中的一些具有语义的地理位置进行分 析,可以确定用户之间的相似度。在确定相似用户时,基于具有语义的地理位置,能够很好 的刻画用户生活习惯和行为模式,也即生活模式,相似的准确度高。基于这种相似用户的确 定,可以支持很多新型的智能应用和服务,诸如定向推荐、交友应用、个性化推荐等。
【附图说明】
[0009] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它 特征、目的和优点将会变得更明显:
[0010] 图1示出了可以应用本申请实施例的示例性系统架构;
[0011] 图2示出了根据本申请一个实施例的用于确定用户之间的相似度的方法的示例 性流程图;
[0012] 图3示出了根据本申请一个实施例的用于分析用户之间的相似度的方法的示例 性流程图;
[0013] 图4示出了根据本申请一个实施例的用于确定动态语义相似度的方法的示例性 流程图;
[0014] 图5示出了按照本申请实施例的用于确定用户之间的相似度的装置的示意性结 构图;以及
[0015] 图6示出了适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
【具体实施方式】
[0016] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了 便于描述,附图中仅示出了与发明相关的部分。
[0017] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本申请。
[0018] 请参考图1,其示出了可以应用本申请实施例的示例性系统架构100。
[0019] 如图1所示,系统架构100可以包括终端设备101、102、网络103和服务器104、 105、106和107。网络103用以在终端设备101、102和服务器104、105、106、107之间提供 通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆 等等。
[0020] 用户110可以使用终端设备101、102通过网络103与服务器104、105、106、107交 互,以访问各种服务,例如浏览网页、下载数据等。终端设备1〇1、1〇2上可以安装有各种客 户端应用,例如定位应用、各种LBS应用、浏览器、安全应用等。
[0021] 终端设备1〇1、1〇2可以是各种电子设备,包括但不限于个人电脑、智能手机、智能 电视、平板电脑、个人数字助理、电子书阅读器等等。
[0022] 服务器104、105、106、107可以是提供各种服务的服务器。服务器可以响应于用户 的服务请求而提供服务。可以理解,一个服务器可以提供一种或多种服务,同一种服务也可 以由多个服务器来提供。在本申请的实施例中,所涉及的服务器可以包括但不限于,用户位 置服务器、用户相似度服务器、推荐服务器等。用户位置服务器可以提供与用户位置有关的 服务,例如管理用户的历史位置信息。用户相似度服务器可以用于确定用户之间的相似度。 推荐服务器可以基于用户之间的相似度为对应的用户群体推荐相应的内容或服务。
[0023] 应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需 要,可以具有任意数目的终端设备、网络和服务器。
[0024] 如【背景技术】中所提到的,已知的针对相似用户发现的几类方法利用不同的参数来 匹配用户,这些参数仅反映了用户在某一方面的信息,匹配度的应用存在一定的局限性。申 请人注意到,在用户的日常生活中,其移动轨迹上通常具有一些重要的地理位置或称"重要 地点",这些重要地点通常会具有特定的潜在语义,例如"家"、"工作地点"、"常去的社交场 所"、"常去的娱乐场所"、"常去的购物中心"等等。这些具有语义的重要地点很好地刻画了 用户的生活习惯和行为模式。因此,在本申请的实施例中,通过分析来自于用户的重要地点 的语义,来寻找在生活模式上具有相似性的用户。
[0025] 参考图2,其示出了根据本申请一个实施例的用于确定用户之间的相似度的方法 的示例性流程图。图2所示的方法可以在图1中的服务器(例如用户相似度服务器)中执 行。
[0026] 如图2所示,在步骤210中,获取用户移动轨迹中的一个或多个地理位置。
[0027] 如前文所提到的,在用户的移动轨迹中一些具有语义的重要地点能够很好地刻画 用户的生活习惯和行为模式,因此可以获取这些重要地点的地理位置。可以采取多种方式 来获取上述一个或多个地理位置。
[0028] 在一些实施例中,可以通过接收用户输入的地理位置而获取这些重要地点。在这 些实施例中,用户可以主动反馈其生活中的重要地点。例如,用户可以通过填写注册信息向 服务器提供其相应的住宅、工作地点、常去就餐地点等一些生活中的重要地点的地理位置。
[0029] 在另一些实施例中,可以通过机器学习的方法从用户的历史移动轨迹中确定用户 的上述一个或多个重要地点。一般而言,用户在这种重要地点的停留时间会比较长。因此, 在一种实现中,可以收集用户所携带的移动设备的定位信息,可选的还可以收集用户所在 地点的WIFI信号,然后基于密度的聚类方法来确定该用户的重要地点。基于密度的聚类方 法是已知的,其可以采用各种算法,本申请在此方面没有限制,因而在此省略其详细描述。
[0030] 接着,在步骤220中,获取该一个或多个地理位置的语义类别。
[0031] 当获取了作为用户的重要地点的一个或多个地理位置之后,可以对这些地理位置 的语义类别进行标注。语义类别可以包括但不限于:工作地点、居住地点、社交地点、购物地 点和娱乐地点。可以采取多种方式来获取上述一个或多个地理位置的语义类别。
[0032] 在一些实施例中,可以通过接收用户对地理位置的语义类别的标注来获取这些重 要地点的语义类别。在这些实施例中,用户可以主动反馈其重要地点的语义类别。例如,用 户在填写注册信息时同时对重要地点的语义类别进行标注。又例如,系统可以在需要时询 问用户相应的地点所代表的意思,从而获得该地点的语义标注。
[0033] 在另一些实施例中,可以通过机器学习的方法对地理位置的语义类别进行自动标 注。例如,可以根据用户对某个重要地点的访问时间来确定该重要地点的语义类别。举例 而言,用户U经常工作日早上8点从地点1出发去地点2,中午12点由地点2去地点3,下 午1点从地点3回到地点2,下午6点离开地点2去往地点4,然后晚上8点从地点4回到地 点1。通过对用户U的历史移动轨迹数据进行学习,可以建立分类模型,从而推断出各个地 点的语义类别。可选的或附加的,可以利用待确定地点周边的兴趣点(PointofInterest, P0I)信息对分类模型进行训练,以提高分类的准确性。例如,利用分类模型可以对用户U的 上述地点的语义类别进行推断,推断结果可以是:地点1为居住地点、地点2为工作地点、地 点3为就餐地点,地点4为健身地点或娱乐地点。
[0034] 基于机器学习建立分类模型以及对分类模型的训练方法是已知的,其可以采用各 种算法,例如,决策树、K-means、支持矢量机(SupportVectorMachine,SVM)、贝叶斯分类 器、分类和回归树,等等。本申请在此方面没有限制,在此省略其详细描述。
[0035] 继而,在步骤230中,基于
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1