多重用户身份融合方法、装置、设备及存储介质与流程

文档序号：19350588发布日期：2019-12-06 21:20阅读：271来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及计算机技术领域，尤其涉及一种大数据技术中的多重用户身份融合方法、装置、设备及存储介质。

背景技术：

在互联网普及的大环境下，将虚拟用户身份(例如，设备id，网络id等)和真实用户身份(例如，身份证号、手机号等身份信息、车产、房产等用户资产信息)相关联，可以从不同的表现载体中还原人的完整行为，从而创造巨大的产品商业价值。

现有技术中，多重身份融合的方案主要可以基于预设的规则，将满足同一规则的多个不同用户身份确定为属于同一用户，并将该用户的多个用户身份进行融合，使其相互关联。

然而，虽然这种融合方法归属判断的准确率高，但是由于使用的规则是人为设定的，无法应用于复杂的场景，使用范围受限。

技术实现要素：

本申请实施例提供一种多重用户身份融合方法、装置、设备及存储介质，用于解决现有融合方法无法应用于复杂的场景，使用范围受限的问题。

第一方面，本申请提供一种多重用户身份融合的方法，包括：

获取用户身份数据，所述用户身份数据具有至少两个身份特征；

根据所述用户身份数据具有的至少两个身份特征，构建图谱网络，所述图谱网络包括：表征身份特征的节点和表征身份特征的关联关系的连接边；

根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，所述身份群组包括：多个身份特征。

在本实施例中，通过图谱网络的形式将用户身份数据具有的身份特征关联起来，不仅能够准确的确定出同一用户的多个身份特征对应的身份群组，而且其可以应用于任何场景，避免了使用范围受限的问题。

在第一方面的一种可能设计中，所述获取用户身份数据，包括：

获取预设的配置信息，所述配置信息包括：数据源类型、数据源路径、提取方式和提取周期；

根据所述数据源路径、所述提取方式和所述提取周期，从所述数据源类型对应数据源中提取所述用户身份数据。

在本实施例中，用户数据提取是基于预设的配置信息中的各信息依赖关系实现的，能够确保数据提取任务可以稳定有序的执行。

可选的，所述配置信息还包括：字段映射关系；

所述方法还包括：

根据所述字段映射关系，依次对获取到的所述用户身份数据进行解析，提取所述用户身份数据具有的至少两个身份特征；

在第一方面的另一种可能设计中，所述根据所述用户身份数据具有的至少两个身份特征，构建图谱网络，包括：

以所述用户身份数据中的每个身份特征作为图谱网络的节点，以所述用户身份数据中的每两个身份特征的关联关系作为图谱网络的连接边，构建所述图谱网络，所述图谱网络中每个节点和每条连接边分别具有属性信息。

通过上述的方案可知，针对不同的数据可能来源不同系统的问题，通过预设的配置信息实现了用户身份数据的提取、用户身份数据中身份特征的识别和提取，并且基于提取的身份特征实现了图谱网络的构建，自动化程度高，成本低。

在第一方面的再一种可能设计中，所述根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，包括：

根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定所述图谱网络中相邻节点间的连接次数；

基于所述图谱网络中相邻节点间的连接次数和预设的次数阈值，确定出第一连接关系和第二连接关系，所述第一连接关系为相邻节点间的连接次数大于所述次数阈值的连接关系，所述第二连接关系为相邻节点间的连接次数小于或等于所述次数阈值的连接关系；

根据所述第一连接关系、所述第二连接关系，以目标节点为起点，依次向外遍历所述图谱网络的节点，确定出所述目标节点对应用户的身份群组。

在本实施例中，通过基于确定的连接关系确定目标节点对应用户的身份群组，得到的结果准确率高。

在第一方面的又一种可能设计中，所述根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，包括：

根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息，确定出节点间的关联关系；

基于所述节点间的关联关系，对所述图谱网络中的节点进行聚合，确定同一用户的身份群组。

在本实施例中，通过基于节点间关联关系且通过聚合的方法，得到的同一用户的身份群组，可以保证较高的融合率。

在第一方面的又一种可能设计中，所述方法还包括：

根据同一用户的身份群组，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征，所述目标身份特征为所述身份群组包括的用户身份特征中的任意一个；

向所述多个用户身份特征中的至少一个身份特征推送消息。

在本实施例中，通过确定身份群组中与目标身份特征具有关联关系的多个用户身份特征，再有针对性的向用户推送消息，提高了产品商业价值。

可选的，所述根据同一用户的身份群组，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征，包括：

对同一用户的身份群组中的节点进行检索、遍历和筛选处理，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征。

在本实施例中，通过上述节点身份检索、节点身份的广度遍历和节点身份特征的筛选等过程可快速推导获得与目标身份特征对应顶点有连通关系的顶点。

在第一方面的又一种可能设计中，所述方法还包括：

以图数据库的形式，存储所述图谱网络中节点与连接边的对应关系；

所述图数据库包括：点存储、连接边存储和属性存储；

所述点存储包括：节点主键、节点拥有的属性信息和节点连接的连接边；

所述连接边存储包括：连接边主键、连接边所连接的起始点和终止点，以及连接边所携带的属性信息；

所述属性存储包括：属性主键、属性所表示的含义，以及属性表示的具体内容。

在本实施例中，基于用户身份数据具有的身份特征之间的关联关系及身份特征共同出现的记录刻画成图数据库的顶点和连接边，使得用户身份数据可以通过图论算法解决数据融合问题。

可选的，所述节点主键、所述连接边主键、所述属性主键均采用索引的方式存储。

在本实施例中，通过对节点主键、连接边主键和属性主键构建索引，可以提高检索和数据管理的便利性。

第二方面，本申请提供一种多重用户身份融合的装置，包括：

获取模块，用于获取用户身份数据，所述用户身份数据具有至少两个身份特征；

处理模块，用于根据所述用户身份数据具有的至少两个身份特征，构建图谱网络，所述图谱网络包括：表征身份特征的节点和表征身份特征的关联关系的连接边；

确定模块，用于根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，所述身份群组包括：多个身份特征。

在第二方面的一种可能设计中，所述获取模块，具体用于获取预设的配置信息，所述配置信息包括：数据源类型、数据源路径、提取方式和提取周期；根据所述数据源路径、所述提取方式和所述提取周期，从所述数据源类型对应数据源中提取所述用户身份数据。

可选的，所述配置信息还包括：字段映射关系；

相应的，所述处理模块，还用于根据所述字段映射关系，依次对获取到的所述用户身份数据进行解析，提取所述用户身份数据具有的至少两个身份特征。

在第二方面的另一种可能设计中，所述处理模块，具体用于以所述用户身份数据中的每个身份特征作为图谱网络的节点，以所述用户身份数据中的每两个身份特征的关联关系作为图谱网络的连接边，构建所述图谱网络，所述图谱网络中每个节点和每条连接边分别具有属性信息。

在第二方面的再一种可能设计中，所述确定模块，具体用于根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定所述图谱网络中相邻节点间的连接次数，基于所述图谱网络中相邻节点间的连接次数和预设的次数阈值，确定出第一连接关系和第二连接关系，所述第一连接关系为相邻节点间的连接次数大于所述次数阈值的连接关系，所述第二连接关系为相邻节点间的连接次数小于或等于所述次数阈值的连接关系；根据所述第一连接关系、所述第二连接关系，以目标节点为起点，依次向外遍历所述图谱网络的节点，确定出所述目标节点对应用户的身份群组。

在第二方面的又一种可能设计中，所述确定模块，具体用于根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息，确定出节点间的关联关系；基于所述节点间的关联关系，对所述图谱网络中的节点进行聚合，确定同一用户的身份群组。

在第二方面的又一种可能设计中，所述确定模块，还用于根据同一用户的身份群组，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征，所述目标身份特征为所述身份群组包括的用户身份特征中的任意一个；

所述装置还包括：推送模块；

所述推送模块，用于向所述多个用户身份特征中的至少一个身份特征推送消息。

可选的，所述确定模块，还具体用于对同一用户的身份群组中的节点进行检索、遍历和筛选处理，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征。

在第二方面的又一种可能设计中，所述处理模块，还用于以图数据库的形式，存储所述图谱网络中节点与连接边的对应关系；

所述图数据库包括：点存储、连接边存储和属性存储；

所述点存储包括：节点主键、节点拥有的属性信息和节点连接的连接边；

所述连接边存储包括：连接边主键、连接边所连接的起始点和终止点，以及连接边所携带的属性信息；

所述属性存储包括：属性主键、属性所表示的含义，以及属性表示的具体内容。

可选的，所述节点主键、所述连接边主键、所述属性主键均采用索引的方式存储。

本申请第二方面提供的装置，可用于执行第一方面提供的方法，其实现原理和技术效果类似，在此不再赘述。

第三方面，本申请提供一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面以及第一方面各可能设计所述的方法。

第四方面，本申请提供一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面以及第一方面各可能设计所述的方法。

第五方面，本申请提供一种多重用户身份融合的方法，包括：

根据用户身份数据具有的至少两个身份特征，确定所述至少两个身份特征的关联关系；

根据所述至少两个身份特征的关联关系，确定同一用户的身份群组。

上述申请中的一个实施例具有如下优点或有益效果：能够准确的确定出同一用户的多个身份特征对应的身份群组，而且其可以应用于任何场景，使用范围广泛。因为采用通过图谱网络的形式将用户身份数据具有的身份特征关联起来的技术手段，所以克服了现有融合方法无法应用于复杂的场景，使用范围受限的技术问题，进而达到可以应用于任何场景，使用范围广泛的技术效果。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例提供的多重用户身份融合的方法的流程示意图；

图2为本申请实施例中点存储对应的k-v形式的示意图；

图3为本申请实施例中连接边存储对应的k-v形式的示意图；

图4为本申请实施例中属性存储对应的k-v形式的示意图；

图5为同一人的身份群组的关联示意图；

图6是根据本申请第二实施例提供的多重用户身份融合的方法的流程示意图；

图7是根据本申请第三实施例提供的多重用户身份融合的方法的流程示意图；

图8是根据本申请第四实施例提供的多重用户身份融合的方法的流程示意图；

图9是根据本申请第五实施例提供的多重用户身份融合的方法的流程示意图；

图10为本申请实施例提供的多重身份融合的装置的结构示意图；

图11是用来实现本申请实施例的多重用户身份融合的方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在互联网普及的大环境下，每天都会产生大量的用户上网信息。通常情况下，用户上网信息中均包含用户身份的信息，该用户身份既可以通过虚拟用户身份表示，也可以通过真实身份表示。示例性的，虚拟用户身份包括：互联网上各类身份标识号(identitydocument，id)(包括设备id，如国际移动设备识别码(internationalmobileequipmentidentity，imei)、广告标识符(identifierforadvertising，idfa)等；网络id，如互联网协议(internetprotocol，ip)地址、接入点(accesspoint，ap)、服务集标识(servicesetidentifier，ssid)等)；真实用户身份包括：身份信息(如身份证号、手机号)以及用户各类资产信息(如车、房)。

在实际应用中，通过将用户虚拟身份和用户真实身份相关联，可以从不同的表现载体(车、房、手机设备码等)中还原人的完整行为，从而创造巨大的产品商业价值。例如，基于各类打通的id可以刻画完整的用户画像；在不同设备上对用户进行精准推荐；针对用户的不同到店行为进行环境触达，投放精准广告；同时，还可以进行企业间的优势互补，如打通某个搜索网站和电商网站的身份，在电商网站上为用户推荐在搜索网站上搜索过的商品，从而有针对性的将该用户可能感兴趣的商品推荐给用户。

然而，随着用户上网信息的不断积累，需要打通的数据急剧膨胀，由此需要解决如下挑战性的问题：

从计算存储上讲：需要解决pb级别的数据处理问题，其中，pb指petabyte，它是较高级的存储单位，1pb＝1024tb。

从用户规模上讲：针对百亿级别的用户id，需要进行两两是否同一人的判定，大约相当于10的20次方相似度计算，其就目前大型互联网企业的计算资源能力是无法处理的，需要优化。

从市场场景上讲：越来越多的企业，希望将互联网设备的id与企业自身数据相融合，增强自身产品的生命力。因此需要考虑在企业有限资源的情况下如何将虚实数据的融合进行私有化，迁移到企业内部。

从技术远景上讲：随着人工智能(artificialintelligence，ai)的发展，势必产生新类型的用户id，如人脸id、声纹id、指纹id，因而，需要考虑现有的虚实数据的融合方法如何自适应的适配各种新类型用户id。

由背景技术的介绍可知，现有技术的多重身份融合方案是基于预设的规则实现的，无法应用于复杂的场景，使用范围受限，针对该问题，本申请实施例提供了一种多重用户身份融合方法，主要是利用图论技术进行用户虚实身份的融合，将用户的每种身份特征看成一个大规模图谱中的节点，通过图论算法，判定两两节点之间是否存在一条强相关的连接边，若存在则视为归属于同一用户，以达到身份融合的目的。该技术方案涉及到数据提取、数据存储、数据融合计算、关联检索等方面，支持私有化部署，方便小企业进行数据融合。

可以理解的是，本申请实施例的执行主体可以是电子设备，例如，计算机、平板电脑等终端设备，也可以是服务器，例如，后台的处理平台等。因而，本实施例以终端设备和服务器统称为电子设备进行解释说明，关于该电子设备具体为终端设备，还是服务器，其可以实际情况确定。

下面，通过具体实施例对本申请的技术方案进行详细说明。需要说明的是，下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。

图1是根据本申请第一实施例提供的多重用户身份融合的方法的流程示意图。如图1所示，该方法可以包括如下步骤：

s101、获取用户身份数据，该用户身份数据具有至少两个身份特征。

在实际应用中，一般用来进行融合的数据主要分为两大类，包括互联网虚拟数据(virtualnetworkdata，vnd)和现实数据(realdata，rd)。互联网虚拟数据涉及用户的上网浏览数据、搜索数据、地图定位数据、消费数据(例如，线上购物数据)、卡口摄像数据等；现实数据涉及社会数据、政务数据、企业数据、消费数据(例如，线下购物数据)、企业内部数据(例如，银行数据)等。

用户身份数据具有的身份特征可以包括：虚拟身份特征和现实身份特征，其中，虚拟身份(virtualidentity，vi)特征特指用户在互联网上一系列活动的身份特征，包括了用户的各类设备信息、账号信息等。从数据类型来看，现实身份(realidentity，ri)特征包括公安登记的地址信息、籍贯、住址、户籍等，还可以包括房产、车产、债务、银行账户等政府或者职能部门信息和数据；该现实身份特征也可根据具体企业使用场景，定义为企业内部的身份id。

可以理解的是，本申请实施例并不对用户身份数据具有的身份特征进行限定，也不对虚拟身份特征和现实身份特征的具体表现形式进行限定，其可以根据实际情况确定，此处不再赘述。

在本申请的实施例中，该步骤目的是获取进行多重用户身份融合的用户身份数据，该用户身份数据需要具有至少两个身份特征，在实际应用中，其主要从各类虚拟数据和真实数据中提取出。

s102、根据上述用户身份数据具有的至少两个身份特征，构建图谱网络。

其中，该图谱网络包括：表征身份特征的节点和表征身份特征的关联关系的连接边。

在实际应用中，通常的数据是关系型的表单数据，通过邻接表的方式刻画图谱结构，因而，一般需要创建点表和边表。但是，由于图谱结构复杂，尤其当节点规模过亿之后，需要利用分布式存储以保证系统的可扩展性。由于选用一般的关系型数据库，数据分布式存储之后，数据间的通信问题会变得比较复杂，增加设计成本。因此，本申请实施例中利用图数据库来存储表征身份特征的节点和表征身份特征的关联关系的连接边，由于图形数据库是一种非关系型数据库，它应用图形理论存储实体之间的关系信息，减少了点边的组织成本。

示例性的，在本申请的实施例中，本申请的方法还可以包括如下步骤：

以图数据库的形式，存储该图谱网络中节点与连接边的对应关系。

其中，该图数据库包括：点存储、连接边存储和属性存储。

该点存储包括：节点主键、节点拥有的属性信息和节点连接的连接边。

该连接边存储包括：连接边主键、连接边所连接的起始点和终止点，以及连接边所携带的属性信息。

该属性存储包括：属性主键、属性所表示的含义，以及属性表示的具体内容。

进一步的，在本申请的实施例中，节点主键、连接边主键、属性主键均采用索引的方式存储。

具体的，在本申请的实施例中，图数据库主要涉及点的存储、边的存储、以及属性的存储。可选的，点-边-属性在存储介质内部以键值(key-value，k-v)对的形式进行组织、索引和存储。

例如，图2为本申请实施例中点存储对应的k-v形式的示意图。图3为本申请实施例中连接边存储对应的k-v形式的示意图。图4为本申请实施例中属性存储对应的k-v形式的示意图。如图2所示，点存储通过k-v形式即键(key)-值(value)表示时，点主键主要由节点主键(vertex_id)、节点所拥有的属性信息以及该节点相连接的边组成。其中，属性信息和连接边均存储所对应的主键，也即，图3所示的属性主键(property_id)和图4所示的边主键(edge_id)。

值得说明的是，在实际应用中，节点主键实际上为顶点的标识，属性主键实际上为属性的标识，边主键实际上为连接边的标识。

参照图2所示，比如，对于两个含有身份特征信息的节点，节点主键分别为12345和67894，具体表示某一个身份证和某一个手机号，那么，点12345具有两个属性p-123和p-124，同时，点12345具有两条边e-12323和e-86743；点67894具有两个属性p-376和p-377，同时，点67894具有两条边e-12323和e-86743。

参照图3所示，连接边存储由边的主键(edge_id)、连接边所连接的起始点和终止点以及连接边上所带的属性组成。其中，起止点均为所对应点的主键(vertex_id)，属性也即点存储中的属性，值对应有属性主键(property_id)。

比如，主键为e-12323的边，其起点为12345，终点为67894，且连接边主键e-12323具有两个边属性p-73625和p-5325。主键为e-86743的边，起点为12345，终点为87251，且连接边主键e-86743具有两个边属性p-56342和p-672。

参照图4所示，属性存储由属性主键(property_id)、当前属性所表示的含义(属性含义：property_key)以及属性表示的具体内容(属性内容：property_value)组成。

比如，对于点12345具有的两个属性p-123和p-124，其中，p-123表示特征类型为手机，即，id-type＝phone，p-124表示特征信息为具体的手机号，即，id-info＝138****1232。对于点67894具有的两个属性p-376和p-377，其中，p-376表示特征类型为身份证，即，id-type＝idcard，p-124表示特征信息为具体的身份证号，即，id-info＝3401**********1273。

值得说明的是，在本申请的实施例中，为了便于检索和数据管理，每个节点、连接边、属性的主键均构建了索引，以及支持对具体某一类属性构建索引，从而方便通过属性检索节点和/或连接边。

示例性的，在本实施例中，基于上述对图数据库中各数据结构的分析，各类身份id可以构建一个图谱关系，其中，连接边上的属性包含所连接的两个节点所表示的身份特征的具体连接信息，如连接时间，连接频次等，其可以为后续的计算提供特征表示。

本实施例中，采用基于k-v的图数据库的形式存储用户身份数据，具体的，针对万亿级规模的数据可以采用分布式k-v存储，针对千万、亿以内规模的数据可以采用内存或单机k-v存储。

s103、根据该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，该身份群组包括：多个身份特征。

在本申请的实施例中，基于根据用户身份数据具有的至少两个身份特征构建得到图谱网络后，可以确定出该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，因而，基于对节点之间的连接关系、节点和连接边之间的连接关系可以确定出该同一用户的身份群组。

具体的，在本申请的实施例中，基于创建的图谱网络确定同一用户的身份群组的步骤可以理解成数据融合的过程，也即，对图谱网络中的每个身份特征进行融合计算，具体的，根据该身份特征自身的拓扑性质以及自身挂载的节点属性，挖掘与该身份特征有隐含连接关系的其他身份特征，最终形成自然人维度一个身份群组(id-group)。

在实际应用中，身份融合计算的方法可以分为规则模式和模型模式。关于规则模式和模型模式的具体实现原理可参见下述实施例图7和图8所示实施例中的记载，此处不再赘述。

值得说明的是，在本申请的实施例中，不管是规则模式还是模型模式，都涉及到对图谱网络进行反复遍历的大量计算问题。对于数据规模较小的场景，可以通过缩小需求目标群体的途径进行数据裁剪(如按城市裁剪或每一个类型特征裁剪)得到数据量较小的数据集合，然后进行单机运算，确定同一用户的身份群组。对于数据规模较大的场景，可以借助分布式图计算，如graphx、graphlab、giraph等计算框架等，确定同一用户的身份群组。

示例性的，在本申请的实施例中，上述确定的同一用户的身份群组id-group，可以表达为一个自然人的身份标识集合。例如，图5为同一人的身份群组的关联示意图。参照图5所示，对一个自然人的身份标识分别展开(两两构建连接关系)，并将每个身份特征对灌入到上述创建的图谱网络中，可以将身份特征之间的关系连通起来，得到身份特征的强连通图。

示例性的，图5所示的示意图中，身份特征的表现形式可以包括：imei、ap、ip地址、idfa、手机号、身份证号、房、车、其他等。

本申请实施例提供的多重用户身份融合的方法，通过获取用户身份数据，根据该用户身份数据具有的至少两个身份特征，构建图谱网络，该图谱网络包括：表征身份特征的节点和表征身份特征的关联关系的连接边，根据该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，该身份群组包括：多个身份特征。该技术方案中，通过图谱网络的形式将用户身份数据具有的身份特征关联起来，不仅能够准确的确定出同一用户的多个身份特征对应的身份群组，而且其可以应用于任何场景，避免了使用范围受限的问题。

示例性的，在上述实施例的基础上，图6是根据本申请第二实施例提供的多重用户身份融合的方法的流程示意图。如图6所示，在本实施例中，上述s101可以通过如下步骤实现：

s601、获取预设的配置信息，该配置信息包括：数据源类型、数据源路径、提取方式和提取周期。

在本申请的实施例中，由于进行融合的用户身份数据可以是互联网虚拟数据和现实数据，且不同的用户身份数据产生后可以存储在类型不同的存储系统中，例如，hdfs、hive、mysql、nosql等。因为，为了能够从不同的存储系统获取用户身份数据，需要获取预设的配置信息，以根据预设的配置信息从不同的存储系统中获取用户身份数据。

相应的，在本实施例中，上述预设的配置信息可以包括数据源类型(hdfs、hive、mysql、nosql…)、数据源路径(主机：端口(host:port)、hdfspath…)、提取方式、提取周期。其中，数据源类型用于表征存储用户身份数据的系统类型，数据源路径用于表征提取用户身份数据时经过的路线，提取方式用于表征采用什么样的方式进行数据提取，提取周期用于表征多长时间自动执行一次数据提取。该提取周期也可以认为是调度频次(执行周期)，用于指示按照天级别、小时级别或是单次执行用户数据提取任务。

在本实施例中，一条用户身份数据必须至少包含两个身份特征，每个身份特征用一个点表示，且这两点间存在一条弱连接边。例如，若身份特征可以是设备码、手机号、身份号、账号等，那么一条用户身份数据至少包括设备码、手机号、身份号、账号中的至少两个。

s602、根据该数据源路径、提取方式和提取周期，从该数据源类型对应数据源中提取用户身份数据。

在本实施例中，基于预设的配置信息首先确定数据源类型、数据源路径以及提取方式和提取周期，其次按照提取方式选择hadoop/spark/单机，基于数据源路径每间隔提取周期的时长从数据源类型对应的数据源中提取用户身份数据。

可以理解的是，用户数据提取是基于预设的配置信息中的各信息依赖关系实现的，能够确保数据提取任务可以稳定有序的执行。

可选的，在本申请的实施例中，若上述配置信息还包括：字段映射关系；那么，该方法还可以包括如下步骤：

s603、根据该字段映射关系，依次对获取到的用户身份数据进行解析，提取该用户身份数据具有的至少两个身份特征。

其中，字段映射关系用于表示获取到的用户身份数据中提取哪些字段(时间上为身份特征)作为图谱网络的节点和连接边，以及标注哪些属性作为点的属性(例如，点属性包括：手机号，设备标识)，哪些属性作为边的属性(边属性可以指登录时间等信息)。

因而，在本实施例中，可以根据字段映射关系对获取到的用户身份数据中的每一行数据进行解析，确定出每一行数据具有的至少两个身份特征，为后续的图谱网络构建提供了实现可能。

相应的，在上述实施例的基础上，例如，参照图6所示，上述步骤102可以通过如下步骤实现：

s604、以用户身份数据中的每个身份特征作为图谱网络的节点，以该用户身份数据中的每两个身份特征的关联关系作为图谱网络的连接边，构建图谱网络。

其中，该图谱网络中每个节点和每条连接边分别具有属性信息。

在本实施例中，根据字段映射关系确定出用户身份数据具有的至少两个身份特征时，确定出每两个身份特征的关联关系以及每个节点和每条连接边具有的属性信息，因而，通过将用户身份数据每个身份特征作为图谱网络的顶点，将每两个身份特征的关联关系作为图谱网络的连接边，可以得到构建的图谱网络。

由上述分析可知，用户身份数据可以组织成有起始点、起始点属性、终止点、终止点属性、连接边、连接边属性的结构数据。该结构数据实际上一个有向图，节点之间的关系可以配置，该结构数据的输出形式可以是json、proto、csv。本申请实施例并不对输出的具体形式进行限定，其可以根据实际情况选定。

进一步的，对基于用户身份数据形成的结构数据进行节点去重、属性合并等操作，以确保新增数据具有的身份特征对应的节点可以插入到图谱网络中，原有数据具有的身份特征对应的节点可以执行相应的更新操作。

同理，还可以对基于用户身份数据形成的结构数据进行连接边去重、属性合并，也即，将多条数据中具有相同连接关系的边合并，去掉重复的连接边和属性，实现了通过合并形式对用户身份数据中的信息进行重构。最后，可以基于重构后的结构数据，将提取到的顶点、连接边等属性信息更新到图谱网络中。

本申请实施例提供的多重用户身份融合的方法，获取预设的配置信息，该配置信息包括：数据源类型、数据源路径、提取方式和提取周期，根据该数据源路径、提取方式和提取周期，从数据源类型对应数据源中提取用户身份数据，以及在配置信息还包括：字段映射关系时，可以根据该字段映射关系，依次对获取到的用户身份数据进行解析，提取该用户身份数据具有的至少两个身份特征，并以用户身份数据中的每个身份特征作为图谱网络的节点，以每两个身份特征的关联关系作为图谱网络的连接边，构建图谱网络。该技术方案中，针对不同的数据可能来源不同系统的问题，通过预设的配置信息实现了用户身份数据的提取、用户身份数据中身份特征的识别和提取，并且基于提取的身份特征实现了图谱网络的构建，自动化程度高，成本低。

示例性的，在上述实施例的基础上，图7是根据本申请第三实施例提供的多重用户身份融合的方法的流程示意图。如图7所示，在本实施例中，上述s103可以通过如下步骤实现：

s701、根据该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定该图谱网络中相邻节点间的连接次数。

在图谱网络中，根据节点之间的连接关系可以确定哪些节点之间具有连通关系，根据节点和连接边之间的连接关系可以确定节点之间连通的基本信息，例如，连通时间，连通次数等，因而，根据节点之间具有连通关系和节点之间连通的基本信息可以确定该图谱网络中相邻节点间的连接次数。

在本实施例中，由于节点之间的连接关系、节点和连接边之间的连接关系也就是节点连接信息，因此，图谱网络中相邻节点间的连接次数还可以解释为根据多个预设时间段内的节点连接信息确定相邻节点间的连接次数。

s702、基于该图谱网络中相邻节点间的连接次数、以及预设的次数阈值，确定出第一连接关系和第二连接关系。

其中，该第一连接关系为相邻节点间的连接次数大于次数阈值的连接关系，该第二连接关系为相邻节点间的连接次数小于或等于该次数阈值的连接关系。

本申请实施例主要基于规则模式进行身份融合的计算，具体的，在该种实现方式中，首先确定出该图谱网络中相邻节点间的连接次数、在不同时间段内的节点连接信息以及定义预设的次数阈值，其次根据不同时间段内的节点连接信息和相邻节点间的连接次数，判定相邻节点间的连接次数与次数阈值之间的关系，从而确定出每两个相邻节点属于哪种连接关系。

在实际应用中，第一连接关系也可以称为强连接关系，第二连接关系也可以称为弱连接关系。

s703、根据该第一连接关系、第二连接关系，以目标节点为起点，依次向外遍历图谱网络的节点，确定出该目标节点对应用户的身份群组。

在本实施例中，在确定出相邻节点之间的连接关系后，可以针对图谱网络中的每一个节点，以自身为起点，向周边进行遍历，对于经过的任意节点进行第一连接关系、第二连接关系的判定，从而将所有满足第一连接关系的节点集合对应的身份特征作为一个身份群组。同理，对于目标节点，通过遍历全部的身份群组，根据某种策略(例如，求最小连通子图)，可以确定出该目标节点对应用户的身份群组。

可以理解的是，在本申请的实施例中，节点遍历的深度(出度)可根据实际情况确定，本实施例中不对其进行限定。通常情况下，遍历的深度一般为3度。

由上述分析可知，在本实施例中，基于图谱网络中相邻节点间的连接次数和预设的次数阈值，确定出第一连接关系和第二连接关系，该第一连接关系为相邻节点间的连接次数大于次数阈值的连接，第二连接关系为相邻节点间的连接次数小于或等于次数阈值的连接，根据该第一连接关系、第二连接关系，以目标节点为起点，依次向外遍历所述图谱网络的节点，确定出该目标节点对应用户的身份群组，也即，该方案基于规则模式的融合方式，得到的结果准确率高。

示例性的，在上述实施例的基础上，图8是根据本申请第四实施例提供的多重用户身份融合的方法的流程示意图。本实施例与图7所示实施例的区别在于两个实施例确定同一用户的身份群组的方式不同。具体的，如图8所示，在本实施例中，上述s103可以通过如下步骤实现：

s801、根据该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息，确定出节点间的关联关系。

在本实施例中，主要基于模型模式进行身份融合的计算，具体的，根据节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息，对节点进行特征化，例如，进行标识嵌入处理(id-embedding)，该id-embedding的目的是为图谱网络中的每个节点提取一组特征(一组向量)，以实现节点间数学运算的目的。

可以理解的是，节点特征化的方法有很多，例如，node2vec、graph-embedding等。关于实际采用的方法可以根据实际需要确定，此处不再赘述。

在本申请的实施例中，为满足更多的需求场景，可以采用基于属性数据类型的特征化方案，其是一种通用性的特征表示方法，具体的，可以根据属性特征的不同类型：string、int、double、enum，进行相关的编码。例如，string类型可以根据onehot字符编码、int进行数值归一化编码。

s802、基于节点间的关联关系，对该图谱网络中的节点进行聚合，确定同一用户的身份群组。

在本实施例中，基于节点间的关联关系对节点进行聚类，也即，采用相似度算法对相似度(相关联度)较高的节点进行聚合，形成强相关群体。其中，相似度算法可以根据s801中提取的特征属性的不同进行选择。例如，离散型特征可以使用jaccard相似度算法，连续性特征向量可以采用余弦相似度，数值型特征可以采用欧几里得相似度。

由上述分析可知，确定出节点间的关联关系之后，相应的得到节点间的关联度，因而，可以选取不同的算法对节点进行聚类，例如，使用经典的louvain社团发现算法，也可以使用传统的k-means算法进行聚类。最终的输出是一个置信度较高的针对同一用户的身份群组。

本申请实施例提供的多重用户身份融合的方法，根据该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息，确定出节点间的关联关系，基于节点间的关联关系，对该图谱网络中的节点进行聚合，确定同一用户的身份群组。该技术方案中，基于模型模式的融合方式，可以保证高融合率。

值得说明的是，在实际应用中，基于规则模式和模型模式的融合方式可以结合使用，也即，两者互补可以构成完整的融合系统。本申请的实施例中，可以根据数据规模选择分布式和非分布式计算，从而方便了在工程角度独立部署的方案。

示例性的，在上述任意实施例的基础上，图9是根据本申请第五实施例提供的多重用户身份融合的方法的流程示意图。参照图9所示，该方法还可以包括如下步骤：

s901、根据同一用户的身份群组，确定该身份群组中与目标身份特征具有关联关系的多个用户身份特征，该目标身份特征为身份群组包括的用户身份特征中的任意一个。

在本实施例中，根据身份群组确定目标身份特征的多个关联用户身份特征的方案实际上是关联检索的过程。具体的，关联检索主要是基于图1所示实施例中s103和图5所示关联关系形成的强连通图进行图遍历检索的过程。

具体的，基于给定的源节点类型、源节点的身份特征，以及目标节点类型等，可以输出连通的节点标识以及对应分值，该分值表征连通的节点与源节点和目标节点的关联程度。由于节点间的连通关系已形成一个连通图，因而，如图5所示，可以根据目标身份特征很直观的进行目标身份特征的身份打通推导，进而得到所有与目标身份特征具有关联关系的所有用户身份特征。

示例性的，在本实施例中，该步骤可以通过如下方式实现：

对同一用户的身份群组中的节点进行检索、遍历和筛选处理，确定该身份群组中与目标身份特征具有关联关系的多个用户身份特征。

在本申请的实施例中，身份特征连通推导的过程可分为：节点身份检索、节点身份的广度遍历和节点身份特征的筛选等。

具体的，节点身份检索：由上述图1所示实施例中的介绍可知，点存储主要包括节点主键(key)、节点拥有的属性信息和节点连接的连接边。通过对属性主键构建索引(例如，对id-type和id-info构建索引)，可以提供提高检索性能。例如，若需要检索手机号为139xxxxxxxx的节点，检索节点的过程，即查询id-type＝phone，id-info＝139xxxxxxxx的数据。

节点身份的广度遍历：基于图的广度优先搜索(breadthfirstsearch，bfs)的节点遍历。从目标身份特征对应的目标节点开始，由内向外，依次遍历与它有1层、2层…n层(可参数控制)连接的节点。

示例性的，在图5所示的示意图中，对于图5中的手机号，第一层得到imei、idfa、ap、ip地址等，第二层得到车、房等。由上述图2所示的点存储可知，bfs的过程即遍历节点的值中存储的连接边的过程，一个节点的一度遍历仅只进行一次k-v检索，大大提升的遍历效率。

节点身份特征的筛选：通过对图谱网络中的节点进行遍历可以获取到所有与目标身份特征对应节点联通的身份群组，由于节点的属性主键带有索引，因而可以支持根据属性主键的索引对检索结果进行过滤。例如，要获取与手机联通的idfa，遍历一轮既可以得到结果，非id-type＝idfa的节点会被过滤掉。

由此，通过上述节点身份检索、节点身份的广度遍历和节点身份特征的筛选等过程可快速推导获得与目标身份特征对应顶点有连通关系的顶点。

本实施例中，基于图遍历的在线身份特征推导，通过利用图谱网络的存储及索引方案，相比于现有通过正方向表存储身份特征的映射关系的方案，平均响应效果显著提升，尤其当连通的通路步长(度数)大于2步时，平均响应性能提升10倍。

s902、向多个用户身份特征中的至少一个身份特征推送消息。

在本实施例中，对于同一用户的身份群组，当确定出身份群组中与目标身份特征具有关联关系的多个用户身份特征之后，可以向多个用户身份特征中的至少一个推送消息。

例如，当打通某个搜索网站和电商网站的身份，当用户在搜索网站上搜索商品之后，可以在用户登录电商网站时，在电商网站上为用户推荐搜索过的该商品，从而有针对性的将该用户可能感兴趣的商品推荐给用户。

由上述分析可知，在本实施例中，通过根据同一用户的身份群组，确定该身份群组中与目标身份特征具有关联关系的多个用户身份特征，该目标身份特征为身份群组包括的用户身份特征中的任意一个，向该多个用户身份特征中的至少一个身份特征推送消息。该技术方案实现了有针对性的向用户推送消息，提高了产品商业价值。

综上所述，本申请实施例的技术实现，将用户身份数据中的每个身份特征看成图谱网络中的一个节点，通过图论算法，将若干弱关系的身份特征对进行连接关系加强，形成强关系对，以达到身份融合的目的，其涉及到数据提取、数据存储、融合计算、关联检索一整套方案，支持私有化部署，方便小企业进行数据融合。

上述介绍了本申请实施例提到的多重身份融合的方法的具体实现，下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图10为本申请实施例提供的多重身份融合的装置的结构示意图。该装置可以集成在电子设备中或通过电子设备实现，该电子设备可以为终端设备，也可以是服务器。如图10所示，在本实施例中，该多重身份融合的装置100可以包括：

获取模块1001，用于获取用户身份数据，所述用户身份数据具有至少两个身份特征；

处理模块1002，用于根据所述用户身份数据具有的至少两个身份特征，构建图谱网络，所述图谱网络包括：表征身份特征的节点和表征身份特征的关联关系的连接边；

确定模块1003，用于根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定同一用户的身份群组，所述身份群组包括：多个身份特征。

在本申请实施例的一种可能设计中，该获取模块1001，具体用于获取预设的配置信息，所述配置信息包括：数据源类型、数据源路径、提取方式和提取周期；根据所述数据源路径、所述提取方式和所述提取周期，从所述数据源类型对应数据源中提取所述用户身份数据。

示例性的，所述配置信息还包括：字段映射关系；

相应的，该处理模块1002，还用于根据所述字段映射关系，依次对获取到的所述用户身份数据进行解析，提取所述用户身份数据具有的至少两个身份特征。

在本申请的另一种可能设计中，所述处理模块1002，具体用于以所述用户身份数据中的每个身份特征作为图谱网络的节点，以所述用户身份数据中的每两个身份特征的关联关系作为图谱网络的连接边，构建所述图谱网络，所述图谱网络中每个节点和每条连接边分别具有属性信息。

在本申请实施例的再一种可能设计中，该确定模块1003，具体用于根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系，确定所述图谱网络中相邻节点间的连接次数，基于所述图谱网络中相邻节点间的连接次数和预设的次数阈值，确定出第一连接关系和第二连接关系，所述第一连接关系为相邻节点间的连接次数大于所述次数阈值的连接关系，所述第二连接关系为相邻节点间的连接次数小于或等于所述次数阈值的连接关系；根据所述第一连接关系、所述第二连接关系，以目标节点为起点，依次向外遍历所述图谱网络的节点，确定出所述目标节点对应用户的身份群组。

在本申请实施例的又一种可能设计中，该确定模块1003，具体用于根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系以及各节点具有的属性信息，确定出节点间的关联关系；基于所述节点间的关联关系，对所述图谱网络中的节点进行聚合，确定同一用户的身份群组。

在本申请实施例的上述任意一种可能设计中，该确定模块1003，还用于根据同一用户的身份群组，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征，所述目标身份特征为所述身份群组包括的用户身份特征中的任意一个；

相应的，该装置还包括：推送模块；

该推送模块，用于向所述多个用户身份特征中的至少一个身份特征推送消息。

在本申请的实施例中，该确定模块1003，还具体用于对同一用户的身份群组中的节点进行检索、遍历和筛选处理，确定所述身份群组中与目标身份特征具有关联关系的多个用户身份特征。

在本实施例的上述任意一种可能设计中，上述处理模块1002，还用于以图数据库的形式，存储所述图谱网络中节点与连接边的对应关系；

其中，所述图数据库包括：点存储、连接边存储和属性存储；

所述点存储包括：节点主键、节点拥有的属性信息和节点连接的连接边；

所述连接边存储包括：连接边主键、连接边所连接的起始点和终止点，以及连接边所携带的属性信息；

所述属性存储包括：属性主键、属性所表示的含义，以及属性表示的具体内容。

可选的，所述节点主键、所述连接边主键、所述属性主键均采用索引的方式存储。

本申请实施例提供的装置，可用于执行图1至图9所示实施例中的方法，其实现原理和技术效果类似，在此不再赘述。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，确定模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(applicationspecificintegratedcircuit，asic)，或，一个或多个微处理器(digitalsignalprocessor，dsp)，或，一个或者多个现场可编程门阵列(fieldprogrammablegatearray，fpga)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(centralprocessingunit，cpu)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，soc)的形式实现。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

进一步的，根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

图11是用来实现本申请实施例的多重用户身份融合的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图11所示，该电子设备包括：一个或多个处理器1101、存储器1102，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图11中以一个处理器1101为例。

存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的多重用户身份融合的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的多重用户身份融合的方法。

存储器1102作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的多重用户身份融合的方法对应的程序指令/模块(例如，附图10所示的获取模块1001、处理模块1002和确定模块1003)。处理器1101通过运行存储在存储器y02中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的多重用户身份融合的方法。

存储器1102可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据多重用户身份融合的电子设备的使用所创建的数据等。此外，存储器1102可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1102可选包括相对于处理器1101远程设置的存储器，这些远程存储器可以通过网络连接至多重用户身份融合的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

多重用户身份融合的电子设备还可以包括：输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接，图11中以通过总线连接为例。

输入装置1103可接收输入的数字或字符信息，以及产生与多重用户身份融合的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置(例如，led)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

本申请实施例还提供一种多重用户身份融合的方法，包括：

根据用户身份数据具有的至少两个身份特征，确定所述至少两个身份特征的关联关系；

根据所述至少两个身份特征的关联关系，确定同一用户的身份群组。

该实施例的具体实现原理可以参见上述图1至图9所示实施例的记载，此处不再赘述。

根据本申请实施例的技术方案，通过获取用户身份数据，根据该用户身份数据具有的至少两个身份特征，构建图谱网络，该图谱网络包括：表征身份特征的节点和表征身份特征关系的连接边，根据该图谱网络中节点之间的关联关系、节点和连接边之间的关联关系，确定同一用户的身份群组，该身份群组包括：多个身份特征。该技术方案中，通过图谱网络的形式将用户身份数据具有的身份特征关联起来，不仅能够准确的确定出同一用户的多个身份特征对应的身份群组，而且其可以应用于任何场景，避免了使用范围受限的问题。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张阳;杨双全;刘畅
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：导向型优化资源调度的制作方法
上一篇：通过跳过处理操作来减少神经网络处理器中的功耗的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。