一种用户数据共享的方法和设备与流程

文档序号：12600643阅读：193来源：国知局

本申请涉及计算机技术领域，特别涉及一种用户数据共享的方法和设备。

背景技术：

随着互联网和信息化的发展，用户在日常业务的进行过程中，会将信息应用于不同的业务平台中，例如：网络购物、网络行为、金融服务、保险业务等诸多方面，而在这些业务实现的过程中，不同的业务平台也会相应的对用户的信息进行记录和累计，包括业务执行记录以及由此衍生的用户行为信息。

不同类型的业务平台分别的不断地积累了用户的在不同方面的数据信息，比如，一些电商平台的业务平台会不断沉淀用户的购物消费信息，另外一些搜索引擎的业务平台会不断沉淀用户的搜索信息，另外一些理财平台的业务平台会沉淀用户的存款理财信息。同一个用户实体在不同类型的业务平台的网站上会有不同的账户，沉淀了不同的信息。如何将不同业务平台之间的同一用户的用户信息进行关联，打通不同业务平台之间的用户数据，实现用户行为信息共享，是一件非常有价值，也非常困难的事情。

但是，由于用户识别，信息交互，分类统计等诸多难题的存在，现有技术中还没有一种方案能够将不同业务平台之间的针对同一个用户实体的用户行为信息打通，实现用户行为信息共享。

因此，现有技术中亟待找到一种能够够将不同业务平台之间的针对同一个用户实体的用户行为信息打通，以实现用户行为信息共享的方案。

技术实现要素：

本申请实施例提供了一种用户数据共享的方法和设备，以实现将不同业务平台之间的针对同一个用户实体的用户行为信息打通，实现共享所述用户行为信息。

为了达到上述目的，一种用户数据共享的方法，包括以下步骤：

获取查询媒介信息；

利用所述查询媒介信息，从媒介网络中查找得到与所述查询媒介相关的至少一个用户账户及其关系信息，所述用户账户的关系信息包括：所述用户账户与该查询媒介之间的关系强度，以及，所述用户账户与其他用户账户之间的关系强度；

利用查找到的所述至少一个用户账户及其关系信息，构建局部媒介网络，所述局部媒介网络中的边包括媒介和用户账户的关系，以及，所述用户账户与其他用户账户之间的关系，边权重为关系强度分值；

利用所述局部媒介网络，从所述至少一个用户账户中确定可信账户；

获取所述可信账户的用户数据，并作为所述查询媒介信息对应的用户数据输出，以实现用户数据共享。

一种网络设备，其特征在于，包括：

获取模块，用于获取查询媒介信息；

查询模块，用于利用所述获取模块所获取的查询媒介信息，从媒介网络中查找得到与所述查询媒介相关的至少一个用户账户及其关系信息，所述用户账户的关系信息包括：所述用户账户与该查询媒介之间的关系强度，以及，所述用户账户与其他用户账户之间的关系强度；

创建模块，用于利用所述查询模块所查找到的所述至少一个用户账户及其关系信息，构建局部媒介网络，所述局部媒介网络中的边包括媒介和用户账户的关系，以及，所述用户账户与其他用户账户之间的关系，边权重为关系强度分值；

确定模块，用于利用所述局部媒介网络，从所述至少一个用户账户中确定可信账户；

处理模块，用于获取所述可信账户的用户数据，并作为所述查询媒介信息对应的用户数据输出，以实现用户数据共享。

与现有技术相比，本申请实施例至少具有以下优点：

本申请实施例公开了一种用户数据共享的方法和设备，根据获取到的查询媒介信息，查询相关的至少一个用户帐户及其关系信息，根据查询到的信息构建局部媒介网络，并利用所述局部媒介网络，从所述至少一个用户账户中确定可信账户，获取所述可信账户的用户数据，并作为所述查询媒介信息对应的用户数据输出，以实现用户数据共享，从而，将不同业务平台之间的针对同一个用户实体的用户行为信息打通，以实现用户行为信息共享。

附图说明

图1是本申请实施例一提供的一种用户数据共享的方法的流程示意图；

图2是本申请实施例一提供的一种局部媒介网络的结构示意图。

图3是本申请实施例二提供的一种网络设备的结构示意图。

具体实施方式

下面将结合本申请的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请的部分实施例，而不是全部的实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

不同的业务平台的数据库都会记录用户的一些身份信息(如用户手机号码，身份证，银行卡等)和环境信息(如使用的IP，WIFI，MAC，IMEI等)，这些身份信息和环境信息可统称为媒介信息。由于同一个用户在不同的业务平台留下的媒介信息是相同的，因此可以将其用来实现数据的打通。所谓的数据的打通是基于上述相同的媒介信息，从不同的业务平台的数据库中，获取在不同业务平台的数据库沉淀的针对同一个用户的用户行为信息，以实现该用户行为信息的数据共享。

通过单一媒介去查找用户，这样的方式准确率比较低，尤其是对于一些公用的媒介信息，如IP，MAC甚至手机等，利用这些媒介信息通常会找到很多账户，而这些账户又不一定是属于同一个用户的。因此，虽然用该单一媒介信息查找到了多个账户，但由于这些账户不是属于同一用户的，所以，所获得用户行为信息将是来自于不同用户的，这样获取的数据准确率低，无法实现共享同一用户在不同业务平台的数据库中所沉淀的用户行为信息。

其中，用户行为信息可以包括例如用户的购物信息、用户的搜索信息以及用户的存款信息等。

而且对于很多业务场景来说，准确率是非常重要的，而且一般情况下，都会有丰富的媒介信息，因此，更好的方案是能够用多个媒介信息去更好的查找用户或者说锁定用户。

本申请实施例所提出的技术方案要实现的正是用多个媒介信息去锁定同一个用户。而当用多个媒介信息锁定一个用户之后，同时也即确认了这些媒介信息是属于该用户的。进一步的，再用这些属于同一个用户的媒介信息在不同业务平台去匹配不同的账号，从而获取该用户在不同业务平台留下的不同的账号，以及在相应的账号在所对应的业务平台的数据库中所沉淀的用户行为信息，即获取了同一个用户在不同业务平台中的用户行为信息。

通过以上的处理，使各个业务平台可以共享同一用户在不同业务平台的数据库中所沉淀的用户行为信息。例如，利用属于同一个用户u的媒介信息在业务平台a、业务平台b和业务平台c中匹配相应的账号，即在业务平台a、业务平台b和业务平台c中查找用户u留下的账号，进而，获取所查找到的账号在业务平台a、业务平台b和业务平台c的数据库中所沉淀的用户行为信息，从而，获取到了用户u在业务平台a、业务平台b和业务平台c中的用户行为信息，在业务平台a、业务平台b和业务平台c之间实现了用户u的用户行为信息的共享。

如图1所示，为本申请实施例一提供的一种用户数据共享的方法的流程示意图，该方法具体包括以下步骤：

步骤S101、获取查询媒介信息。

媒介是指使双方(人或事物)发生关系的人或事物，常见的媒介包括账户、身份证、手机、邮箱、银行卡、设备码、地址相关的信息等。

而在本申请实施例中，查询媒介是指用以在媒介网络中查询目标用户的帐户的媒介，当前，可以确定这些媒介与目标用户的账户存在关联性的可能性较大，所以，用以查询目标用户的准确性也较高。在实际的应用中，可以选择已验证与用户相匹配，或者具有排他性的媒介来作为查询媒介。

需要进一步说明的是，为了提高查询的准确度，也为了降低干扰信息或识别度较低的信息作为查询媒介所导致的查询结果错误，本申请实施例所提出的技术方案中，优选的需要获取两个以上的查询媒介用以后续的处理流程，具体查询媒介数量可以根据实际场景需要进行设置，这样的变化并不会影响本申请的保护范围。

步骤S102、利用所述查询媒介信息，从媒介网络中查找得到与所述查询媒介相关的至少一个用户账户及其关系信息。

其中，所述用户账户的关系信息包括：所述用户账户与该查询媒介之间的关系强度，以及，所述用户账户与其他用户账户之间的关系强度。

需要说明的是，所述媒介网络是包括用户账户之间的关联关系、用户账户与媒介之间的关联关系的网络，所述媒介网络中包括任意用户账户之间的关系强度、用户账户和媒介之间的关系强度。

在步骤S101中，如果获取了至少两个查询媒介信息，则本步骤的操作具体为：分别利用所述至少两个查询媒介信息，从媒介网络中查找得到与对应的所述查询媒介相关的各个用户账户以其关系信息。

需要说明的是，在一种具体的应用场景中，可以包括以下的处理选择，从媒介网络中查找得到与对应的所述查询媒介相关的各个用户账户以其关系信息之后，进一步可以包括：

判断所述至少两个查询媒介信息是否属于同一个用户账户，若是，则将确定的同一个用户账户作为可信账户；否则，执行步骤S103。

步骤S103、利用查找到的所述至少一个用户账户及其关系信息，构建局部媒介网络。

在实际应用场景中，局部媒介网络的创建流程如下：

根据用户账户与媒介之间的共现关系，确定用户账户和媒介之间的关系强度，根据用户之间的关系，确定用户账户之间的关系强度，其中，所述用户之间的关系包括：用户之间的社交关系、资金关系、共设备关系、共媒介关系。

具体的，所述局部媒介网络包括顶点和边，所述局部媒介网络中的顶点包括媒介或用户账户，所述局部媒介网络中的边包括媒介和用户账户的关系，以及，所述用户账户与其他用户账户之间的关系，边权重为关系强度分值。

如图2所示，为本申请实施例所提出的根据一个具体的应用场景所创建的局部媒介网络的结构示意图，相应的创建过程如下：

首先，获取媒介信息1、媒介信息2、媒介信息3、媒介信息4。

然后，在媒介网络中，根据媒介信息1找对应的账户A、B，根据媒介信息2找对应的账户A、C，根据媒介信息3找对应的账户A、C，根据媒介信息4找对应的账户D、E。

最后，根据媒介信息1、媒介信息2、媒介信息3、媒介信息4、以及与该媒介信息1对应的账户A、B，与该媒介信息2对应的账户A、C，与该媒介信息3对应的账户A、C，与该媒介信息4对应的账户D、E构建出如附图2所示的局部媒介网络，其中，媒介信息1、媒介信息2、媒介信息3、媒介信息4，以及账户A、账户B、账户C和账户D作为不同的顶点，图中各顶点之间的连线即为边，示意相应顶点之间关系。

步骤S104、利用所述局部媒介网络，从所述至少一个用户账户中确定可信账户。

具体的，本步骤的处理方案为利用步骤S103所创建的局部媒介网络，对所述至少一个用户账户进行混合排序，将排在前N个用户账户确定为可信账户。

具体的，在实际应用场景中，上述的混合排序的实现流程如下：

步骤1、边权重归一化，对所述局部媒介网络中的各个边的边权重进行归一化，即在所述局部媒介网络中，分别对各查询媒介信息和与其对应的用户账户之间、以及各用户账户之间的原始边权重信息进行边权重信息归一操作。

需要具体说明的是，上述的边权重信息归一操作可以通过如下的方式实现：

首先，分别获取所述各查询媒介信息和与其对应的用户账户之间的原始边权重、各用户账户之间的原始边权重在第一预设次数内的变化率信息；

根据该变化率信息对各查询媒介信息和与其对应的用户账户之间的原始边权重、各用户账户之间的原始边权重进行边权重归一化操作。

在具体的应用场景下，可参考如下公式实现：

公式一(逻辑回归公式)：

其中，f(x)为进行边权重信息归一操作后所获得边权重值，“ax”中的x表示原始的边权重值，a作为逻辑回归公式中的变量，可以通过以下公式求得：

公式二(求导公式)：

其中，x0表示原始边权重的最小值；x99％表示边权重的99％分位数的值。

步骤2、迭代计算边权重，对归一化后的边权重进行迭代计算，直至收敛，即根据步骤1的边权重信息归一操作所获得的各查询媒介信息和与其对应的用户账户之间的边权重、以及各用户账户之间的边权重进行迭代计算操作，直至迭代结果收敛后，获得各查询媒介信息和与其对应的用户账户之间的边权重、以及各用户账户之间的边权重。

为了方便描述，定义数学符号如下：局部媒介网络定义为G，n表示G中的节点数据，节点可以是用户账户，也可以是媒介。

在具体的应用场景下，上述的迭代操作可参考如下公式实现：

公式三(初始状态下，也即第k次迭代中的边权重信息计算公式)：

在迭代过程中，通过如下公式四重新计算每条边的权重(第k+1次迭代中的的边权重信息计算公式)，公式四：

其中，Rk(a，b)表示节点a和节点b的在第k次迭代中的边权重信息、R_k+1(a，b)表示节点a和节点b的在第k+1次迭代中的边权重信息、C表示收敛速度控制参数或者叫衰减因子、|I(a)|表示节点a的邻居列表的边权重信息的和值、|I(b)|表示节点b的邻居列表的边权重信息的和值、i表示第i个、j表示第j个、I_i(a)表示节点a的邻居列表信息、I_j(b)表示节点b的邻居列表信息。(在局部媒介网络中，媒介信息以及与媒介信息相对应的账户称为节点，与节点相连接的其他节点称为该节点的邻居，所有邻居称为邻居列表)。

需要说明的是，由于对边权重进行迭代计算的目的是：使求得的节点之间的边权重信息趋于稳定也即收敛，而非无限制的迭代下去；因此，在本实施例中，在进行到预设次数的迭代计算操作之后，要判断此时获得的节点之间的边权重信息是否满足收敛条件。

具体的，在本实施例中，可通过如下方式确定此时获得的节点之间的边权重信息是否满足收敛条件：

当进行第一预设次数的迭代计算操作后，分别获取所述各用户账户与与其相对应的各媒介信息之间新的边权重的第一变化值、以及与所述各用户账户之间的边权重的第二变化值；

判断所述第一变化值与第二变化值的和值是否小于预设的第一和值阀值；

若小于，则停止进行迭代计算操作；

若不小于，则继续进行迭代计算操作。

步骤3、确定综合权重信息，利用收敛后的各个边权重，计算各个用户账户的综合权重或各查询媒介的综合权重。

根据所述用户账户之间的边权重和用户账户与相应的媒介之间的边权重信息，确定各用户账户的综合权重信息和各查询媒介信息的综合权重信息。

在具体的应用场景下，可参考如下公式实现：

公式五(媒介权重信息的计算公式)：

其中，W(a)为媒介权重。通常，不同的查询媒介的权重是不一样的，比如作为查询媒介，身份证比手机查询的结果一般都更加可信，因此，权重更高。不同类型的查询媒介，由于其查询用户的准确率(置信度)是不一样的，权重也应该是不同的，通常该媒介权重是根据业务经验和理解指定的。因此，根据媒介的不同类型，设置不同的媒介权重。

公式六(各用户账户的综合权重信息计算公式)：

其中，u表示该局部媒介网络中的用户账户u，S表示与用户账户u相对应的的媒介信息所组成的媒介信息集合S，Score(u)表示用户账户u的综合权重信息；

W(a)*R(a，u)表示用户账户u与与其相对应的各媒介信息之间的边权重信息；

W(a)*W(b)*R(a，b)表示与用户账户u相对应的媒介信息之间的边权重信息。

步骤4、综合权重排序，根据步骤3所得到的各个用户账户的综合权重或各查询媒介的综合权重，对各用户账户或各各查询媒介进行排序，确定可信账户或可信媒介。

具体的，可以利用所述局部媒介网络，对所述至少一个用户账户进行混合排序，将排在前N个用户账户确定为可信账户，N为正整数。

N可以根据实际场景需要所设置的数值，例如N＝1。排名第一的用户账户为最可信账户，可信度为该用户账户的综合权重分值。最可信账户相关的媒介为可信媒介，同样，可信度为该媒介的综合权重分值。

对于可信媒介的判定，可以直接将可信用户相关的媒介判定为可信媒介，且该媒介属于可信账户。

如果存在非可信媒介，且该非可信媒介和可信媒介的相似度(R)小于某个阈值(如0.01)，则认为该媒介是不可信的，即该媒介不属于可信账户。

步骤S105、获取所述可信账户的用户数据，并作为所述查询媒介信息对应的用户数据输出，以实现用户数据共享。

在具体的应用场景中，实现用户数据共享的操作方式可以具体为：

根据所述可信账户所对应的至少两个媒介信息到不同数据库中去获取所述不同数据库中所记录的该可信账户所对应的用户的用户行为信息，以实现共享所述用户行为信息。

在本实施例中，作为一个优选步骤，在根据所述可信账户所对应的至少两个媒介信息到不同数据库中去获取所述不同数据库中所记录的该可信账户所对应的用户的用户行为信息后，还可以在上述的局部媒介网络中获取不与所述可信账户相对应的其他媒介信息，将这些媒介信息作为非可信媒介信息。需要说明的是，非可信媒介信息并非不可信媒介信息，因此，还需要对这些非可信媒介信息进行判断，以确定其是否是不可信媒介信息。

具体的，可通过如下方式实现判断所述非可信媒介信息是否是不可信媒介信息：

步骤A：获取所述非可信媒介信息与所述与所述可信账户相对应的媒介信息之间的相似度。

其中，所述相似度是与所述非可信媒介信息与与其相关的可信媒介信息之间所具有的相同的邻边的数量相对应的。

优选的，所述非可信媒介信息与与其相关的可信媒介信息之间所具有的相同的邻边的数量越多表示所述非可信媒介信息与所述与所述可信账户相对应的媒介信息之间的相似度越高；反之，该数量越少表示相似度越低。

在实际应用中，对于可信媒介，可以直接判定且属于可信账户，如果存在非可信媒介且和可信媒介的相似度(R)小于某个阈值(如0.01)，则认为该媒介是不可信的，即该媒介不属于可信账户。

步骤B：将所述相似度与预设的相似度阀值进行比较；

步骤C：将所述相似度小于预设的相似度阀值的非可信媒介信息作为不可信媒介信息。

另一方面，由于不同的媒介信息与账户之间的边权重信息是不一样的，比如：身份证比手机的查询用户结果要更加可信，因此身份证的边权重信息更高；另外不同类型的媒介信息，由于其查询用户的准确率(置信度)是不一样的，其边权重信息也应该是不同的。因此，在根据所述可信账户所对应的至少两个媒介信息到不同数据库中去获取所述不同数据库中所记录的该可信账户所对应的用户的用户行为信息后，还可以确定与所述可信账户相对应的各媒介信息与所述可信账户的关系强度，该关系强度指根据媒介信息查询用户时的准确率；具体的，可通过如下方式实现：

步骤A：分别获取与所述可信账户相对应的各媒介信息的第二综合边权重信息；其中，所述各第二综合边权重信息为所述各媒介信息与与其相对应的账户所组成的账户之间的综合边权重信息。

具体的，上述的第二综合边权重信息可以根据以下方式来确定：

公式七(第二综合边权重信息计算公式)：

其中，m表示该局部媒介网络中的媒介信息m，K表示与该媒介信息m相对应的账户所组成的账户集合K，Score(m)表示第二综合边权重信息；

Score(a)*R(a，m)表示媒介信息m与其相对应的各用户之间的边权重信息；

Score(a)*Score(b)*R(a，b)表示与媒介信息m相对应的用户之间的边权重信息。

步骤B：对所述各第二综合边权重信息进行排序。

步骤C：根据排序结果确定所述各媒介信息与所述可信账户的关系强度。

与现有技术相比，本申请实施例至少具有以下优点：

基于与上述方法同样的发明构思，本发明实施例二还提出了一种网络设备，如图3所示，具体包括：

获取模块31，用于获取查询媒介信息；

查询模块32，用于利用所述获取模块31所获取的查询媒介信息，从媒介网络中查找得到与所述查询媒介相关的至少一个用户账户及其关系信息，所述用户账户的关系信息包括：所述用户账户与该查询媒介之间的关系强度，以及，所述用户账户与其他用户账户之间的关系强度；

创建模块33，用于利用所述查询模块32所查找到的所述至少一个用户账户及其关系信息，构建局部媒介网络，所述局部媒介网络中的边包括媒介和用户账户的关系，以及，所述用户账户与其他用户账户之间的关系，边权重为关系强度分值；

确定模块34，用于利用所述局部媒介网络，从所述至少一个用户账户中确定可信账户；

处理模块35，用于获取所述可信账户的用户数据，并作为所述查询媒介信息对应的用户数据输出，以实现用户数据共享。

在具体的应用场景中，所述确定模块34，具体用于：

利用所述局部媒介网络，对所述至少一个用户账户进行混合排序，将排在前N个用户账户确定为可信账户，N为正整数。

其中，确定模块34具体包括：

归一化单元，用于对所述局部媒介网络中的各个边的边权重进行归一化；

迭代单元，用于对所述归一化单元归一化后的边权重进行迭代计算，直至收敛；

计算单元，用于利用所述迭代单元收敛后的各个边权重，计算各个用户账户的综合权重或各查询媒介的综合权重；

排序单元，用于根据所述计算单元计算的所述各个用户账户的综合权重或各查询媒介的综合权重，对所述至少一个用户账户或各各查询媒介排序，确定可信账户或可信媒介。

优选的，所述获取模块31，具体用于获取至少两个查询媒介信息；

所述查询模块32，具体用于分别利用所述至少两个查询媒介信息，从媒介网络中查找得到与对应的所述查询媒介相关的各个用户账户以其关系信息。

相应的，所述创建模块33，具体用于：

判断所述至少两个查询媒介信息是否属于同一个用户账户，若是，则将确定的同一个用户账户作为可信账户；否则，利用查找到的所述至少一个用户账户及其关系信息，构建局部媒介网络。

与现有技术相比，本申请实施例至少具有以下优点：

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明实施例可以通过硬件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，本发明实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或网络侧设备等)执行本发明实施例各个实施场景所述的方法。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本发明实施例所必须的。

本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本发明实施例序号仅仅为了描述，不代表实施场景的优劣。

以上公开的仅为本发明实施例的几个具体实施场景，但是，本发明实施例并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明实施例的业务限制范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王峰伟;何慧梅;吴东杏;何帝君;林瑞华
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。