一种数据处理方法及其设备与流程

文档序号:11829845阅读:236来源:国知局
一种数据处理方法及其设备与流程

本发明涉及计算机技术领域,尤其涉及一种数据处理方法及其设备。



背景技术:

随着计算机技术不断的开发和完善,手机和平板电脑等终端已经成为了人们生活中不可或缺的一个部分,人们不仅可以利用这些终端进行通讯,还可以进行文件传输、摄像、玩游戏等。

随着技术的发展,通讯录的联系人数据可在远程服务器中进行实时的数据同步,然而联系人数据在上传的过程中容易发生数据丢失的情况,导致远程服务器中的联系人数据与终端中的联系人数据不一致,影响了联系人数据的完整性,进而影响了对联系人数据同步的准确性。



技术实现要素:

本发明实施例提供一种数据处理方法及其设备,可以保证联系人数据的完整性,提升对联系人数据同步的准确性。

为了解决上述技术问题,本发明实施例第一方面提供了一种数据处理方法,可包括:

生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息;

采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中。

本发明实施例第二方面提供了一种数据处理设备,可包括:

信息生成单元,用于生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息;

强度值计算单元,用于采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

数据加入单元,用于根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中。

在本发明实施例中,通过生成在当前条件属性的联系人集合中待加入联系人数据与集合中待加入联系人数据的邻近联系人数据间的关联信息,并采用关联信息计算两者间的关系强度值,最终依据关系强度值将待加入联系人数据加入至该联系人集合中,实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种数据处理方法的流程示意图;

图2是本发明实施例提供的另一种数据处理方法的流程示意图;

图3是本发明实施例提供的一种数据处理设备的结构示意图;

图4是本发明实施例提供的另一种数据处理设备的结构示意图;

图5是本发明实施例提供的信息获取单元的结构示意图;

图6是本发明实施例提供的又一种数据处理设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的数据处理方法可以应用于终端中对于通讯录的联系人数据重建的场景,例如:数据处理设备生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息,所述数据处理设备采用所述关联信息计算所述待加入联系人数 据与所述邻近联系人数据间的关系强度值,所述数据处理设备根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中的场景等。实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性。

本发明实施例涉及的数据处理设备具体为对用户终端的通讯录中的联系人数据进行同步存储的后台服务器,该后台服务器可以包括但不限于联系人数据的同步、联系人数据重建等功能在内的服务器;所述联系人数据优选为针对用户终端所属用户在不同应用中的联系人信息,例如:电话号码、应用账号等等。

下面将结合附图1和附图2,对本发明实施例提供的一种数据处理方法进行详细介绍。

请参见图1,为本发明实施例提供了一种数据处理方法的流程示意图。如图1所示,本发明实施例的所述方法可以包括以下步骤S101-步骤S103。

S101,生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息;

具体的,数据处理设备可以生成在当前条件属性的联系人集合中的待加入联系人数据,所述当前条件属性为所述数据处理设备根据在已知的联系人集合中所确定的核心属性,例如:A高中的属性、B公司的属性等等,所述联系人集合可以包含一个或多个当前存储于所述数据处理设备中且未丢失的联系人数据,所述待加入联系人数据为所述数据处理设备根据所述当前条件属性,并结合已知的所述联系人集合中的任意联系人数据(即邻近联系人数据)所查找到的联系人数据。

所述数据处理设备在获取所述待加入联系人数据后,进一步生成在所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息,所述关联信息优选为所述待加入联系人数据和所述邻近联系人数据间的影响力数值,需要说明的是,所述数据处理设备可以根据多个邻近联系人数据查找到同一个所述待加入联系人数据,即所述待加入联系人数据与所述联系人集合中的多个邻近联系人数据均存在所述当前条件属性所指示的关联关系,因此所述数据处理设备需要分别计算该多个邻近联系人数据与所述待加入联系人数据间的关联信 息。

S102,采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

具体的,所述数据处理设备可以采用所述关联信息对所述待加入联系人数据与所述临近联系人数据间的关系强度值进行计算,可选的,所述数据处理设备可以采用预设强度公式并根据所述关联信息,获取所述待加入联系人数据与所述邻近联系人数据在预设时间段内的关系强度值,所述预设强度公式可以为以下公式1:

<mrow> <mi>&lambda;</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&mu;</mi> <mo>+</mo> <mi>&theta;</mi> <munder> <mi>&Sigma;</mi> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>&lt;</mo> <mi>t</mi> </mrow> </munder> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>

其中,λ(t)定义为强度函数,μ表示为泊松分布的参数,(t-ti)表示待加入联系人数据与邻近联系人数据间的关系强度值随时间的变化而变化,g(t-ti)表示为传播速率函数,θ表示为所述待加入联系人数据与邻近联系人数据间的关联信息(即影响力数值)。

所述数据处理设备会在预设时间段内多次获取所述待加入联系人数据与所述邻近联系人数据间的关联信息,并最终确定所述待加入联系人数据与所述邻近联系人数据间的关系强度值。

S103,根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中;

具体的,所述数据处理设备可以根据所述待加入联系人数据与邻近联系人数据间的关系强度值确定是否将所述待加入联系人数据加入至所述联系人集合中,优选的,当所述关系强度值满足预设强度阈值时,所述数据处理设备可以将所述待加入联系人数据加入至所述联系人集合中。可以理解的是,所述预设强度阈值为用户定义的强度阈值,满足预设强度阈值的规则也可以由人为设定,例如:可以设定为当所述关系强度值大于所述预设强度阈值时,将所述待加入联系人数据加入至所述联系人集合中;或者也可以设定为当所述关系强度值小于所述预设强度阈值时,将所述待加入联系人数据加入至所述联系人集合中等。

在本发明实施例中,通过生成在当前条件属性的联系人集合中待加入联系人数据与集合中待加入联系人数据的邻近联系人数据间的关联信息,并采用关联信息计算两者间的关系强度值,最终依据关系强度值将待加入联系人数据加 入至该联系人集合中,实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性。

请参见图2,为本发明实施例提供了另一种数据处理方法的流程示意图。如图2所示,本发明实施例的所述方法可以包括以下步骤S201-步骤S208。

S201,获取预先存储的基于所选择的应用主题下的至少一个联系人数据;

具体的,数据处理设备可以获取预先存储的基于所选择的应用主题下的至少一个联系人数据,所述所选择的应用主题表示在多个社交应用中所选择的其中一个社交应用,可以由用户进行选择,也可以为所述数据处理设备随机进行选择,针对所述所选择的应用主题下,在所述数据处理设备中有预先存储的至少一个联系人数据,即针对该用户的用户标识在所述应用主题下预先同步存储的至少一个联系人数据。

S202,采用粗糙集属性简约获取所述至少一个联系人数据中每个联系人数据的核心属性;

具体的,所述数据处理设备可以在社交网络中获取所述至少一个联系人数据中每个联系人数据对应的属性,例如:针对X联系人数据,其对应的属性可以包括:A高中、B公司等,所述数据处理设备可以采用粗糙集属性简约,并利用非对称关系获取所述每个联系人数据的核心属性,进一步的,所述数据处理设备可以对每个联系人数据对应多个属性进行量化,并选取属性值最高的属性作为该联系人数据的核心属性。

S203,将所述至少一个联系人数据中核心属性对应的属性值最高的联系人数据确定为中心联系人数据,并将所述中心联系人数据的核心属性确定为当前条件属性;

具体的,所述数据处理设备可以将所述至少一个联系人数据中核心属性对应的属性值最高的联系人数据确定为中心联系人数据,并将所述中心联系人数据的核心属性确定为当前条件属性,而所述至少一个联系人数据中的其它联系人数据则依据所述当前条件属性进行分类并进行关联,得到基于当前条件属性下的联系人集合。例如:X联系人数据为中心联系人数据,并且其A高中为核心属性,则在至少一个联系人数据中筛选出A高中的Y联系人数据和Z联系人 数据,则基于A高中的条件属性下的联系人集合包括X联系人数据、Y联系人数据和Z联系人数据。

S204,当检测到在当前条件属性的联系人集合中存在待加入联系人数据时,将所述待加入联系人数据转换为第一节点向量,并将所述联系人集合中所述待加入联系人数据的邻近联系人数据转换为第二节点向量;

具体的,当检测到在当前条件属性的联系人集合中存在待加入联系人数据时,例如:针对A高中的条件属性下,通过Y联系人数据查找到一个待加入联系人数据为O联系人数据时。所述数据处理设备可以获取所述待加入联系人数据,优选的,所述数据处理设备通过地震模型(TAP)算法可以将所述联系人集合中的所有联系人数据以及所述待加入联系人数据均抽象为节点,并分别转化为节点向量,进一步的,所述数据处理设备将所述待加入联系人数据转换为第一节点向量,并将所述联系人集合中所述待加入联系人数据的邻近联系人数据转换为第二节点向量,依据上述举例,将O联系人数据转换为第一节点向量,而与其邻近的Y联系人数据则转换为第二节点向量。其中,TAP算法的传播是基于局部因素图形模型(Topical Factor Graph,TFG)的基础上进行改进,可以将节点转换为对应的节点向量。

可以理解的是,所述数据处理设备可以根据多个邻近联系人数据查找到同一个所述待加入联系人数据,即所述待加入联系人数据与所述联系人集合中的多个邻近联系人数据均存在所述当前条件属性所指示的关联关系,例如:针对A高中的条件属性下,通过Y联系人数据以及Z联系人数据可以查找到一个待加入联系人数据为P联系人数据,则将P联系人数据转换为第一节点向量,将Y联系人数据以及Z联系人数据分别转换为第二节点向量,需要说明的是,Y联系人数据的第二节点向量与Z联系人数据的第二节点向量不相同,此处采用第一节点向量以及第二节点向量仅为了区分待加入联系人数据和邻近联系人数据。

S205,计算所述第一节点向量与所述第二节点向量间的影响力数值,并将所述影响力数值确定为所述待加入联系人数据与所述邻近联系人数据间的关联信息;

具体的,所述数据处理设备进一步可以采用TAP Learning计算所述第一节点向量与所述第二节点向量间的影响力数值,并将所述影响力数值确定为所述待加入联系人数据与所述邻近联系人数据间的关联信息,针对多个临近联系人 数据的情况,所述数据处理设备需要分别计算该多个邻近联系人数据与所述待加入联系人数据间的影响力数值。

S206,采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

具体的,所述数据处理设备可以采用所述关联信息对所述待加入联系人数据与所述临近联系人数据间的关系强度值进行计算,可选的,所述数据处理设备可以采用预设强度公式并根据所述关联信息,获取所述待加入联系人数据与所述邻近联系人数据在预设时间段内的关系强度值,所述预设强度公式可以为以下公式1:

<mrow> <mi>&lambda;</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&mu;</mi> <mo>+</mo> <mi>&theta;</mi> <munder> <mi>&Sigma;</mi> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>&lt;</mo> <mi>t</mi> </mrow> </munder> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>

其中,λ(t)定义为强度函数,μ表示为泊松分布的参数,(t-ti)表示待加入联系人数据与邻近联系人数据间的关系强度值随时间的变化而变化,g(t-ti)表示为传播速率函数,θ表示为所述待加入联系人数据与邻近联系人数据间的关联信息(即影响力数值)。

所述数据处理设备会在预设时间段内多次获取所述待加入联系人数据与所述邻近联系人数据间的关联信息,并最终确定所述待加入联系人数据与所述邻近联系人数据间的关系强度值。

S207,当所述关系强度值满足预设强度阈值时,将所述待加入联系人数据发送至用户终端,以使所述用户终端输出对所述待加入联系人数据的提示信息;

具体的,当所述关系强度值满足预设强度阈值时,所述数据处理设备可以将将所述待加入联系人数据发送至用户终端,所述用户终端可输入对所述待加入联系人数据的提示信息,例如:直接显示该待加入联系人数据及属性、邻近联系人数据等关联数据等。

可以理解的是,所述预设强度阈值为用户定义的强度阈值,满足预设强度阈值的规则也可以由人为设定,例如:可以设定为当所述关系强度值大于所述预设强度阈值时,执行将所述待加入联系人数据发送至用户终端的步骤;或者也可以设定为当所述关系强度值小于所述预设强度阈值时,执行将所述待加入联系人数据发送至用户终端的步骤等。

S208,当接收到所述用户终端发送的对所述待加入联系人数据的确认加入 指令时,将所述待加入联系人数据加入至所述联系人集合中;

具体的,用户可以通过所述用户终端对所显示的待加入联系人数据进行确认,所述用户终端可以向所述数据处理设备发送对所述待加入联系人数据的确认加入指令,即确定所述待加入联系人数据为用户所认识或者准许添加至联系人集合中的联系人数据。当所述数据处理设备接收到所述用户终端发送的对所述待加入联系人数据的确认加入指令时,所述数据处理设备可以将所述待加入联系人数据加入至所述联系人集合中。

在本发明实施例中,通过生成在当前条件属性的联系人集合中待加入联系人数据与集合中待加入联系人数据的邻近联系人数据间的关联信息,并采用关联信息计算两者间的关系强度值,最终依据关系强度值将待加入联系人数据加入至该联系人集合中,实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性;通过采用粗糙集属性简约的方式确定核心属性,实现了基于核心属性的联系人数据重建方式;通过加入时间参数对节点间的关系强度值进行计算,考虑到了时间对节点间的关系强度值的影响,提升了关系强度值计算的准确性,进一步的提升了对联系人数据同步的准确性。

下面将结合附图3-附图5,对本发明实施例提供的数据处理设备进行详细介绍。需要说明的是,附图3-附图5所示的数据处理设备,用于执行本发明图1和图2所示实施例的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明图1和图2所示的实施例。

请参见图3,为本发明实施例提供了一种数据处理设备的结构示意图。如图3所示,本发明实施例的所述数据处理设备1可以包括:信息生成单元11、强度值计算单元12和数据加入单元13。

信息生成单元11,用于生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息;

具体实现中,所述信息生成单元11可以获取在当前条件属性的联系人集合中的待加入联系人数据,所述当前条件属性为所述数据处理设备1根据在已知的联系人集合中所确定的核心属性,例如:A高中的属性、B公司的属性等等, 所述联系人集合可以包含一个或多个当前存储于所述数据处理设备1中且未丢失的联系人数据,所述待加入联系人数据为所述信息生成单元11根据所述当前条件属性,并结合已知的所述联系人集合中的任意联系人数据(即邻近联系人数据)所查找到的联系人数据。

所述信息生成单元11在获取所述待加入联系人数据后,进一步生成在所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息,所述关联信息优选为所述待加入联系人数据和所述邻近联系人数据间的影响力数值,需要说明的是,所述信息生成单元11可以根据多个邻近联系人数据查找到同一个所述待加入联系人数据,即所述待加入联系人数据与所述联系人集合中的多个邻近联系人数据均存在所述当前条件属性所指示的关联关系,因此所述信息生成单元11需要分别计算该多个邻近联系人数据与所述待加入联系人数据间的关联信息。

强度值计算单元12,用于采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

具体实现中,所述强度值计算单元12可以采用所述关联信息对所述待加入联系人数据与所述临近联系人数据间的关系强度值进行计算,可选的,所述强度值计算单元12可以采用预设强度公式并根据所述关联信息,获取所述待加入联系人数据与所述邻近联系人数据在预设时间段内的关系强度值,所述预设强度公式可以为以下公式1:

<mrow> <mi>&lambda;</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&mu;</mi> <mo>+</mo> <mi>&theta;</mi> <munder> <mi>&Sigma;</mi> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>&lt;</mo> <mi>t</mi> </mrow> </munder> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>

其中,λ(t)定义为强度函数,μ表示为泊松分布的参数,(t-ti)表示待加入联系人数据与邻近联系人数据间的关系强度值随时间的变化而变化,g(t-ti)表示为传播速率函数,θ表示为所述待加入联系人数据与邻近联系人数据间的关联信息(即影响力数值)。

所述强度值计算单元12会在预设时间段内多次获取所述待加入联系人数据与所述邻近联系人数据间的关联信息,并最终确定所述待加入联系人数据与所述邻近联系人数据间的关系强度值。

数据加入单元13,用于根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中;

具体实现中,所述数据加入单元13可以根据所述待加入联系人数据与邻近联系人数据间的关系强度值确定是否将所述待加入联系人数据加入至所述联系人集合中,优选的,当所述关系强度值满足预设强度阈值时,所述数据加入单元13可以将所述待加入联系人数据加入至所述联系人集合中。可以理解的是,所述预设强度阈值为用户定义的强度阈值,满足预设强度阈值的规则也可以由人为设定,例如:可以设定为当所述关系强度值大于所述预设强度阈值时,将所述待加入联系人数据加入至所述联系人集合中;或者也可以设定为当所述关系强度值小于所述预设强度阈值时,将所述待加入联系人数据加入至所述联系人集合中等。

在本发明实施例中,通过生成在当前条件属性的联系人集合中待加入联系人数据与集合中待加入联系人数据的邻近联系人数据间的关联信息,并采用关联信息计算两者间的关系强度值,最终依据关系强度值将待加入联系人数据加入至该联系人集合中,实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性。

请参见图4,为本发明实施例提供了另一种数据处理设备的结构示意图。如图4所示,本发明实施例的所述数据处理设备1可以包括:信息生成单元11、强度值计算单元12、数据加入单元13、数据获取单元14、属性获取单元15、属性确定单元16、数据发送单元17和通知单元18。

数据获取单元14,用于获取预先存储的基于所选择的应用主题下的至少一个联系人数据;

具体实现中,所述数据获取单元14可以获取预先存储的基于所选择的应用主题下的至少一个联系人数据,所述所选择的应用主题表示在多个社交应用中所选择的其中一个社交应用,可以由用户进行选择,也可以为所述数据处理设备1随机进行选择,针对所述所选择的应用主题下,在所述数据处理设备1中有预先存储的至少一个联系人数据,即针对该用户的用户标识在所述应用主题下预先同步存储的至少一个联系人数据。

属性获取单元15,用于采用粗糙集属性简约获取所述至少一个联系人数据中每个联系人数据的核心属性;

具体实现中,所述数据处理设备1可以在社交网络中获取所述至少一个联系人数据中每个联系人数据对应的属性,例如:针对X联系人数据,其对应的属性可以包括:A高中、B公司等,所述属性获取单元15可以采用粗糙集属性简约,并利用非对称关系获取所述每个联系人数据的核心属性,进一步的,所述属性获取单元15可以对每个联系人数据对应多个属性进行量化,并选取属性值最高的属性作为该联系人数据的核心属性。

属性确定单元16,用于将所述至少一个联系人数据中核心属性对应的属性值最高的联系人数据确定为中心联系人数据,并将所述中心联系人数据的核心属性确定为当前条件属性;

具体实现中,所述属性确定单元16可以将所述至少一个联系人数据中核心属性对应的属性值最高的联系人数据确定为中心联系人数据,并将所述中心联系人数据的核心属性确定为当前条件属性,而所述至少一个联系人数据中的其它联系人数据则依据所述当前条件属性进行分类并进行关联,得到基于当前条件属性下的联系人集合。例如:X联系人数据为中心联系人数据,并且其A高中为核心属性,则在至少一个联系人数据中筛选出A高中的Y联系人数据和Z联系人数据,则基于A高中的条件属性下的联系人集合包括X联系人数据、Y联系人数据和Z联系人数据。

信息生成单元11,用于生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息;

具体实现中,所述信息获取单元11可以生成在当前条件属性的联系人集合中的待加入联系人数据,所述当前条件属性为所述数据处理设备1根据在已知的联系人集合中所确定的核心属性,例如:A高中的属性、B公司的属性等等,所述联系人集合可以包含一个或多个当前存储于所述数据处理设备1中且未丢失的联系人数据,所述待加入联系人数据为所述信息生成单元11根据所述当前条件属性,并结合已知的所述联系人集合中的任意联系人数据(即邻近联系人数据)所查找到的联系人数据。

所述信息生成单元11在获取所述待加入联系人数据后,进一步生成在所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息,所述关联信息优选为所述待加入联系人数据和所述邻近联系人数据间的影响力数值, 需要说明的是,所述信息生成单元11可以根据多个邻近联系人数据查找到同一个所述待加入联系人数据,即所述待加入联系人数据与所述联系人集合中的多个邻近联系人数据均存在所述当前条件属性所指示的关联关系,因此所述信息生成单元11需要分别计算该多个邻近联系人数据与所述待加入联系人数据间的关联信息。

具体的,请一并参见图5,为本发明实施例提供了信息获取单元的结构示意图。如图5所示,所述信息生成单元11可以包括:

向量转换子单元111,用于当检测到在当前条件属性的联系人集合中存在待加入联系人数据时,将所述待加入联系人数据转换为第一节点向量,并将所述联系人集合中所述待加入联系人数据的邻近联系人数据转换为第二节点向量;

具体实现中,当检测到在当前条件属性的联系人集合中存在待加入联系人数据时,例如:针对A高中的条件属性下,通过Y联系人数据查找到一个待加入联系人数据为O联系人数据时。所述向量转换子单元111可以获取所述待加入联系人数据,优选的,所述向量转换子单元111通过TAP算法可以将所述联系人集合中的所有联系人数据以及所述待加入联系人数据均抽象为节点,并分别转化为节点向量,进一步的,所述向量转换子单元111将所述待加入联系人数据转换为第一节点向量,并将所述联系人集合中所述待加入联系人数据的邻近联系人数据转换为第二节点向量,依据上述举例,将O联系人数据转换为第一节点向量,而与其邻近的Y联系人数据则转换为第二节点向量。其中,TAP算法的传播是基于TFG的基础上进行改进,可以将节点转换为对应的节点向量。

可以理解的是,所述向量转换子单元111可以根据多个邻近联系人数据查找到同一个所述待加入联系人数据,即所述待加入联系人数据与所述联系人集合中的多个邻近联系人数据均存在所述当前条件属性所指示的关联关系,例如:针对A高中的条件属性下,通过Y联系人数据以及Z联系人数据可以查找到一个待加入联系人数据为P联系人数据,则将P联系人数据转换为第一节点向量,将Y联系人数据以及Z联系人数据分别转换为第二节点向量,需要说明的是,Y联系人数据的第二节点向量与Z联系人数据的第二节点向量不相同,此处采用第一节点向量以及第二节点向量仅为了区分待加入联系人数据和邻近联系人数据。

信息确定子单元112,用于计算所述第一节点向量与所述第二节点向量间的 影响力数值,并将所述影响力数值确定为所述待加入联系人数据与所述邻近联系人数据间的关联信息;

具体实现中,所述信息确定子单元112进一步可以采用TAP Learning计算所述第一节点向量与所述第二节点向量间的影响力数值,并将所述影响力数值确定为所述待加入联系人数据与所述邻近联系人数据间的关联信息,针对多个临近联系人数据的情况,所述信息确定子单元112需要分别计算该多个邻近联系人数据与所述待加入联系人数据间的影响力数值。

强度值计算单元12,用于采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

具体实现中,所述强度值计算单元12可以采用所述关联信息对所述待加入联系人数据与所述临近联系人数据间的关系强度值进行计算,可选的,所述强度值计算单元12可以采用预设强度公式并根据所述关联信息,获取所述待加入联系人数据与所述邻近联系人数据在预设时间段内的关系强度值,所述预设强度公式可以为以下公式1:

<mrow> <mi>&lambda;</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&mu;</mi> <mo>+</mo> <mi>&theta;</mi> <munder> <mi>&Sigma;</mi> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>&lt;</mo> <mi>t</mi> </mrow> </munder> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>

其中,λ(t)定义为强度函数,μ表示为泊松分布的参数,(t-ti)表示待加入联系人数据与邻近联系人数据间的关系强度值随时间的变化而变化,g(t-ti)表示为传播速率函数,θ表示为所述待加入联系人数据与邻近联系人数据间的关联信息(即影响力数值)。

所述强度值计算单元12会在预设时间段内多次获取所述待加入联系人数据与所述邻近联系人数据间的关联信息,并最终确定所述待加入联系人数据与所述邻近联系人数据间的关系强度值。

数据发送单元17,用于当所述关系强度值满足预设强度阈值时,将所述待加入联系人数据发送至用户终端,以使所述用户终端输出对所述待加入联系人数据的提示信息;

具体实现中,当所述关系强度值满足预设强度阈值时,所述数据发送单元17可以将将所述待加入联系人数据发送至用户终端,所述用户终端可输入对所述待加入联系人数据的提示信息,例如:直接显示该待加入联系人数据及属性、邻近联系人数据等关联数据等。

可以理解的是,所述预设强度阈值为用户定义的强度阈值,满足预设强度阈值的规则也可以由人为设定,例如:可以设定为当所述关系强度值大于所述预设强度阈值时,执行将所述待加入联系人数据发送至用户终端的步骤;或者也可以设定为当所述关系强度值小于所述预设强度阈值时,执行将所述待加入联系人数据发送至用户终端的步骤等。

通知单元18,用于当接收到所述用户终端发送的对所述待加入联系人数据的确认加入指令时,通知所述数据加入单元13执行将所述待加入联系人数据加入至所述联系人集合中。

具体实现中,用户可以通过所述用户终端对所显示的待加入联系人数据进行确认,所述用户终端可以向所述数据处理设备1发送对所述待加入联系人数据的确认加入指令,即确定所述待加入联系人数据为用户所认识或者准许添加至联系人集合中的联系人数据。当所述数据处理设备1接收到所述用户终端发送的对所述待加入联系人数据的确认加入指令时,所述通知单元18可以通知所述数据加入单元13执行将所述待加入联系人数据加入至所述联系人集合中。

数据加入单元13,用于将所述待加入联系人数据加入至所述联系人集合中;

具体实现中,所述数据加入单元13可以根据所述通知单元18的指示将所述待加入联系人数据加入至所述联系人集合中。

在本发明实施例中,通过生成在当前条件属性的联系人集合中待加入联系人数据与集合中待加入联系人数据的邻近联系人数据间的关联信息,并采用关联信息计算两者间的关系强度值,最终依据关系强度值将待加入联系人数据加入至该联系人集合中,实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性;通过采用粗糙集属性简约的方式确定核心属性,实现了基于核心属性的联系人数据重建方式;通过加入时间参数对节点间的关系强度值进行计算,考虑到了时间对节点间的关系强度值的影响,提升了关系强度值计算的准确性,进一步的提升了对联系人数据同步的准确性。

请参见图6,为本发明实施例提供了又一种数据处理设备的结构示意图。如图6所示,所述数据处理设备1000可以包括:至少一个处理器1001,例如CPU,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。 其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard)、手写板、录音器,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据处理应用程序。

在图6所示的数据处理设备1000中,网络接口1004主要用于连接用户终端,与所述用户终端进行数据通信;而用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的数据处理应用程序,并具体执行以下步骤:

生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息;

采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值;

根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中。

在一个实施例中,所述处理器1001在执行生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息之前,还执行以下步骤:

获取预先存储的基于所选择的应用主题下的至少一个联系人数据;

采用粗糙集属性简约获取所述至少一个联系人数据中每个联系人数据的核心属性;

将所述至少一个联系人数据中核心属性对应的属性值最高的联系人数据确定为中心联系人数据,并将所述中心联系人数据的核心属性确定为当前条件属性。

在一个实施例中,所述处理器1001在执行生成在当前条件属性的联系人集合中待加入联系人数据与所述联系人集合中所述待加入联系人数据的邻近联系人数据间的关联信息时,具体执行以下步骤:

当检测到在当前条件属性的联系人集合中存在待加入联系人数据时,将所 述待加入联系人数据转换为第一节点向量,并将所述联系人集合中所述待加入联系人数据的邻近联系人数据转换为第二节点向量;

计算所述第一节点向量与所述第二节点向量间的影响力数值,并将所述影响力数值确定为所述待加入联系人数据与所述邻近联系人数据间的关联信息。

在一个实施例中,所述处理器1001在执行采用所述关联信息计算所述待加入联系人数据与所述邻近联系人数据间的关系强度值时,具体执行以下步骤:

采用预设强度公式并根据所述关联信息,获取所述待加入联系人数据与所述邻近联系人数据在预设时间段内的关系强度值。

在一个实施例中,所述处理器1001在执行根据所述关系强度值将所述待加入联系人数据加入至所述联系人集合中时,具体执行以下步骤:

当所述关系强度值满足预设强度阈值时,将所述待加入联系人数据加入至所述联系人集合中。

在一个实施例中,所述处理器1001在执行将所述待加入联系人数据加入至所述联系人集合中之前,还执行以下步骤:

将所述待加入联系人数据发送至用户终端,以使所述用户终端输出对所述待加入联系人数据的提示信息;

当接收到所述用户终端发送的对所述待加入联系人数据的确认加入指令时,执行将所述待加入联系人数据加入至所述联系人集合中的步骤。

在本发明实施例中,通过生成在当前条件属性的联系人集合中待加入联系人数据与集合中待加入联系人数据的邻近联系人数据间的关联信息,并采用关联信息计算两者间的关系强度值,最终依据关系强度值将待加入联系人数据加入至该联系人集合中,实现了联系人数据的自动重建,同时通过关系强度值将丢失的联系人数据重新加入至联系人集合中,保证了联系人数据的完整性,进而提升了对联系人数据同步的准确性;通过采用粗糙集属性简约的方式确定核心属性,实现了基于核心属性的联系人数据重建方式;通过加入时间参数对节点间的关系强度值进行计算,考虑到了时间对节点间的关系强度值的影响,提升了关系强度值计算的准确性,进一步的提升了对联系人数据同步的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。 其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1