一种图数据处理方法及系统与流程

文档序号:21725306发布日期:2020-08-05 01:16阅读:197来源:国知局
一种图数据处理方法及系统与流程

本发明涉及大数据的技术领域,特别涉及一种图数据处理方法及系统。



背景技术:

随着信息技术的不断进步,尤其是互联网技术的发展,人们每天都将面对着不断更新的海量数据。然而在现有技术中,绝大多数的数据库系统只是对关系型的数据提出了存储策略和查询优化策略。目前一些图数据的原型系统相继被开发出来,例如华盛顿州立大学开发的系统,卢布尔雅那大学的系统以及意大利卡塔尼亚大学和纽约大学联合开发的系统等。前两者主要集中在图数据的可视化系统是一种能够提供子图搜索的图数据库系统。但目前的图数据库的研究是尚处在起步阶段,且当前的图数据库技术只是将一些关系图转化为普通数据库的关系与节点,没有保存图片数据并利用图片数据辅助检索。



技术实现要素:

基于上述问题,本发明提供了一种图数据处理方法及系统,通过引入图片,除了保存关系和节点,还保存关系引申的图片,采取图片检索辅助查找,提高了数据处理的速率和系统运算速度,同时通过图的匹配查找提高了匹配精度,本发明能够应用于人力资源领域职业履历画像,提高匹配效率。

为实现上述目的,本发明提供了一种图数据处理方法:

所述方法包括:

步骤101,发送推荐目标人员信息请求至所述图智能推荐模;

步骤102,所述图智能推荐模块接收推荐目标人员信息请求,建立目标岗位树模型,并根据所述目标岗位树模型生成标准目标岗位树图模型;

步骤103,将图数据库的岗位树图片信息与所述标准目标岗位树图比对,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标;

步骤104,将推荐目标结果返回至推荐人员模块;

进一步地,步骤103,将图数据库的岗位树图片信息与所述标准目标岗位树图比对,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标具体为:将目标岗位树图分割获得子图,根据余弦算法获得累加的余弦相似度总和,根据斐波那契函数判断子图的前两个序列像素点之和是否约等于该子图像素数,符合返回1,不符合返回0,根据返回值组成斐波那契数哈希特征向量,比较目标岗位树图与本次检索岗位树图的斐波那契数哈希特征向量的相似度并保存为相似斐波那契数哈希,然后根据相似斐波那契数哈希与余弦相似度总和取平均值,选择平均值最大前n个,作为推荐目标。

进一步地,所述图数据处理方法还包括:定期遍历大数据库,识别大数据库中待推荐目标的第一信息获得第一信息的属性信息,根据所述属性信息获得关系信息,将所述关系信息以及第一信息以树图格式保存至图数据库。

进一步地,所述第一信息为员工单位信息,所述第一信息的属性信息为员工同事关系信息,所述关系信息为通过所述属性信息关联获得的同事关系信息。

进一步地,在所述步骤103之前还包括图数据库存储关系信息、第一数据以及岗位树图图片信息。

另外,本发明还提供了一种图数据处理系统:

所述系统包括:客户端以及大数据图数据服务平台;所述客户端包括查询模块以及推荐人员模块;所述大数据图数据服务平台包括通信代理模块、大数据库、图数据库、大数据图智能训练模块、关系图查询模块以及图智能推荐模块;

所述查询模块用于查询图数据库、大数据库,查询请求通过通信代理模块访问图数据库和大数据库,查询结果通过通信代理模块返回客户端查询模块;

所述推荐人员模块用于发送推荐目标人员信息请求至所述图智能推荐模,所述图智能推荐模块经过计算获得与岗位最相近节点,并将结果返回至推荐人员模块;

所述关系图查询模块用于访问数据库,根据通信代理模块请求,根据图查询请求访问图数据库,对列表查询请求访问大数据库;

所述图智能推荐模块接收推荐目标人员信息请求,建立目标岗位树模型,并根据所述目标岗位树模型生成标准目标岗位树图模型,将图数据库的岗位树图片信息与所述标准目标岗位树图比对,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标;

所述大数据图智能训练模块用于定期遍历大数据库,识别大数据库中待推荐目标的第一信息获得第一信息的属性信息,根据所述属性信息获得关系信息,将所述关系信息以及第一信息以树图格式保存至图数据库;

所述图数据库存储关系信息、第一数据以及岗位树图图片信息。

进一步地,所述学习训练获得与目标岗位树图最相近的岗位图片信息节点具体为:将目标岗位树图分割获得子图,根据余弦算法获得累加的余弦相似度总和,根据斐波那契函数判断子图的前两个序列像素点之和是否约等于该子图像素数,符合返回1,不符合返回0,根据返回值组成斐波那契数哈希特征向量,比较目标岗位树图与本次检索岗位树图的斐波那契数哈希特征向量的相似度并保存为相似斐波那契数哈希,最后根据相似斐波那契数哈希与余弦相似度总和取平均值,选择平均值最大前n个,作为推荐目标。

另外,本发明还提供了一种计算机可读存储介质:

所述计算机可读存储介质用于存储图数据处理程序,执行所述图数据处理程序实现图数据处理步骤。

本发明提供了一种图数据处理方法及系统,接收推荐目标人员信息请求建立目标岗位树模型,根据目标岗位树模型生成标准目标岗位树图模型,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标;通过在数据处理中引入图片,保存关系和节点以及关系引申的图片,采取图片检索辅助查找,利用余弦算法和斐波那契算法拟合运算获得目标数据,提高了数据处理的速率和系统运算速度,同时通过图的匹配查找提高了匹配精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的图数据处理系统的结构框图;

图2为本发明的岗位树示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了提高数据处理的速率和系统运算速度,提高匹配精度本发明提供了,本发明提出了一种图数据处理方法:

所述方法包括:

步骤101,发送推荐目标人员信息请求至所述图智能推荐模;

图智能推荐模块接收通信代理模块发送的评价目标人信息,查询图数据库中评价目标人相关同事、前同事关系,并返回同事、前同事关系列表集,列表集合为三维数据集合array(a1(x1,x2,x3),a2(x4,x5,x6)......),集合中每个元素包含姓名,身份证号码,关系种类三维信息。

步骤102,所述图智能推荐模块接收推荐目标人员信息请求,建立目标岗位树模型,并根据所述目标岗位树模型生成标准目标岗位树图模型;

图智能推荐模块接收通信代理模块推荐人员信息请求,建立目标岗位树模型,并根据目标岗位树模型绘制标准目标岗位树图模型。

步骤103,将图数据库的岗位树图片信息与所述标准目标岗位树图比对,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标;

通过比较目标岗位树图与图数据中岗位树图片信息,通过学习训练找到与目标岗位数图最相近的岗位图片信息。

将图数据库的岗位树图片信息与所述标准目标岗位树图比对,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标,具体算法为:

假设图数据库中存有n组岗位树图img1到imgn,目标岗位树图为imgt,将该目标岗位树图分割为r*t组图片,imgt(y,u)为其中一个子图,imge为其中任一个岗位树图,将该图片分割为r*t组图片,imge(y,u)为其中一个子图,gra(x)为灰度处理函数,stand(x)为图像格式化函数,sqrt(x)为平方根计算函数,cosine(x)为余弦计算公式,comparison(a,b)为余弦相似比较函数,∑sim(e)为第e张图片的累加余弦相似值,getpixnum(x)函数获取子图像素点个数,并赋值给num2,将num2赋值给矩阵特征iffibonacci(x,y,z)函数判断子图的前两个序列是否符合斐波那契数列数列规律,即前两个子图像素点之和是否约等于该子图像素数,如何符合返回1,如果不符合返回0,根据返回值组成斐波那契数哈希特征向量tfibonaccihash,comparisonhash(a,b)函数比较目标岗位树图与本次检索岗位树图的斐波那契数哈希特征向量hash的相似度并保存为simfibonaccihash,最后根据simfibonaccihash与余弦相似度总和取平均值,选择平均值最大的10个,作为推荐目标,通过图片名称对应的hash地址找到对应的人员作为拟推荐人员,具体算法如下:

步骤104,将推荐目标结果返回至推荐人员模块。

推荐人员模块发送推荐目标人员信息请求至所述图智能推荐模,所述图智能推荐模块经过计算获得与岗位最相近节点,并将结果返回至推荐人员模块。

大数据图智能训练模块,通过定期遍历大数据库,识别大数据库中人员现工作单位、曾经工作单位信息,按照工作单位识别将大数据库中人员现同事关系与前同事关系,将关系和人员保存到图数据库中。通过定期遍历大数据库,识别大数据库中员工岗位历史信息,分析曾工作岗位信息,对每个岗位信息建立岗位树,岗位跟节点hash地址保存人员hash地址,对抓取岗位树图,以图片信息保存到图数据中,图片名称为人员hash地址+岗位编码id。

大数据库采用hadoop大数据库,存储工作者工作历史信息、岗位信息、人员信息等人力资源相关大数据。其中,图数据库存储人员关系图的关系与人员节点数据,并存储岗位树图图片数据。

另外,本发明还提供了一种图数据处理系统:

所述系统包括:客户端以及大数据图数据服务平台;所述客户端包括查询模块以及推荐人员模块;所述大数据图数据服务平台包括通信代理模块、大数据库、图数据库、大数据图智能训练模块、关系图查询模块以及图智能推荐模块;

其中,查询模块负责查询图数据库、与大数据库,查询请求通过大数据图数据服务平台的通信代理模块访问图数据库与大数据库,查询结果通过通信代理模块返回客户端查询模块。

其中,推荐人员模块通过建立岗位模型,并将模型通过通信代理模块发送到图智能推荐模块,图智能推荐模块经过推荐计算找到与岗位最相近人员,并将结果通过通信代理模块返回到推荐人员模块。

其中,通信代理模块接收查询图数据库、大数据库请求,并查询相关结果返回客户端中,通信代理模块接收岗位模型推荐数据,经过图智能推荐模块推荐计算后返回到客户端中

其中,图智能推荐模块接收通信代理模块发送的评价目标人信息,查询图数据库中评价目标人相关同事、前同事关系,并返回同事、前同事关系列表集,列表集合为三维数据集合array(a1(x1,x2,x3),a2(x4,x5,x6)......),集合中每个元素包含姓名,身份证号码,关系种类三维信息。

图智能推荐模块接收通信代理模块推荐人员信息请求,建立目标岗位树模型,并根据目标岗位树模型生成标准目标岗位树图模型,通过比较目标岗位树图与图数据中岗位树图片信息,通过学习训练找到与目标岗位数图最相近的岗位图片信息节点。相近拟合具体算法如下:

假设图数据库中存有n组岗位树图img1到imgn,目标岗位树图为imgt,将该目标岗位树图分割为r*t组图片,imgt(y,u)为其中一个子图片,imge为其中任一个岗位树图,将该图片分割为r*t组图片,imge(y,u)为其中一个子图片,gra(x)为灰度处理函数,stand(x)为图像格式化函数,sqrt(x)为平方根计算函数,cosine(x)为余弦计算公式,comparison(a,b)为余弦相似比较函数,∑sim(e)为第e张图片的累加余弦相似值,根据公式simmax(∑sim(x))选取累加余弦相似值最大的岗位树图为与目标岗位最相似岗位,通过图片名称对应的hash地址找到对应的人员作为拟推荐人员,具体算法如下:

其中,大数据图智能训练模块,通过定期遍历大数据库,识别大数据库中人员现工作单位、曾经工作单位信息,按照工作单位识别将大数据库中人员现同事关系与前同事关系,将关系和人员保存到图数据库中。通过定期遍历大数据库,识别大数据库中员工岗位历史信息,分析曾工作岗位信息,对每个岗位信息建立岗位树,岗位跟节点hash地址保存人员hash地址,对抓取岗位树图,以图片信息保存到图数据中,图片名称为人员hash地址+岗位编码id。

其中,大数据库采用hadoop大数据库,存储工作者工作历史信息、岗位信息、人员信息等人力资源相关大数据。图数据库存储人员关系图的关系与人员节点数据,并存储岗位树图图片数据。

此外,本发明还提供了一种计算机可读存储介质:

所述计算机可读存储介质用于存储图数据处理程序,执行所述图数据处理程序实现图数据处理步骤。

本发明提供了一种图数据处理方法及系统,接收推荐目标人员信息请求建立目标岗位树模型,根据目标岗位树模型生成标准目标岗位树图模型,学习训练获得与目标岗位树图最相近的岗位图片信息节点,作为推荐目标;通过在数据处理中引入图片,保存关系和节点以及关系引申的图片,采取图片检索辅助查找,利用余弦算法和斐波那契算法拟合运算获得目标数据,提高了数据处理的速率和系统运算速度,同时通过图的匹配查找提高了匹配精度,本发明能够应用于人力资源领域职业履历画像,提高匹配效率。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1