一种人际路径快速定位系统、方法及介质与流程

文档序号:17331133发布日期:2019-04-05 22:05阅读:215来源:国知局
本发明涉及一种人际路径快速定位系统、方法及介质,属于计算机
技术领域
:。
背景技术
::人际网络是为达到特定目的,人与人之间进行信息交流的关系网。目前,无论是企业和个人,都对人际网络的应用有迫切需求。对于企业而言,专家是宝贵的隐性知识资源,但面向针对性需求的专家的查找与定位却并不容易,很多员工在工作中遇到问题,却不知向谁请教,或者即便知道向谁请教,却不知如何利用自己的人际关系拉近与专家的距离,这些问题极大限制了专家知识的挖掘、流通与共享;对于个人而言,社交已成为人们生活的重要需求,每个人都希望利用自己人际关系获取更多的人脉资源,实现人际关系的拓宽和延伸。过去,受限于技术难度,人际关系网络的构建和应用相对保守,近年来,随着大数据时代的来临,人们的人际关系数据更容易被捕捉和获取,人际关系网将比以往将更加全面和完善,然而,对人际关系网络的利用仍存在巨大的潜力,有广阔的研究空间。基于上述需求,不少学者开始研究人际关系网的构建及应用方法。有学者提出了一些构建人际关系网络的方法,但在人际关系权重设置方面,采用预设好的关系强度,未实现关系权重的动态调整,而且用户需要知道目标用户的姓名或手机号,输入这些条件进行搜索,不支持用户在不了解目标人员明确属性的条件下的模糊匹配查找;有学者提出了基于人际网络的竞争情报获取,但其重点利用用户认识的人员获取情报,而不是对人际网络中用户有需求但尚不熟悉的人员进行查找和定位。技术实现要素:本发明要解决的技术问题是:克服现有技术的不足,提供了一种人际路径快速定位系统、方法及介质。本发明面向用户特定需求,在形成个人肖像信息时,引入聚类分析的方法捕捉用户的兴趣爱好属性;充分利用个人的工作关系、家庭关系、社会关系等人际联络数据,对于人际关系权重的设置引入动态调整机制;支持用户在不知道目标人员姓名、手机号等明确信息的情况下,系统根据用户的模糊需求匹配查找筛选目标人员,实现目标人员的快速定位,并完成最优联系路径的规划和推荐。本发明目的通过以下技术方案予以实现:一种人际路径快速定位系统,包括个人肖像生成模块、个人肖像完善模块、个人关系图谱生成模块、人际关系距离动态配置模块、人际关系互联网络构建模块、目标人员定位模块和人际关系路径规划模块;所述个人肖像生成模块基于用户交际数据源利用数据捕捉方法和聚类方法生成所有个人肖像;所述个人肖像完善模块根据用户反馈对所述所有个人肖像进行完善;所述个人关系图谱生成模块利用完善后的所有个人肖像建立用户的个人关系图谱;所述人际关系距离动态配置模块用于按照预先设定的周期计算用户和所有个人肖像的关系距离;所述人际关系互联网络构建模块根据所述用户的个人关系图谱和所述关系距离建立人际关系网络;所述目标人员定位模块用于目标人员的定位;所述人际关系路径规划模块根据所述人际关系网络和所述目标人员的定位计算用户与目标人员之间的最优人际关系路径。上述人际路径快速定位系统,所述用户交际数据源包括个人社交平台数据和个人工作业务平台数据。上述人际路径快速定位系统,所述个人肖像生成模块基于用户交际数据源利用数据捕捉方法和聚类方法生成所有个人肖像的方法为:基于用户交际数据源的获得初步的个人肖像信息,然后对个人社交平台数据和个人工作业务平台数据进行分析,预测个人的兴趣点然后获得用户的兴趣点集合,所述兴趣点集合和初步的个人肖像信息组成个人肖像。上述人际路径快速定位系统,利用所述个人肖像完善模块完善后的所有个人肖像包括个人基本情况数据、工作信息数据、兴趣爱好信息数据。上述人际路径快速定位系统,所述个人关系图谱中任意两个个人肖像之间的关系为家庭关系、工作关系、社交关系、同学关系中的一种;所述联系人的关系距离drela的计算方法为:步骤(5a)、根据任意两个个人肖像之间的联系频次和每次联系时间,计算任意两个个人肖像之间的联系总时长t_f;根据任意两个个人肖像之间的联系总时长t_f,获取任意两个个人肖像之间的关系距离值d_inasp;步骤(5b)、根据任意两个个人肖像之间的关系,预设家庭关系的权重为d_aspfami、工作关系的权重为d_aspwork、社交关系的权重为d_aspsocial、同学关系的权重为d_aspclass;步骤(5c)、计算任意两个个人肖像之间的关系距离drela,drela=d_asp*d_inasp;其中权重值d_asp根据两个个人肖像之间的关系类型确定。上述人际路径快速定位系统,步骤(4a)中所述任意两个个人肖像之间的联系总时长t_f越大,该两个个人肖像之间的关系距离值d_inasp越小。上述人际路径快速定位系统,步骤(4a)所述根据任意两个个人肖像之间的联系频次和每次联系时间,预设联系方式的权重,计算任意两个个人肖像之间的联系总时长t_f;其中联系方式包括语音即时通信方式、文字即时通信方式、语音非即时通信方式和文字非即时通信方式;所述联系方式的权重从大到小依次为语音即时通信方式的权重、文字即时通信方式的权重、语音非即时通信方式的权重和文字非即时通信方式的权重。上述人际路径快速定位系统,所述建立人际关系网络的方法为:(8a)随机选取人员pi作为网络起始节点,以pi为中心,构建以pi为中心的一级人际网络图netpi_l_1;(8b)遍历一级人际网络图netpi_l_1中的人员,对于一级人际网络图netpi_l_1中的任一人员pj,计算pj与pi之间的距离drela(i,j);(8c)以pj为中心,重复(8a)~(8b),构建以pj为中心的人际网络图,将其作为以pi为中心的二级人际网络图netpi_l_2,计算以pj为中心的人际网络图中任一人员pk与pj之间的距离;(8d)以为pk中心,重复(8a)~(8b),构建以pk为中心的人际网络图,将其作为以pi为中心的三级人际网络图netpi_l_4,计算以pk为中心的人际网络图中任一人员与pk之间的距离。一种人际路径快速定位方法,采用上述人际路径快速定位系统,该系统进行人际路径快速定位的方法包括如下步骤:步骤(9a)、确定提出需求的用户porigin和目标人员pobj,以pobj的id在人际路径快速定位系统中搜索,当获取一条记录数时,选取该条记录转入步骤(9b);否则在多条记录中选取“与中心节点距离”值最小的记录,如果仅有一条记录数时,选取该条记录转入步骤(9b),否则在多条记录的“与中心节点距离”值相等时,选取“与中心节点建立关联时间”值最早的记录转入步骤(9b);步骤(9b)、根据步骤(9a)选取的记录,获得目标人员pobj和与其对应的中心人员pobj_c_1的距离值;步骤(9c)、重复以上方法,直到步骤(9b)与其对应的中心人员为porigin;即获得提出需求的用户porigin和目标人员pobj之间的途径和距离值。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述人际路径快速定位方法的步骤。本发明相比于现有技术具有如下有益效果:(1)本发明在形成个人肖像信息时,引入聚类分析的方法捕捉用户的兴趣爱好属性,不仅减轻了用户自定义兴趣爱好带来的额外工作量,同时也避免了依靠用户自己描述可能造成信息描述不一致、不准确、不知如何定义等问题;(2)本发明对于人际关系权重的设置引入动态调整机制,根据预设的周期,分析周期内用户与各位联系人的联系频次、时间等,计算并分析关系紧密程度,设置距离值,并定期更新,从而保证人际关系距离能保持准确、客观;(3)本发明同时支持对用户明确需求的接收和对用户模糊需求的分析,实现对目标人员的匹配筛选和过滤,解决了用户知道想找什么样的人,却不知这个人是谁的难题;(4)本发明根据用户的需求,在用户人际关系网中定位目标人员,利用层层延伸的人际关系网络,规划中用户与目标人员之间的联接路径,解决用户想找某个目标人员,却不知道利用自己的人际关系如何找到该人员的问题;(5)本发明提出的方法,除了规划人际关系路径外,还可向用户推荐与其从事领域相似,或人际关系有重复的人员,从而拓展其社交圈。附图说明图1为本发明方法的流程图;图2为本发明基于数据捕捉和聚类的个人肖像生成流程图;图3为本发明个人关系图谱构建流程;图4为本发明人际关系距离动态配置流程;图5为本发明人际关系互联网络构建流程;图6为本发明针对用户明确需求的目标人员定位流程;图7为本发明针对用户模糊需求的目标人员定位流程;图8为本发明人际关系路径规划流程。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步详细描述。一种人际路径快速定位系统,其特征在于:包括个人肖像生成模块、个人肖像完善模块、个人关系图谱生成模块、人际关系距离动态配置模块、人际关系互联网络构建模块、目标人员定位模块和人际关系路径规划模块;所述个人肖像生成模块基于用户交际数据源利用数据捕捉方法和聚类方法生成所有个人肖像,所述用户交际数据源包括个人社交平台数据和个人工作业务平台数据;所述个人肖像完善模块根据用户反馈对所述所有个人肖像进行完善;所述个人关系图谱生成模块利用完善后的所有个人肖像建立用户的个人关系图谱;所述人际关系距离动态配置模块用于按照预先设定的周期计算用户和所有个人肖像的关系距离;所述人际关系互联网络构建模块根据所述用户的个人关系图谱和所述关系距离建立人际关系网络;所述目标人员定位模块用于目标人员的定位;所述人际关系路径规划模块根据所述人际关系网络和所述目标人员的定位计算用户与目标人员之间的最优人际关系路径。所述个人肖像生成模块基于用户交际数据源利用数据捕捉方法和聚类方法生成所有个人肖像的方法为:基于用户交际数据源的获得初步的个人肖像信息,然后对个人社交平台数据和个人工作业务平台数据进行分析,预测个人的兴趣点然后获得用户的兴趣点集合,所述兴趣点集合和初步的个人肖像信息组成个人肖像。利用所述个人肖像完善模块完善后的所有个人肖像包括个人基本情况数据、工作信息数据、兴趣爱好信息数据。所述个人关系图谱中任意两个个人肖像之间的关系为家庭关系、工作关系、社交关系、同学关系中的一种;所述联系人的关系距离drela的计算方法为:步骤(5a)、根据任意两个个人肖像之间的联系频次和每次联系时间,预设联系方式的权重,计算任意两个个人肖像之间的联系总时长t_f;根据任意两个个人肖像之间的联系总时长t_f,获取任意两个个人肖像之间的关系距离值d_inasp;所述任意两个个人肖像之间的联系总时长t_f越大,该两个个人肖像之间的关系距离值d_inasp越小;其中联系方式包括语音即时通信方式、文字即时通信方式、语音非即时通信方式和文字非即时通信方式;所述联系方式的权重从大到小依次为语音即时通信方式的权重、文字即时通信方式的权重、语音非即时通信方式的权重和文字非即时通信方式的权重。步骤(5b)、根据任意两个个人肖像之间的关系,预设家庭关系的权重为d_aspfami、工作关系的权重为d_aspwork、社交关系的权重为d_aspsocial、同学关系的权重为d_aspclass;步骤(5c)、计算任意两个个人肖像之间的关系距离drela,drela=d_asp*d_inasp;其中权重值d_asp根据两个个人肖像之间的关系类型确定。所述建立人际关系网络的方法为:(8a)随机选取人员pi作为网络起始节点,以pi为中心,构建以pi为中心的一级人际网络图netpi_l_1;(8b)遍历一级人际网络图netpi_l_1中的人员,对于一级人际网络图netpi_l_1中的任一人员pj,计算pj与pi之间的距离drela(i,j);(8c)以pj为中心,重复(8a)~(8b),构建以pj为中心的人际网络图,将其作为以pi为中心的二级人际网络图netpi_l_2,计算以pj为中心的人际网络图中任一人员pk与pj之间的距离;(8d)以为pk中心,重复(8a)~(8b),构建以pk为中心的人际网络图,将其作为以pi为中心的三级人际网络图netpi_l_4,计算以pk为中心的人际网络图中任一人员与pk之间的距离。一种人际路径快速定位方法,采用所述人际路径快速定位系统,包括如下步骤:步骤(9a)、确定提出需求的用户porigin和目标人员pobj,以pobj的id在人际路径快速定位系统中搜索,当获取一条记录数时,选取该条记录转入步骤(9b);否则在多条记录中选取“与中心节点距离”值最小的记录,如果仅有一条记录数时,选取该条记录转入步骤(9b),否则在多条记录的“与中心节点距离”值相等时,选取“与中心节点建立关联时间”值最早的记录转入步骤(9b);步骤(9b)、根据步骤(9a)选取的记录,获得目标人员pobj和与其对应的中心人员pobj_c_1的距离值;步骤(9c)、重复以上方法,直到步骤(9b)与其对应的中心人员为porigin;即获得提出需求的用户porigin和目标人员pobj之间的途径和距离值。一种计算机可读存储介质,其上存储有计算程序,该程序被处理器执行时实现上述人际路径快速定位方法的步骤。实施例:一种基于人员关系网络的人际路径快速定位方法,如图1所示,包括以下步骤:步骤(1)基于数据源捕捉和聚类形成初步个人肖像信息,如图2所示,具体处理过程如下:(1a)以个人的社交平台数据及业务工作平台数据为数据源,识别个人年龄、性别、工作单位、领域、具体岗位、职务、职称等属性项,提取个属性项对应的属性值,形成个人基本信息;(1b)以个人业务工作平台及社交平台为数据源,进行数据分析,预测个人的兴趣点,抓取个人在业务工作平台中的浏览、评论、转发、下载的知识,日常处理的文件,抓取个人在微信、微博、论坛等社交平台中关注、评论、转发、发布的文章等,进行分词、特征词提取等操作,提取出各篇文章的典型文本特征;(1c)以所述的各篇文章的典型文本特征为数据源,应用聚类算法,计算形成兴趣类别簇,提出中各类别簇中心向量对应的特征词,作为该兴趣类别簇的标签,形成用户的兴趣点集合,兴趣点集合与步骤(1a)中的个人信息共同形成基于系统捕捉的个人肖像;步骤(2)用户确认并完善个人肖像信息,具体处理过程为:用户基于步骤(1)形成的个人肖像,进行补充或调整,形成完善的个人肖像信息,所述的完善的个人肖像信息包含个人基本情况、工作信息、兴趣爱好信息三大类,所述的个人基本情况包括个人姓名、性别、年龄等,所述的工作信息包括个人专业、岗位、职务、职称等,同时,提供深入了解相关成果的入口,用户可通过触发该入口,了解个人公开发表的论文、专利、参与项目等信息,所述的兴趣爱好信息包括个人兴趣集和特长集等,同时,提供深入了解相关成果的入口,用户可通过触发该入口,了解个人在兴趣特长方面关注的信息源、公开发表的信息、获得的荣誉等;步骤(3)构建用户的个人关系图谱,如图3所示,具体处理过程如下:(3a)系统以个人人力资源档案信息、工作流程处理信息、邮件往来信息、社交平台联系人信息、通讯录联系人信息等作为数据源,提取个人的日常联系人,形成用户的日常联系人集合,记作c_person,提取用户为各位联系人所标注的分类、标签、备注等数据,以及通常联系时间、联系流程、联系场景等信息,判别人员类别、角色,形成初步的人员关系图谱mappre,所述的mappre应涵盖关系维度类别,以及各维度下所包括的人员,为避免人员关系图谱过于庞大,系统根据联系频次,由高到低选取各维度的人员,人员数量均不超过预设阈值n_limit。(3b)个人基于mappre进行信息完善,根据个人实际情况新增或移除关系网的人员列表、调整人员类别、补充人员信息详情,如果信息完善者在某一维度下设置的人员数量超过预设阈值n_limit,系统将进行提醒并请信息完善者重新设置,基于个人完善的结果,系统形成完善的人员关系图谱mapmat,所述的mapmat至少包含工作关系、家庭关系、社交关系、同学关系四大维度,所述的工作关系维度aspwork包括业务往来关系及同事关系,所述的业务往来关系指工作时间通过邮件或对公电话往来的联系人,所述的同事关系细分为领导、平级、下属,所述的家庭关系维度aspfami包括直系亲属关系及旁系亲属关系,所述的直系亲属关系细分为父母、配偶、子女、兄弟姐妹,所述的旁系亲属关系细分为姑(叔)表亲、姨(舅)表亲,所述的社交关系维度aspsocial包括社交平台好友、论坛共同爱好者、培训课共同参与者,所述的同学关系aspclass指个人求学经历中的同学,包括小学同学、初中同学、高中同学、大学同学、研究生同学等,各维度下的人员数量均低于预设阈值n_limit。步骤(4)动态计算个人关系图谱中用户与各位联系人之间的关系距离,如图4所示,该关系距离记为drela,关系距离越短,表示关系亲密度越近。drela的计算过程如下:(4a)根据预设的更新周期,遍历该周期内用户的c_person中的各位联系人,计算用户与各位联系人的联系频次和每次联系时间,对于联系方式为语音交互的,联系时间为实际花费的时间,对于联系方式为文字交互的,由于涉及到非即时通信,交互效率不可控,可为每次的信息发送行为预设一个固定的交互时长,将该交互时长作为每次联系时间,将该周期内用户与各位联系人的联系频次与每次联系时间相乘,乘积记作联系总时长t_f,用户与第i位联系人的联系总时长即为t_f;(4b)统计各位联系人中,分别有多少人属于家庭关系、工作关系、社交关系、同学关系,综合考虑各关系维度包含的实际人数多少及各联系人对应的t_f值,分配四类关系的权重,所述的家庭关系、工作关系、同学关系、社交关系四类维度关系对应的距离权重分别记为d_aspfami,d_aspwork,d_aspclass,d_aspsocial,权重值范围为1-10;(4c)根据各关系维度下t_f的值,分配各位联系人的维度内关系距离值,记为d_inasp,其范围亦为1-10,t_frq_time越高,d_inasp越小;(4d)计算用户与各位联系人最终的关系距离drela,drela=d_asp*d_inasp;;其中权重值d_asp根据两个个人肖像之间的关系类型确定。(4e)用户与各联系人的关系距离drela按照预设的更新周期更新计算,每次更新后,提示用户是否重新计算目标人际路径。步骤(5)构建人际关系互联网络,如图5所示,具体处理过程如下:(5a)随机选取人员pi作为网络起始节点,以pi为中心,按照(3a)-(3b)的步骤,构建针对pi的完善的人员关系图谱mapmat,即mapmat_pi;(5b)提取出mapmat_pi中不同维度的联系人,分别连结上述联系人与pi,以不同颜色的连接线标识不同的维度关系,同时在连接线上标注具体的关系,如领导维度中的领导、平级、下属,同学维度中的大学同学、研究生同学等,将pi相关的联系人关系数据存入数据表table_cpi中,table_cpi的字段包括人员id、姓名、性别、年龄、工作领域、兴趣点、职位、中心节点id、与中心节点关系、与中心节点距离、与中心节点建立关联时间,其中,联系人的姓名、性别、年龄、工作领域、兴趣点、职位等信息采用步骤(1)的方法分析计算得出;(5c)提取table_cpi中pi相关的人员关系数据,形成以pi为中心的一级人际网络图netpi_l_1;(5d)遍历table_cpi中pi相关的人员,对于第j个人员pj,根据步骤(4)中预设的不同维度及人员子类别对应的距离值,计算pj与pi之间的距离drela(i,j),并标注在两节点间的连线上,同时,将drela(i,j)写入table_cpi中“与中心节点距离”字段;(5e)以pj为中心,按照(5b)的步骤,形成pj的人员关系数据,并将pj的人员关系数据继续写入table_cpi中,其中,“中心节点id”字段值为人员pj的id,对于已经存在于table_cpi中的人员,也就是pi的联系人,如果其同时也是pj的联系人,那么在建立pj的人员关系数据时,将其新增在table_cpi表中;(5f)根据table_cpi中pj相关的人员关系数据,构建以pj为中心的一级人际网络图netpj_l_1;(5g)重复步骤(5e),直到table_cpi中pi相关的人员遍历结束,此时形成以pi为中心的二级人际网络图netpi_l_2,按照步骤(5d)计算并标注netpj_l_1的中心节点pj与任一节点pk的drela(j,k),将相应数据写入table_cpi中“与中心节点距离”字段;(5h)读取预先设定的网络级数nlevel,当nlevel<3时,不做任何操作,当nlevel≥3时,重复步骤(5e)-(5f)nlevel-2次,在table_cpi中形成完整的数据,同时构建出以pi为中心的n级人际网络图netpi_l_n;步骤(6)针对目标人员需求明确的用户,如图6所示,采集需求信息并进行目标人员定位,所述的明确需求是指已知目标用户姓名的需求,具体处理过程如下:(6a)系统接收目标用户的姓名in_name作为数据源,以in_name为关键词,在table_cpi中搜索匹配的人员;(6b)对于匹配的结果,形成人员结果列表list_spec,将符合搜索条件的人员数量记为n_spec,则list_spec中包含n_spec条数据,每条数据中均涵盖人员姓名、性别、年龄、工作领域、兴趣点、职位等基本信息,系统将list_spec反馈给用户,供用户选择并确认;(6c)用户在list_spec中选择1条作为自己确认要寻找的目标人员,系统接收用户的选择,将list_spec中符合相应条件的记录标记为recobj_spec,同时在netpi_l_n中将对应的人员以高亮标识,将该人员记为pobj_spec;步骤(7)针对目标人员需求模糊的用户,如图7所示,采集需求信息并进行目标人员定位,所述的模糊需求是不知目标用户的姓名,但可描述目标用户的部分特征的需求,具体处理过程如下:(7a)系统分别从年龄、工作领域、兴趣爱好几个维度,对用户人际关系网络数据进行分析、挖掘,通过聚类方法,形成各个维度的类簇;(7b)将几个维度的类簇数据源提供给用户选择,用户依托系统选择目标人员的性别、年龄范围、工作领域、兴趣等需求信息;(7c)用户完成需求信息填写后,系统接收用户输入的需求信息,将上述信息同时作为搜索条件,在table_cpi中搜索匹配或近似匹配的人员,对于搜索结果,形成人员结果列表list_blur,将符合搜索条件的人员数量记为n_blur,则list_blur中包含n_blur条数据,每条数据中均涵盖人员姓名、性别、年龄、工作领域、兴趣点、职位等基本信息,供用户选择并确认;(7d)用户在list_blur中选择1条作为自己确认要寻找的目标人员,系统接收用户的选择,将list_blur中符合相应条件的记录标记为recobj_blur,同时在netpi_l_n中将对应的人员以高亮标识,将该人员记为pobj_blur;步骤(8)规划用户和目标人员之间的最优人际关系路径,如图8所示,具体处理过程如下:(8a)将提出需求的用户记作porigin,将porigin欲查找的目标人员记作pobj,,将用户和pobj之间的总距离记为dtotal,设置dtotal初始值为0;(8b)在table_cpi中以pobj的id为搜索条件,搜索pobj对应的中心节点人员,将返回的记录列表记为listc_obj,将listc_obj中的记录条数记为nc_obj,如果nc_obj=1,取listc_obj中唯一一条记录中“中心节点id”字段对应的人员作为pobj对应的中心人员,如果nc_obj≥2,对listc_obj中各条记录的“与中心节点距离”字段进行比较,取该字段值最小的记录中“中心节点id”字段对应的人员作为pobj对应的中心人员,对于该字段值相同的记录,取“与中心节点建立关联时间”值最早的记录对应的人员作为pobj对应的中心人员,所述的pobj对应的中心人员记为pobj_c_1,将pobj与pobj_c_1之间的距离记为dcenter_1,设置dtotal=dtotal+dcenter_1;(8c)以查找到的pobj_c的id为搜索条件,重复步骤(8b),对于第n次搜索(n≥2),作为搜索条件的中心节点记作pobj_c_n,要查找的上级中心节点记作pobj_c_n+1,pobj_c_n与pobj_c_n+1之间的距离记为dcenter_n,每完成一次搜索,设置dtotal=dtotal+dcenter_n,直到pobj_c_n+1为提出需求的用户porigin时,结束搜索;(8d)将搜索结果记录到数据表table_ri中,数据字段包括需求用户id、目标人员id、途径人员节点、路径总距离,其中,所述的“需求用户id”字段存储porigin的id,所述的“目标人员id”字段存储pobj的id,所述的“途径人员节点”字段存储从pobj_c_1到pobj_c_n的id值列表,各id值之间以“,”分隔,其格式为(pobj_c_1,pobj_c_2,……pobj_c_n),所述的“路径总距离”字段存储dtotal;(8e)查询table_ri,在netpi_l_n中,将与table_ri记录匹配的人员节点及节点之间的连接线高亮标识出来,包括提出需求的用户porigin、目标人员pobj、以及途径的所有pobj_c_i,i=1,2……n,形成用户与目标人员pobj之间的连结路径,为用户提供目标人员的联系途径。本发明提供的基于人员关系网络的人际路径快速定位方法在专家网络的构建中得到应用,具体包括以下步骤:(1)、基于数据捕捉和聚类的个人肖像生成模块首先系统捕捉用户个人的社交平台数据及业务工作平台数据,识别个人年龄、性别、工作单位、领域、具体岗位、职务、职称等属性项,提取个属性项对应的属性值,形成个人基本信息。随后,以个人业务工作平台及社交平台为数据源,进行数据分析,预测个人的兴趣点,抓取个人在业务工作平台中的浏览、评论、转发、下载的知识,日常处理的文件,抓取个人在微信、微博、论坛等社交平台中关注、评论、转发、发布的文章等,进行分词、特征向量提取等操作,提取出各篇文章的典型文本特征向量。其中,分词和特征向量提取的具体实现过程如下:(a)、采用基于马尔科夫模型或最大信息熵的分词算法,对读取的文本数据全文进行分词处理,然后采用基于规则的停用词识别法,在分词处理后的文本数据全文中查照停用词,并用空格替代这些停用词,从而将每个分词用空格作为分割符进行分割,之后以分割符为标识提取每个分词,组成分词集合wordsplit;(b)、采用特征词提取算法对分词集合wordsplit进行处理,提取文本数据的特征词,并采用特征权重计算方法,计算每个特征词对应的权重;然后由所述文本数据的特征词以及特征词的权重组成所述文本数据的特征向量。其中,可以采用信息增益法、χ2统计量法或互信息法,对每个文本数据对应的分词集合进行处理,提取每个文本数据的特征词,并采用布尔权重算法、绝对词频tf算法、倒排文档频度idf算法、tf-idf算法或tfc算法计算各特征词的特征权重,具体可以参考2008年清华大学出版社出版的由宗成庆编著的《统计自然语言处理》。最后,以所述的各篇文章的典型文本特征为数据源,应用聚类算法,计算形成兴趣类别簇,提出中各类别簇中心向量对应的特征词,作为该兴趣类别簇的标签,形成用户的兴趣点集合,兴趣点集合与步骤(1a)中的个人信息共同形成基于系统捕捉的个人肖像。其中,聚类分析的具体实现过程如下:(a)将文本特征向量总数记为m;(b)进行文本特征向量的修正操作,即对于所有已完成预处理的文本数据,将其特征向量长度加和求平均值,将该值作为文本数据特征向量的统一长度,记为l。对所有已完成预处理的文本数据特征向量进行截取,长度大于l的,则保留l个值,小于l的,则进行补零操作,使所有文本数据的特征向量长度均为l。(c)如果m>1,且对(log10m)2取整后得到的整数k≥2,则以k作为类簇个数。(d)在m个已完成预处理的文本数据中,随机选取k个文本数据作为初始的聚类中心,即将所述k个文本数据对应的k个特征向量作为初始的类簇中心向量;其中,将所述k个中心向量记为t1′、t2′、…、t′k;将聚类中心以外的m-k个文本数据的特征向量记为t′k+1、t′k+2、…、t′m;(e)对m-k个文本数据的特征向量进行聚类划分,将t′k+1、t′k+2、…、t′m划分到以t1′、t2′、…、t′k为中心向量的类簇中,具体划分过程如下:(e-1)、计算m-k个文本数据的特征向量t′k+1、t′k+2、…、t′m与k个中心向量t1′、t2′、…、t′k之间的相似度距离;其中,第m个特征向量t′k+m与第n个中心向量tn′之间的相似度距离m=1、2、…、m-k,n=1、2、…、k;(e-2)、根据m-k个特征向量t′k+1、t′k+2、…、t′m与k个中心向量t1′、t2′、…、t′k之间的相似度距离,进行聚类划分,其中:如果第m个特征向量t′k+m与第n′个中心向量t′n′的相似度距离sm,n′最小,即sm,n′=min(sm,1,sm,2,…,sm,k),则将第m个特征向量t′k+m划分到以t′n′为中心向量的类簇中;m=1、2、…、m-k,n′=1、2、…或k;(e-3)、分别对k个类簇内的特征向量求取平均值,并将所述平均值作为类簇的中心向量;即将第n个类簇的中心向量tn′更新为第n个类簇内所有特征向量的平均值;(e-4)、如果更新后的类簇中心向量与更新前的类簇中心向量的相似度距离小于或等于设定的误差阈值,则判断聚类划分结束,记录k个类簇的中心向量,分别标记为f1、f2、…、fk;如果更新后的类簇中心向量与更新前的类簇中心向量的相似度距离大于设定的误差阈值,则返回步骤(e-1);(2)、人际关系距离动态配置模块人际关系距离动态配置流程,具体实施方式如下:首先根据预设的更新周期,遍历该周期内用户的日常联系人集合c_person中的各位联系人,计算用户与各位联系人的联系频次和每次联系时间,对于联系方式为语音交互的,联系时间为实际花费的时间,对于联系方式为文字交互的,由于涉及到非即时通信,交互效率不可控,可为每次的信息发送行为预设一个固定的交互时长,将该交互时长作为每次联系时间,将该周期内用户与各位联系人的联系频次与每次联系时间相乘,乘积记作联系总时长t_f,用户与第i位联系人的联系总时长即为t_f;其次统计各位联系人中,分别有多少人属于家庭关系、工作关系、社交关系、同学关系,综合考虑各关系维度包含的实际人数多少及各联系人对应的t_f值,分配四类关系的权重,所述的家庭关系、工作关系、同学关系、社交关系四类维度关系对应的距离权重分别记为d_aspfami,d_aspwork,d_aspclass,d_aspsocial,权重值范围为1-10;随后根据各关系维度下t_f的值,分配各位联系人的维度内关系距离值,其范围亦为1-10,t_frq_time越高,d_inasp越小;最后计算用户与各位联系人最终的关系距离,计算方法为:drela,drela=d_asp*d_inasp。(二)人际路径快速定位系统本发明的基于人员关系网络的人际路径快速定位方法可以基于人际路径快速定位系统,该系统包括基于数据捕捉和聚类的个人肖像生成模块、基于用户确认的个人肖像完善模块、个人关系图谱生成模块、人际关系距离动态配置模块、人际关系互联网络构建模块、目标人员定位模块和人际关系路径规划模块。其中,基于数据捕捉和聚类的个人肖像生成模块用于实现步骤(1)的个人肖像生成,基于用户确认的个人肖像完善模块用于实现步骤(2)的个人肖像完善,个人关系图谱生成模块用于实现步骤(3)的个人关系图谱构建,人际关系距离动态配置模块用于实现步骤(4)的关系距离动态计算及更新,人际关系互联网络构建模块用于实现步骤(5)的人际关系网络构建,目标人员定位模块用于实现步骤(6)面向明确需求的目标人员定位和步骤(7)的面向模糊需求的目标人员匹配及筛选,人际关系路径规划模块用于实现步骤(8)的最优人际关系路径规划及展示。本实施例在专家网络构建中应用基于人员关系网络的人际路径快速定位方法,其系统由服务器和客户端组成,数据库服务器采用xeon2.8双核处理器,16g内存,2tb硬盘,负责存储所有的数据信息,同时配置磁带库和备份软件,作为历史数据备份和恢复使用;应用服务器采用linux操作系统,oracle11g以上的数据管理软件,用于实现个人肖像生成、个人关系图谱生成、人际关系互联网络构建、目标人员定位和人际关系路径规划,负责客户端所传递数据的后端解析及处理工作;客户端主机采用3.7ghzcpu,8g内存,2t硬盘,使用windows8/7/xp操作系统,通过b/s方式与服务器进行交互,主要功能为前端展示,并提交服务器所需数据。本发明的系统及方法已经成功应用于航天科技集团公司第一研究院知识管理系统的专家网络构建中,对于员工欲查找的专家,不仅快速定位具体人员,同时规划出用户与该专家之间的人际关系路径,解决了员工想找某领域专家,但不知该专家到底是谁,或者不知道如何去找的难题,大大提升了专家作用的发挥,进一步促进了组织智力资产的传承与重用,证明了本发明系统及方法的实用性。本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1