基于技能图的任务分配方法、装置、介质、设备及系统与流程

文档序号:15560054发布日期:2018-09-29 02:02阅读:153来源:国知局

本发明涉及众包的任务分配领域,具体涉及一种基于技能图的任务分配方法、装置、介质、设备及系统。



背景技术:

随着众包(crowdsourcing)在图片标注、情感分析等工作中的成功应用,人们希望借助众包来处理一些需要某种特定技能才能解决的任务,如项目评审、代码众包等,这些任务要求工人具备一种或多种专业知识。由于众包中存在任务完成门槛较低、工人不可靠、专业知识多样性、缺少专业知识等诸多问题,人们可能得到不满意、质量低下的结果。因此,如何控制众包结果的质量成为众包的一个挑战。理想情况下,众包平台应该在任务分配(taskassignment)过程将任务准确分配给具有某种特定技能的工人。

目前国内外诸多学者在众包的研究中发表了许多论文和期刊,其中就有不少关注任务分配中工人与任务匹配度计算问题的研究。现在众包平台的普遍做法是简单描述工人能够完成任务所需的某种特定技能,最多仅是设计一套测试方法验证工人的资格。zheng等人则提出基于向量的工人匹配算法,它将所有任务分为13个领域,如体育、财经等,然后根据工人以往的完成任务历史为他们计算出每个领域的得分,再抽取出任务描述中的实体,并计算出任务在每个领域的得分,然后利用这些得分计算出工人与任务的匹配度,并以此排序挑选工人。mavridis等人提出使用技能树的方式对工人所拥有的技能与任务所需的技能构建模型,用技能树上的节点作为任务和工人的技能标签,利用此树直接计算技能之间的距离并转换工人与任务的匹配度,以实现将任务准确分配给相应工人。

以上两种方法在实际应用中都有各自的缺陷,基于向量的方式是将任务领域做静态划分,并不能适应任务的动态扩展,另外该方法划分领域的粒度也较难设定,太大和太小都会造成匹配度计算不准确。而技能树在构建过程中可能无法真实反映现实世界中技能的分布,比如“门球”和“篮球”虽然都属于体育运动,但喜欢和熟悉的人群可能完全无交集,篮球迷对门球运动可能一窍不通,尤其是针对知识图谱修正这样的任务,任务间交叉纷繁,无法用一棵单一的树来建模技能和知识。



技术实现要素:

为了解决上述全部或部分问题,本发明提供一种基于技能图的任务分配方法、装置、介质、设备以及系统。

本发明的实施方式公开了一种基于技能图的任务分配方法,所述方法包括

构建技能图;

将任务需要的技能和工人具有的技能分别映射到所述技能图上;

计算所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值;

将所述任务分配给与所述任务之间的匹配度最高的所述工人,所述匹配度与所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值成反比。

在一示范例中,所述技能图包含节点、所述节点之间的有向边以及所述有向边的is-a属性,所述节点表示技能,所述有向边表示所述有向边连接的所述节点之间存在联系,所述is-a属性表示所述有向边连接的所述节点之间为父类与子类的关系。

在一示范例中,将所述任务需要的技能和所述工人具有的技能分别映射到所述技能图上包括:

为所述技能图上的各技能获取技能信息;

如果所述任务需要的技能存在于所述技能图上,则将所述任务需要的技能直接映射到所述技能图上;

如果所述任务需要的技能不在所述技能图上,则为所述任务需要的技能获取技能信息,并且与所述技能图上的各技能的技能信息取交集,将所述技能图上与所述任务需要的技能交集最大的技能作为映射结果。

在一示范例中,从维基百科获取相应于技能的词条页中的超链接信息作为技能信息。

在一示范例中,如果在所述技能图上表示所述任务需要的技能的所述节点与表示所述工人具有的技能的所述节点重合,或者在所述技能图上由表示所述任务需要的技能的所述节点至表示所述工人具有的技能的所述节点存在最短路径,并且组成该最短路径的各个所述有向边均具有所述is-a属性,则所述技能图上所述任务需要的技能和所述工人具有的技能之间的距离为0;否则

所述技能图上所述任务需要的技能和所述工人具有的技能之间的距离为

其中,s为所述技能图上表示所述任务需要的技能的所述节点,s′为所述技能图上表示所述工人具有的技能的所述节点,depth表示所述技能图的最深层次,lca(s,s′)表示s和s’的最低共同祖先,depth(lca(s,s′))表示所述最低共同祖先所在层次,hop(s,s′)表示s和s’之间的最短路径中不包含所述is-a属性的所述有向边的数量,当s和s’之间不存在路径时,α=1,hop(s,s′)=0,当由s至s’存在最短路径时,α=0。

在一示范例中,所述方法还包括:

根据所述技能图上所述任务需要的技能所在的层次,对所述任务进行排序;

根据所述工人具有的技能的数量,对所述工人进行排序;

按照所述技能图上所述任务需要的技能所在的层次由大到小的顺序分配所述任务,并且在分配所述任务时,若存在具有相同所述匹配度的所述工人,则将所述任务分配给具有更少技能数量的所述工人。

本发明的实施方式还公开了一种基于技能图的众包任务分配装置,所述装置包括:

技能图构建模块,所述技能图构建模块构建技能图;

技能映射模块,所述技能映射模块将任务需要的技能和工人具有的技能分别映射到所述技能图上;

距离计算模块,所述距离计算模块计算所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值;

任务分配模块,所述任务分配模块将所述任务分配给与所述任务之间的匹配度最高的所述工人,所述匹配度与所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值成反比。

本发明的实施方式还公开了一种非易失性存储介质,在所述存储介质上存储有基于技能图的众包任务分配程序,所述基于技能图的众包任务分配程序被计算机执行以实施基于技能图的众包任务分配方法,所述程序包括:

技能图构建指令,构建技能图;

技能映射指令,将任务需要的技能和工人具有的技能分别映射到所述技能图上;

距离计算指令,计算所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值;

任务分配指令,将所述任务分配给与所述任务之间的匹配度最高的所述工人,所述匹配度与所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值成反比。

本发明的实施方式还公开了一种基于技能图的众包任务分配设备,包括:

存储器,存储有计算机可以执行的基于技能图的众包任务分配程序;以及

处理器,连接至所述存储器,并且被配置为执行所述基于技能图的众包任务分配程序以:

构建技能图;

将任务需要的技能和工人具有的技能分别映射到所述技能图上;

计算所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值;

将所述任务分配给与所述任务之间的匹配度最高的所述工人,所述匹配度与所述技能图上所述任务需要的技能和所述工人具有的技能之间距离的最小值成反比。

本发明的实施方式还公开了一种基于技能图的众包任务分配系统,包括上述基于技能图的众包任务分配装置。

本发明实施方式与现有技术相比,主要区别及其效果在于:本发明中构建的技能图,不仅能进行现有技术中技能树的技能推理和替换,也考虑到了同一领域内技能之间的联系,更加符合现实世界的技能分布,能够有效提升众包质量,适用于各大众包平台的任务分配工程。

进一步地,通过为技能获取技能信息,能够准确地将任务需要的技能以及工人具有的技能映射到技能图上。

进一步地,技能图上任务需要的技能以及工人具有的技能之间距离最小值的计算方法能够准确地反应任务与工人之间的匹配度。

进一步地,对任务以及工人进行排序,能够将专业化程度最高的任务分配给技能数量最少的工人,为剩余任务保留技能最多样性的工人。

附图说明

图1为根据本发明实施方式的基于技能图的任务分配装置的结构示意图;

图2为根据本发明实施方式的基于技能图的任务分配方法的流程示意图;

图3为根据本发明实施方式的技能图的示意图;

图4为根据本发明实施方式的计算机科学领域的技能图的示意图。

具体实施方式

在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。

图1为根据本发明实施方式的基于技能图的任务分配装置的结构示意图,任务分配装置100包括技能图构建模块101、技能映射模块102、距离计算模块103、任务分配模块104。图2为根据本发明实施方式的基于技能图的任务分配方法的流程示意图,如图2所示,基于技能图的任务分配方法具体包括:

步骤201,技能图构建模块101构建技能图;

步骤202,技能映射模块102将任务需要的技能和工人具有的技能分别映射到技能图上;

步骤203,距离计算模块103计算技能图上任务需要的技能和工人具有的技能之间距离的最小值;

步骤204,任务分配模块104将任务分配给与该任务之间的匹配度最高的工人,匹配度与技能图上任务需要的技能和工人具有的技能之间距离的最小值成反比。

具体地,技能图包含节点、节点之间的有向边以及有向边的is-a属性,节点表示技能,有向边表示有向边连接的节点之间存在联系,is-a属性表示有向边连接的节点之间为父类与子类的关系。如图3所示,定义为有向图g=(root,s,e,≤),root为图g的中心,也为图g的起点,所有边都源于root,即root为根节点,且其代表的技能为空;s为技能集,即根节点外其他节点的集合;e为技能关系集,即有向边的集合,e(s,s’)∈e表示技能s和s’之间有一条由s指向s’的有向边,其中部分有向边具有is-a特殊属性;具有is-a特殊属性的有向边构成了技能图g的层次性,也构成了技能之间的偏序关系≤,技能s与s’之间存在一条具有is-a属性的有向边,表示技能s’的专业化程度比技能s高,技能s’为技能s的子类,技能s为技能s’的父类,具有技能s’的工人默认也具有技能s,即s≤s’。

在技能图中,使用depth表示技能图的最深层次,例如在图3中,技能图g的depth为2;使用depth(s)表示技能s所在层次,例如在图3中,depth(s)为1,depth(s’)为2,技能的层次越大,表示技能的专业程度越高。

技能映射模块102将任务需要的技能和工人具有的技能分别映射到技能图上具体包括:

为技能图上的各技能获取技能信息;

如果任务需要的技能存在于技能图上,则将任务需要的技能直接映射到技能图上;

如果任务需要的技能不在技能图上,则为任务需要的技能获取技能信息,并且与技能图上的各技能的技能信息取交集,将技能图上与任务需要的技能交集最大的技能作为映射结果。

在获取技能信息时,作为其中一种实施方式,可以将技能图中各个技能或者任务需要的技能作为搜索关键词,在维基百科中搜索相应词条页并获取页面中的超链接信息,然后将该超链接信息作为技能信息。需要说明的是,技能信息的获取途径不限于此,也可以通过其他资源获取技能信息。

在计算任务与工人之间的匹配度时,设技能图上任务t需要的技能为集合skill(t),技能图上工人p具有的技能为集合skill(p),那么任务t与工人p之间的匹配度d(t,p)与技能图上skill(t)和skill(p)两组技能之间距离的最小值成反比,距离的最小值越小,匹配度越高,即:

其中技能s表示任务t需要的技能,技能s’表示工人p具有的技能,技能s和技能s’之间的距离公式为:

如果在技能图上技能s节点与技能s’节点重合,或者在技能图上由技能s节点至技能s’节点存在最短路径,并且组成该最短路径的各个有向边均具有is-a属性,则技能图上技能s节点与技能s’节点之间的距离为0;此时,工人恰好拥有任务所需的技能或拥有比任务所需技能更专业的技能,任务需要的技能与工人具有的技能之间的距离为0;

否则,通过式(2)的下半部分计算,其中lca(s,s′)表示s和s’的最低共同祖先,depth(lca(s,s′))表示所述最低共同祖先所在层次,hop(s,s′)表示s和s’之间的最短路径中不包含所述is-a属性的所述有向边的数量,当s和s’之间不存在路径时,α=1,hop(s,s′)=0,当由s至s’存在最短路径时,α=0。

图4为计算机科学领域的技能图的示意图,参考图4对匹配度的计算进行说明。假设任务t的所需技能为‘数据挖掘’,而工人p1具有技能‘知识抽取’和‘计算机科学’,工人p2具有技能‘计算机科学’,工人p3具有技能‘关系抽取’。对于工人p1,d(数据挖掘,知识抽取)=0,因为由数据挖掘至知识抽取存在一条具有is-a属性的有向边,即知识抽取≥数据挖掘;因为由数据挖掘至计算机科学不存在路径,故α=1,hop(s,s′)=0,d(数据挖掘,计算机科学)=1*(3-1)/3+(1-1/(0+1))=2/3;故任务t需要的技能和工人p1具有的技能之间距离的最小值为0。对于工人p2,d(数据挖掘,计算机科学)=1*(3-1)/3+(1-1/(0+1))=2/3,任务t需要的技能和工人p1具有的技能之间距离的最小值为2/3。对于工人p3,因为由数据挖掘至关系抽取存在最短路径,α=0,d(数据挖掘,关系抽取)=0*(3-2)/3+(1-1/(1+1))=1/2,任务t需要的技能和工人p1具有的技能之间距离的最小值为1/2。因此,可以看出,任务t与工人p1匹配度最高,与工人p2匹配度最低,应该将任务t分配给工人p1。

此外,为了将专业化程度最高的任务分配给技能数量最少的工人(为剩余任务保留技能最多样性的工人),还可以根据技能图上任务需要的技能所在的层次,对所有任务进行排序;根据工人具有的技能的数量,对所有工人进行排序;按照层次由大到小的顺序分配任务,并且在分配任务时,判断某个任务与所有工人之间的匹配度,将该任务分配给具有最高匹配度的工人,若存在具有相同匹配度的工人,则将该任务分配给具有更少技能数量的工人。

本发明中构建的技能图,不仅能进行现有技术中技能树的技能推理和替换,也考虑到了同一领域内技能之间的联系,更加符合现实世界的技能分布,能够有效提升众包质量,适用于各大众包平台的任务分配工程。

本发明的实施方式还提供一种非易失性存储介质,在存储介质上存储有基于技能图的任务分配程序,基于技能图的任务分配序被计算机执行以实施基于技能图的任务分配方法,该程序包括:

技能图构建指令,构建技能图;

技能映射指令,将任务需要的技能和工人具有的技能分别映射到技能图上;

距离计算指令,计算技能图上任务需要的技能和工人具有的技能之间距离的最小值;

任务分配指令,将任务分配给与该任务之间的匹配度最高的工人,匹配度与技能图上任务需要的技能和工人具有的技能之间距离的最小值成反比。

本发明的实施方式还提供一种基于技能图的任务分配设备,包括:

存储器,存储有计算机可以执行的基于技能图的任务分配程序;以及

处理器,连接至存储器,并且被配置为执行基于技能图的任务分配程序以:

构建技能图;

将任务需要的技能和工人具有的技能分别映射到技能图上;

计算技能图上任务需要的技能和工人具有的技能之间距离的最小值;

将任务分配给与该任务之间的匹配度最高的工人,匹配度与技能图上任务需要的技能和工人具有的技能之间距离的最小值成反比。

本发明的实施方式还提供一种基于技能图的任务分配系统,包括如上所述的基于技能图的任务分配装置。

需要说明的是,在本专利的权利要求和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1