一种基于top-k结构洞的众包问题选择方法和系统

文档序号:35385741发布日期:2023-09-09 12:30阅读:64来源:国知局
一种基于top-k结构洞的众包问题选择方法和系统

本发明涉及计算机众包,更具体地,涉及一种基于top-k结构洞的众包问题选择方法和系统。


背景技术:

1、众包指的是企业或组织将以往由雇员承担的工作,转而交给没有具体规定并且通常是大规模的大众工作者。近年来,以语言翻译为主要领域,越来越多的企业和机构开始借助众包来完成和解决传统计算机难以单独处理的问题。伴随着web2.0、物联网和智能互联等技术的迅速发展,众包技术逐渐从“特定工作群体”转化为“大众工作群体”,为解决众包问题带来了全新的思路与方法,一系列研究工作通过众包使用人类知识来提高众包准确性。

2、众包问题是指需要通过众包方式来解决的任务或问题。这些任务和问题通常需要人类智能和判断力,例如翻译、图像标注、实体解析等。通过将这些任务分配给大众工作者,企业或组织可以更快速地完成这些任务,同时降低成本。众包问题数量是指需要通过众包方式来解决的任务或问题的数量。通常情况下,众包问题数量越多,需要的众包资源和时间就越多。众包问题收益是指通过众包解决某个问题后,进一步推出其他待解决问题所能获得的效益。这些收益可能包括任务完成速度的提高、成本的降低、质量的提高、准确性的增加等。企业或组织需要考虑众包问题收益与成本之间的平衡,以确定是否使用众包解决问题。同时,他们也需要优化众包流程和设计合适的激励机制,以最大化众包问题收益。

3、为了进一步减少所需的问题数量,同时最大化所选择的众包问题收益。例如在实体解析的众包场景中应用传递关系,即如果一对待解析匹配对可以通过传递关系推导出来,则不需要进行众包。例如,给定三条记录a、b、c,一种传递关系是,如果a匹配b,b匹配c,则a匹配c。另一种传递关系是,如果a匹配b,b不匹配c,则a不匹配c。通过众包或传递关系进一步确定所有记录对后,可以对初始结果进行全局分析。其基本思想是,如果根据众包获得的匹配结果可以推断出一个记录对,那么就没有必要进行众包,如果存在传递关系,则可以直接推导出记录对。在众包平台上,选择最优的众包问题是一个非常重要的任务,最优问题选择的目标是选择一组能使收益最大化的问题。

4、结构洞是社会网络分析中的基本概念,用于解释社会中资源的差异来源,处于结构洞节点的个体,在不同社区之间起到了桥接作用,可以进一步控制关键的信息传播路径,从而获得更多的资源和机会。这种类型的个体被称为结构洞跨越者,它们对于理解社会网络的结构和用户行为非常重要。个体在其邻居之间没有直接联系或联系很弱的情况下,该个体可以在不同邻居之间传递信息或资源,而不受其他人干扰或竞争,反映了一个个体在网络中的独立性和多样性。个体与其邻居之间有越多的结构洞,就有越多的资源,这是因为该个体可以利用不同邻居之间信息或资源上的差异,从而获得更大的收益和影响力。其次,个体在其邻居之间有更少的冗余联系(即相互重叠或相似度高的联系),就有更多的资源,这是由于该个体可以避免与其他人分享信息或资源,从而保持自己独特和稀缺性。结构洞理论的基础定理是桥接定理,该定理认为,那些连接不同子群的人在网络中处于重要地位,因为他们可以控制信息的流动。这些桥接者拥有许多不同子群之间的联系,能够将信息在不同的子群之间传递,从而在网络中发挥重要作用;而如果只与自己的子群联系,那么在整个网络中的影响力可能相对较小。

5、top-k结构洞是一种在网络或图结构中寻找最重要的、最具有代表性的结构(例如子图或节点)的方法。它的基本思想是在整个网络或图结构中寻找最能代表整个结构的前k个子图或节点,这些子图或节点可以被认为是整个结构的核心部分。具体来说,使用top-k结构洞算法时,首先通过一个指标(例如子图密度、连通性等)来评估每个子图或节点的重要性。然后,根据这个指标对整个结构中的所有子图或节点进行排名,并选择排名前k的子图或节点作为最终的结构洞。

6、因此,基于top-k结构洞的众包问题选择方法的优势在于,在众包问题选择中,top-k结构洞可以用来快速筛选出最有代表性的问题,从而降低评估成本和提高准确度。通过选取最具有代表性的问题,可以确保选中的问题能够最大程度地代表整个问题空间,从而提高解决方案的可靠性和准确性。同时,这种方法还可以提高众包效率,降低成本,并改善工作者的工作体验,因为只有最有价值的问题会被选中,从而减少了工作者需要评估的问题数量,提高了他们的工作效率和满意度,在众包领域中具有重要的应用价值。

7、现有技术中公开了一种众包中任务最优分配方法及其系统,根据用户的投标情况,统计选择每个任务的用户数量;之后通过判断每个任务众包所设定的所需用户的数量是否小于选择对应任务的用户数量,以决定是否调整交易价格以实现选择每个任务的用户数量的变化,整个过程在基于众包所设定的交易价格及用户的投标情况,满足每个任务对于完成任务的人数的要求,使得众包中多个任务高效有序的完成,使得众包中任务的分配达到优化;现有技术中的众包最优问题选择方法容易受到工作者的评分和任务的数量等因素的影响,导致结果不够准确;另外,众包平台上有大量的待解决问题任务,该众包最优问题选择方法需要对所有问题进行评估或是随机选择问题,这需要大量的时间和人力成本且效果不佳,还可能会导致某些收益较高的问题被忽略。


技术实现思路

1、本发明为克服上述现有技术在选择收益最大的众包问题时存在效率和准确性低、成本高的缺陷,提供一种基于top-k结构洞的众包问题选择方法和系统,能够降低评估成本和提高准确度,同时提高众包效率,降低成本,显著改善众包工作者的工作体验。

2、为解决上述技术问题,本发明的技术方案如下:

3、一种基于top-k结构洞的众包问题选择方法,包括以下步骤:

4、s1:获取包括若干个众包问题的问题集合,设置每个所述众包问题对应的初始收益;根据问题集合构造概率传播图;

5、s2:根据概率传播图计算图中的top-k结构洞,获得top-k结构洞集合;

6、s3:在问题集合中随机选择一个众包问题,遍历top-k结构洞集合,判断所选的众包问题是否为top-k结构洞集合中的问题,若是,则对所选的众包问题附加定量权重,并获取附加定量权重后的收益,执行步骤s4;否则令其附加定量权重后的收益等于其初始收益,执行步骤s4;

7、s4:对于每个所选的众包问题,根据附加定量权重后的收益和初始收益计算对应的收益增量;

8、s5:将每个所选众包问题的收益增量与初始收益最大的众包问题的收益增量进行比较,若大于,则将所选众包问题加入结果集合,执行步骤s6;否则直接执行步骤s6;

9、s6:重复若干次步骤s3~s5,对结果集合中的众包问题数量进行迭代更新,将更新后的结果集合作为最终的众包问题选择结果。

10、优选地,所述步骤s1中,根据问题集合构造概率传播图的具体方法为:

11、根据问题集合u构造概率传播图g,记为g=(v,e),其中,v为概率传播图g中的问题节点,e为与问题节点v相连的带权边;

12、在所述概率传播图g中,一个问题节点v表示一个问题集合u中的问题;带权边e表示与其相连的两个问题节点v之间的关联概率。

13、优选地,所述步骤s1中,每个众包问题对应的初始收益具体为:

14、每个众包问题q对应的初始收益benefit(q)具体为:

15、

16、其中,u为问题集合,solve(q)表示问题q被众包解决后可以被随之解决的问题集合。

17、优选地,所述步骤s2中,根据概率传播图计算图中的top-k结构洞,获得top-k结构洞集合的具体方法为:

18、s2.1:基于概率传播图g,设置根节点r,利用预设的活边图模型构造辅助图g',记为g'=(v,e'),其中,e'为辅助图g'中与问题节点v相连的带权边;

19、s2.2:根据辅助图g'获取辅助图子图g”;

20、s2.3:根据辅助图子图g”构造一棵以根节点r为根的支配树tdom,支配树tdom中的节点u满足u∈v;

21、s2.4:计算每个节点u的整体平均阻塞数bx();

22、s2.5:将所有的节点u根据其对应的整体平均阻塞数bx()进行降序排序,取前k个节点u作为top-k结构洞集合。

23、优选地,所述步骤s2.2中根据辅助图g'获取辅助图子图g”的具体方法为:

24、在辅助图g'中删除对于根节点r不可达的节点,获取辅助图子图g”;

25、所述辅助图子图g”满足图中所有其他问题节点v对于根节点r均可达。

26、优选地,所述步骤s2.3中根据辅助图子图g”构造一棵以根节点r为根的支配树tdom的具体方法为:

27、利用深度优先算法,遍历获取辅助图子图g”中所有节点u的直接支配者,构造一棵以根节点r为根的支配树tdom。

28、优选地,所述步骤s2.4中,计算每个节点u的整体平均阻塞数bx()的具体方法为:

29、根据以下公式计算计算每个节点u的整体平均阻塞数bx():

30、bx()=bu/

31、其中,bu为整体阻塞数,x为迭代次数。

32、本发明还提供一种基于top-k结构洞的众包问题选择系统,应用上述的一种基于top-k结构洞的众包问题选择方法,包括:

33、初始化单元:用于获取包括若干个众包问题的问题集合,设置每个所述众包问题对应的初始收益;根据问题集合构造概率传播图;

34、结构洞构造单元:用于根据概率传播图计算图中的top-k结构洞,获得top-k结构洞集合;

35、问题选择单元:用于在问题集合中随机选择一个众包问题,遍历top-k结构洞集合,判断所选的众包问题是否为top-k结构洞集合中的问题,若是,则对所选的众包问题附加定量权重,并获取附加定量权重后的收益;否则令其附加定量权重后的收益等于其初始收益,执行下一步;

36、收益增量计算单元:用于对于每个所选的众包问题,根据附加定量权重后的收益和初始收益计算对应的收益增量;

37、比较单元:用于将每个所选众包问题的收益增量与初始收益最大的众包问题的收益增量进行比较,若大于,则将所选众包问题加入结果集合;否则直接执行下一步;

38、结果输出单元:用于重复若干次上述步骤,对结果集合中的众包问题数量进行迭代更新,将更新后的结果集合作为最终的众包问题选择结果。

39、本发明还提供一种计算机可读的存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法中的步骤。

40、本发明还提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行上述方法中的步骤。

41、与现有技术相比,本发明技术方案的有益效果是:

42、本发明提供一种基于top-k结构洞的众包问题选择方法和系统,该方法首先获取包括若干个众包问题的问题集合,设置每个所述众包问题对应的初始收益;根据问题集合构造概率传播图;根据概率传播图计算图中的top-k结构洞,获得top-k结构洞集合;在问题集合中随机选择一个众包问题,遍历top-k结构洞集合,判断所选的众包问题是否为top-k结构洞集合中的问题,若是,则对所选的众包问题附加定量权重,并获取附加定量权重后的收益,否则直接执行下一步;对于每个所选的众包问题,根据附加定量权重后的收益和初始收益计算对应的收益增量;将收益增量大于最大初始收益众包问题的收益增量的问题加入结果集合;重复上述步骤,将结果集合作为最终的众包问题选择结果;

43、本发明具有如下有益效果:

44、1)提高选择准确性:传统的众包最优问题选择方法容易受到工作者的评分和任务的数量等因素的影响,导致结果不够准确,而本发明中基于top-k结构洞的方法通过计算问题收益,提高了众包最优问题选择的准确性;

45、2)降低成本:众包平台上有大量的待解决问题任务,如何快速而准确地选择最佳的问题成为了一个重要的挑战,传统的众包最优问题选择方法需要对所有问题进行评估或是随机选择问题,这需要大量的时间和人力成本且效果不佳;而本发明中基于top-k结构洞的方法可以减少评估的数量,提高解决问题带来的整体收益,从而降低成本;

46、3)改善众包平台和任务发布者的合作效能:传统的众包最优问题选择方法可能会让某些收益较高的问题被忽略,而本发明中基于top-k结构洞的方法可以更好地构造任务发布者的用户画像,对应增加其任务被解决的可能性,从而改善任务发布者的使用体验,增强他们的参与度和忠诚度,从而更好地组织任务分配,并使众包任务完成更加高效,提高任务完成效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1