基于机器学习的众包任务个性化推荐方法和系统

文档序号：31793429发布日期：2022-10-14 16:34阅读：来源：国知局

技术特征：
1.一种基于机器学习的众包任务个性化推荐方法，其特征在于，该方法包括：获取工人历史特征数据和任务特征数据；并基于任务特征数据获取工人-任务交互特征数据；基于预处理后的工人历史特征数据、工人-任务交互特征数据训练考虑工人动机和工人能力的工人分类模型。基于训练好的工人分类模型，从待分类工人特征数据集中筛选出具有高动机高能力的工人，并对其进行任务推荐。2.如权利要求1所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所述获取工人历史特征数据和任务特征数据；并基于任务特征数据获取工人-任务交互特征数据，包括：s101、从众包平台上爬取所有工人历史特征数据以及一段时间内的任务特征数据；s102、对任务特征数据进行预处理，并对任务特征数据进行编码，得到任务特征数据集；s103、将任务特征数据集按照时间顺序1：1划分为训练集、测试集，基于训练集获取工人-任务交互特征数据；s104、对工人历史特征数据进行预处理，并进行编码，得到工人历史特征数据集；s105、对工人-任务交互特征数据进行预处理，并进行编码。3.如权利要求2所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所述对任务特征数据进行预处理，包括：筛选出任务投标人数大于等于m1人的任务特征数据；剔除招募未结束或非竞赛类任务；剔除任务当选报酬、任务发布时间、任务截止时间等关键特征缺失的任务；对列表中重复的任务特征数据进行去重；剔除任务列表中的异常值；所述对工人历史特征数据进行预处理，包括：剔除过去当选建议数小于或等于m2的工人；剔除过去建议数小于或等于m3的工人；所述对工人-任务交互特征数据进行预处理，包括：剔除参与任务个数小于m4的工人；剔除中标任务个数小于m5的工人；补全缺失值。4.如权利要求1所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所述基于预处理后的工人历史特征数据、工人-任务交互特征数据训练考虑工人动机和工人能力的工人分类模型，包括：s201、构建工人的能力指标和动机指标；s202、确定工人的能力指标的各个变量的权重和动机指标的各个变量的权重，得到每个工人的动机值和能力值；s203、获取阈值线模型，用于作为高动机和高能力的工人的划分标准。5.如权利要求4所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所
述工人的能力指标，包括：固有能力、专业能力、一般经验、专业经验、多样性、复杂性；所述工人的动机指标，包括：享乐和乐趣、工作自主性、任务复杂性、自我营销/归属感；且所述固有能力的变量包括：平台评分、平台认证等级、过去中标次数；所述专业能力的变量包括：认证类别数量、认证子类别数量、认证技能数量、十年以上技能数量；所述一般经验的变量包括：过去的任务建议数量、近期参与任务数量、近期中标任务数量、每小时费率；所述专业经验的变量包括：认证行业数量、近期参与任务所含任务数量、近期中标任务所含任务数量；所述多样性的变量包括：近期参与不同任务类别的数量、近期参与不同任务子类别的数量、近期中标不同任务类别的数量、近期中标不同任务子类别的数量；所述复杂性的变量包括：近期参与任务平均投标人数、近期参与任务平均建议数量、近期参与任务平均收藏人数、近期参与任务平均浏览次数；所述享乐和乐趣的变量包括：平均任务奖励、任务审批率；所述工作自主性的变量包括：平均招募时间、任务完成率；所述任务复杂性的变量包括：参与任务平均收藏人数与投标人数之比、中标任务平均收藏人数与投标人数之比、参与任务平均浏览人数与收藏人数之比、中标任务平均浏览人数与收藏人数之比；所述自我营销/归属感的变量包括：好评率、评论个数。6.如权利要求4所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所述确定工人的能力指标的各个变量的权重和动机指标的各个变量的权重，得到每个工人的动机值和能力值，包括：基于critic客观赋权法确定各个变量的权重；且工人的动机值、能力值计算公式如下：且工人的动机值、能力值计算公式如下：a
i
表示第i个工人的能力值大小；m
i
表示第i个工人的动机值大小；表示第j个能力变量的客观权重大小；表示第k个动机变量的客观权重大小；x
ij
表示第i个工人的第j个能力变量值；y
ik
表示第i个工人的第k个动机变量值。7.如权利要求4所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所述阈值线模型，包括：motivition＝m
i-m
f
+βability＝a
i-a
f
+α
其中，a
i
表示第i个工人的能力值大小；m
i
表示第i个工人的动机值大小；m
f
为工人动机的kolmogorov平均值；a
f
为工人能力的kolmogorov平均值；α表示能力轴上调节的参数；β表示动机轴上调节的参数；且通过构建损失函数lost，运用五折交叉验证训练α、β使lost收敛，取α、β的平均值作为最终结果。8.如权利要求7所述的一种基于机器学习的众包任务个性化推荐方法，其特征在于，所述基于训练好的工人分类模型，从待分类工人特征数据集中筛选出具有高动机高能力的工人，包括：当待分类工人的动机值和能力值均大于阈值线，则识别为高动机高能力的工人。9.一种基于机器学习的众包任务个性化推荐系统，所述系统包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1-8任一所述方法的步骤。

技术总结
本发明提供了一种基于机器学习的众包任务个性化推荐方法和系统，涉及任务调度技术领域。本发明根据众包竞赛的现有文献和众包平台的可用信息，基于融合动力、能力理论的福格行为学模型，构建了完整、精细的工人特征识别体系。同时通过爬取工人的历史数据，以及一段时间的任务数据，构建现在的工人-任务交互数据，形成涵盖工人过去、现在信息的工人数据集，更好的衡量工人特征。帮助平台快速识别具备高价值的工人，基于当选概率生成推荐列表，最终实现众包任务的个性化推荐。现众包任务的个性化推荐。现众包任务的个性化推荐。

技术研发人员：彭张林杨威张强陆效农万德全陈媛媛胡欣如
受保护的技术使用者：合肥工业大学
技术研发日：2022.06.02
技术公布日：2022/10/13

完整全部详细技术资料下载

当前第2页1 2