一种用户匹配方法、装置、计算机设备及存储介质与流程

文档序号:26050544发布日期:2021-07-27 15:25阅读:79来源:国知局
一种用户匹配方法、装置、计算机设备及存储介质与流程

本公开涉及数据处理技术领域,具体而言,涉及一种用户匹配方法、装置、计算机设备及存储介质。



背景技术:

在面对大量数据类型不同的无序数据时,通常采用数据处理(dataprocessing,dp)的方法对数据进行分析加工,以得到有价值和意义的结果;用户行为预测作为数据处理的重要应用场景,其在结果预测、决策、能力分析确定等方面应用广泛。



技术实现要素:

本公开实施例至少提供一种用户匹配方法、装置、计算机设备、及存储介质。

第一方面,本公开实施例提供了一种用户匹配方法,包括:

获取第一用户针对目标课程的第一特征数据;基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果;基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户。

在一种可能的实施方式中,所述第一特征数据包括下述至少一种:课程推广信息的投放渠道对应的历史转化数据、历史课程订单数据、课程推广信息的操作数据、所述第一用户的历史课堂数据、所述第一用户的历史沟通数据、所述第一用户的历史订单数据。

在一种可能的实施方式中,所述课程推广信息包括:与至少一种正规课程对应的引流课的推广信息;所述课程推广信息的投放渠道对应的历史转化数据包括下述至少一种:课程推广信息在预设投放渠道下的投放次数、所述引流课对应的平均支付人数、所述引流课对应的总支付人数、所述引流课对应的平均到课人数、所以引流课对应的总到课人数、所述正规课程对应的平均支付人数、所述正规课程对应的总支付人数;所述历史课程订单数据包括下述至少一种:所述历史课程订单对应的渠道信息、地域信息、课程费用的结算方式和支付方式、所述历史课程订单对应用户的年龄以及性别;所述课程推广信息的操作数据包括下述至少一种:用户对所述课程推广信息的点击次数、用户对所述课程推广信息对应的推广网页页面的浏览时长、用户对所述课程推广信息的点击时段、通过所述课程推广信息对应的推广网页页面报名课程的订单数量;所述第一用户的历史课堂数据包括下述至少一种:所述第一用户的历史课程听课数据、历史课程互动数据、历史课程回放数据、历史课程测试数据、历史课程资源获取数据、以及历史课程作业数据;所述第一用户的历史沟通数据包括下述至少一种:所述第一用户历史关注课程推广信息的时长、历史点击课程推广信息的次数、历史添加带教老师联系方式的数量、历史课程沟通数据、对历史课程的评价数据、注册课程应用程序的注册数据;所述第一用户的历史订单数据包括下述至少一种:所述第一用户对应的历史引流课的订单数据、所述第一用户对应的历史正规课程的订单数据。

在一种可能的实施方式中,所述基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果,包括:利用预先训练的行为预测模型对所述第一特征数据进行行为预测处理,得到所述第一用户是否报名所述目标课程的预测结果。

在一种可能的实施方式中,还包括:获取多个所述第二用户分别对应的第二特征数据;基于所述第二特征数据得到多个所述第二用户分别对应的能力评价预测结果。

在一种可能的实施方式中,所述第二特征数据,包括:所述第二用户的历史带班数据、所述第二用户所带班级中的学生数据、所述第二用户对应的评价数据、所述第二用户与所带班级中学生的沟通数据。

在一种可能的实施方式中,所述第二用户的历史带班数据包括下述至少一种:历史带班的总学期数、历史带班的总数量、每个学期的平均带班数量、历史带班的学生总人数、每个学期对应的学生总人数;所述第二用户的所带班级中的学生数据包括下述至少一种:所述第二用户在带班过程中的总到课人数、总到课率、多个学期的平均到课人数、多个学期的平均到课率、各学期的每班到课人数、各学期的每班到课率、第二用户带教学生报名正规课的人数、报名正规课的学生在带教总学生数中的占比、平均每学期报名正规课的带教学生的人数、平均每学期报名正规课的学生在带教总学生数中的占比、平均每个带教班级报名正规课程的学生人数、平均每个班级报名正规课的学生人数在班级总学生人数中的占比;所述第二用户对应的评价数据包括下述至少一种:学生对所述第二用户的评价数据、其他用户对所述第二用户的评价数据;所述第二用户与所带班级中学生的沟通数据包括下述至少一种:与多个学期学生的平均电话沟通次数和平均沟通时间、多个学期中每个学期学生的平均电话沟通次数和平均沟通时间、每个班级群发消息的次数、每个学期平均群发消息的次数、每个学期私聊学生的数量在该学期学生总数量中的占比、每个学期私聊学生时发送的语音信息数量在总信息数量中的占比、每个学期私聊学生时发送图像信息数量在总信息数量中的占比。

在一种可能的实施方式中,所述基于所述第二特征数据得到多个所述第二用户分别对应的能力评价预测结果,包括:利用预先训练的能力预测模型对多个所述第二用户分别对应的所述第二特征数据进行预测处理,得到多个所述第二用户分别对应的能力评价预测结果。

在一种可能的实施方式中,所述基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户,包括:基于所述第一用户的预测结果,对所述第一用户进行排序;基于多个所述第二用户的能力评价预测结果,对多个所述第二用户进行排序;基于多个第二用户中每个第二用户对应的学生数量、所述第一用户的排序序号、以及多个第二用户分别对应的排序序号,为所述第一用户匹配目标第二用户。

第二方面,本公开实施例还提供一种用户匹配装置,包括:

获取模块,用于获取第一用户针对目标课程的第一特征数据;

第一处理模块,用于基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果;

第二处理模块,用于基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户。

在一种可能的实施方式中,所述第一特征数据包括下述至少一种:课程推广信息的投放渠道对应的历史转化数据、历史课程订单数据、课程推广信息的操作数据、所述第一用户的历史课堂数据、所述第一用户的历史沟通数据、所述第一用户的历史订单数据。

在一种可能的实施方式中,所述课程推广信息包括:与至少一种正规课程对应的引流课的推广信息;所述课程推广信息的投放渠道对应的历史转化数据包括下述至少一种:课程推广信息在预设投放渠道下的投放次数、所述引流课对应的平均支付人数、所述引流课对应的总支付人数、所述引流课对应的平均到课人数、所以引流课对应的总到课人数、所述正规课程对应的平均支付人数、所述正规课程对应的总支付人数;所述历史课程订单数据包括下述至少一种:所述历史课程订单对应的渠道信息、地域信息、课程费用的结算方式和支付方式、所述历史课程订单对应用户的年龄以及性别;所述课程推广信息的操作数据包括下述至少一种:用户对所述课程推广信息的点击次数、用户对所述课程推广信息对应的推广网页页面的浏览时长、用户对所述课程推广信息的点击时段、通过所述课程推广信息对应的推广网页页面报名课程的订单数量;所述第一用户的历史课堂数据包括下述至少一种:所述第一用户的历史课程听课数据、历史课程互动数据、历史课程回放数据、历史课程测试数据、历史课程资源获取数据、以及历史课程作业数据;所述第一用户的历史沟通数据包括下述至少一种:所述第一用户历史关注课程推广信息的时长、历史点击课程推广信息的次数、历史添加带教老师联系方式的数量、历史课程沟通数据、对历史课程的评价数据、注册课程应用程序的注册数据;所述第一用户的历史订单数据包括下述至少一种:所述第一用户对应的历史引流课的订单数据、所述第一用户对应的历史正规课程的订单数据。

在一种可能的实施方式中,在基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果时,所述第一处理模块,具体用于利用预先训练的行为预测模型对所述第一特征数据进行行为预测处理,得到所述第一用户是否报名所述目标课程的预测结果。

在一种可能的实施方式中,所述第二处理模块,还用于获取多个所述第二用户分别对应的第二特征数据;基于所述第二特征数据得到多个所述第二用户分别对应的能力评价预测结果。

在一种可能的实施方式中,所述第二特征数据,包括:所述第二用户的历史带班数据、所述第二用户所带班级中的学生数据、所述第二用户对应的评价数据、所述第二用户与所带班级中学生的沟通数据。

在一种可能的实施方式中,所述第二用户的历史带班数据包括下述至少一种:历史带班的总学期数、历史带班的总数量、每个学期的平均带班数量、历史带班的学生总人数、每个学期对应的学生总人数;所述第二用户的所带班级中的学生数据包括下述至少一种:所述第二用户在带班过程中的总到课人数、总到课率、多个学期的平均到课人数、多个学期的平均到课率、各学期的每班到课人数、各学期的每班到课率、第二用户带教学生报名正规课的人数、报名正规课的学生在带教总学生数中的占比、平均每学期报名正规课的带教学生的人数、平均每学期报名正规课的学生在带教总学生数中的占比、平均每个带教班级报名正规课程的学生人数、平均每个班级报名正规课的学生人数在班级总学生人数中的占比;所述第二用户对应的评价数据包括下述至少一种:学生对所述第二用户的评价数据、其他用户对所述第二用户的评价数据;所述第二用户与所带班级中学生的沟通数据包括下述至少一种:与多个学期学生的平均电话沟通次数和平均沟通时间、多个学期中每个学期学生的平均电话沟通次数和平均沟通时间、每个班级群发消息的次数、每个学期平均群发消息的次数、每个学期私聊学生的数量在该学期学生总数量中的占比、每个学期私聊学生时发送的语音信息数量在总信息数量中的占比、每个学期私聊学生时发送图像信息数量在总信息数量中的占比。

在一种可能的实施方式中,在基于所述第二特征数据得到多个所述第二用户分别对应的能力评价预测结果时,所述第二处理模块,具体用于利用预先训练的能力预测模型对多个所述第二用户分别对应的所述第二特征数据进行预测处理,得到多个所述第二用户分别对应的能力评价预测结果。

在一种可能的实施方式中,在基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户时,所述第二处理模块,具体用于基于所述第一用户的预测结果,对所述第一用户进行排序;基于多个所述第二用户的能力评价预测结果,对多个所述第二用户进行排序;基于多个第二用户中每个第二用户对应的学生数量、所述第一用户的排序序号、以及多个第二用户分别对应的排序序号,为所述第一用户匹配目标第二用户。

第三方面,本公开可选实现方式还提供一种计算机设备,处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

第四方面,本公开可选实现方式还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

关于上述用户匹配装置、计算机设备、及计算机可读存储介质的效果描述参见上述匹配方法的说明,这里不再赘述。

本公开实施例提供的用户匹配方法、装置、计算机设备及存储介质,基于第一用户针对目标课程的第一特征数据得到对第一用户是否报名目标课程进行预测的预测结果,并基于对第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个第二用户中为第一用户匹配目标第二用户,这样实现了针对第一用户的预测结果和第二用户的能力预测结果为第一用户匹配合适的第二用户,提高了第一用户与第二用户匹配的合理性、减少资源浪费的情况,并提升报名目标课程的用户的留存率。

为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种用户匹配方法的流程图;

图2示出了本公开实施例所提供的一种获取第一用户的第一特征数据的具体方法流程图;

图3示出了本公开实施例所提供的一种利用预先训练的行为预测模型对第一特征数据进行行为预测处理,得到第一用户是否报名目标课程的预测结果的具体方法流程图;

图4示出了本公开实施例所提供的一种训练行为预测模型的方法流程图;

图5示出了本公开实施例所提供的一种用户匹配方法的具体实施方式流程图;

图6示出了本公开实施例所提供的一种用户匹配装置的示意图;

图7示出了本公开实施例所提供的一种计算机设备的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

经研究发现,在线教育的场景下,为了吸引学生报名目标课程,会设置该目标课程的引流课,学生通过参与引流课确定是否要报名目标课程。当前通常采用随机分班的方式为学生分配对应的教师。但是实际上,报名参与引流课的学生对引流课的出勤率不同,对参加引流课的学生进行随机分班,可能会使一些带教能力较为优秀的老师匹配到一些课程出勤率较低的学生,导致教师资源的浪费;另外,也会因为带教老师的带教能力无法达到有些学生的要求,而造成报名引流课对应的目标课程意愿较高的学生流失。

基于上述研究,本公开提供了一种用户匹配方法、装置、计算机设备及存储介质,基于第一用户针对目标课程的第一特征数据得到对第一用户是否报名目标课程进行预测的预测结果,并基于对第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个第二用户中为第一用户匹配目标第二用户,这样实现了针对第一用户的预测结果和第二用户的能力评价预测结果为第一用户匹配合适的第二用户,提高了第一用户与第二用户匹配的合理性,减少资源浪费的情况,并提升报名目标课程的用户的留存率。

针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本实施例进行理解,首先对本公开实施例所公开的一种用户匹配方法进行详细介绍,本公开实施例所提供的用户匹配方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(userequipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(personaldigitalassistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该用户匹配方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

本公开实施例所提供的用户匹配方法,例如可以应用于在线教育对学生和老师进行分班匹配的场景中。

下面对本公开实施例中的一些名词加以解释说明:

本公开实施例所述的目标课程例如为针对各种课程类型的正规课,其中,课程类型例如包括下述至少一种:语文、数学、英语、生物、物理、化学、政治、地理等;引流课例如包括针对每一目标课程设置的前序课、试听课程、目标课程的动员讲座、目标课程的知识讲座等至少一种。

本公开所述的开课学期中的每一开课学期例如包含两个阶段,第一阶段例如包括目标课程对应的引流课的报名和开课阶段;第二阶段例如包括目标课程的报名和开课阶段。

下面以执行主体为服务器为例,对本公开实施例提供的用户匹配方法加以说明。

参见图1所示,为本公开实施例提供的用户匹配方法的流程图,所述方法包括步骤s101~s103,其中:

s101:获取第一用户针对目标课程的第一特征数据。

其中,第一用户例如包括:通过各种报名渠道报名目标课程对应的引流课的学生;例如,通过线上各种社交软件、浏览器的广告页面报名引流课的学生,或者到线下指定地点报名引流课的学生。

另外,第一特征数据例如包括下述(a)~(f)至少一种:

(a)课程推广信息的投放渠道对应的历史转化数据。其中,课程推广信息例如包括:目标课程、引流课在当前开课学期以及历史开课学期的宣传信息、广告等;投放渠道例如包括下述至少一种:各种社交软件、浏览器、在线教育应用程序、网页、线下门店、线下宣传点等。

示例性的,课程推广信息的投放渠道对应的历史转化数据例如包括下述至少一种:课程推广信息在预设投放渠道下的投放次数、引流课对应的平均支付人数、引流课对应的总支付人数、引流课对应的平均到课人数、引流课对应的总到课人数、正规课程对应的平均支付人数、正规课程对应的总支付人数。

(b)历史课程订单数据。其中,历史课程例如包括下述至少一种:在历史开课学期开课的正规课程、引流课、以及在历史开课学期开课的目标课程。

示例性的,历史课程订单数据例如包括下述至少一种:历史课程订单对应的渠道信息、地域信息(例如xx省xx市xx县xx镇)、课程费用的结算方式(例如按天结算、按月结算或者按照季度结算等)和支付方式(例如线上支付或者线下支付;线上支付的具体方式例如:通过社交平台支付、通过网页支付、通过浏览器支付、通过在线教育应用程序支付等;线下支付的方式例如:现金、银行卡或者信用卡等)、历史课程订单对应用户的年龄以及性别。

(c)课程推广信息的操作数据。

示例性的,课程推广信息的操作数据例如包括下述至少一种:用户对课程推广信息的点击次数、用户对课程推广信息对应的推广网页页面的浏览时长、用户对课程推广信息的点击时段、通过课程推广信息对应的推广网页页面报名课程的订单数量;此处,用户例如包括第一用户、学生家长、以及浏览课程推广信息的其他人员。

另外,第一用户除在当前开课学期报名了引流课,还可能在历史开课学期报名过正规课、以及引流课,因此第一特征数据例如还包括下述(d)~(f)至少一种:

(d)第一用户的历史课堂数据。

示例性的,第一用户的历史课堂数据例如包括下述至少一种:第一用户的历史课程听课数据(例如包括:第一用户针对报名的历史课程的出勤率、听课时长等至少一种)、历史课程互动数据(例如包括第一用户回答问题的次数、提问的次数、参与课堂讨论的次数、发弹幕或者文字消息的次数等至少一种)、历史课程回放数据(例如包括:第一用户对历史课程回放次数、历史课程回放时长、历史课程回放时间段等至少一种)、历史课程测试数据(例如包括:第一用户参与历史课程测试的次数、历史课程测试成绩、历史课程测试方式等至少一种)、历史课程资源获取数据(例如包括:第一用户在历史课程中获得奖励、评分等)、以及历史课程作业数据(例如包括:第一用户的历史课程作业的完成次数、历史课程作业总量、历史课程作业完成率、历史课程作业评分等至少一种)。

(e)第一用户的历史沟通数据。

示例性的,第一用户的历史沟通户数例如包括下述至少一种:第一用户历史关注课程推广信息的时长、历史点击课程推广信息的次数、历史添加带教老师联系方式的数量、历史课程沟通数据(例如包括:第一用户添加历史课程群的数量、在历史课程群中的发信息次数、在历史课程群中的活跃天数、在历史课程群中发送文本信息在总发送信息中的占比、在历史课程群中发送语音信息在总发送信息中的占比、在历史课程群中发送表情包信息在总发送信息中的占比等至少一种)、对历史课程的评价数据(例如包括:第一用户评价历史课程的数量、评价历史课程的课程类型、评价每一历史课程的平均字数、评价每一历史课程的平均评分、对历史课程的差评次数等至少一种)、注册课程应用程序的注册数据(例如包括:第一用户是否注册过课程应用程序、注册课程应用程序的时间点、注册课程应用程序的时间点到当前时间点的时长等至少一种)。

(f)第一用户的历史订单数据。

示例性的,第一用户的历史订单数据例如包括下述至少一种:第一用户对应的历史引流课的订单数据(例如包括:第一用户对应的历史引流课的总订单数量、历史引流课的退课次数、历史引流课的课程类型、报名价格、支付价格、历史引流课的课程节数、历史引流课程的开课时间、历史引流课程的结课时间等至少一种)、第一用户对应的历史正规课程的订单数据(例如包括:第一用户对应的历史正规课程的总订单数量、历史正规课程的退课次数、历史正规课程的课程类型、报名价格、支付价格、历史正规课程的课程节数、历史正规课程的开课时间、历史正规课程的结课时间等至少一种)。

参见图2所示,本公开实施例还提供了一种获取第一用户的第一特征数据的具体方法,包括:

s201:获取目标课程对应的引流课的报名支付时间。

此处,在确定目标课程的情况下,确定目标课程对应的引流课的报名支付时间。

s202:基于目标课程对应的引流课的报名支付时间获取第一特征数据。

此处,基于目标课程对应的引流课的报名支付时间获取第一特征数据例如包括:在数据库中时间节点在目标课程对应的引流课的报名支付时间以前的目标数据中,获取第一用户的第一特征数据。

承接上述s101,本公开实施例提供的用户匹配方法,还包括:

s102:基于第一特征数据得到对第一用户是否报名目标课程进行预测的预测结果。

此处,第一用户是否报名目标课程例如包括第一用户是否报名当前开课学期目标课程对应的正规课程。

具体的,基于第一特征数据得到对第一用户是否报名目标课程进行预测的预测结果时,例如利用预先训练的行为预测模型对第一特征数据进行行为预测处理,得到第一用户是否报名目标课程的预测结果。

参见图3所示,为本公开实施例所提供的一种利用预先训练的行为预测模型对第一特征数据进行行为预测处理,得到第一用户是否报名目标课程的预测结果的具体方法,包括:

s301:将第一用户的第一特征数据作为输入,输入到预先训练的行为预测模型中。

此处,由于第一特征数剧中包含多种数据类型的数据,且数据量较大,因此在输入第一特征数据前,还包括对第一特征数据进行预处理,其中,预处理的方法包括但不限于下述至少一种:缺失值处理、特征离散化处理、特征选择处理、特征交叉处理、及特征归一化处理。

示例性的,在预处理包括缺失值处理的情况下,可以将缺失的数据使用与确定数据属性相同的其他数据的众数进行填充;例如在获取五次课程签到信息时,只获取到四次已签到的签到记录,存在一个不确定是否已签到的签到记录的情况下,对不确定的签到信息填充已签到的记录。或者,在预处理包括缺失值处理的情况下,可以将缺失的数据按照预设数据进行填充,例如在获取历史课程订单的地域信息时,只获取到了历史课程订单的省级地域信息,而不确定历史课程订单的市级、县级、镇级的地域信息,对不确定的地域信息填充预设数据“未知”。

示例性的,在预处理包括特征离散化处理的情况下,可以将不具备大小意义的特征,例如包括结算方式、支付方式等进行独热编码(one-hot)操作,将特征转化为可计算处理的向量。

示例性的,在预处理包括特征选择处理的情况下,例如可以对第一特征数据进行特征相关性分析,并选择代表特征,去除高相关的特征。此时,还可以去除部分特征相关度较高的数据以减少需要进行处理的数据量。

示例性的,在预处理包括特征归一化的情况下,例如可以将第一特征数据映射到预设区间上,预设区间例如为[0,1],以减小异常数据带来的影响。

在进行了预处理后,即能够得到可用于计算机处理的第一特征数据,将处理后的第一特征数据输入到行为预测模型中。

s302:将行为预测模型的输出作为第一用户是否报名目标课程的预测结果。

其中,预测结果例如包括:愿意报名目标课程、以及该愿意报名目标课程的权重;或者不愿意报名目标课程、以及该不愿意报名目标课程的权重。

此处,行为预测模型例如包括梯度提升xgboost模型,参见图4所示,本公开实施例提供了一种训练行为预测模型的方法,包括:

s401:获取多个样本用户的样本特征数据。

其中,样本用户例如包括正样本用户、负样本用户。在获取样本用户的样本特征数据时,例如可以采用下述方法:

获取历史开课学期中报名引流课的学生的出勤率;其中,出勤率=(学生观看直播的引流课节数+学生观看课程回放的引流课节数)/学生报名引流课的节数*100%;将出勤率大于或者等于30%的学生作为正样本用户,或者将报名该引流课对应的正规课的学生作为正样本用户,记该引流课程的结束时间为t1,前序课结束后前序课可回放预设天数,前序课结束后正规课的报名支付时间t3=t1+预设天数,基于t3从数据库中确定正样本用户对应的样本特征数据;将出勤率小于30%并且之后没有报名该引流课的对应的正规课的学生作为负样本用户,基于t3从数据库中确定负样本用户对应的样本特征数据。

s402:针对多个样本用户中的每个样本用户,利用行为预测模型对每个样本用户对应的样本特征数据进行行为预测处理,得到与每个样本用户对应的是否报名引流课程对应正规课程的样本预测结果;

s403:基于多个样本用户分别对应的样本预测结果,确定行为预测模型的模型损失,并基于模型损失,对行为预测模型进行训练。

此处,确定行为预测模型损失的方法例如包括:利用行为预测模型对多个样本用户的样本特征数据进行行为预测处理,得到对应于行为预测模型的样本预测结果,并与预先确定的标注预测结果计算差值以确定模型损失。

s404:经过对行为预测模型的多轮训练,得到训练好的行为预测模型。

此处,在训练行为预测模型和测试行为预测模型时,例如还可以采取模型评估指标(areaundercurve,auc)对行为预测模型进行评估,同时引入模型概率值>=正样本时的准确率、正样本>模型概率值>=负样本时的准确率、以及模型预测值<负样本的样本用户的准确率来评估的概念,通过不同域值划分为3层,评价每层样本用户报名正规课程的准确率。

本公开实施例提供一种针对xgboost模型的参数范围:决策树的棵数n_estimators选定范围为:50-1000;学习率,控制每次迭代更新权重的步长learning_rate范围为:0.01-0.5;每棵二叉树的最大深度max_depth范围为:3-10;最小叶子结点权重min_child_weight范围为:1-8;惩罚系数gamma范围为:0-0.5;随机选择多少样本建立决策树subsample范围为:0.5-1.0;随机选择多少样本特征建立决策树colsample_bytree范围为:0.5-1.0;l1正则化系数reg_alpha范围为:0.0001-100。

承接上述s302,行为预测模型基于输入的第一特征数据,会输出对应的标签值,例如“1”或“0”,并输出每个标签值对应的预测值;“1”代表愿意报名目标课程、“1”的预测值代表该愿意报名目标课程的权重;“0”表示不愿意报名目标课程、“0”的预测值代表该不愿意报名目标课程的权重。

承接上述s102,本公开实施例提供的用户匹配方法,还包括:

s103:基于第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个第二用户中为第一用户匹配目标第二用户。

此处,第二用户例如包括带教正规课程、引流课的带教老师等。

具体的,多个第二用户分别对应的能力评价预测结果例如通过下述方式获取:获取多个第二用户分别对应的第二特征数据;基于第二特征数据得到多个第二用户分别对应的能力评价预测结果。

其中,第二特征数据例如包括下述(1)~(4)至少一种:

(1)第二用户的历史带班数据。

示例性的,第二用户的历史带班数据例如包括下述至少一种:历史带班的总学期数、历史带班的总数量、每个学期的平均带班数量、历史带班的学生总人数、每个学期对应的学生总人数。

(2)第二用户所带班级中的学生数据。

示例性的,第二用户所带班级中的学生数据例如包括下述至少一种:第二用户在带班过程中的总到课人数、总到课率、多个学期的平均到课人数、多个学期的平均到课率、各学期的每班到课人数、各学期的每班到课率、第二用户带教学生报名正规课的人数、报名正规课的学生在带教总学生数中的占比、平均每学期报名正规课的带教学生的人数、平均每学期报名正规课的学生在带教总学生人数中的占比、平均每个带教班级报名正规课程的学生人数、平均每个班级报名正规课的学生人数在班级总学生人数中的占比。

(3)第二用户对应的评价数据。

示例性的,第二用户对应的评价数据例如包括下述至少一种:

学生对第二用户的评价数据,例如包括:第二用户带教学生对第二用户的总评分、平均每一学生对第二用户的评分、最近一个开课学期学生对第二用户的平均评分、最近三个开课学期中前序课学生对第二用户的平均评分、最近三个学期学生对第二用户平均评分低于40分的占比、最近三个学期学生对第二用户平均评分高于90分的占比等中至少一种。

其他用户(例如其他代课教师、领导)对第二用户的评价数据,例如包括:最近一个月其他代课教师对第二用户的平均评分、最近一个月其他代课教师对第二用户低于10个字的评价在所有文字评价中的占比、最近一个月其他代课教师对第二用户的平均评分低于40分的占比、最近一个月其他代课教师对第二用户的平均评分高于90分的占比、最近三个月其他代课教师对第二用户的平均评分、最近三个月其他代课教师对第二用户低于10个字的评价在所有文字评价中的占比、最近三个月其他代课教师对第二用户的平均评分低于40分的占比、最近三个月其他代课教师对第二用户的平均评分高于90分的占比、最近一个月上级领导对第二用户的平均评分、最近一个月上级领导对第二用户低于10个字的评价在所有文字评价中的占比、最近一个月上级领导对第二用户的平均评分低于40分的占比、最近一个月上级领导对第二用户的平均评分高于90分的占比等中至少一种。

(4)第二用户与所带班级中学生的沟通数据。

示例性的,第二用户与所带班级中学生的沟通数据例如包括下述至少一种:与多个学期学生的平均电话沟通次数和平均沟通时间、多个学期中每个学期学生的平均电话沟通次数和平均沟通时间、每个班级群发消息的次数、每个学期平均群发消息的次数、每个学期私聊学生的数量在该学期学生总数量中的占比、每个学期私聊学生时发送的语音信息数量在总信息数量中的占比、每个学期私聊学生时发送图像信息数量在总信息数量中的占比。

具体的,获取多个第二用户分别对应的第二特征数据时,例如基于第二用户最近历史开课学期带教课程结束的时间,从数据库中获取第二特征数据。

另外,基于第二特征数据得到多个第二用户分别对应的能力评价预测结果时,例如可以利用预先训练的能力预测模型对多个第二用户分别对应的第二特征数据进行预测处理,得到多个第二用户分别对应的能力评价预测结果。

其中,基于第二特征数据得到多个第二用户分别对应的能力评价预测结果时,因为第二特征数据中也包含多种数据类型的数据,因此需要对第二特征数据进行预处理,对第二特征数剧进行预处理的方式与对第一特征数据进行预处理的方式类似,此处不再赘述。

此处,能力预测模型例如包括单标签三分类模型(k-nearestneighbor,knn),训练能力预测模型的方法与上述训练行为预测模型的方法类似,此处不再赘述;能力预测模型基于第二用户对应的第二特征数据,输出对每个教师的能力评价预测结果,例如包括:能力等级、以及该能力等级对应的预测值。

本公开实施例提供一种针对knn的参数范围:k值n_neighbors范围为:2-10之间;标识每个样本的近邻样本的权重weights选择uniform;限定半径最近邻法使用的算法algorithm选择kd_tree;使用kd树或者球树时,停止建子树的叶子节点数量的阈值leaf_size选择20-50之间;metric默认选择。

承接上述s103,在确定多个第二用户分别对应的能力评价预测结果后,基于第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个第二用户中为所述第一用户匹配目标第二用户时,例如:

步骤1:基于第一用户的预测结果,对第一用户进行排序。

示例性的,先基于每一第一用户的预测结果中的标签值对第一用户进行排序,标签值为“1”的排在前,标签值为“0”的排在后边;在标签值相同的情况下,基于每一标签值对应的预测值对第一用户进行排序,例如将标签值相同的按照预测值降序排列。

步骤2:基于多个第二用户的能力评价预测结果,对多个第二用户进行排序。

示例性的,先基于每一第二用户的能力评价预测结果的能力等价对第二用户进行排序,例如一共a、b、c三个等级,按照等级a、等级b、等级c排序;在能力等级相同的情况下,基于每一能力等级对应的预测值对第二用户进行排序,例如将能力等级相同的按照预测值降序排列。

步骤3:基于多个第二用户中每个第二用户对应的学生数量、第一用户的排序序号、以及多个第二用户分别对应的排序序号,为第一用户匹配目标第二用户。

示例性的,一共100个第一用户,基于每个第一用户对应的预测结果对第一用户排序,排第一的第一用户的排序序号为1,排第二的第一用户的排序序号为2,…此次类推,直至排第一百的第一用户的排序序号为100;一共五个第二用户,每个第二用户对应于20个学生,基于每一第二用户的能力评价预测结果多个第二用户进行排序,排第一的第二用户的排序序号为1,排第二的第二用户的排序序号为2,…此次类推,直至排第五的第二用户的排序序号为5,则为排序序号1-20的第一用户匹配的目标第二用户为排第一的第二用户;为21-40的第一用户匹配的目标第二用户为排第二的第二用户;为41-60的第一用户匹配的目标第二用户为排第三的第二用户;为61-80的第一用户匹配的目标第二用户为排第四的第二用户;为81-100的第一用户匹配的目标第二用户为排第五的第二用户。

参见图5所示,为本公开实施例提供的一种用户匹配方法的具体实施方式,包括:

s501:将第一用户的第一特征数据输入行为预测模型,得到第一用户的行为预测结果。

此处,行为预测模型的作用时间为第一用户在当前开课学期报名引流课后,对第一用户进行分班的时间点。

s502:基于每一第一用户的行为预测结果对第一用户进行排序,跳转至步骤s505。

s503:将第二用户的第二特征数据输入能力预测模型,得到第二用户的能力评价预测结果。

此处,能力预测模型的作用时间为第二用户最近一个历史开课学期的带教课程结束时间到第一用户在当前开课学期报名引流课后对第一用户进行分班的时间之间的任一时间点。

s504:基于多个第二用户的能力评价预测结果,对多个第二用户进行排序,跳转至步骤s505。

s505:基于多个第二用户中每个第二用户对应的学生数量、第一用户的排序序号、以及多个第二用户分别对应的排序序号,为第一用户匹配目标第二用户。

本公开实施例基于第一用户针对目标课程的第一特征数据得到对第一用户是否报名目标课程进行预测的预测结果,并基于对第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个第二用户中为第一用户匹配目标第二用户,这样实现了针对第一用户的预测结果和第二用户的能力预测结果为第一用户匹配合适的第二用户,提高了第一用户与第二用户匹配的合理性,减少资源浪费的情况,并提升报名目标课程的用户的留存率。

本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一发明构思,本公开实施例中还提供了与用户匹配方法对应的用户匹配装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述用户匹配方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

参照图6所示,为本公开实施例提供的一种用户匹配装置的示意图,该匹配装置应用于服务器,所述装置包括:获取模块601、第一处理模块602、第二处理模块603;其中,

获取模块601,用于获取第一用户针对目标课程的第一特征数据;

第一处理模块602,用于基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果;

第二处理模块603,用于基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户。

在一种可能的实施方式中,所述第一特征数据包括下述至少一种:课程推广信息的投放渠道对应的历史转化数据、历史课程订单数据、课程推广信息的操作数据、所述第一用户的历史课堂数据、所述第一用户的历史沟通数据、所述第一用户的历史订单数据。

在一种可能的实施方式中,所述课程推广信息包括:与至少一种正规课程对应的引流课的推广信息;所述课程推广信息的投放渠道对应的历史转化数据包括下述至少一种:课程推广信息在预设投放渠道下的投放次数、所述引流课对应的平均支付人数、所述引流课对应的总支付人数、所述引流课对应的平均到课人数、所以引流课对应的总到课人数、所述正规课程对应的平均支付人数、所述正规课程对应的总支付人数;所述历史课程订单数据包括下述至少一种:所述历史课程订单对应的渠道信息、地域信息、课程费用的结算方式和支付方式、所述历史课程订单对应用户的年龄以及性别;所述课程推广信息的操作数据包括下述至少一种:用户对所述课程推广信息的点击次数、用户对所述课程推广信息对应的推广网页页面的浏览时长、用户对所述课程推广信息的点击时段、通过所述课程推广信息对应的推广网页页面报名课程的订单数量;所述第一用户的历史课堂数据包括下述至少一种:所述第一用户的历史课程听课数据、历史课程互动数据、历史课程回放数据、历史课程测试数据、历史课程资源获取数据、以及历史课程作业数据;所述第一用户的历史沟通数据包括下述至少一种:所述第一用户历史关注课程推广信息的时长、历史点击课程推广信息的次数、历史添加带教老师联系方式的数量、历史课程沟通数据、对历史课程的评价数据、注册课程应用程序的注册数据;所述第一用户的历史订单数据包括下述至少一种:所述第一用户对应的历史引流课的订单数据、所述第一用户对应的历史正规课程的订单数据。

在一种可能的实施方式中,在基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果时,所述第一处理模块,具体用于利用预先训练的行为预测模型对所述第一特征数据进行行为预测处理,得到所述第一用户是否报名所述目标课程的预测结果。

在一种可能的实施方式中,所述第二处理模块,还用于获取多个所述第二用户分别对应的第二特征数据;基于所述第二特征数据得到多个所述第二用户分别对应的能力评价预测结果。

在一种可能的实施方式中,所述第二特征数据,包括:所述第二用户的历史带班数据、所述第二用户所带班级中的学生数据、所述第二用户对应的评价数据、所述第二用户与所带班级中学生的沟通数据。

在一种可能的实施方式中,所述第二用户的历史带班数据包括下述至少一种:历史带班的总学期数、历史带班的总数量、每个学期的平均带班数量、历史带班的学生总人数、每个学期对应的学生总人数;所述第二用户的所带班级中的学生数据包括下述至少一种:所述第二用户在带班过程中的总到课人数、总到课率、多个学期的平均到课人数、多个学期的平均到课率、各学期的每班到课人数、各学期的每班到课率、第二用户带教学生报名正规课的人数、报名正规课的学生在带教总学生数中的占比、平均每学期报名正规课的带教学生的人数、平均每学期报名正规课的学生在带教总学生数中的占比、平均每个带教班级报名正规课程的学生人数、平均每个班级报名正规课的学生人数在班级总学生人数中的占比;所述第二用户对应的评价数据包括下述至少一种:学生对所述第二用户的评价数据、其他用户对所述第二用户的评价数据;所述第二用户与所带班级中学生的沟通数据包括下述至少一种:与多个学期学生的平均电话沟通次数和平均沟通时间、多个学期中每个学期学生的平均电话沟通次数和平均沟通时间、每个班级群发消息的次数、每个学期平均群发消息的次数、每个学期私聊学生的数量在该学期学生总数量中的占比、每个学期私聊学生时发送的语音信息数量在总信息数量中的占比、每个学期私聊学生时发送图像信息数量在总信息数量中的占比。

在一种可能的实施方式中,在基于所述第二特征数据得到多个所述第二用户分别对应的能力评价预测结果时,所述第二处理模块,具体用于利用预先训练的能力预测模型对多个所述第二用户分别对应的所述第二特征数据进行预测处理,得到多个所述第二用户分别对应的能力评价预测结果。

在一种可能的实施方式中,在基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户时,所述第二处理模块,具体用于基于所述第一用户的预测结果,对所述第一用户进行排序;基于多个所述第二用户的能力评价预测结果,对多个所述第二用户进行排序;基于多个第二用户中每个第二用户对应的学生数量、所述第一用户的排序序号、以及多个第二用户分别对应的排序序号,为所述第一用户匹配目标第二用户。

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。

本公开实施例还提供了一种计算机设备,如图7所示,为本公开实施例提供的计算机设备结构示意图,包括:

处理器71和存储器72;所述存储器72存储有处理器71可执行的机器可读指令,处理器71用于执行存储器72中存储的机器可读指令,所述机器可读指令被处理器71执行时,处理器71执行下述步骤:

获取第一用户针对目标课程的第一特征数据;

基于所述第一特征数据得到对所述第一用户是否报名所述目标课程进行预测的预测结果;

基于所述第一用户的预测结果、以及多个第二用户分别对应的能力评价预测结果,从多个所述第二用户中为所述第一用户匹配目标第二用户。

上述存储器72包括内存721和外部存储器722;这里的内存721也称内存储器,用于暂时存放处理器71中的运算数据,以及与硬盘等外部存储器722交换的数据,处理器71通过内存721与外部存储器722进行数据交换。

上述指令的具体执行过程可以参考本公开实施例中所述的用户匹配方法的步骤,此处不再赘述。

本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的用户匹配方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的用户匹配方法的步骤,具体可参见上述方法实施例,在此不再赘述。

其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(softwaredevelopmentkit,sdk)等等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1