用户特征群中用户特征寻优方法、装置、介质及电子设备与流程

文档序号:18902244发布日期:2019-10-18 22:06阅读:234来源:国知局
用户特征群中用户特征寻优方法、装置、介质及电子设备与流程

本公开涉及机器学习应用技术领域,具体而言,涉及一种用户特征群中用户特征寻优方法、装置、介质及电子设备。



背景技术:

用户特征群中用户特征寻优就是从拥有大量用户特征的用户特征群中寻找满足需求的特殊用途的用户特征组合,即从用户特征群中寻找优化用户特征。例如,从用户特征用户特征群中寻找满足需求的用户特征组合,以求得到可以满足预定目的的一群用户组合。

目前,进行用户特征群中用户特征寻优的主要是通过从用户用户特征群中爬去关键字,基于不同的关键字设置对应的权重系数,然后通过权重系数计算出满足需求的用户特征组合。这样,在用户特征寻优过程中,不能够考虑到所有用户特征群中用户特征之间的区别,获取到的用户特征组合存在组合不合理的问题,且用户特征组合获取的过程需要进行大量数据的统计,算法负荷大,获取效率低。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。



技术实现要素:

本公开的目的在于提供一种用户特征群中用户特征寻优方案,进而至少在一定程度上通过机器学习模型根据部分用户特征组合的区别特征准确、高效预测寻优目标对应的用户特征组合,进而保证目标用户特征组合获取的高效性和准确性。

根据本公开的一个方面,提供一种用户特征群中用户特征寻优方法,包括:

基于目标用户特征群,初始化生成多个用户特征组合;

将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;

获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;

获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;

将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;

基于所述预测优化用户特征组合,从所述目标用户特征群中获取目标优化用户特征组合。

在本公开的一种示例性实施例中,所述基于目标用户特征群,初始化生成多个用户特征组合,包括:

从所述目标用户特征群中,依次分别获取预定数目个用户特征,其中,每次获取时的所述预定数目比前一次多预定个数个;

依次分别将获取的所述预定数目个用户特征,按照所述目标用户特征群的排列规则排列成用户特征串,得到多个用户特征组合。

在本公开的一种示例性实施例中,所述基于目标用户特征群,初始化生成多个用户特征组合,包括:

基于目标用户特征群,随机初始化生成预定数目个用户特征组合。

在本公开的一种示例性实施例中,在所述获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值之后,所述方法还包括:

如果有所述第一分数范围及所述第二分数范围没有获取到对应的用户特征组合,基于所述目标用户特征群,初始化生成预定组数个用户特征组合;

将所述用户特征组合分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;

获取所有所述评价分数中,大于第一预定阈值的多个第一分数范围的评价分数对应的用户特征组合,及低于第二预定阈值的多个第二分数范围的评价分数对应的用户特征组合

当所有所述第一分数范围及所述第二分数范围有获取到对应的用户特征组合,获取结束。

在本公开的一种示例性实施例中,所述获取获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别,包括:

从每个所述第一分数范围的用户特征组合中随机获取一个用户特征组合;

从每个所述第二分数范围的用户特征组合中随机获取一个用户特征组合;

获取每个所述第一分数范围的所述随机获取的一个用户特征组合与每个所述第二分数范围的所述随机获取的一个用户特征组合的用户特征区别,得到多个用户特征区别。

在本公开的一种示例性实施例中,所述获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别,包括:

获取每个所述第一分数范围的用户特征组合的第一用户特征组合要素;

获取每个第一分数范围对应的所述第二分数范围的用户特征组合的第二用户特征组合要素;

获取每个所述第一用户特征组合要素与每个所述第二用户特征组合要素的区别特征,得到每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别。

在本公开的一种示例性实施例中,所述第一机器学习模型的训练方法:

收集用户特征组合及寻优目标样本集,所述样本集中每个样本事先标定对应的评价分数;

将所述样本集中每个样本的输入数据分别输入机器学习模型,得到每个所述样本对应的评价分数;

如果存在有样本的输入数据输入机器学习模型后,得到样本对应的评价分数与对所述样本事先标定的评价分数不一致,则调整学习模型的系数,直到一致;

当所有的样本的输入数据输入机器学习模型后,得到的每个样本对应的评价分数与对每个所述样本事先标定的评价分数一致,训练结束。

根据本公开的一个方面,提供一种用户特征群中用户特征寻优装置,其特征在于,包括:

初始化模块,用于基于目标用户特征群,初始化生成多个用户特征组合;

评价模块,用于将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;

第一获取模块,用于获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;

第二获取模块,用于获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;

预测模块,用于将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;

优化特征获取模块,用于基于所述预测优化用户特征组合,从所述目标用户特征群中获取目标优化用户特征组合。

根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有用户特征群中用户特征寻优程序,其特征在于,所述用户特征群中用户特征寻优程序被处理器执行时实现上述任一项所述的方法。

根据本公开的一个方面,提供一种电子设备,其特征在于,包括:

处理器;以及

存储器,用于存储所述处理器的用户特征群中用户特征寻优程序;其中,所述处理器配置为经由执行所述用户特征群中用户特征寻优程序来执行上述任一项所述的方法。

本公开一种用户特征群中用户特征寻优方法及装置,首先,基于目标用户特征群,初始化生成多个用户特征组合;这样可以快速的获取少数几个用户特征组合,进而,将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;可以准确地对每个用户特征组合与寻优目标的适配性进行准确评估。然后,获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;这样可以根据评价分数准确地将多个用户特征组合分类,进而,通过获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;可以根据不同分数类别的用户特征组合的对比准确得到系列范围的用户特征区别,有效保证区别特征在后续步骤中进行优化用户特征组合分析的可靠性。然后,将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;这样可以高效准确地基于系列范围的用户特征区别预测到优化用户特征组合。进而,基于所述预测优化用户特征组合,可以高效、准确地从所述目标用户特征群中获取目标优化用户特征组合。以这种方式,通过机器学习模型根据部分用户特征组合的区别特征准确、高效预测寻优目标对应的用户特征组合,进而保证目标用户特征组合获取的高效性和准确性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示意性示出一种用户特征群中用户特征寻优方法的流程图。

图2示意性示出一种用户特征群中用户特征寻优方法的应用场景示例图。

图3示意性示出一种获取用户特征区别的方法流程图。

图4示意性示出一种用户特征群中用户特征寻优装置的方框图。

图5示意性示出一种用于实现上述用户特征群中用户特征寻优方法的电子设备示例框图。

图6示意性示出一种用于实现上述用户特征群中用户特征寻优方法的计算机可读存储介质。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

本示例实施方式中首先提供了用户特征群中用户特征寻优方法,该用户特征群中用户特征寻优方法可以运行于服务器,也可以运行于服务器集群或云服务器等,当然,本领域技术人员也可以根据需求在其他平台运行本发明的方法,本示例性实施例中对此不做特殊限定。参考图1所示,该用户特征群中用户特征寻优方法可以包括以下步骤:

步骤s110,基于目标用户特征群,初始化生成多个用户特征组合;

步骤s120,将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;

步骤s130,获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;

步骤s140,获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;

步骤s150,将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;

步骤s160,基于所述预测优化用户特征组合,从所述目标用户特征群中获取目标优化用户特征组合。

上述用户特征群中用户特征寻优方法中,首先,基于目标用户特征群,初始化生成多个用户特征组合;这样可以快速的获取少数几个用户特征组合,进而,将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;可以准确地对每个用户特征组合与寻优目标的适配性进行准确评估。然后,获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;这样可以根据评价分数准确地将多个用户特征组合分类,进而,通过获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;可以根据不同分数类别的用户特征组合的对比准确得到系列范围的用户特征区别,有效保证区别特征在后续步骤中进行优化用户特征组合分析的可靠性。然后,将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;这样可以高效准确地基于系列范围的用户特征区别预测到优化用户特征组合。进而,基于所述预测优化用户特征组合,可以高效、准确地从所述目标用户特征群中获取目标优化用户特征组合。以这种方式,通过机器学习模型根据部分用户特征组合的区别特征准确、高效预测寻优目标对应的用户特征组合,进而保证目标用户特征组合获取的高效性和准确性。

下面,将结合附图对本示例实施方式中上述用户特征群中用户特征寻优方法中的各步骤进行详细的解释以及说明。

在步骤s110中,基于目标用户特征群,初始化生成多个用户特征组合。

本示例的实施方式中,参考图2所示,服务器201从平台服务器202上获取目标用户特征群,然后基于目标用户特征群,初始化生成多个用户特征组合。这样可以由服务器201在后续步骤中根据初始化生成的多个用户特征组合进行用户特征组合的组合特征分析,进而可以获取到优化目标用户组合特征。可以理解,根据需求,也可以直接由服务器202基于目标用户特征群,初始化生成多个用户特征组合。在后续步骤中根据初始化生成的多个用户特征组合进行用户特征组合特征分析,进而获取到优化目标用户特征。其中,服务器201和服务器202可以是任何具有处理能力的设备,例如,电脑、微处理器、云服务器等,在此不做特殊限定。

目标用户特征群就是包含有大量用户特征的用户特征群,例如,某个如购物平台或者交流平台上大量的用户特征。基于目标用户特征群,初始化生成多个用户特征组合,就是从目标用户特征群中,进行获取多个用户特征后随机或者按照预定顺序组合成用户特征组合,进而多个获取得到多个用户特征组合,这样可以快速的获取所有可能的用户特征组合中少数几个用户特征组合,用于进行后续步骤中进行评价。其中,获取的用户特征组合的数目可以是将目标用户特征群中按照用户特征个数进行排列组合,获取预定比例的用户特征组合,预定比例根据需求设定,可以是例如0.001%、0.002%等。

本示例的一种实施方式中,所述基于目标用户特征群,初始化生成多个用户特征组合,包括:

从所述目标用户特征群中,依次分别获取预定数目个用户特征,其中,每次获取时的所述预定数目比前一次多预定个数个;

依次分别将获取的所述预定数目个用户特征,按照所述目标用户特征群的排列规则排列成用户特征串,得到多个用户特征组合。

从所述目标用户特征群中,依次分别获取预定数目个用户特征,其中,每次获取时的所述预定数目比前一次多预定个数个,就是例如从拥有10000个用户特征的用户特征群中依次获取100个、110个......、200个用户特征,每次获取时用户特征个数比前一次多10个。然后,依次分别将获取的所述预定数目个用户特征,按照所述目标用户特征群的排列规则排列成用户特征串,得到多个用户特征组合。这样可以在目标用户特征群拥有自己地用户特征排列规则时,保证获取到的用户特征组合携带有用户特征群特征,保证后续步骤分析的准确性。其中,排列规则可以是例如按照预定顺序排列或者按照预定表格形式排列等。

本示例的一种实施方式中,所述基于目标用户特征群,初始化生成多个用户特征组合,包括:

基于目标用户特征群,随机初始化生成预定数目个用户特征组合。

这样通过随机初始化生成预定数目个用户特征组合,可以保证用户特征组合获取的随机性,在用户特征群没有排列顺序时,保证用户特征组合获取的效率。

在步骤s120中,将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数。

本示例的实施方式中,将每个用户特征组合及寻优目标分别输入预先训练好的机器学习模型,可以由机器学习模型根据寻优目标评价每个用户特征组合与寻优目标的适配性,即每个所述用户特征组合的评价分数。其中,寻优目标就是用户特征组合的用途,例如某些用户特征用户特征组合在是否可以适配用于某个项目的用户组合需求。

本示例的一种实施方式中,所述第一机器学习模型的训练方法:

收集用户特征组合及寻优目标样本集,所述样本集中每个样本事先标定对应的评价分数;

将所述样本集中每个样本的输入数据分别输入机器学习模型,得到每个所述样本对应的评价分数;

如果存在有样本的输入数据输入机器学习模型后,得到样本对应的评价分数与对所述样本事先标定的评价分数不一致,则调整学习模型的系数,直到一致;

当所有的样本的输入数据输入机器学习模型后,得到的每个样本对应的评价分数与对每个所述样本事先标定的评价分数一致,训练结束。

用户特征组合及寻优目标样本就是历史上对应于某个用户特征群的用户特征组合及寻优目标样本。通过收集用户特征组合及寻优目标样本集作为机器学习模型的输入,每个样本事先由专家标定对应的评价分数,作为机器学习模型的输出。然后,通过调整系数使得当所有的样本的输入数据输入机器学习模型后,得到的每个样本对应的评价分数与对每个所述样本事先标定的评价分数一致,训练结束,得到训练好的第一学习模型,可以有效保证训练准确性。

在步骤s130中,获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值。

本示例的实施方式中,第一预定阈值为设置的判断评价分数较高的阈值,第二预定阈值为设置的判断评价分数较低的阈值。大于第一预定阈值的多个第一分数范围就是例如第一预定阈值为60时,范围为60-65,65-70等多个第一分数范围,低于第二预定阈值的多个第二分数范围,就是例如第二预定阈值为50时,范围为50-45,45-40等多个第二分数范围。这样获取所有所述评价分数中,大于第一预定阈值的多个第一分数范围的评价分数对应的用户特征组合,及低于第二预定阈值的多个第二分数范围的评价分数对应的用户特征组合,可以根据评价分数准确地将多个用户特征组合分类,得到与寻优目标对应的不同级别的用户特征组合。其中,一种示例中,根据需要第一预定阈值与第二预定阈值相等;另一个示例性中,第一预定阈值大于第二预定阈值,舍弃第一预定阈值与第二预定阈值之间的分数范围的用户组合特征。

本示例的一种实施方式中,在所述获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值之后,所述方法还包括:

如果有所述第一分数范围及所述第二分数范围没有获取到对应的用户特征组合,基于所述目标用户特征群,初始化生成预定组数个用户特征组合;

将所述用户特征组合分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;

获取所有所述评价分数中,大于第一预定阈值的多个第一分数范围的评价分数对应的用户特征组合,及低于第二预定阈值的多个第二分数范围的评价分数对应的用户特征组合

当所有所述第一分数范围及所述第二分数范围有获取到对应的用户特征组合,获取结束。

以这种方式,如果有所述第一分数范围及所述第二分数范围没有获取到对应的用户特征组合,例如大于第一预定阈值的多个第一分数范围为例如第一预定阈值为60时,范围为60-65,65-70等多个第一分数范围,其中60-65的范围,没有获取到用户特征组合。通过基于所述目标用户特征群,初始化生成预定组数个用户特征组合,重新进行评分、分类,直到当所有所述第一分数范围及所述第二分数范围有获取到对应的用户特征组合,获取结束。可以保证每个第一分数范围及第二分数范围有对应的用户特征组合,保证后续步骤进行分析的可靠性。

在步骤s140中,获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别。

本示例的实施方式中,每个第一分数范围对应一个所述第二分数范围,就是对每个第一分数范围预先关联的一个第二分数范围。例如,大于第一预定阈值的多个第一分数范围就是例如第一预定阈值为60时,范围为60-65,65-70等多个第一分数范围,低于第二预定阈值的多个第二分数范围,就是例如第二预定阈值为50时,范围为50-45,45-40等多个第二分数范围,此时,60-65的第一分数范围对应50-45的第二分数范围,65-70的第一分数范围对应45-40的第二分数范围。这样获取每个所述第一分数范围的用户特征组合与每个第一分数范围对应的所述第二分数范围的用户特征组合的用户特征区别,可以得到系列范围的多个用户特征区别。其中,用户特征区别可以是由评分高的用户特征组合的用户特征特征的映射向量或者转化得到的字符串与评分低的用户特征组合的用户特征特征的映射向量或者转化得到字符串的差。其中用户特征特征的映射向量通过用户特征特征进行向量映射得到,例如,一个高评分用户特征特征为50男120女,映射为(1,50,21,120,22),其中1为性别维度向量,50、120为个数维度,21、22为性别属性值维度,此时如果一个低评分用户特征特征向量为(1,10,21,160,22),则他们的差表示为(1,50,21,120,22)-(1,10,21,160,22)。

这样使得区别技术特征基于每个用户特征组合的评价系列化存在,有效保证后续步骤中基于用户特征区别预测优化用户特征组合的准确性。

本示例的一种实施方式中,所述获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别,包括:

从每个所述第一分数范围的用户特征组合中随机获取一个用户特征组合;

从每个所述第二分数范围的用户特征组合中随机获取一个用户特征组合;

获取每个所述第一分数范围的所述随机获取的一个用户特征组合与每个所述第二分数范围的所述随机获取的一个用户特征组合的用户特征区别,得到多个用户特征区别。

每个第一分数范围及每个第二分数范围中可能具有多个用户特征组合。但每个分数范围中一个用户特征组合就可以代表该范围的用户特征组合特征。进而,通过从每个所述第一分数范围的用户特征组合中随机获取一个用户特征组合;从每个所述第二分数范围的用户特征组合中随机获取一个用户特征组合;可以高效的获取每个所述第一分数范围的一个用户特征组合与每个第一分数范围对应的所述第二分数范围的一个用户特征组合的用户特征区别,得到多个用户特征区别。

本示例的一种实施方式中,参考图3所示,所述获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别,包括:

步骤s310,获取每个所述第一分数范围的用户特征组合的第一用户特征组合要素;

步骤s320,获取每个第一分数范围对应的所述第二分数范围的用户特征组合的第二用户特征组合要素;

步骤s330,获取每个所述第一用户特征组合要素与每个所述第二用户特征组合要素的区别特征,得到每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别。

用户特征组合要素至少包括用户特征组合中用户特征的数量、用户特征的预设特征标签、用户特征多个属性的属性值等,用户特征的预设特征标签就是例如某个用户的身份,用户特征多个属性的属性值就是例如用户的性别的男女,年龄的大小等。这样通过获取每个第一分数范围的用户特征组合的第一用户特征组合要素,及获取每个第一分数范围对应的第二分数范围的用户特征组合的第二用户特征组合要素,然后,获取每个第一用户特征组合要素及与第一用户特征组合要素对应的第二用户特征组合要素的区别特征,可以准确地获取到每个用户特征组合的区别特征。有效保证后续步骤中分析的准确性。

在步骤s150中,将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合。

本示例的实施方式中,多个用户特征区别为系列范围的用户特征区别,可以准确反映用户特征组合评分变化与用户特征组合特征变化,进而,将多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,可以由寻优目标高效准确地基于用户特征区别分析得到目标用户特征群的与寻优目标适应的预测优化用户特征组合,保证后续步骤中从用户特征群中获取目标用户特征组合的效率和准确性。

本示例的一种实施方式中,所述第二机器学习模型的训练方法:

收集用户特征区别及寻优目标样本集,所述样本集中每个样本事先标定对应的优化用户特征组合;

将所述样本集中每个样本的输入数据分别输入机器学习模型,得到每个所述样本对应的优化用户特征组合;

如果存在有样本的输入数据输入机器学习模型后,得到样本对应的优化用户特征组合与对所述样本事先标定的优化用户特征组合不一致,则调整学习模型的系数,直到一致;

当所有的样本的输入数据输入机器学习模型后,得到的每个样本对应的优化用户特征组合与对每个所述样本事先标定的优化用户特征组合一致,训练结束。

用户特征区别及寻优目标样本就是历史上对应于某个用户特征群的用户特征区别及寻优目标样本。通过收集用户特征区别及寻优目标样本集作为机器学习模型的输入,每个样本事先由专家标定对应的优化用户特征组合,作为机器学习模型的输出。然后,通过调整系数使得当所有的样本的输入数据输入机器学习模型后,得到的每个样本对应的优化用户特征组合与对每个所述样本事先标定的优化用户特征组合一致,训练结束,得到训练好的第二学习模型,可以有效保证训练准确性。

在步骤s160中,基于所述预测优化用户特征组合,从所述目标用户特征群中获取目标优化用户特征组合。

本示例的实施方式中,基于预测优化用户特征组合,可以从目标用户特征群中通过用户特征特征标签或者用户特征属性名等逐个对比,准确地从目标用户特征群中获取目标优化用户特征组合。

最后,本公开通过机器学习模型根据部分用户特征组合的区别特征准确、高效预测寻优目标对应的用户特征组合,进而保证目标用户特征组合获取的高效性和准确性。

本公开还提供了一种用户特征群中用户特征寻优装置。参考图4所示,该用户特征群中用户特征寻优装置可以包括用户特征初始化模块410、评价模块420、第一获取模块430、第二获取模块440、预测模块450及优化特征获取模块460。其中:

初始化模块410可以用于基于目标用户特征群,初始化生成多个用户特征组合;

评价模块420可以用于将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;

第一获取模块430可以用于获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;

第二获取模块440可以用于获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;

预测模块450可以用于将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;

优化特征获取模块460可以用于基于所述预测优化用户特征组合,从所述目标用户特征群中获取目标优化用户特征组合。

上述用户特征群中用户特征寻优装置中各模块的具体细节已经在对应的用户特征群中用户特征寻优方法中进行了详细的描述,因此此处不再赘述。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。

在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。

下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1中所示的步骤s110:基于目标用户特征群,初始化生成多个用户特征组合;s120:将每个所述用户特征组合及寻优目标分别输入预先训练好的第一机器学习模型,得到每个所述用户特征组合的评价分数;步骤s130:获取多个第一分数范围中的评价分数对应的用户特征组合,及多个第二分数范围中的评价分数对应的用户特征组合,其中,所述多个第一分数范围中的评价分数大于第一预定阈值,所述多个多个第二分数范围中的评价分数低于第二预定阈值;步骤s140:获取每个所述第一分数范围的用户特征组合与每个第二分数范围的用户特征组合的用户特征区别,得到多个用户特征区别;步骤s150:将所述多个用户特征区别及寻优目标输入预先训练好的第二机器学习模型,得到所述目标用户特征群的预测优化用户特征组合;步骤s160:基于所述预测优化用户特征组合,从所述目标用户特征群中获取目标优化用户特征组合。

存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(rom)5203。

存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备500也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得客户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。

参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在客户计算设备上执行、部分地在客户设备上执行、作为一个独立的软件包执行、部分在客户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到客户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1