一种目标帐号的确定方法、装置、存储介质和电子装置与流程

文档序号:26141598发布日期:2021-08-03 14:26阅读:96来源:国知局
一种目标帐号的确定方法、装置、存储介质和电子装置与流程

本申请涉及数据处理领域,尤其涉及一种目标帐号的确定方法、装置、存储介质和电子装置。



背景技术:

随着网络生活的日益发展,人们在网络上的活动和操作越来越频繁,网络数据日益激增。对于需要对个人特点进行分析从而预测个人行为的领域,比如对某个区域的居民特点进行分析从而预测居民需求,可以根据居民在网络上产生的网络数据进行分析。但是,目前结合网络数据预测个人行为的方式一般为通过领域专家的经验对收集到的个人网络数据进行评价从而分析出个人行为。

这种预测方式一方面可能由于过于依赖领域专家自身的知识架构,在评价过程中会引入领域专家较多的主观因素,比如具有不同经验的领域专家给出不同的评价标准,导致评价结果的可信度较低。另一方面,也可能由于领域专家所涉及领域较为单一,导致评价结果具有较大的局限性,进而更加影响评价结果的可信度。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请提供了一种目标帐号的确定方法、装置、存储介质和电子装置,以至少解决相关技术中从多个帐号中所确定出的与事件具有关联关系的帐号的可信度较低的技术问题。

根据本申请实施例的一个方面,提供了一种目标帐号的确定方法,包括:通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,所述事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,所述触发标签用于指示所述帐号样本集中的帐号样本是否触发了所述目标事件;分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的第二概率确定所述每个帐号对应的第三概率,其中,所述每个帐号对应的所述第二概率是通过对所述每个帐号的与所述目标事件对应的使用历史进行解析得到的;根据所述每个帐号对应的第三概率,从所述多个帐号中确定与所述目标事件具有关联关系的目标帐号。

可选地,分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的第二概率确定所述每个帐号对应的所述第三概率包括以下之一:将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的加权和确定为所述每个帐号对应的所述第三概率;将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的几何平均值确定为所述每个帐号对应的所述第三概率。

可选地,将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的加权和确定为所述每个帐号对应的所述第三概率包括:获取所述事件预测模型对应的第一权重值,和帐号使用历史的解析过程对应的第二权重值,其中,所述第一权重值用于指示所述事件预测模型的可信度,所述第二权重值用于指示所述帐号使用历史的解析过程的可信度;将所述第一权重值作为所述每个帐号的所述第一概率的权重以及将所述第二权重值作为所述每个帐号的所述第二概率的权重进行求和计算,得到所述每个帐号对应的所述第三概率。

可选地,在分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率确定所述每个帐号对应的第三概率之前,所述方法还包括:获取所述每个帐号的使用过程中产生的帐号数据;从所述帐号数据中提取目标属性特征的特征值,其中,所述目标属性特征为所述帐号数据所具有的全部属性特征中与所述目标事件对应的属性特征;对所述每个帐号的目标属性特征的特征值进行解析,得到所述每个帐号对应的所述第二概率。

可选地,通过所述事件预测模型预测所述多个帐号中所述每个帐号触发所述目标事件的所述第一概率包括:获取所述每个帐号包括的目标属性特征的特征值,其中,所述目标属性特征为所述帐号数据所具有的全部属性特征中与所述目标事件对应的属性特征;将所述每个帐号包括的目标属性特征的特征值输入所述事件预测模型;获取所述事件预测模型输出的目标概率值作为所述每个帐号对应的所述第一概率。

可选地,在将所述每个帐号包括的目标属性特征的特征值输入所述事件预测模型之前,所述方法还包括:将所述帐号样本集输入所述初始事件预测模型;根据所述初始事件预测模型输出的初始概率值与所述触发标签之间的比较值对所述初始事件预测模型的模型参数进行调整,直至所述初始概率值与所述触发标签之间的比较值落入预设的阈值范围;将使得所述初始概率值与所述触发标签之间的比较值落入预设的阈值范围的模型参数确定为所述事件预测模型的目标模型参数。

可选地,根据所述每个帐号对应的第三概率,从所述多个帐号中确定与所述目标事件具有关联关系的目标帐号包括以下之一:从所述多个帐号中获取所述第三概率最高的目标数量的帐号作为所述目标帐号;从所述多个帐号中获取所述第三概率高于概率阈值的帐号作为所述目标帐号。

根据本申请实施例的另一方面,还提供了一种目标帐号的确定装置,包括:预测模块,通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,所述事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,所述触发标签用于指示所述帐号样本集中的帐号样本是否触发了所述目标事件;第一确定模块,分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的第二概率确定所述每个帐号对应的第三概率,其中,所述每个帐号对应的所述第二概率是通过对所述每个帐号的与所述目标事件对应的使用历史进行解析得到的;第二确定模块,根据所述每个帐号对应的第三概率,从所述多个帐号中确定与所述目标事件具有关联关系的目标帐号。

根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。

根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。

本方案可以应用于营销智能技术领域进行预测和优化,在本申请实施例中,采用通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,触发标签用于指示帐号样本集中的帐号样本是否触发了目标事件;分别根据每个帐号对应的第一概率和每个帐号对应的第二概率确定每个帐号对应的第三概率,其中,每个帐号对应的第二概率是通过对每个帐号的与目标事件对应的使用历史进行解析得到的;根据每个帐号对应的第三概率,从多个帐号中确定与目标事件具有关联关系的目标帐号的方式。

在从多个帐号中确定目标帐号的过程中,通过事件预测模型来预测多个帐号中的每个帐号对应的第一概率,该模型是使用标注了用于指示帐号样本集中的帐号样本是否触发了目标事件的触发标签的帐号样本集对初始事件预测模型进行训练得到的,使得第一概率能够更加客观准确地体现帐号与目标事件的关联,再结合通过对每个帐号的使用历史进行解析得到的第二概率确定出每个帐号对应的第三概率来表示每个帐号触发目标事件的最终概率,由于第三概率是结合多个维度的预测和解析过程得到的,因此该第三概率能够更加准确地体现帐号触发目标事件的可能性,使得依据第三概率确定的与目标事件具有关联关系的目标帐号更加可信,从而实现了提高从多个帐号中所确定出的与事件具有关联关系的帐号的可信度的技术效果,进而解决了从多个帐号中所确定出的与事件具有关联关系的帐号的可信度较低的技术问题。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是根据本申请实施例的目标帐号的确定方法的硬件环境的示意图;

图2是根据本申请实施例的一种可选的目标帐号的确定方法的流程图;

图3是根据本申请实施例的一种可选的帐号排序的流程图;

图4是根据本申请实施例的一种可选的评分排序的框架图;

图5是根据本申请实施例的一种可选的目标帐号的确定装置的示意图;

图6是根据本申请实施例的一种电子装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例的一方面,提供了一种目标帐号的确定方法实施例。

可选地,在本实施例中,上述目标帐号的确定方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如数据计算服务),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于pc、手机、平板电脑等。本申请实施例的目标帐号的确定方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的目标帐号的确定方法也可以是由安装在其上的客户端来执行。

图2是根据本申请实施例的一种可选的目标帐号的确定方法的流程图,如图2所示,该方法可以包括以下步骤:

步骤s202,通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,所述事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,所述触发标签用于指示所述帐号样本集中的帐号样本是否触发了所述目标事件;

步骤s204,分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的第二概率确定所述每个帐号对应的第三概率,其中,所述每个帐号对应的所述第二概率是通过对所述每个帐号的使用历史进行解析得到的;

步骤s206,根据所述每个帐号对应的第三概率,从所述多个帐号中确定目标帐号。

通过上述步骤s202至步骤s206,在从多个帐号中确定目标帐号的过程中,通过事件预测模型来预测多个帐号中的每个帐号对应的第一概率,该模型是使用标注了用于指示帐号样本集中的帐号样本是否触发了目标事件的触发标签的帐号样本集对初始事件预测模型进行训练得到的,使得第一概率能够更加客观准确地体现帐号与目标事件的关联,再结合通过对每个帐号的使用历史进行解析得到的第二概率确定出每个帐号对应的第三概率来表示每个帐号触发目标事件的最终概率,由于第三概率是结合多个维度的预测和解析过程得到的,因此该第三概率能够更加准确地体现帐号触发目标事件的可能性,使得依据第三概率确定的与目标事件具有关联关系的目标帐号更加可信,从而实现了提高从多个帐号中所确定出的与事件具有关联关系的帐号的可信度的技术效果,进而解决了从多个帐号中所确定出的与事件具有关联关系的帐号的可信度较低的技术问题。

在步骤s202提供的技术方案中,目标事件可以但不限于包括目标帐号购买了某种产品、违反了某个预设的规则等等,本方案对此不作限定。

可选地,在本实施例中,上述事件预测模型可以但不限于使用分类模型来实现,比如:lr(logisticregression,逻辑回归)模型、xgboost模型、deepfm模型等等。

在步骤s204提供的技术方案中,确定每个帐号对应的第三概率的方法可以是对每个帐号的第一概率和每个帐号的第二概率进行计算得到第三概率,还可以是通过对第一概率和第二概率的比较从第一概率和第二概率中选择一个作为第三概率。

可选地,在本实施例中,每个帐号的与目标事件对应的使用历史可以但不限与包括在帐号使用的过程中产生的与目标事件对应的浏览数据、操作数据、交互数据等等。

可选地,在本实施例中,对每个帐号的使用历史进行解析可以但不限于包括使用算法或者解析模型对每个帐号使用数据进行处理,比如:对帐号的使用数据、操作数据、与其他帐号的交互数据进行归一化处理,并使用公式或算法模型对处理后的数据进行计算,从而得到该帐号对应的第二概率。

在步骤s206提供的技术方案中,目标帐号可以是多个帐号中第三概率最大或者最小的一个或多个,还可以是第三概率大于某一阈值的帐号,或者还可以是第三概率位于某一阈值区间的帐号,本方案对此不做限定。

可选地,在本实施例中,在多个帐号中确定出目标帐号后,可以根据确定出的目标帐号和目标帐号的第三概率生成通知消息,并将该通知消息发送至目标帐号、某一个预设帐号或者某一预设终端设备,还可以是根据确定出的目标帐号和目标帐号的第三概率生成对应的操作指令,该操作指令用于指示对目标帐号执行某些预设的操作,比如,限制目标帐号的某些功能、开通目标帐号的某些功能、向目标帐号推荐某物品等等,本方案对此不作限定。

作为一种可选的实施例,分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的第二概率确定所述每个帐号对应的所述第三概率包括以下之一:

s11,将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的加权和确定为所述每个帐号对应的所述第三概率;

s12,将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的几何平均值确定为所述每个帐号对应的所述第三概率。

可选地,在本实施例中,计算每个帐号对应的第一概率和每个帐号的第二概率的几何平均值的方法可以是计算每个帐号的第一概率和第二概率的乘积的二次根。

通过以上步骤,通过对每个帐号的第一概率和第二概率进行加权求和计算,或者计算每个帐号的第一概率和第二概率的几何平均值,从而实现了将预测模型预测的第一概率和对帐号解析得到的第二概率的融合,提高得到的每个帐号的第三概率的准确率。

作为一种可选的实施例,将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的加权和确定为所述每个帐号对应的所述第三概率包括:

s21,获取所述事件预测模型对应的第一权重值,和帐号使用历史的解析过程对应的第二权重值,其中,所述第一权重值用于指示所述事件预测模型的可信度,所述第二权重值用于指示所述帐号使用历史的解析过程的可信度;

s22,将所述第一权重值作为所述每个帐号的所述第一概率的权重以及将所述第二权重值作为所述每个帐号的所述第二概率的权重进行求和计算,得到所述每个帐号对应的所述第三概率。

可选地,在本实施例中,第一权重值和第二权重值都可以是预先设定的固定值,还可以是将多个参考帐号中的每个参考帐号的第一权重值的平均值和第二权重值的平均值分别确定为每个帐号的第一权重值和第二权重值,或者还可以是根据该帐号的第一概率和第二概率的比例对上一次计算得到的第一权重和第二权重进行修调得到的,本方案对此不作限定。

通过以上步骤,对事件预测模型的可信度以及帐号使用历史的解析过程的可信度,并获取与事件预测模型对应的第一权重值和与帐号使用历史的解析过程对应的第二权重值,并使用第一权重值对事件预测模型输出的第一概率进行赋权,以及使用第二权重值对帐号的使用历史的解析得到的第二概率进行赋权,并进行求和计算,从而得到该帐号的第三概率,使帐号的第三概率受对事件预测模型的可信度和对帐号的使用历史的解析过程的可信度的影响,进而保证了得到的帐号的第三概率的准确性。

作为一种可选的实施例,在分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率确定所述每个帐号对应的第三概率之前,还包括:

s31,获取所述每个帐号的使用过程中产生的帐号数据;

s32,从所述帐号数据中提取目标属性特征的特征值,其中,所述目标属性特征为所述帐号数据所具有的全部属性特征中与所述目标事件对应的属性特征;

s33,对所述每个帐号的目标属性特征的特征值进行解析,得到所述每个帐号对应的所述第二概率。

可选地,在本实施例中,获取帐号数据可以是通过获取帐号的日志文件,并对日志文件进行筛选、提取等实现的,还可以是通过对帐号进行实时监控实现的。

可选地,在本实施例中,帐号数据中可以但不限于包括帐号的各类属性的属性特征数据、帐号的浏览数据、帐号的操作数据、与其他帐号的交互数据等等。

可选地,在本实施例中,从帐号数据中提取目标属性特征的特征值可以是直接在帐号数据中提取的目标属性特征的特征值,还可以是先从帐号数据中提取出目标属性特征的数据,并对目标属性特征进行计算得到的特征值,或者是在预设特征值中匹配的与目标属性特征对应的特征值,本方案对此不作限定。

可选地,在本实施例中,从帐号数据中提取的目标属性特征的类型可以是预先设置的,比如可以设置在帐号数据中提取出1个、2个、3个、5个等数量的目标属性特征。

可选地,在本实施例中,在对目标属性特征的特征值进行解析的过程中,可以对特征值设置权重,特征值不同权重不同,并将每个目标属性特征的权重相加,将权重和作为第二概率;还可以计算各个特征值之间的比值并对不同的目标属性特征设置不同的权重,将目标属性特征的权重值作为对应的特征值的权重并进行求和计算,将计算结果作为第二概率,比如:提取到多个帐号的帐号数据中与目标事件对应的四个特征分别为学历、毕业学校、月收入、存款信息,预先设置特征的属性类别为教育类和财产类,四个特征中学历和毕业学校同属于教育类,月收入和存款信息同属于财产类,预先设置了教育类的特征的权重值为0.4,财产类的特征的权重值为0.6,并预先设置各个特征分值分组,比如在0至100分的范围内均匀设置4个分值分组,即4个分值分组分别为[0,25),[25,50),[50,75),[75,100],并设置各个分值分组的权重值分别为0.1,0.2,0.3,0.4,通过对四个属性进行归一化处理并计算得到学历这一特征对应的特征值为75分、毕业学校这一特征的特征值45分、月收入这一特征的特征值为88分、存款信息的特征值为60分,因此可确定学历这一特征的权重值为0.4,毕业学校这一特征的权重值为0.2,月收入这一特征的权重值为0.4,存款信息这一特征的权重值为0.3,通过对各个特征的权重值和各个特征所属的属性类别的权重值进行求和计算,得到帐号的第二概率为[(0.4+0.2)*0.4+(0.4+0.3)*0.6]*100%=66%,从而可得到该帐号的第二概率为66%。

作为一种可选的实施例,通过所述事件预测模型预测所述多个帐号中所述每个帐号触发所述目标事件的所述第一概率包括:

s41,获取所述每个帐号包括的目标属性特征的特征值,其中,所述目标属性特征为所述帐号数据所具有的全部属性特征中与所述目标事件对应的属性特征;

s42,将所述每个帐号包括的目标属性特征的特征值输入所述事件预测模型;

s43,获取所述事件预测模型输出的目标概率值作为所述每个帐号对应的所述第一概率。

可选地,在本实施例中,目标属性特征与上文的计算第二概率用到的目标属性特征数量以及种类相同。

可选地,在本实施例中,事件预测模型可以是卷积神经网络模型,将每个帐号包括的目标属性特征的特征值输入事件预测模型的目标输入层,其中,事件预测模型包括依次连接的目标输入层,目标卷积层和目标全连接层,目标输入层用于接收事件预测模型的输入参数,目标卷积层用于从输入参数中提取参数特征,目标全连接层用于预测具有参数特征的帐号触发目标事件的概率,获取目标全连接层输出的目标概率值作为每个帐号对应的第一概率。

作为一种可选的实施例,在将所述每个帐号包括的目标属性特征的特征值输入所述事件预测模型之前,还包括:

s51,将所述帐号样本集输入所述初始事件预测模型;

s52,根据所述初始事件预测模型输出的初始概率值与所述触发标签之间的比较值对所述初始事件预测模型的模型参数进行调整,直至所述初始概率值与所述触发标签之间的比较值落入预设的阈值范围;

s53,将使得所述初始概率值与所述触发标签之间的比较值落入预设的阈值范围的模型参数确定为所述事件预测模型的目标模型参数。

可选地,在本实施例中,当事件预测模型为卷积神经网络模型时,训练模型的过程可以为将帐号样本集输入初始事件预测模型包括的初始输入层,其中,初始事件预测模型包括依次连接的初始输入层,初始卷积层和初始全连接层;根据初始全连接层输出的初始概率值与触发标签之间的比较值对初始输入层,初始卷积层和初始全连接层所具有的模型参数进行调整,直至初始概率值与触发标签之间的比较值落入预设的阈值范围;将使得初始概率值与触发标签之间的比较值落入预设的阈值范围的模型参数确定为目标输入层,目标卷积层和目标全连接层具有的模型参数,得到事件预测模型。

可选地,在本实施例中,当事件预测模型为逻辑回归模型时,训练模型可以是使用标注了触发标签的帐号样本集输入值算法模型,并根据初始事件预测模型输出的初始概率值与触发标签之间的比较值对初始事件预测模型的模型参数进行调整。

作为一种可选的实施例,根据所述每个帐号对应的第三概率,从所述多个帐号中确定目标帐号包括以下之一:

s61,从所述多个帐号中获取所述第三概率最高的目标数量的帐号作为所述目标帐号;

s62,从所述多个帐号中获取所述第三概率高于概率阈值的帐号作为所述目标帐号。

可选地,在本实施例中,目标数量可以根据需求灵活设置,比如可以设置目标数量为1个、2个、5个等等。

可选地从多个帐号中获取第三概率最高的目标数量的帐号可以是根据第三概率对各个帐号进行排序,从前向后提取目标数量的帐号作为目标帐号;还可以是根据第三概率对各个帐号进行排序,提取出排名第一的帐号以及排名并列第一的帐号作为目标帐号。

图3是根据本申请实施例的一种可选的帐号排序的流程图,如图3所示:

s301,获取多个帐号中的每个帐号的特征作为原始数据,并构建原始数据表x,原始数据表中由m行n列,每一行表示一个待排序的帐号,每一列表示帐号的一个特征,每个帐号包含n个特征。

s302,在原始数据表x中筛选出每个帐号的k个特征,筛选出的k个特征为与目标事件具有对应关系的特征,k≤n,筛选后的数据组成中间数据列表x’,中间数据表是一个m行k列的表,每一行代表一个待排序的帐号,每一列标识帐号的一个特征。

s303,确定中间数据表中的目标特征的特征值,预先设置阈值区间,每个区间设置对应的权重值,根据特征值在预设阈值区间中确定每个人帐号的目标特征所在的分组区间,并按照分组结果对每个帐号的目标特征的权重值,将每个帐号的目标特征的权重值相加得到目标值,并将该目标值作为目标帐号触发目标事件的第一概率。

s304,获取中间数据表中的目标特征的特征值,选用训练好的机器学习模型(比如训练过的lr、xgboost或者deepfm等),以每个帐号的目标特征的特征值作为输入,以输出模型预测值,并将该模型预测值确定为目标帐号触发目标事件的第二概率。

s305,按照预定的融合方案对第一概率和第二概率进行融合,以得到最终的第三概率,融合方案可以是计算第一概率和第二概率加权平均值,还可以是计算第一概率和第二概率的几何平均值。

s306,根据每个帐号的第三概率在多个帐号中确定第三概率最大的目标帐号。

图4是根据本申请实施例的一种可选的评分排序的框架图,如图4所示:

原始数据:原始数据是基于感知设备收集或者对接客户业务数据库的第一手数据。

衍生数据:衍生数据是基于原始数据进行加工处理后的数据,比如转化成图谱数据、时间序列数据、时空数据等。

数据标准化:基于原始数据和衍生数据,进行数据排序业务标准化,那些字段是业务需要的,要做好映射关系,部分数据的缺失值处理等清洗过程,比如:数值类型的字段如果没有填写或null等给定默认值(比如0或1),部分数据的标准化处理(比如性别字段,1表示男;0表示女)。

规则引擎:基于领域专家知识给出的业务规则,能够解析并计算出相应的值。比如:针对时空大数据的harts规则引擎,处理技战法类相关的公安专家给出的业务规则。

算法引擎:主要实现业务场景的算法,比如基于图谱数据的图挖掘算法的各种中心性度量和节点重要性度量,基于时空数据的轨迹相似度计算等等。

业务场景多目标:多目标指当前业务场景决策影响因素,通过规则引擎和算法引擎来完成具体业务场景的多目标属性值的计算。

评分函数权重学习:基于机器学习模型和用户实例完善的方法来学习评分函数权重。

评分排序:基于评分函数计算评分,然后按照评分进行正、逆排序。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

根据本申请实施例的另一个方面,还提供了一种用于实施上述目标帐号的确定方法的目标帐号的确定装置。图5是根据本申请实施例的一种可选的目标帐号的确定装置的示意图,如图5所示,该装置可以包括:

预测模块52,用于通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,所述事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,所述触发标签用于指示所述帐号样本集中的帐号样本是否触发了所述目标事件;

第一确定模块54,用于分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的第二概率确定所述每个帐号对应的第三概率,其中,所述每个帐号对应的所述第二概率是通过对所述每个帐号的与所述目标事件对应的使用历史进行解析得到的;

第二确定模块56,根据所述每个帐号对应的第三概率,从所述多个帐号中确定与所述目标事件具有关联关系的目标帐号。

需要说明的是,该实施例中的预测模块52可以用于执行本申请实施例中的步骤s202,该实施例中的第一确定模块54可以用于执行本申请实施例中的步骤s204,该实施例中的第二确定模块56可以用于执行本申请实施例中的步骤s206。

此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。

通过上述模块,可以解决了从多个帐号中所确定出的与事件具有关联关系的帐号的可信度较低的技术问题,进而达到从多个帐号中所确定出的与事件具有关联关系的帐号的可信度的技术效果。

可选地,所述第一确定模块包括以下之一:第一确定单元,用于将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的加权和确定为所述每个帐号对应的所述第三概率;第二确定单元,用于将所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率的几何平均值确定为所述每个帐号对应的所述第三概率。

可选地,所述第一确定单元用于:获取所述事件预测模型对应的第一权重值,和帐号使用历史的解析过程对应的第二权重值,其中,所述第一权重值用于指示所述事件预测模型的可信度,所述第二权重值用于指示所述帐号使用历史的解析过程的可信度;将所述第一权重值作为所述每个帐号的所述第一概率的权重以及将所述第二权重值作为所述每个帐号的所述第二概率的权重进行求和计算,得到所述每个帐号对应的所述第三概率。

可选地,所述装置还包括:获取模块,用于在分别根据所述每个帐号对应的所述第一概率和所述每个帐号对应的所述第二概率确定所述每个帐号对应的第三概率之前,获取所述每个帐号的使用过程中产生的帐号数据;提取模块,用于从所述帐号数据中提取目标属性特征的特征值,其中,所述目标属性特征为所述帐号数据所具有的全部属性特征中与所述目标事件对应的属性特征;解析模块,用于对所述每个帐号的目标属性特征的特征值进行解析,得到所述每个帐号对应的所述第二概率。

可选地,所述预测模块包括:第一获取单元,用于获取所述每个帐号包括的目标属性特征的特征值,其中,所述目标属性特征为所述帐号数据所具有的全部属性特征中与所述目标事件对应的属性特征;输入单元,将所述每个帐号包括的目标属性特征的特征值输入所述事件预测模型;第二获取单元,获取所述事件预测模型输出的目标概率值作为所述每个帐号对应的所述第一概率。

可选地,所述装置还包括:输入模块,用于在将所述每个帐号包括的目标属性特征的特征值输入所述事件预测模型之前,将所述帐号样本集输入所述初始事件预测模型;调整模块,用于根据所述初始事件预测模型输出的初始概率值与所述触发标签之间的比较值对所述初始事件预测模型的模型参数进行调整,直至所述初始概率值与所述触发标签之间的比较值落入预设的阈值范围;第三确定后模块,用于将使得所述初始概率值与所述触发标签之间的比较值落入预设的阈值范围的模型参数确定为所述事件预测模型的目标模型参数。

可选地,所述第二确定模块包括以下之一:第三获取单元,用于从所述多个帐号中获取所述第三概率最高的目标数量的帐号作为所述目标帐号;第四获取单元,用于从所述多个帐号中获取所述第三概率高于概率阈值的帐号作为所述目标帐号。

此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。

根据本申请实施例的另一个方面,还提供了一种用于实施上述目标帐号的确定方法的电子装置。

图6是根据本申请实施例的一种电子装置的结构框图,如图6所示,该电子装置可以包括:一个或多个(图中仅示出一个)处理器601、存储器603、以及传输装置605,如图6所示,该电子装置还可以包括输入输出设备607。

其中,存储器603可用于存储软件程序以及模块,如本申请实施例中的目标帐号的确定方法和装置对应的程序指令/模块,处理器601通过运行存储在存储器603内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标帐号的确定方法。存储器603可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器603可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至电子装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置605用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置605包括一个网络适配器(networkinterfacecontroller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置605为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。

其中,具体地,存储器603用于存储应用程序。

处理器601可以通过传输装置605调用存储器603存储的应用程序,以执行下述步骤:通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,触发标签用于指示帐号样本集中的帐号样本是否触发了目标事件;分别根据每个帐号对应的第一概率和每个帐号对应的第二概率确定每个帐号对应的第三概率,其中,每个帐号对应的第二概率是通过对每个帐号的与目标事件对应的使用历史进行解析得到的;根据每个帐号对应的第三概率,从多个帐号中确定与目标事件具有关联关系的目标帐号。

采用本申请实施例,提供了一种目标帐号的确定方法和装置的方案。在从多个帐号中确定目标帐号的过程中,通过事件预测模型来预测多个帐号中的每个帐号对应的第一概率,该模型是使用标注了用于指示帐号样本集中的帐号样本是否触发了目标事件的触发标签的帐号样本集对初始事件预测模型进行训练得到的,使得第一概率能够更加客观准确地体现帐号与目标事件的关联,再结合通过对每个帐号的使用历史进行解析得到的第二概率确定出每个帐号对应的第三概率来表示每个帐号触发目标事件的最终概率,由于第三概率是结合多个维度的预测和解析过程得到的,因此该第三概率能够更加准确地体现帐号触发目标事件的可能性,使得依据第三概率确定的与目标事件具有关联关系的目标帐号更加可信,从而实现了提高从多个帐号中所确定出的与事件具有关联关系的帐号的可信度的技术效果,进而解决了从多个帐号中所确定出的与事件具有关联关系的帐号的可信度较低的技术问题。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

本领域普通技术人员可以理解,图6所示的结构仅为示意,电子装置可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobileinternetdevices,mid)、pad等电子设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令电子设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-onlymemory,rom)、随机存取器(randomaccessmemory,ram)、磁盘或光盘等。

本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行目标帐号的确定方法的程序代码。

可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过事件预测模型预测多个帐号中的每个帐号触发目标事件的第一概率,其中,事件预测模型是使用标注了触发标签的帐号样本集对初始事件预测模型进行训练得到的,触发标签用于指示帐号样本集中的帐号样本是否触发了目标事件;分别根据每个帐号对应的第一概率和每个帐号对应的第二概率确定每个帐号对应的第三概率,其中,每个帐号对应的第二概率是通过对每个帐号的与目标事件对应的使用历史进行解析得到的;根据每个帐号对应的第三概率,从多个帐号中确定与目标事件具有关联关系的目标帐号。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1