一种数据筛选引擎建立方法及数据筛选引擎的制作方法_5

文档序号:9547293阅读:来源:国知局
一规则建立子单元6051,被配置为对高置信度名单通过采用高置信度名单的自 身特征信息进行分析,建立相对应的数据筛选规则;
[0203] 第二规则建立子单元6052,被配置为对高置信度名单通过采用对每个类别对应 的参考样本和高置信度名单的自身特征信息的相关性进行分析,建立相对应的数据筛选规 则。
[0204] 本实施例中,通过特征构造单元603基础信息和历史行为数据,并结合预置的复 数个业务逻辑确定每个用户的特征向量;确定单元604根据特征向量,并再次结合复数个 业务逻辑确定高置信度名单;规则建立单元605对高置信度名单通过采用预置分析方式进 行分析,建立相对应的数据筛选规则,便建立了可进行黑白名单筛选的数据筛选引擎,解决 了目前的人工方式很难从海量的用户行为中总结出区分出黑白名单的规则的技术问题,进 一步地,特征衍生子单元6032根据基础信息和历史行为数据,并结合业务逻辑量化出与业 务逻辑相对应的复数个衍生特征,以及通过预置方式进行归一化处理的特征向量,大大地 提高了后续的黑白名单筛选的精确性,以及,无监督聚类子单元6041先采用聚类方法,特 征验证子单元6042再结合复数个业务逻辑确定高置信度名单,实现了除有机器作弊和正 常用户,还有行为表象偏两者之间的用户时,先对用户进行类别,再一次提高了后续的黑白 名单筛选的精确性。
[0205] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统, 装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0206] 在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以 通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的 划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件 可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或 讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦 合或通信连接,可以是电性,机械或其它的形式。
[0207] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个 网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
[0208] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以 是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单 元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0209] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用 时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质 上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形 式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算 机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法 的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程 序代码的介质。
[0210] 以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前 述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前 述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些 修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1. 一种数据筛选引擎建立方法,其特征在于,包括: 提取已注册的用户的基础信息和所述用户对应的历史行为数据; 根据所述基础信息和所述历史行为数据,并结合预置的复数个业务逻辑确定每个用户 的特征向量; 根据所述特征向量,并再次结合复数个所述业务逻辑确定高置信度名单; 对所述高置信度名单通过采用预置分析方式进行分析,建立相对应的数据筛选规则。2. 根据权利要求1所述的数据筛选引擎建立方法,其特征在于,提取已注册的用户的 基础信息和所述用户对应的历史行为数据具体包括: 通过接入客户端提取已注册的所述用户的所述基础信息; 提取与所述用户对应的所述历史所述行为数据,所述行为数据包括登录行为数据、观 看行为数据、消费行为数据和互动行为数据。3. 根据权利要求1或2所述的数据筛选引擎建立方法,其特征在于,根据所述基础信 息和所述历史行为数据,并结合预置的复数个业务逻辑确定每个用户的特征向量之前还包 括: 建立复数个所述业务逻辑,所述业务逻辑与非常规注册方式相对应。4. 根据权利要求3所述的数据筛选引擎建立方法,其特征在于,根据所述基础信息和 所述历史行为数据,并结合预置的复数个业务逻辑确定每个用户的特征向量具体包括: 根据所述基础信息和所述历史行为数据定义相对应的复数个特征; 根据所述基础信息和所述历史行为数据,并结合所述业务逻辑量化出与所述业务逻辑 相对应的复数个衍生特征; 根据复数个所述特征和/或复数个所述衍生特征,并结合所述业务逻辑建立相关联的 复数个所述特征向量; 其中,所述特征向量为通过预置方式进行归一化处理的所述特征向量。5. 根据权利要求4所述的数据筛选引擎建立方法,其特征在于,根据所述特征向量,并 再次结合复数个所述业务逻辑确定高置信度名单具体包括: 对复数个所述特征向量采用聚类方法进行基于所述用户的类别分类,确定每个所述类 别对应的所述特征向量; 对每个所述类别对应的所述特征向量再次结合复数个所述业务逻辑确定所述高置信 度名单,并将所述高置信度名单设定为每个所述类别对应的参考样本。6. 根据权利要求5所述的数据筛选引擎建立方法,其特征在于,预置分析方式具体包 括: 所述高置信度名单的自身特征信息分析,以及每个所述类别对应的参考样本和所述高 置信度名单的自身特征信息的相关性分析。7. -种数据筛选引擎,其特征在于,包括: 数据接入单元,被配置为提取已注册的用户的基础信息和所述用户对应的历史行为数 据; 特征构造单元,被配置为根据所述基础信息和所述历史行为数据,并结合预置的复数 个业务逻辑确定每个用户的特征向量; 确定单元,被配置为根据所述特征向量,并再次结合复数个所述业务逻辑确定高置信 度名单; 规则建立单元,被配置为对所述高置信度名单通过采用预置分析方式进行分析,建立 相对应的数据筛选规则。8. 根据权利要求7所述的数据筛选引擎,其特征在于,所述数据接入单元具体包括: 基础信息采集子单元,被配置为通过接入客户端提取已注册的所述用户的所述基础信 息; 行为数据采集子单元,被配置为提取与所述用户对应的所述历史所述行为数据; 所述行为数据采集子单元包括:登录行为数据采集模块、观看行为数据采集模块、消费 行为数据采集子单元和互动行为数据采集模块。9. 根据权利要求7或8所述的数据筛选引擎,其特征在于,所述数据筛选引擎还包括: 建立单元,被配置为建立复数个所述业务逻辑,所述业务逻辑与非常规注册方式相对 应。10. 根据权利要求9所述的数据筛选引擎,其特征在于,特征构造单元具体包括: 特征定义子单元,被配置为根据所述基础信息和所述历史行为数据定义相对应的复数 个特征; 特征衍生子单元,被配置为根据所述基础信息和所述历史行为数据,并结合所述业务 逻辑量化出与所述业务逻辑相对应的复数个衍生特征; 特征向量构建子单元,被配置为根据复数个所述特征和/或复数个所述衍生特征,并 结合所述业务逻辑建立相关联的复数个所述特征向量; 其中,所述特征向量为通过预置方式进行归一化处理的所述特征向量。11. 根据权利要求10所述的数据筛选引擎,其特征在于,确定单元具体包括: 无监督聚类子单元,被配置为对复数个所述特征向量采用聚类方法进行基于所述用户 的类别分类,确定每个所述类别对应的所述特征向量; 特征验证子单元,被配置为对每个所述类别对应的所述特征向量再次结合复数个所述 业务逻辑确定所述高置信度名单,并将所述高置信度名单设定为每个所述类别对应的参考 样本。12. 根据权利要求11所述的数据筛选引擎,其特征在于,规则建立单元包括: 第一规则建立子单元,被配置为对所述高置信度名单通过采用所述高置信度名单的自 身特征信息进行分析,建立相对应的所述数据筛选规则; 第二规则建立子单元,被配置为对所述高置信度名单通过采用对每个所述类别对应的 参考样本和所述高置信度名单的自身特征信息的相关性进行分析,建立相对应的所述数据 筛选规则。
【专利摘要】本发明实施例公开一种数据筛选引擎建立方法及数据筛选引擎,解决了目前的人工方式很难从海量的用户行为中总结出区分出黑白名单的规则的技术问题。本发明实施例数据筛选引擎建立方法包括:提取已注册的用户的基础信息和用户对应的历史行为数据;根据基础信息和历史行为数据,并结合预置的复数个业务逻辑确定每个用户的特征向量;根据特征向量,并再次结合复数个业务逻辑确定高置信度名单;对高置信度名单通过采用预置分析方式进行分析,建立相对应的数据筛选规则。
【IPC分类】G06F17/30
【公开号】CN105302911
【申请号】CN201510763075
【发明人】余建兴
【申请人】珠海多玩信息技术有限公司
【公开日】2016年2月3日
【申请日】2015年11月10日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1