区分交互行为的方法及装置的制造方法_3

文档序号:9667314阅读:来源:国知局
):
[0046] 表 1
[0047]

[0048] 如表1所示,用户A的交易对象(即上述实施例中的第二交互对象)可以有10个, 其中,包括A1-A10,通过上述的统计,可以对其发生频率和交互类型进行查表评分,具体地, 可以通过计算交互类型与评分表中的关键字的相似度,将相似度大于预设相似度阈值的关 键字的评分作为所述交互类型的评分,并查询交互对象表中对应该评分的第三交互对象。 通过上述处理将10个第二交互对象分为了四类(也可以称之为四组):亲友、卖家、通信运 营商和其他。
[0049] 又如,上述实施例中,如表2所示用户A发生的历史交互行为的交换数据的降维处 理。
[0050] 表 2
[0051]

[0052]
[0053] 对历史交互行为数据中的第二交换数据进行降维处理得到第三交换数据:查询得 到与第二交换数据对应的第三交换数据(如表2中的高、中、低)。具体地,在第二交换数 据符合第一范围时,第三交换数据为高;在第二交换数据符合第二范围时,第三交换数据为 中;在第二交换数据符合第三范围时,第三交换数据为低。其中,第一范围可以为[1000, …);第二范围可以为[300,1000);第三范围可以为(0, 300)。
[0054] 在上述实施例中,第一范围、第二范围以及第三范围共同构成了上述的预设数据 关系。
[0055] 在完成对第二交换数据和第二交互对象的降维处理之后,使用第三交换数据替换 第二交换数据,并使用第三交互对象替换第二交互对象,得到更新后的历史交互行为数据, 如表3所示。
[0056]表 3
[0057]
[0058]
[0059] 通过上述实施例,获取到的更新第二交互对象和第二交换数据的历史交互行为集 合,然后从该更新后的历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数 据,得到合法行为项集。具体到上述的表中,可以提取发生频率大于0. 1的历史交互行为数 据生成合法行为项集,然后将合法行为项集中的历史交互行为数据转换为历史时间序列, 生成预设交互行为数据库,如表4所示的合法行为项集中的历史交互行为数据可以使用六 个描述数据来表示,表中的每一行用序列的形式表示即为历史时间序列,如第二行中的历 史时间序列为:(2014,1,6,高,养老转账,亲人)。
[0060] 表 4
[0061]
[0062] 需i进一i说i的▲,获取历史时·间序列之后,k可以对其进行进丄步地聚类分 析,也即,可以将得到的合法行为项集中的历史时间序列进行合并处理得到预设交互行为 数据库。
[0063] 具体地,将得到的合法行为项集中的历史时间序列进行合并处理包括:将得到的 历史时间序列中至少三个属性数据相同的数据合并为一条历史时间序列,将其中不同的属 性数据使用字符代替。
[0064] 如,将上述的第二条和第三条的历史时间序列合并为(*,*,*,中,购物,卖家)。
[0065] 在预设交互行为数据库中还可以保存有上述进行降维处理过程中第二交互对象 与第三交互对象的映射关系将其作为预设对象关系。
[0066] 根据本申请的上述实施例,如图2所示,可以按照预设的交互亲密度模型和交换 数据的模型对历史交互行为数据进行聚类处理。
[0067] 具体地,交互亲密度模型可以根据交易对象(即上述实施例中的第二交互对象) 与用户的历史交互数据对交易对象进行分类;交换数据的模型可以根据用户的交易金额进 行聚类,实现连续变量的离散化处理。
[0068] 上述实施例中的获取合法行为项集的过程即为项集频繁项目集挖掘的过程。在该 实施例中,执行该步骤是为了发现用户的频繁交易行为,该步骤不会考虑到事件的时间因 素影响。
[0069] 需要进一步说明的是,在该实施例中可以将用户的一次网上交易行为作为一个事 务(即作为一条历史交互行为数据),伴随事务发生往往会涉及多维度信息:第二交互时 间、第二交互对象、交互类型(如转账、汇款等)以及交易金额(即上述实施例中的交换数 据),通过上述实施例,可以挖掘出用户的历史交易行为模式(即上述实施例中的历史交互 行为的模式),并建立相应的用户正常交易行为规则库(即上述实施例中的预设交互行为 数据库),通过当前交互行为数据与预设交互行为数据库作匹配,以识别用户的风险交易行 为。
[0070] 具体地,假设I是项的集合,给定一个交易数据库D(即上述实施例中的历史交互 行为集合),其中每个事务(Transaction)t(即上述实施例中的历史交互行为数据)是I的 非空子集,即每一个交易都与一个唯一的标识符TID(TransactionID)对应。上述实施例 中的频繁指某一项集出现的概率相对于所有记录而言必须达到某一水平(即达到预设概 率阈值)。项集出现的概率称为支持度(Support),以一个包含A与B两个项的2-itemset 为例,事务同时包含A和B的百分比即是{A,B}项的支持度,若支持度大于等于所设定的最 小支持度(MinimumSupport)门槛值时,则{A,B}称为频繁项集。一个满足最小支持度的 k-itemset,则称为高频k_ 项集(Frequentk-itemset),一般表示为Largek或Frequent k〇
[0071] 通过上述实施例得到合法行为项集之后,可以将合法行为项集中的历史交互行 为数据转换为历史时间序列,生成预设交互行为数据库。具体地,获取用户频繁交易项 集I(即上述实施例中的合法行为项集),项ik= (object,amount,trade_type),其中的 object为第二交互对象,amount为交换数据,trade_type为交互类型,在该历史交互行为 数据中并未包含时间维度的数据,可选地,可以将频繁交易项集转换为多维时间序列(即 上述实施例中的历史时间序列)S= (si,s2,…,sn),其中sj= (year,month,day,ik),也 即历史时间序列中增加了时间参数sj=(年,月,日,时)。
[0072] 通过上述实施例,得到的历史时间序列可以是如下的表现形式"1个月以前购买 奔腾PC的客户很可能在一个月内订购新的CPU芯片"。
[0073] 在得到的历史时间序列中可以包括历史交互行为数据的六个属性,该六个属性可 以为:年、月、日、第三交互对象、第三交换数据以及交互类型。
[0074] 例如,用户在2014年3月15日向招商银行信用卡还款1500;在2014年4月15 日向招商银行信用卡还款1000 ;在2014年5月15日向招商银行信用卡还款2500 ;……。 对用户的该历史交互行为进行分析之后,该类交互行为即可成为一个合法行为项集,也即X 月的15日向招商银行还款M。
[0075] 根据本申请的上述实施例,按照预设对象关系和预设数据关系对当前交互行为数 据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列包括:使用预设对象 关系查询与第一交互对象对应的第四交互对象;使用预设数据关系查询与第一交换数据对 应的第四交换数据;使用第四交互对象替换第一交互对象,使用第四交换数据替换第一交 互对象,得到当前交互序列。
[0076] 需要进一步说明的是,使用预设交互行为数据库中的数据对当前交互序列进行匹 配处理,得到匹配结果包括:将当前交互序列与预设交互行为数据库中的数据逐个进行匹 配处理,得到预设交互行为数据库中存在与当前交互序列相匹配的数据的第一匹配结果, 或得到预设交互行为数据库中不存在与当前交互序列相匹配的数据的第二匹配结果;依据 匹配结果确定当前交互行为是否为合法行为包括:若得到第一匹配结果确定当前交互行为 为合法行为;若得到第二匹配结果确定当前交互行为不为合法行为。
[0077] 在通过上述实施例确定当前交互行为
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1