一种移动互联网用户行为特征属性的获取装置及方法

文档序号:9911261阅读:429来源:国知局
一种移动互联网用户行为特征属性的获取装置及方法
【技术领域】
[0001] 本发明涉及数据处理领域,尤其涉及一种移动互联网用户行为特征属性的获取装 置及方法。
【背景技术】
[0002] 目前的移动互联网公司有对用户进行广告的精准投放的需求,但移动互联网公司 在获取到手机用户的手机设备识别码后,还需要获取手机用户的注册信息,比如身份证号、 年龄、性别、兴趣爱好等填写的信息才能标注移动用户的行为特征,继而进行广告的精准投 放。如果获取不到移动用户的注册信息,很难为移动用户标注行为特征,从而不能进行广告 的精准投放。

【发明内容】

[0003] 本发明的目的是提供一种移动互联网用户行为特征属性的获取装置及方法,不需 要获取手机用户的注册信息,也能进行广告的精准投放。
[0004] 本发明解决其技术问题所采用的技术方案是:
[0005] -种移动互联网用户行为特征属性的获取方法,包括:
[0006] 获取用户的行为特征数据;
[0007] 根据用户的行为特征数据,输出用户的行为特征及权重。
[0008] -种移动互联网用户行为特征属性的获取方法,包括:
[0009] 步骤一:利用网络爬虫从互联网爬取应用的属性信息,建立基础数据库;
[0010] 步骤二:在基础数据库中增加行为特征的字段并建立属性映射表,对每个应用的 行为特征属性进行分类;
[0011] 步骤三:获取用户的应用行为特征数据,并与基础数据库进行逐条匹配,如果用户 的应用行为特征数据中应用的属性信息与基础数据库中应用的属性信息匹配成功,则保存 用户的身份信息和该应用的行为特征值到用户数据库;
[0012] 步骤四:计算各时间段行为特征的各项行为特征值的累计权重,具体为:
[0013] 首先,在To时间段内,获取用户数据库中的某一行为特征各项行为特征值的数量, 记为矩阵?(1'〇) = [?1(1'())?2(1'())'11(1'())'111(1'())],其中1、11是自然数,1<1<11小(1'())是1' 0 时间段内第i项行为特征值的数量,则To时间段内总行为特征值的数量p总(To )= pi (To) +P2 (Τ〇)+···+ρ?(Τ〇)+···+ρη(Τ()),计算第i项行为特征值的数量。^(^与总行为特征值的数量卩总 (To)的比值,得到To时间段内第i项行为特征值的初始权重ki(T0) = ^^T()时间段内第i 项行为特征值的累计权重kKToV =1^(?),所以kiCTj =
[0014] 随后在^时间段内,获取用户数据库中该行为特征各项行为特征值的数量,记为 矩阵?(1'1) = [?1(1'1)?2(1'1)"_?1(1' 1)~?"(1'1)],?1(1'1)是1'1时间段内第1项行为特征值的数 量,贝丨打1时间段内总行为特征值的数量閲,(1'1)=口1(1'1)+口2(1'1) +~+口1(1'1) + '"+口11(1'1),计算 第i项行为特征值的数量Pl(T0与总行为特征值的数量p总(TO的比值,得到h时间段内第i 项行为特征值的初始权重kid) ,则Π 时间段内第i项特征值的累计权重
其中α是该行为特征的衰减因子;
[0015] 按照上述过程,直到在Τ财间段内,j是自然数,j 2 2,获取用户数据库中该行为特 征各项行为特征值的数量,记为矩阵P(Tj) = [p1(Tj)p2(Tj)-_pi(T j)-_pn(Tj)],pi(Tj)是Tj时 间段内第i项行为特征值的数量,则L时间段内总行为特征值的数量p总(LhpKD+pKTj) +…+Pi(Tj) +…+pn(Tj),计算第i项行为特征值的数量pi(Tj)与总行为特征值的数量p总(Tj) 的比值,得到T财间段内第i项行为特征值的初始权重Ml)) 则1^时间段内第i项 特征值的累计权重
[0016] 步骤五:输出在预定时间段内用户的行为特征及累计权重。
[0017]在此基础上,进一步地,行为特征的衰减因子α的取值在0.7到0.8之间。
[0018] -种利用了上述任意实施例中方法进行广告信息推送的方法,根据预定时间段内 用户的行为特征及累计权重推送对应的广告信息。
[0019] 一种移动互联网用户行为特征属性的获取装置,包括:
[0020] 应用属性获取模块,用于利用网络爬虫从互联网爬取应用的属性信息,建立基础 数据库;
[0021] 应用属性分类模块,用于在基础数据库中增加行为特征的字段并建立属性映射 表,对每个应用的行为特征属性进行分类;
[0022] 用户行为特征匹配模块,用于获取用户的应用行为特征数据,并与基础数据库进 行逐条匹配,如果用户的应用行为特征数据中应用的属性信息与基础数据库中应用的属性 信息匹配成功,则保存用户的身份信息和该应用的行为特征值到用户数据库;
[0023] 行为特征权重计算模块,用于计算各时间段行为特征的各项行为特征值的累计权 重,具体为:
[0024]首先,在To时间段内,获取用户数据库中的某一行为特征各项行为特征值的数量, 记为矩阵?(1'〇) = [?1(1'())?2(1'())'11(1'())'111(1'())],其中1、11是自然数,1<1<11小(1'())是1' 0 时间段内第i项行为特征值的数量,则Το时间段内总行为特征值的数量p总(To )= pi (To) +P2 (Το)+···+ρ?(Το)+···+ρη(Το),计算第i项行为特征值的数量。^(^与总行为特征值的数量卩总 (To)的比值,得到To时间段内第i项行为特征值的初始权重ΜΤβ) = ^^,Τ()时间段内第i 项行为特征值的累计权重kKTo)' =1^(?),所以ki(Ta)' =
[0025]随后在^时间段内,获取用户数据库中该行为特征各项行为特征值的数量,记为 矩阵?(1'1) = [?1(1'1)?2(1'1)"_?1(1' 1)~?11(1'1)],?1(1'1)是1'1时间段内第1项行为特征值的数 量,贝丨打1时间段内总行为特征值的数量閲,(1'1)=口1(1'1)+口2(1'1) +~+口1(1'1) + '"+口11(1'1),计算 第i项行为特征值的数量Pl(T0与总行为特征值的数量p总(TO的比值,得到h时间段内第i 项行为特征值的初始权重ki(Ti)=f_,则Π 时间段内第i项特征值的累计权重 '=kiCTD+W'其中α是该行为特征的衰减因子; lv LJ l.+u:
[0026] 按照上述过程,直到在乃时间段内,j是自然数,j 2 2,获取用户数据库中该行为特 征各项行为特征值的数量,记为矩阵P(Tj) = [p1(Tj)p2(Tj)-_pi(T j)-_pn(Tj)],pi(Tj)是Tj时 间段内第i项行为特征值的数量,则L时间段内总行为特征值的数量p总(LhpKD+pKTj) +…+Pi(Tj) +…+pn(Tj),计算第i项行为特征值的数量pi(Tj)与总行为特征值的数量p总(Tj) 的比值,得到T财间段内第i项行为特征值的初始权重k:i(Tj:) = ^,则1时间段内第i项 特征值的累计权重知〇^ = ki(Ti)^^~l),XK·
[0027] 行为特征及权重输出模块,用于输出在预定时间段内用户的行为特征及累计权 重。
[0028] 在此基础上,进一步地,行为特征的衰减因子α的取值在〇. 7到0.
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1