基于智能手机姿态行为大数据的用户性别识别方法与流程

文档序号:11620176阅读:1155来源:国知局
基于智能手机姿态行为大数据的用户性别识别方法与流程

本发明涉及大数据技术领域,具体涉及一种基于智能手机姿态行为大数据的用户性别识别方法。



背景技术:

随着移动互联网的高速发展,智能手机的用户画像或者说是用户标签对于在庞大的移动互联网用户群体中对精准人群进行品牌营销尤为关键。用户画像是将用户信息标签化,即企业通过收集与分析用户的消费习惯、生活习惯和社会属性等主要信息的数据后,抽象出用户的商业全貌。移动互联网企业可以通过用户画像寻找匹配人群,精准推送营销广告或服务信息,最终实现个性化营销与服务推送。

经过20多年的发展,随着技术的进步,手机无论从造型还是功能都发生了翻天覆地的变化,已经不再是一个简单的通信工具,而是具有多样化的功能。在这种情况下,各种传感器在iphone、ipad、android系统和其它系统的智能手机中得到广泛应用。其中,加速度/运动传感器、陀螺仪可通过感知设备的加速度/重力和运动状态,从而得到当前设备的姿态。

针对用户的画像研判,当前已经有了一些研究工作,主要集中在用户的网络日志和搜索内容上。对网络日志的书写习惯和用语习惯、以及用户的搜索内容,通过基于文本的分类方法、统计分析和关联预测方法,建立搜索内容、用语习惯等与用户基本属性之间的联系,从而预测用户的性别、年龄、职业等用户画像属性。

但是,对于智能手机,其浏览器一般没有cookie,用户的网络日志难以获取。用户的搜索一般只能由搜索引擎公司获得,第三方公司无法得到。因此,在手机上要获取用户信息,建立用户画像是比较困难的。因此一些新的方法被提出。例如专利《一种基于智能手机加速度传感器的用户基础属性预测方法》提出通过收集用户智能手机的流量数据,例如app流量的精确使用情况,包括app的名字、使用时间和流量等特征数据,再通过svm模型对这些数据进行分析,建立用户分类预测模型。但是该方法的准确性不是很高。



技术实现要素:

针对上述问题,本发明的目的在于提供一种基于智能手机姿态行为大数据的用户性别识别方法,实现通过用户使用智能手机的姿态行为的不同精确识别智能手机用户性别的方法。

本发明通过以下技术手段解决上述问题:

一种基于智能手机姿态行为大数据的用户性别识别方法,包括如下步骤:

s1、使用智能手机操作系统提供的api,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;

s2、通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,对运动状态进行分类,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;

s3、对加速传感器的数据进行处理,得到每个运动状态下的加速特征值组;

s4、将每个运动状态下的加速特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的加速特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;

s5、对陀螺传感器的数据进行处理,得到每个运动状态下的角速度特征值组;

s6、将每个运动状态下的角速度特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的角速度特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;

s7、对方向传感器的数据进行处理,得到每个运动状态下的方向特征值组;

s8、将每个运动状态下的方向特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的方向特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;

s9、将步骤s4、步骤s6和步骤s8结果加权平均得到最终的用户的性别。

进一步地,步骤s3-s4、步骤s5-s6和步骤s7-s8是同时进行的。

进一步地,所述运动状态包括走路、跑步、上楼、下楼、乘坐交通工具、坐和静止。

进一步地,步骤s2中,采用android官方api文档和iphone官方api文档中叙述的算法得到智能手机用户的运动状态。

进一步地,步骤s7具体包括如下步骤:

s71、方向传感器数据记录三个维度数据:智能手机绕着z轴旋转的角度、智能手机绕着x轴旋转的角度和智能手机绕着y轴旋转的角度;

s72、对每个运动状态下的方向传感器数据按时间顺序进行统计,将突然上升或突然下降超过一定阀值的数据记录为一个峰值;

s73、对相邻两个峰值之间的数据计算数据的平均值、最大值、最小值和标准差;

s74、所有数据的平均值、最大值、最小值和标准差按时间顺序组成用户的每个运动状态下的方向特征值组。

进一步地,s72中,所述阀值设为90°。

进一步地,所述大数据分类算法模型为svm、adaboost或lda。

本发明通过用户使用智能手机的姿态行为的不同,通过大数据方法统计大量人群的使用习惯,能对智能手机用户的性别进行准确的识别,准确度更高。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明基于智能手机姿态行为大数据的用户性别识别方法的步骤图;

图2是本发明基于智能手机姿态行为大数据的用户性别识别方法的流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1、图2所示,本发明提供一种基于智能手机姿态行为大数据的用户性别识别方法,包括如下步骤:

s1、使用智能手机操作系统提供的api,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;

s2、通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,相关算法在android官方api文档和iphone官方api文档中都有叙述,对运动状态进行分类,运动状态包括走路、跑步、上楼、下楼、乘坐交通工具、坐和静止,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;

s3、对加速传感器的数据进行处理,得到每个运动状态下的加速特征值组;

s4、将每个运动状态下的加速特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的加速特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别,大数据分类算法模型为svm(supportvectormachine)、adaboost或lda(lineardiscriminantanalysis);

s5、对陀螺传感器的数据进行处理,得到每个运动状态下的角速度特征值组;

s6、将每个运动状态下的角速度特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的角速度特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;

s7、对方向传感器的数据进行处理,得到每个运动状态下的方向特征值组;

具体包括如下步骤:

s71、方向传感器数据记录三个维度数据:智能手机绕着z轴旋转的角度、智能手机绕着x轴旋转的角度和智能手机绕着y轴旋转的角度;

s72、对每个运动状态下的方向传感器数据按时间顺序进行统计,将突然上升或突然下降超过一定阀值(例如90°)的数据记录为一个峰值;

s73、对相邻两个峰值之间的数据计算数据的平均值、最大值、最小值和标准差;

s74、所有数据的平均值、最大值、最小值和标准差按时间顺序组成用户的每个运动状态下的方向特征值组。

s8、将每个运动状态下的方向特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的方向特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;

s9、将步骤s4、步骤s6和步骤s8结果加权平均得到最终的用户的性别。

其中,步骤s3-s4、步骤s5-s6和步骤s7-s8是同时进行的。

由于男女携带智能手机的习惯不同,导致手机的姿态不同。例如在走路时男子多将手机放在裤袋内,女子多将手机放在手提包中。裤袋中的手机一般接近竖立的角度,手提包中的手机一般接近侧卧的角度。在坐下时,男女的手机姿态都有可能是侧卧角度;但裤袋中的手机会因为腿的小幅度运动而运动,手提包中的手机会一直静止不动。上下楼和乘坐交通工具时裤袋中的手机运动方向与手提包中的手机有着显著差异。

由于现代智能手机内部都配置了手机重力感应技术,利用压电效应,测量内部一片重物重力正交两个方向的分力大小,来判定水平方向,从而能够感受手机在变换姿势时,重心的变化。智能手机内部的三轴陀螺仪测量手机的三维方向,能更精确地检测手机的三维方向变化。加速度传感器能感知手机在三维方向的加速度。这些传感器可以用来测量手机的运动状态和姿态。

本发明通过用户使用智能手机的姿态行为的不同,通过大数据方法统计大量人群的使用习惯,能对智能手机用户的性别进行准确的识别,准确度更高。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1