用户行为数据的上传方法、用户行为的识别方法及装置的制造方法_2

文档序号：9810997阅读：来源：国知局

计算三轴加速度三个轴向数值的平方的和值，假设预定时长为2S，则在每一个2S的时间段内计算一个三轴加速度三个轴向数值的平方的和值。上述初步处理还可以是：计算三轴加速度三个轴向数值的平方根，然后再对三个轴向得到的平方根进行求和计算，得到一个和值；或者是计算三轴加速度三个轴向数值的平方的和值后，再计算和值的方差值；或者是计算三轴加速度三个轴向数值的绝对值的和值，等等。即，对三轴加速度的数值的处理，可以根据具体环境和统计经验来自行选择，并不局限于以上的举例。
[0035] 若对三个轴向的加速度数值进行初步处理的方式为计算三轴加速度三个轴向数值的平方的和值，则在计算所述和值后，可以确定所述和值所属的预设数值区间，并将所述预设数值区间对应的行为种类，作为该时间段内该用户的行为种类，其中，预先设定不同的行为种类对应于不同的预设数值区间。例如，在所述采集终端内预先设有不同行为种类所对应的数值区间，在计算得到三轴加速度数值的平方的和值后，将该和值与不同的数值区间进行对比，确定该和值位于哪个数值区间，假设该和值位于第一数值区间，则第一数值区间所对应的行为种类即为该和值所属的行为种类。
[0036] 若对三个轴向的加速度数值进行初步处理的方式为计算三轴加速度三个轴向数值的平方的和值，再对该和值进行方差计算得到的方差值，那么本发明实施例中可以将该方差值与不同的数值区间进行对比，确定该方差值位于哪个数值区间，假设该方差值位于第二数值区间，则第二数值区间所对应的行为种类即为该方差值所属的行为种类。方差值的计算量较小，且更能够反映出用户加速度的变化规律，本发明实施例在采集终端侧可优选地采用方差值来确定用户的行为种类。
[0037] 步骤S102,按照预设周期，统计该预设周期内记录的该用户各种行为种类的出现频率，并生成动频向量。
[0038] 在本实施例中，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，各个分量的值是对应行为种类的出现频率。在此以具体实施例进行说明，若各种行为种类分别为静止、乘车、骑行、活动和锻炼5种行为种类，则所述动频向量的各个分量按照预定顺序排序后分别为静止、乘车、骑行、活动和锻炼，所述动频向量的各个分量的值分别为静止、乘车、骑行、活动和锻炼5种行为种类的出现频率，假设静止、乘车、骑行、活动和锻炼 5种行为种类的出现频率分别为D1、D2、D3、D4、D5,即动频向量D = (Dl，D2, D3, D4, D5)。
[0039] 可选的，预设周期可以以小时为单位进行设定，也可以以天为单位进行设定，即预设周期并不局限于具体的时间限定，假设预设周期为5Min，则采集终端统计该5Min内记录的该用户各种行为种类的出现频率，最后将该用户各种行为种类的出现频率形成动频向量。
[0040] 步骤S103,将所述动频向量上传至平台，在此需要说明的是，采集终端可以为可穿戴式设备，如计步器。
[0041] 如图2所示，为本发明的实施例中平台在用户行为的识别方法中的步骤流程图，包括如下步骤：
[0042] 步骤S201，接收采集终端周期性发送的动频向量，需要说明的是，接收的动频向量与步骤S102中生成的动频向量为同一个动频向量。
[0043] 步骤S202,基于所述动频向量识别该用户的行为，获得所述动频向量的信息后，通过对所述动频向量进行处理最后得到该用户的行为识别结果。
[0044] 优选的，在识别用户的行为后，还可以将该用户的行为传送至该用户的显示终端，其中，显示终端可以为电脑、手机等。
[0045] 如图3所示，为图2中步骤S202的进一步细化的流程图，包括如下步骤：
[0046] 步骤S301，对所述动频向量的各个分量进行加权。
[0047] 在本实施例中，平台内预设有动频向量的各个分量的权重，将所述动频向量的各个分量分别按照各个分量的权重进行加权；优选的，各个分量具有预设的重要性指标，重要性指标较高的分量则具有较高的权重，即用户不同的行为种类对应的权重是不同的。在此以具体实施例进行说明，假设各种行为种类分别为静止、乘车、骑行、活动和锻炼5种行为种类，由于静止、乘车、骑行、活动和锻炼5种行为种类中都会有静止行为的出现，因此静止行为对用户行为的识别贡献最小，则静止行为的重要性指标就最低，权重则最小；相反，锻炼行为通常只出现在锻炼行为种类中，静止、乘车、骑行、活动等行为种类中很少会出现锻炼行为，因此锻炼行为对用户行为的识别贡献是最大的，则锻炼行为的重要性指标就最高，权重则最大；当静止、乘车、骑行、活动和锻炼5种行为种类的权重确定后，则按照该权重对动频向量的各个分量分别进行加权。
[0048] 步骤S302,对所述动频向量与各种行为种类的特征向量进行比较。
[0049] 在本实施例中，平台中预设有各种行为种类的特征向量。优选的，平台中包括有分类器，分类器中存储了各种行为种类的特征向量，若所述特征向量没有进行过加权，则对所述动频向量与特征向量进行比较；若所述特征向量为加权后的特征向量，则对加权后的动频向量与加权后的特征向量进行比较。
[0050] 步骤S303,计算所述动频向量与所述特征向量的最大相似性，将最大相似性对应的特征向量的行为种类作为该用户在预设周期的行为种类。
[0051] 在本实施例中，优选的，计算所述动频向量与所述特征向量的相似性中所采用的计算方法为余弦距离度量相似性的方法，所述余弦距离定义为
[0053] 其中，X为所述动频向量，Xi为所述动频向量中的第一个分量，x2为所述动频向量中的第二个分量，依次类推，x n为所述动频向量中的第η个向量，Y为预先确定的所述各种行为种类的的特征向量，yi为所述特征向量的第一个分量，y 2为所述特征向量的第二个分量，依次类推，yn为所述特征向量的第η个分量，Θ为动频向量X与各种行为种类的的特征向量Υ之间的夹角。
[0054] 在计算所述动频向量与所述特征向量的最大相似性时，将所述动频向量与各种行为种类的特征向量做比较，即分别计算所述动频向量与各种行为种类的特征向量之间夹角的余弦值，余弦值越大，则说明相似度越大，得到最大相似度后，将最大相似性对应的特征向量的行为种类作为该用户在预设周期的行为种类，即该行为种类即为最后的识别结果。
[0055] 在此举例进行说明，假设各种行为种类分别为静止、乘车、骑行、活动和锻炼5种行为种类，静止行为的特征向量为Yi，乘车行为的特征向量为，骑行行为的特征向量为 γ3，活动行为的特征向量为γ4，锻炼行为的特征向量为γ5，动频向量为D，则分别计算动频向量D与静止行为的特征向量t、乘车行为的特征向量Υ 2、骑行行为的特征向量Υ3、活动行为的特征向量Υ4、锻炼行为的特征向量Υ 5之间的相似度，即分别计算动频向量D与静止行为的特征向量t、乘车行为的特征向量1、骑行行为的特征向量1、活动行为的特征向量1、锻炼行为的特征向量Y 5之间夹角的余弦值，余弦值越大，则说明相似度越大，取最大相似度相对应的特征向量的行为种类为该动频向量所属的行为种类，即该用户在预设周期内的行为种类，也即为最后的行为识别结果。
[0056] 在此需要说明的是，上述识别结果可能包含个别偶发的错误，可以根据生活经验对识别结果进行后处理。例如，多个日常活动中夹杂一个5分钟的剧烈运动，通常是误判，可以去除。长时间静止过程中突发的5分钟乘车也很有可能是误判，可以予以去除。
[0057] 下面结合实例说明该识别方法的有益效果。
[0058] 如图4所示，图4为RAD数据库中展示的一条分析结果中的用户的加速度数据，该数据可以作为提示辅助用户对数据进行标注。由图4中可以看出数据采集时长约2小时5 分钟。实际情况是10分钟整理物品并步行至停车场（日常活动），35分钟驾驶，25分钟打篮球，5分钟步行，15分钟驾驶，5分钟从停车场步行至家中，然后一直静止。
[0059] 图5表示根据图4中的加速度数据得出的识别结果，图5将用户各种行为种类划分为静止、乘车、骑行、活动和锻炼5种行为种类，由图5中可以看出该结果与用户结合记忆与步数信息的标注结果几乎完全相符，只有1. 5小时处发生一次错误，即最后一次活动。这段活动为从停车场步行至家中，5分钟内包括停车、步行、乘坐电梯以及在家里坐下，由于5 分钟活动复杂，最终被错误的综合识别为骑行。
[0060] 这种错误是可以理解的，由于5分钟内包含多次状态转换，状态的过度点（即从一个状态切换到另一个状态的时段）会造成采集终端识别产生错误，进而平台也会产生错误。RAD数据集上的测试结果表明，识别准确率达到94. 21%。
[0061] 如图6所示，为本发明的实施例中采集终端的结构框图，采集

完整全部详细技术资料下载

当前第2页1 2 3