基于移动终端的多模态低头族危险环境感知与预警方法

文档序号：36176411发布日期：2023-11-28 23:19阅读：57来源：国知局

本发明涉及一种基于移动终端的多模态低头族危险环境感知与预警方法，属于多传感器数据融合。

背景技术：

1、随着互联网和现代通信技术的快速发展，智能手机逐渐成为人们日常生活中不可缺失的一部分。然而，“机不离手”也成为了一个普遍的社会现象。很多人长时间低头看手机，往往忽略了周围环境，这不仅容易引起各种健康问题，而且存在很大的安全隐患。例如在上下楼时玩手机容易造成摔倒，在过马路时玩手机则会酿成交通事故。

2、当前的移动终端在上述危险场景使用时也并没有预警措施，无法给予使用者足够的安全警示，极易养成用户的侥幸、依赖心理，甚至对自己的危险行为毫不在意。目前，未有面向极易发生危险情况的环境检测系统，而能够对行人行走状态进行可能性检测的软件也寥寥无几，且设计角度单一。大多都是斑马线的检测或者是跑步及静止的判别。而综合性更高的行为检测以及行走环境检测也更是未经面世。故需要设计一种新方法从而能够实时监控，能够做到高效及时的获取周边环境并进行检测判断，且检测效率高达90％及以上。而且能够做到声音预警，提醒人们注意周边环境以避免危险状况的发生

技术实现思路

1、针对上述现有技术存在的问题，本发明提供一种基于移动终端的多模态低头族危险环境感知与预警方法，利用手机自带传感器，在不添加任何其他设备的情况下，实时检测用户的行为状态和所处环境状况；并根据传感器检测数据建立“低头族”危险预警系统，通过文字和语音提示进一步加强用户对行走环境的注意力，有效降低事故发生率，保障用户的安全。

2、为了实现上述目的，本发明采用的技术方案是：一种基于移动终端的多模态低头族危险环境感知与预警方法，其特征在于，包括以下步骤：

3、步骤1：利用手机内置加速度传感器，采集三方向加速度时间序列数据；面向三个方向加速度时间序列数据，提取加速度状态特征，构建基于并行lstm-cnn网络的用户运动状态分类(手持手机慢行、手机揣兜慢行、手机静放、慢行看手机、上下楼梯看手机、静止看手机)模块，对手机用户的当前运动状态进行识别；

4、步骤2：利用单目摄像机采集图像，估计单目图像深度信息；面向彩色图像序列和深度图的深度信息，预测视角扩展图像；

5、步骤3：分析步骤1的运动状态识别结果，当用户处于非静止状态时，开启手机后视摄像头，采集用户周围环境图像数据；面向用户周围环境图像数据，构建基于yolov5轻型网络的危险环境检测模块，对手机用户周边潜在的危险环境(斑马线、楼梯区域、湿滑路面、低照明)进行识别；

6、步骤4：面向步骤1、步骤3输出的手机用户运动状态识别结果、周围危险环境识别结果，构建基于决策树模型的低头族危险状态判定模块，对低头族当前的危险状态进行分类；

7、步骤5：面向实时的手机用户运动状态识别结果、用户周围危险环境识别结果、低头族危险状态判定结果，设计手机端用户界面，建立听觉-视觉立体式预警方式。

8、进一步的，所述步骤1具体为：

9、步骤11：面向手机内置重力加速度传感器，以20hz为采样频率采集13位不同用户在手持手机慢行、手机揣兜慢行、手机静放、慢行看手机、上下楼梯看手机、静止看手机六种状态下的加速度时间序列数据，每种状态采集10s的数据；

10、步骤12：按照不同用户和状态对采集的数据进行标号；用a、b、c、d、e、f、g、h、i、j、k、l、m分别表示13个不同用户，用1、2、3、4、5、6分别表示手持手机慢行、手机揣兜慢行、手机静放、慢行看手机、上下楼梯看手机、静止看手机六种状态，具体表示为：

11、

12、其中，表示a用户在手持手机慢行状态下，重力加速度传感器采集的x、y、z三轴加速度时间序列数据，x200＝{x1，x2，...x200}，y200＝{y1，y2，...y200}，z200＝{z1，z2，...z200}；

13、步骤13：面向x、y、z三轴加速度输入数据，手动提取统计学特征timput，包括每种状态下的平均值：μx，μy，μz，方差：σx，σy，σz以及两轴之间的皮尔逊相关系数：ρxy，ρxz，ρyz。其中，皮尔逊相关系数的计算公式如下：

14、

15、步骤14：将x、y、z三轴加速度数据按时间进行叠加，生成信号图像，然后将二维离散傅里叶变换(dft)应用于信号图像，并选择其幅度作为活动图像fimput。其中，二维离散傅里叶变换的公式如下所示：

16、

17、步骤15：以重力加速度传感器原始采集数据sinput、统计量timput、频率图像fimput为输入数据，构建基于lstm-cnn的用户状态识别网络，通过dwconv深度卷积模块提取数据特征，利用最大池化层和下采样层增强模型的鲁棒性并减少过拟合的风险。

18、进一步的，所述步骤2具体为：

19、步骤21：首先，利用基于拉普拉斯金字塔的解码器结构对单目图像进行深度估计，精确地解释编码特征与最终输出之间的关系；输入的彩色图像的拉普拉斯残差为lk，具体表示为：

20、lk＝ik-up(ik+1),k＝1,2,3,4 (4)

21、其中，k为拉普拉斯金字塔中的水平指数，ik是通过对原始输入图像进行下采样得到的，up表示上采样函数；

22、第k个金字塔层获得的深度残差为rk，具体表示为：

23、rk＝bk([xk,lk,up(rk+1)])+lk,k＝1,2,3,4 (5)

24、其中，[xk,lk,up(rk+1)]为串联，bk由堆叠的卷积块组成；

25、从拉普拉斯金字塔的最高层开始逐步重建深度图，具体表示为：

26、dk＝rk+up(dk+1),k＝1,2,3,4 (6)；

27、步骤22：然后，使用标准的全卷积架构分别在两个独立的流中预测单个图像的预测像素深度和法线贴图；在每个平面上，给定所需的相对姿态，即3d旋转和平移，以及相机的内在参数，可以从其深度和法线计算出一个单应性，对m个不同的平面建模，将输入图像分割成m个区域；使用vgg的前4个卷积模块从输入图像和种子区域掩码中应用反向扭曲过程在新视图中预测m个平面区域掩码，将这些分割掩码和相对姿态结合，产生各自的单应性变换，并根据扭曲的输入图像组合生成新的视图。

28、进一步的，所述步骤3具体为：

29、步骤31：首先，构建pytorch框架下的yolov5s 6.0轻量化目标检测网络，该网络由四个模块组成：input(输入端)模块、backbone网络(主干网络)模块、neck网络(颈部网络)模块和head(预测端)模块；

30、步骤32：然后，自制stage(楼梯)、wetroad(湿滑路面)、zcrossing(斑马线)、night(夜晚)四类图像数据集，数量分别为2500张、1500张、1500张、1500张，另外还有1000张负样本，对数据集以7:2:1的比例划分为训练集、验证集和测试集；

31、步骤33：用labelimg工具对四类图像的训练集进行手动标记，接着进行200轮训练生成best.pt模型，并通过验证集和测试集数据检验训练生成的模型效果。

32、进一步的，所述input(输入端)模块包括mosaic数据增强、自适应锚框计算、图片尺寸处理三部分；输入的图像标准尺寸为640×640×3，经过mosaic数据增强将数据集中的任意四张图片进行随机缩放、裁剪、排布的方式进行拼接，再通过自适应描框计算，yolov5s设定的初始描框为[70,28,74,100,88,213]、[147,67,181,106,189,303]、[261,132,513,281,544,395]，网络在训练的时候，根据初始描框来进行输出预测框，然后与真实框groundtruth相比对，根据两者计算的差值进行反向更新，从而反复迭代更新网络参数；

33、所述backbone网络(主干网络)模块由1个fcous结构、5个conv模块、21个c3模块、1个sppf模块构成。focus结构将640×640×3的图像输入，采用切片操作，先变成320×320×12的特征图，再经过3×3的卷积操作，输出通道32，最终变成320×320×32的特征图；conv模块包括卷积(conv2d)、batch normalization和激活函数(silu)；c3模块包含了3个标准卷积层以及多个bottleneck模块；sppf模块采用多个小尺寸池化核级联代替spp模块中单个大尺寸池化核；

34、所述neck网络(颈部网络)模块由fpn+pan的网络结构构成，从上到下的fpn结构通过上采样操作来处理信息传递过程，以得到预测的特征图；从下到上的特征金字塔应用在pan结构中；

35、所述head(预测端)模块由4个conv模块、2个nn.upsample模块、4个concat(拼接层)模块、12个c3模块、1个detect模块构成，其主要负责对骨干网络提取的特征图进行多尺度目标检测。

36、进一步的，所述步骤4具体为：

37、步骤41：首先，确定输入数据的三个特征：用户是否正在运动、用户是否正在玩手机、用户是否处于危险环境，根据这些特征来建立决策树模型；

38、步骤42：然后，选择“用户是否正在运动”作为决策树的根节点，该特征能够尽可能最好分类手机用户是否处于危险状态；

39、步骤43：最后，计算“用户是否正在玩手机”、“用户是否处于危险环境”两个特征的gini系数，确定决策树模型的内部节点和叶子节点；gini系数的计算公式如下：

40、

41、其中，pk表示某一类别的发生概率。

42、进一步的，所述步骤5具体为：

43、用户界面分为上、下两个部分；下边实时检测用户的活动状态，并显示手持手机慢行、手机揣兜慢行、手机静放、慢行看手机、上下楼梯看手机、静止看手机六种情况的x、y、z三轴重力加速度传感器检测的实时数据；界面上边实时显示用户所处的环境，同时对用户的危险状态进行判定，当检测到用户在楼梯、斑马线、黑夜、湿滑路面等危险环境中使用手机时，通过字样显示和语音播报的形式向低头族提供预警。

44、本发明的有益效果是：本发明研发了基于移动终端的多模态低头族危险环境感知系统方法。通过实时监控行走的环境，并根据加速度传感器检测数据进行状态判别，并综合性的得出状态结果可能性，及时发出预警。同时，本发明不仅能够实时监控，能够做到高效及时的获取周边环境并进行检测判断，且检测效率高达90％及以上，而且能够做到声音预警，提醒人们注意周边环境以避免危险状况的发生。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王晗吉翔金磊何欣樾闫苏园季钰姣邓丽云
技术所有人：南通大学
我是此专利的发明人

上一篇：一种富氢水的超临界导入法工艺的制作方法
上一篇：一种耐火云母带及加工方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。